;
; Реализация среды исполнения языка программирования
; Объектно-ориентированный продвинутый векторный транслятор
;
; Copyright © 2021, 2024 Малик Разработчик
;
; Это свободная программа: вы можете перераспространять ее и/или изменять
; ее на условиях Меньшей Стандартной общественной лицензии GNU в том виде,
; в каком она была опубликована Фондом свободного программного обеспечения;
; либо версии 3 лицензии, либо (по вашему выбору) любой более поздней версии.
;
; Эта программа распространяется в надежде, что она будет полезной,
; но БЕЗО ВСЯКИХ ГАРАНТИЙ; даже без неявной гарантии ТОВАРНОГО ВИДА
; или ПРИГОДНОСТИ ДЛЯ ОПРЕДЕЛЕННЫХ ЦЕЛЕЙ. Подробнее см. в Меньшей Стандартной
; общественной лицензии GNU.
;
; Вы должны были получить копию Меньшей Стандартной общественной лицензии GNU
; вместе с этой программой. Если это не так, см.
; <https://www.gnu.org/licenses/>.
;
; <fold векторное меньше или равно>
; <fold первый операнд — на стаке, второй операнд — на аккумуляторе, результат — на аккумуляторе>
macro vled {
vmovdqa xmm1, [rsp+$00]
vcmpsd xmm0, xmm1, xmm0, $02
vmovq qsc0, xmm0
__pop $01
}
macro vled2 {
vmovdqa xmm1, [rsp+$00]
vcmppd xmm0, xmm1, xmm0, $02
__pop $01
}
macro vled4 {
vmovdqu ymm1, [rsp+$00]
vcmppd ymm0, ymm1, ymm0, $02
__cltag_y $00
__pop $02
}
macro vled8 {
vmovdqu64 zmm1, [rsp+$00]
vcmppd msk1, zmm1, zmm0, $02
vmovdqa64 zmm0\{k1\}\{z\}, [cons$long8.m1]
__cltag_z $00
__pop $04
}
macro vlef {
vmovdqa xmm1, [rsp+$00]
vcmpss xmm0, xmm1, xmm0, $02
vmovd dsc0, xmm0
__pop $01
}
macro vlef2 {
vmovdqa xmm1, [rsp+$00]
vcmpps xmm0, xmm1, xmm0, $02
vpand xmm0, xmm0, [cons$int8.mask2]
__pop $01
}
macro vlef4 {
vmovdqa xmm1, [rsp+$00]
vcmpps xmm0, xmm1, xmm0, $02
__pop $01
}
macro vlef8 {
vmovdqu ymm1, [rsp+$00]
vcmpps ymm0, ymm1, ymm0, $02
__cltag_y $00
__pop $02
}
macro vleb {
cmp dword [rsp+$00], dsc0
setnle bsc0
dec bsc0
movsx dsc0, bsc0
__pop $01
}
macro vleb2 {
vmovdqa xmm1, [rsp+$00]
vpcmpgtb xmm0, xmm1, xmm0
vpxor xmm0, xmm0, [cons$byte8.mask2]
__pop $01
}
macro vleb4 {
vmovdqa xmm1, [rsp+$00]
vpcmpgtb xmm0, xmm1, xmm0
vpxor xmm0, xmm0, [cons$byte8.mask4]
__pop $01
}
macro vleb8 {
vmovdqa xmm1, [rsp+$00]
vpcmpgtb xmm0, xmm1, xmm0
vpxor xmm0, xmm0, [cons$byte8.mask8]
__pop $01
}
macro vles {
cmp dword [rsp+$00], dsc0
setnle bsc0
dec bsc0
movsx dsc0, bsc0
__pop $01
}
macro vles2 {
vmovdqa xmm1, [rsp+$00]
vpcmpgtw xmm0, xmm1, xmm0
vpxor xmm0, xmm0, [cons$short8.mask2]
__pop $01
}
macro vles4 {
vmovdqa xmm1, [rsp+$00]
vpcmpgtw xmm0, xmm1, xmm0
vpxor xmm0, xmm0, [cons$short8.mask4]
__pop $01
}
macro vles8 {
vmovdqa xmm1, [rsp+$00]
vpcmpgtw xmm0, xmm1, xmm0
vpxor xmm0, xmm0, [cons$short8.mask8]
__pop $01
}
macro vlei {
cmp dword [rsp+$00], dsc0
setnle bsc0
dec bsc0
movsx dsc0, bsc0
__pop $01
}
macro vlei2 {
vmovdqa xmm1, [rsp+$00]
vpcmpgtd xmm0, xmm1, xmm0
vpxor xmm0, xmm0, [cons$int8.mask2]
__pop $01
}
macro vlei4 {
vmovdqa xmm1, [rsp+$00]
vpcmpgtd xmm0, xmm1, xmm0
vpxor xmm0, xmm0, [cons$int8.mask4]
__pop $01
}
macro vlei8 {
vmovdqu ymm1, [rsp+$00]
vpcmpgtd ymm0, ymm1, ymm0
vpxor ymm0, ymm0, [cons$int8.mask8]
__cltag_y $00
__pop $02
}
macro vlel {
cmp qword [rsp+$00], qsc0
setnle bsc0
dec bsc0
movsx qsc0, bsc0
__pop $01
}
macro vlel2 {
vmovdqa xmm1, [rsp+$00]
vpcmpgtq xmm0, xmm1, xmm0
vpxor xmm0, xmm0, [cons$long8.mask2]
__pop $01
}
macro vlel4 {
vmovdqu ymm1, [rsp+$00]
vpcmpgtq ymm0, ymm1, ymm0
vpxor ymm0, ymm0, [cons$long8.mask4]
__cltag_y $00
__pop $02
}
macro vlel8 {
vmovdqu64 zmm1, [rsp+$00]
vpcmpgtq msk1, zmm1, zmm0
knotw msk1, msk1
vmovdqa64 zmm0\{k1\}\{z\}, [cons$long8.m1]
__cltag_z $00
__pop $04
}
; </fold>
; <fold первый операнд — на стаке, второй операнд — на аккумуляторе, результат — на стаке>
macro vled_p {
vmovdqa xmm1, [rsp+$00]
vcmpsd xmm0, xmm1, xmm0, $02
vmovdqa xword [rsp+$00], xmm0
}
macro vled2_p {
vmovdqa xmm1, [rsp+$00]
vcmppd xmm0, xmm1, xmm0, $02
vmovdqa xword [rsp+$00], xmm0
}
macro vled4_p {
vmovdqu ymm1, [rsp+$00]
vcmppd ymm0, ymm1, ymm0, $02
vmovdqu yword [rsp+$00], ymm0
__sttag_y $00, TAG_LONG4
}
macro vled8_p {
vmovdqu64 zmm1, [rsp+$00]
vcmppd msk1, zmm1, zmm0, $02
vmovdqa64 zmm0\{k1\}\{z\}, [cons$long8.m1]
vmovdqu64 zword [rsp+$00], zmm0
__sttag_z $00, TAG_LONG8
}
macro vlef_p {
vmovdqa xmm1, [rsp+$00]
vcmpss xmm0, xmm1, xmm0, $02
vmovdqa xword [rsp+$00], xmm0
}
macro vlef2_p {
vmovdqa xmm1, [rsp+$00]
vcmpps xmm0, xmm1, xmm0, $02
vpand xmm0, xmm0, [cons$int8.mask2]
vmovdqa xword [rsp+$00], xmm0
}
macro vlef4_p {
vmovdqa xmm1, [rsp+$00]
vcmpps xmm0, xmm1, xmm0, $02
vmovdqa xword [rsp+$00], xmm0
}
macro vlef8_p {
vmovdqu ymm1, [rsp+$00]
vcmpps ymm0, ymm1, ymm0, $02
vmovdqu yword [rsp+$00], ymm0
__sttag_y $00, TAG_INT8
}
macro vleb_p {
cmp dword [rsp+$00], dsc0
setnle bsc0
dec bsc0
movsx dsc0, bsc0
mov dword [rsp+$00], dsc0
}
macro vleb2_p {
vmovdqa xmm1, [rsp+$00]
vpcmpgtb xmm0, xmm1, xmm0
vpxor xmm0, xmm0, [cons$byte8.mask2]
vmovdqa xword [rsp+$00], xmm0
}
macro vleb4_p {
vmovdqa xmm1, [rsp+$00]
vpcmpgtb xmm0, xmm1, xmm0
vpxor xmm0, xmm0, [cons$byte8.mask4]
vmovdqa xword [rsp+$00], xmm0
}
macro vleb8_p {
vmovdqa xmm1, [rsp+$00]
vpcmpgtb xmm0, xmm1, xmm0
vpxor xmm0, xmm0, [cons$byte8.mask8]
vmovdqa xword [rsp+$00], xmm0
}
macro vles_p {
cmp dword [rsp+$00], dsc0
setnle bsc0
dec bsc0
movsx dsc0, bsc0
mov dword [rsp+$00], dsc0
}
macro vles2_p {
vmovdqa xmm1, [rsp+$00]
vpcmpgtw xmm0, xmm1, xmm0
vpxor xmm0, xmm0, [cons$short8.mask2]
vmovdqa xword [rsp+$00], xmm0
}
macro vles4_p {
vmovdqa xmm1, [rsp+$00]
vpcmpgtw xmm0, xmm1, xmm0
vpxor xmm0, xmm0, [cons$short8.mask4]
vmovdqa xword [rsp+$00], xmm0
}
macro vles8_p {
vmovdqa xmm1, [rsp+$00]
vpcmpgtw xmm0, xmm1, xmm0
vpxor xmm0, xmm0, [cons$short8.mask8]
vmovdqa xword [rsp+$00], xmm0
}
macro vlei_p {
cmp dword [rsp+$00], dsc0
setnle bsc0
dec bsc0
movsx dsc0, bsc0
mov dword [rsp+$00], dsc0
}
macro vlei2_p {
vmovdqa xmm1, [rsp+$00]
vpcmpgtd xmm0, xmm1, xmm0
vpxor xmm0, xmm0, [cons$int8.mask2]
vmovdqa xword [rsp+$00], xmm0
}
macro vlei4_p {
vmovdqa xmm1, [rsp+$00]
vpcmpgtd xmm0, xmm1, xmm0
vpxor xmm0, xmm0, [cons$int8.mask4]
vmovdqa xword [rsp+$00], xmm0
}
macro vlei8_p {
vmovdqu ymm1, [rsp+$00]
vpcmpgtd ymm0, ymm1, ymm0
vpxor ymm0, ymm0, [cons$int8.mask8]
vmovdqu yword [rsp+$00], ymm0
}
macro vlel_p {
cmp qword [rsp+$00], qsc0
setnle bsc0
dec bsc0
movsx qsc0, bsc0
mov qword [rsp+$00], qsc0
}
macro vlel2_p {
vmovdqa xmm1, [rsp+$00]
vpcmpgtq xmm0, xmm1, xmm0
vpxor xmm0, xmm0, [cons$long8.mask2]
vmovdqa xword [rsp+$00], xmm0
}
macro vlel4_p {
vmovdqu ymm1, [rsp+$00]
vpcmpgtq ymm0, ymm1, ymm0
vpxor ymm0, ymm0, [cons$long8.mask4]
vmovdqu yword [rsp+$00], ymm0
}
macro vlel8_p {
vmovdqu64 zmm1, [rsp+$00]
vpcmpgtq msk1, zmm1, zmm0
knotw msk1, msk1
vmovdqa64 zmm0\{k1\}\{z\}, [cons$long8.m1]
vmovdqu64 zword [rsp+$00], zmm0
}
; </fold>
; <fold первый операнд — на аккумуляторе, второй операнд — локальная переменная, результат — на аккумуляторе>
macro vled_l localvarName* {
vcmpsd xmm0, xmm0, [.#localvarName], $02
vmovq qsc0, xmm0
}
macro vled2_l localvarName* {
vcmppd xmm0, xmm0, [.#localvarName], $02
}
macro vled4_l localvarName* {
vmovdqu ymm1, [.#localvarName]
vcmppd ymm0, ymm0, ymm1, $02
}
macro vled8_l localvarName* {
vmovdqu64 zmm1, [.#localvarName]
vcmppd msk1, zmm0, zmm1, $02
vmovdqa64 zmm0\{k1\}\{z\}, [cons$long8.m1]
}
macro vlef_l localvarName* {
vcmpss xmm0, xmm0, [.#localvarName], $02
vmovd dsc0, xmm0
}
macro vlef2_l localvarName* {
vcmpps xmm0, xmm0, [.#localvarName], $02
vpand xmm0, xmm0, [cons$int8.mask2]
}
macro vlef4_l localvarName* {
vcmpps xmm0, xmm0, [.#localvarName], $02
}
macro vlef8_l localvarName* {
vmovdqu ymm1, [.#localvarName]
vcmpps ymm0, ymm0, ymm1, $02
}
macro vleb_l localvarName* {
cmp dsc0, [.#localvarName]
setnle bsc0
dec bsc0
movsx dsc0, bsc0
}
macro vleb2_l localvarName* {
vpcmpgtb xmm0, xmm0, [.#localvarName]
vpxor xmm0, xmm0, [cons$byte8.mask2]
}
macro vleb4_l localvarName* {
vpcmpgtb xmm0, xmm0, [.#localvarName]
vpxor xmm0, xmm0, [cons$byte8.mask4]
}
macro vleb8_l localvarName* {
vpcmpgtb xmm0, xmm0, [.#localvarName]
vpxor xmm0, xmm0, [cons$byte8.mask8]
}
macro vles_l localvarName* {
cmp dsc0, [.#localvarName]
setnle bsc0
dec bsc0
movsx dsc0, bsc0
}
macro vles2_l localvarName* {
vpcmpgtw xmm0, xmm0, [.#localvarName]
vpxor xmm0, xmm0, [cons$short8.mask2]
}
macro vles4_l localvarName* {
vpcmpgtw xmm0, xmm0, [.#localvarName]
vpxor xmm0, xmm0, [cons$short8.mask4]
}
macro vles8_l localvarName* {
vpcmpgtw xmm0, xmm0, [.#localvarName]
vpxor xmm0, xmm0, [cons$short8.mask8]
}
macro vlei_l localvarName* {
cmp dsc0, [.#localvarName]
setnle bsc0
dec bsc0
movsx dsc0, bsc0
}
macro vlei2_l localvarName* {
vpcmpgtd xmm0, xmm0, [.#localvarName]
vpxor xmm0, xmm0, [cons$int8.mask2]
}
macro vlei4_l localvarName* {
vpcmpgtd xmm0, xmm0, [.#localvarName]
vpxor xmm0, xmm0, [cons$int8.mask4]
}
macro vlei8_l localvarName* {
vmovdqu ymm1, [.#localvarName]
vpcmpgtd ymm0, ymm0, ymm1
vpxor ymm0, ymm0, [cons$int8.mask8]
}
macro vlel_l localvarName* {
cmp qsc0, [.#localvarName]
setnle bsc0
dec bsc0
movsx qsc0, bsc0
}
macro vlel2_l localvarName* {
vpcmpgtq xmm0, xmm0, [.#localvarName]
vpxor xmm0, xmm0, [cons$long8.mask2]
}
macro vlel4_l localvarName* {
vmovdqu ymm1, [.#localvarName]
vpcmpgtq ymm0, ymm0, ymm1
vpxor ymm0, ymm0, [cons$long8.mask4]
}
macro vlel8_l localvarName* {
vmovdqu64 zmm1, [.#localvarName]
vpcmpgtq msk1, zmm0, zmm1
knotw msk1, msk1
vmovdqa64 zmm0\{k1\}\{z\}, [cons$long8.m1]
}
; </fold>
; <fold первый операнд — на аккумуляторе, второй операнд — глобальный член, результат — на аккумуляторе>
macro vled_g globalmember* {
vcmpsd xmm0, xmm0, globalmember, $02
vmovq qsc0, xmm0
}
macro vled2_g globalmember* {
vcmppd xmm0, xmm0, globalmember, $02
}
macro vled4_g globalmember* {
vcmppd ymm0, ymm0, globalmember, $02
}
macro vled8_g globalmember* {
vcmppd msk1, zmm0, globalmember, $02
vmovdqa64 zmm0\{k1\}\{z\}, [cons$long8.m1]
}
macro vlef_g globalmember* {
vcmpss xmm0, xmm0, globalmember, $02
vmovd dsc0, xmm0
}
macro vlef2_g globalmember* {
vcmpps xmm0, xmm0, globalmember, $02
vpand xmm0, xmm0, [cons$int8.mask2]
}
macro vlef4_g globalmember* {
vcmpps xmm0, xmm0, globalmember, $02
}
macro vlef8_g globalmember* {
vcmpps ymm0, ymm0, globalmember, $02
}
macro vleb_g globalmember* {
cmp dsc0, globalmember
setnle bsc0
dec bsc0
movsx dsc0, bsc0
}
macro vleb2_g globalmember* {
vpcmpgtb xmm0, xmm0, globalmember
vpxor xmm0, xmm0, [cons$byte8.mask2]
}
macro vleb4_g globalmember* {
vpcmpgtb xmm0, xmm0, globalmember
vpxor xmm0, xmm0, [cons$byte8.mask4]
}
macro vleb8_g globalmember* {
vpcmpgtb xmm0, xmm0, globalmember
vpxor xmm0, xmm0, [cons$byte8.mask8]
}
macro vles_g globalmember* {
cmp dsc0, globalmember
setnle bsc0
dec bsc0
movsx dsc0, bsc0
}
macro vles2_g globalmember* {
vpcmpgtw xmm0, xmm0, globalmember
vpxor xmm0, xmm0, [cons$short8.mask2]
}
macro vles4_g globalmember* {
vpcmpgtw xmm0, xmm0, globalmember
vpxor xmm0, xmm0, [cons$short8.mask4]
}
macro vles8_g globalmember* {
vpcmpgtw xmm0, xmm0, globalmember
vpxor xmm0, xmm0, [cons$short8.mask8]
}
macro vlei_g globalmember* {
cmp dsc0, globalmember
setnle bsc0
dec bsc0
movsx dsc0, bsc0
}
macro vlei2_g globalmember* {
vpcmpgtd xmm0, xmm0, globalmember
vpxor xmm0, xmm0, [cons$int8.mask2]
}
macro vlei4_g globalmember* {
vpcmpgtd xmm0, xmm0, globalmember
vpxor xmm0, xmm0, [cons$int8.mask4]
}
macro vlei8_g globalmember* {
vpcmpgtd ymm0, ymm0, globalmember
vpxor ymm0, ymm0, [cons$int8.mask8]
}
macro vlel_g globalmember* {
cmp qsc0, globalmember
setnle bsc0
dec bsc0
movsx qsc0, bsc0
}
macro vlel2_g globalmember* {
vpcmpgtq xmm0, xmm0, globalmember
vpxor xmm0, xmm0, [cons$long8.mask2]
}
macro vlel4_g globalmember* {
vpcmpgtq ymm0, ymm0, globalmember
vpxor ymm0, ymm0, [cons$long8.mask4]
}
macro vlel8_g globalmember* {
vpcmpgtq msk1, zmm0, globalmember
knotw msk1, msk1
vmovdqa64 zmm0\{k1\}\{z\}, [cons$long8.m1]
}
; </fold>
; </fold>