;
; Реализация среды исполнения языка программирования
; Объектно-ориентированный продвинутый векторный транслятор
;
; Copyright © 2021, 2024 Малик Разработчик
;
; Это свободная программа: вы можете перераспространять ее и/или изменять
; ее на условиях Меньшей Стандартной общественной лицензии GNU в том виде,
; в каком она была опубликована Фондом свободного программного обеспечения;
; либо версии 3 лицензии, либо (по вашему выбору) любой более поздней версии.
;
; Эта программа распространяется в надежде, что она будет полезной,
; но БЕЗО ВСЯКИХ ГАРАНТИЙ; даже без неявной гарантии ТОВАРНОГО ВИДА
; или ПРИГОДНОСТИ ДЛЯ ОПРЕДЕЛЕННЫХ ЦЕЛЕЙ. Подробнее см. в Меньшей Стандартной
; общественной лицензии GNU.
;
; Вы должны были получить копию Меньшей Стандартной общественной лицензии GNU
; вместе с этой программой. Если это не так, см.
; <https://www.gnu.org/licenses/>.
;
; <fold векторное умножение>
; <fold приватные макросы — должны использоваться только этим текстом исходного кода>
macro _mulvb {
vpmovsxbw xmm0, xmm0
vpmullw xmm0, xmm0, xmm1
vpand xmm0, xmm0, [cons$short8.$00ff]
vpackuswb xmm0, xmm0, [cons$zero]
}
; </fold>
; <fold первый операнд — на стаке, второй операнд — на аккумуляторе, результат — на аккумуляторе>
macro vmuld {
smuld
}
macro vmuld2 {
vmulpd xmm0, xmm0, [rsp+$00]
__pop $01
}
macro vmuld4 {
vmovdqu ymm1, [rsp+$00]
vmulpd ymm0, ymm1, ymm0
__cltag_y $00
__pop $02
}
macro vmuld8 {
vmovdqu64 zmm1, [rsp+$00]
vmulpd zmm0, zmm1, zmm0
__cltag_z $00
__pop $04
}
macro vmulf {
smulf
}
macro vmulf2 {
vmulps xmm0, xmm0, [rsp+$00]
__pop $01
}
macro vmulf4 {
vmulps xmm0, xmm0, [rsp+$00]
__pop $01
}
macro vmulf8 {
vmovdqu ymm1, [rsp+$00]
vmulps ymm0, ymm1, ymm0
__cltag_y $00
__pop $02
}
macro vmulb {
imul dsc0, [rsp+$00]
movsx dsc0, bsc0
__pop $01
}
macro vmulb2 {
vpmovsxbw xmm1, [rsp+$00]
_mulvb
__pop $01
}
macro vmulb4 {
vpmovsxbw xmm1, [rsp+$00]
_mulvb
__pop $01
}
macro vmulb8 {
vpmovsxbw xmm1, [rsp+$00]
_mulvb
__pop $01
}
macro vmuls {
imul dsc0, [rsp+$00]
movsx dsc0, wsc0
__pop $01
}
macro vmuls2 {
vpmullw xmm0, xmm0, [rsp+$00]
__pop $01
}
macro vmuls4 {
vpmullw xmm0, xmm0, [rsp+$00]
__pop $01
}
macro vmuls8 {
vpmullw xmm0, xmm0, [rsp+$00]
__pop $01
}
macro vmuli {
smuli
}
macro vmuli2 {
vpmulld xmm0, xmm0, [rsp+$00]
__pop $01
}
macro vmuli4 {
vpmulld xmm0, xmm0, [rsp+$00]
__pop $01
}
macro vmuli8 {
vmovdqu ymm1, [rsp+$00]
vpmulld ymm0, ymm1, ymm0
__cltag_y $00
__pop $02
}
macro vmull {
smull
}
macro vmull2 {
vpmullq xmm0, xmm0, [rsp+$00]
__pop $01
}
macro vmull4 {
vmovdqu ymm1, [rsp+$00]
vpmullq ymm0, ymm1, ymm0
__cltag_y $00
__pop $02
}
macro vmull8 {
vmovdqu64 zmm1, [rsp+$00]
vpmullq zmm0, zmm1, zmm0
__cltag_z $00
__pop $04
}
; </fold>
; <fold первый операнд — на стаке, второй операнд — на аккумуляторе, результат — на стаке>
macro vmuld_p {
smuld_p
}
macro vmuld2_p {
vmulpd xmm0, xmm0, [rsp+$00]
vmovdqa xword [rsp+$00], xmm0
}
macro vmuld4_p {
vmovdqu ymm1, [rsp+$00]
vmulpd ymm0, ymm1, ymm0
vmovdqu yword [rsp+$00], ymm0
}
macro vmuld8_p {
vmovdqu64 zmm1, [rsp+$00]
vmulpd zmm0, zmm1, zmm0
vmovdqu64 zword [rsp+$00], zmm0
}
macro vmulf_p {
smulf_p
}
macro vmulf2_p {
vmulps xmm0, xmm0, [rsp+$00]
vmovdqa xword [rsp+$00], xmm0
}
macro vmulf4_p {
vmulps xmm0, xmm0, [rsp+$00]
vmovdqa xword [rsp+$00], xmm0
}
macro vmulf8_p {
vmovdqu ymm1, [rsp+$00]
vmulps ymm0, ymm1, ymm0
vmovdqu yword [rsp+$00], ymm0
}
macro vmulb_p {
imul dsc0, [rsp+$00]
movsx dsc0, bsc0
mov dword [rsp+$00], dsc0
}
macro vmulb2_p {
vpmovsxbw xmm1, [rsp+$00]
_mulvb
vmovdqa xword [rsp+$00], xmm0
}
macro vmulb4_p {
vpmovsxbw xmm1, [rsp+$00]
_mulvb
vmovdqa xword [rsp+$00], xmm0
}
macro vmulb8_p {
vpmovsxbw xmm1, [rsp+$00]
_mulvb
vmovdqa xword [rsp+$00], xmm0
}
macro vmuls_p {
imul dsc0, [rsp+$00]
movsx dsc0, wsc0
mov dword [rsp+$00], dsc0
}
macro vmuls2_p {
vpmullw xmm0, xmm0, [rsp+$00]
vmovdqa xword [rsp+$00], xmm0
}
macro vmuls4_p {
vpmullw xmm0, xmm0, [rsp+$00]
vmovdqa xword [rsp+$00], xmm0
}
macro vmuls8_p {
vpmullw xmm0, xmm0, [rsp+$00]
vmovdqa xword [rsp+$00], xmm0
}
macro vmuli_p {
smuli_p
}
macro vmuli2_p {
vpmulld xmm0, xmm0, [rsp+$00]
vmovdqa xword [rsp+$00], xmm0
}
macro vmuli4_p {
vpmulld xmm0, xmm0, [rsp+$00]
vmovdqa xword [rsp+$00], xmm0
}
macro vmuli8_p {
vmovdqu ymm1, [rsp+$00]
vpmulld ymm0, ymm1, ymm0
vmovdqu yword [rsp+$00], ymm0
}
macro vmull_p {
smull_p
}
macro vmull2_p {
vpmullq xmm0, xmm0, [rsp+$00]
vmovdqa xword [rsp+$00], xmm0
}
macro vmull4_p {
vmovdqu ymm1, [rsp+$00]
vpmullq ymm0, ymm1, ymm0
vmovdqu yword [rsp+$00], ymm0
}
macro vmull8_p {
vmovdqu64 zmm1, [rsp+$00]
vpmullq zmm0, zmm1, zmm0
vmovdqu64 zword [rsp+$00], zmm0
}
; </fold>
; <fold первый операнд — на аккумуляторе, второй операнд — локальная переменная, результат — на аккумуляторе>
macro vmuld_l localvarName* {
smuld_l localvarName
}
macro vmuld2_l localvarName* {
vmulpd xmm0, xmm0, [.#localvarName]
}
macro vmuld4_l localvarName* {
vmovdqu ymm1, [.#localvarName]
vmulpd ymm0, ymm0, ymm1
}
macro vmuld8_l localvarName* {
vmovdqu64 zmm1, [.#localvarName]
vmulpd zmm0, zmm0, zmm1
}
macro vmulf_l localvarName* {
smulf_l localvarName
}
macro vmulf2_l localvarName* {
vmulps xmm0, xmm0, [.#localvarName]
}
macro vmulf4_l localvarName* {
vmulps xmm0, xmm0, [.#localvarName]
}
macro vmulf8_l localvarName* {
vmovdqu ymm1, [.#localvarName]
vmulps ymm0, ymm0, ymm1
}
macro vmulb_l localvarName* {
smuli_l localvarName
movsx dsc0, bsc0
}
macro vmulb2_l localvarName* {
vpmovsxbw xmm1, [.#localvarName]
_mulvb
}
macro vmulb4_l localvarName* {
vpmovsxbw xmm1, [.#localvarName]
_mulvb
}
macro vmulb8_l localvarName* {
vpmovsxbw xmm1, [.#localvarName]
_mulvb
}
macro vmuls_l localvarName* {
smuli_l localvarName
movsx dsc0, wsc0
}
macro vmuls2_l localvarName* {
vpmullw xmm0, xmm0, [.#localvarName]
}
macro vmuls4_l localvarName* {
vpmullw xmm0, xmm0, [.#localvarName]
}
macro vmuls8_l localvarName* {
vpmullw xmm0, xmm0, [.#localvarName]
}
macro vmuli_l localvarName* {
smuli_l localvarName
}
macro vmuli2_l localvarName* {
vpmulld xmm0, xmm0, [.#localvarName]
}
macro vmuli4_l localvarName* {
vpmulld xmm0, xmm0, [.#localvarName]
}
macro vmuli8_l localvarName* {
vmovdqu ymm1, [.#localvarName]
vpmulld ymm0, ymm0, ymm1
}
macro vmull_l localvarName* {
smull_l localvarName
}
macro vmull2_l localvarName* {
vpmullq xmm0, xmm0, [.#localvarName]
}
macro vmull4_l localvarName* {
vmovdqu ymm1, [.#localvarName]
vpmullq ymm0, ymm0, ymm1
}
macro vmull8_l localvarName* {
vmovdqu64 zmm1, [.#localvarName]
vpmullq zmm0, zmm0, zmm1
}
; </fold>
; <fold первый операнд — на аккумуляторе, второй операнд — глобальный член, результат — на аккумуляторе>
macro vmuld_g globalmember* {
smuld_g globalmember
}
macro vmuld2_g globalmember* {
vmulpd xmm0, xmm0, globalmember
}
macro vmuld4_g globalmember* {
vmulpd ymm0, ymm0, globalmember
}
macro vmuld8_g globalmember* {
vmulpd zmm0, zmm0, globalmember
}
macro vmulf_g globalmember* {
smulf_g globalmember
}
macro vmulf2_g globalmember* {
vmulps xmm0, xmm0, globalmember
}
macro vmulf4_g globalmember* {
vmulps xmm0, xmm0, globalmember
}
macro vmulf8_g globalmember* {
vmulps ymm0, ymm0, globalmember
}
macro vmulb_g globalmember* {
smuli_g globalmember
movsx dsc0, bsc0
}
macro vmulb2_g globalmember* {
vpmovsxbw xmm1, globalmember
_mulvb
}
macro vmulb4_g globalmember* {
vpmovsxbw xmm1, globalmember
_mulvb
}
macro vmulb8_g globalmember* {
vpmovsxbw xmm1, globalmember
_mulvb
}
macro vmuls_g globalmember* {
smuli_g globalmember
movsx dsc0, wsc0
}
macro vmuls2_g globalmember* {
vpmullw xmm0, xmm0, globalmember
}
macro vmuls4_g globalmember* {
vpmullw xmm0, xmm0, globalmember
}
macro vmuls8_g globalmember* {
vpmullw xmm0, xmm0, globalmember
}
macro vmuli_g globalmember* {
smuli_g globalmember
}
macro vmuli2_g globalmember* {
vpmulld xmm0, xmm0, globalmember
}
macro vmuli4_g globalmember* {
vpmulld xmm0, xmm0, globalmember
}
macro vmuli8_g globalmember* {
vpmulld ymm0, ymm0, globalmember
}
macro vmull_g globalmember* {
smull_g globalmember
}
macro vmull2_g globalmember* {
vpmullq xmm0, xmm0, globalmember
}
macro vmull4_g globalmember* {
vpmullq ymm0, ymm0, globalmember
}
macro vmull8_g globalmember* {
vpmullq zmm0, zmm0, globalmember
}
; </fold>
; </fold>