vector.mul.inc

Переключить прокрутку окна
Загрузить этот исходный код

;
  ; Реализация среды исполнения языка программирования
  ; Объектно-ориентированный продвинутый векторный транслятор
  ;
  ; Copyright © 2021, 2024 Малик Разработчик
  ;
  ; Это свободная программа: вы можете перераспространять ее и/или изменять
  ; ее на условиях Меньшей Стандартной общественной лицензии GNU в том виде,
  ; в каком она была опубликована Фондом свободного программного обеспечения;
  ; либо версии 3 лицензии, либо (по вашему выбору) любой более поздней версии.
  ;
  ; Эта программа распространяется в надежде, что она будет полезной,
  ; но БЕЗО ВСЯКИХ ГАРАНТИЙ; даже без неявной гарантии ТОВАРНОГО ВИДА
  ; или ПРИГОДНОСТИ ДЛЯ ОПРЕДЕЛЕННЫХ ЦЕЛЕЙ. Подробнее см. в Меньшей Стандартной
  ; общественной лицензии GNU.
  ;
  ; Вы должны были получить копию Меньшей Стандартной общественной лицензии GNU
  ; вместе с этой программой. Если это не так, см.
  ; <https://www.gnu.org/licenses/>.
;

; <fold векторное умножение>
    ; <fold приватные макросы — должны использоваться только этим текстом исходного кода>
        macro _mulvb {
                        vpmovsxbw   xmm0, xmm0
                        vpmullw     xmm0, xmm0, xmm1
                        vpand       xmm0, xmm0, [cons$short8.$00ff]
                        vpackuswb   xmm0, xmm0, [cons$zero]
        }
    ; </fold>

    ; <fold первый операнд — на стаке, второй операнд — на аккумуляторе, результат — на аккумуляторе>
        macro vmuld {
                        smuld
        }

        macro vmuld2 {
                        vmulpd      xmm0, xmm0, [rsp+$00]
                        __pop       $01
        }

        macro vmuld4 {
                        vmovdqu     ymm1, [rsp+$00]
                        vmulpd      ymm0, ymm1, ymm0
                        __cltag_y   $00
                        __pop       $02
        }

        macro vmuld8 {
                        vmovdqu64   zmm1, [rsp+$00]
                        vmulpd      zmm0, zmm1, zmm0
                        __cltag_z   $00
                        __pop       $04
        }

        macro vmulf {
                        smulf
        }

        macro vmulf2 {
                        vmulps      xmm0, xmm0, [rsp+$00]
                        __pop       $01
        }

        macro vmulf4 {
                        vmulps      xmm0, xmm0, [rsp+$00]
                        __pop       $01
        }

        macro vmulf8 {
                        vmovdqu     ymm1, [rsp+$00]
                        vmulps      ymm0, ymm1, ymm0
                        __cltag_y   $00
                        __pop       $02
        }

        macro vmulb {
                        imul        dsc0, [rsp+$00]
                        movsx       dsc0, bsc0
                        __pop       $01
        }

        macro vmulb2 {
                        vpmovsxbw   xmm1, [rsp+$00]
                        _mulvb
                        __pop       $01
        }

        macro vmulb4 {
                        vpmovsxbw   xmm1, [rsp+$00]
                        _mulvb
                        __pop       $01
        }

        macro vmulb8 {
                        vpmovsxbw   xmm1, [rsp+$00]
                        _mulvb
                        __pop       $01
        }

        macro vmuls {
                        imul        dsc0, [rsp+$00]
                        movsx       dsc0, wsc0
                        __pop       $01
        }

        macro vmuls2 {
                        vpmullw     xmm0, xmm0, [rsp+$00]
                        __pop       $01
        }

        macro vmuls4 {
                        vpmullw     xmm0, xmm0, [rsp+$00]
                        __pop       $01
        }

        macro vmuls8 {
                        vpmullw     xmm0, xmm0, [rsp+$00]
                        __pop       $01
        }

        macro vmuli {
                        smuli
        }

        macro vmuli2 {
                        vpmulld     xmm0, xmm0, [rsp+$00]
                        __pop       $01
        }

        macro vmuli4 {
                        vpmulld     xmm0, xmm0, [rsp+$00]
                        __pop       $01
        }

        macro vmuli8 {
                        vmovdqu     ymm1, [rsp+$00]
                        vpmulld     ymm0, ymm1, ymm0
                        __cltag_y   $00
                        __pop       $02
        }

        macro vmull {
                        smull
        }

        macro vmull2 {
                        vpmullq     xmm0, xmm0, [rsp+$00]
                        __pop       $01
        }

        macro vmull4 {
                        vmovdqu     ymm1, [rsp+$00]
                        vpmullq     ymm0, ymm1, ymm0
                        __cltag_y   $00
                        __pop       $02
        }

        macro vmull8 {
                        vmovdqu64   zmm1, [rsp+$00]
                        vpmullq     zmm0, zmm1, zmm0
                        __cltag_z   $00
                        __pop       $04
        }
    ; </fold>

    ; <fold первый операнд — на стаке, второй операнд — на аккумуляторе, результат — на стаке>
        macro vmuld_p {
                        smuld_p
        }

        macro vmuld2_p {
                        vmulpd      xmm0, xmm0, [rsp+$00]
                        vmovdqa     xword [rsp+$00], xmm0
        }

        macro vmuld4_p {
                        vmovdqu     ymm1, [rsp+$00]
                        vmulpd      ymm0, ymm1, ymm0
                        vmovdqu     yword [rsp+$00], ymm0
        }

        macro vmuld8_p {
                        vmovdqu64   zmm1, [rsp+$00]
                        vmulpd      zmm0, zmm1, zmm0
                        vmovdqu64   zword [rsp+$00], zmm0
        }

        macro vmulf_p {
                        smulf_p
        }

        macro vmulf2_p {
                        vmulps      xmm0, xmm0, [rsp+$00]
                        vmovdqa     xword [rsp+$00], xmm0
        }

        macro vmulf4_p {
                        vmulps      xmm0, xmm0, [rsp+$00]
                        vmovdqa     xword [rsp+$00], xmm0
        }

        macro vmulf8_p {
                        vmovdqu     ymm1, [rsp+$00]
                        vmulps      ymm0, ymm1, ymm0
                        vmovdqu     yword [rsp+$00], ymm0
        }

        macro vmulb_p {
                        imul        dsc0, [rsp+$00]
                        movsx       dsc0, bsc0
                        mov         dword [rsp+$00], dsc0
        }

        macro vmulb2_p {
                        vpmovsxbw   xmm1, [rsp+$00]
                        _mulvb
                        vmovdqa     xword [rsp+$00], xmm0
        }

        macro vmulb4_p {
                        vpmovsxbw   xmm1, [rsp+$00]
                        _mulvb
                        vmovdqa     xword [rsp+$00], xmm0
        }

        macro vmulb8_p {
                        vpmovsxbw   xmm1, [rsp+$00]
                        _mulvb
                        vmovdqa     xword [rsp+$00], xmm0
        }

        macro vmuls_p {
                        imul        dsc0, [rsp+$00]
                        movsx       dsc0, wsc0
                        mov         dword [rsp+$00], dsc0
        }

        macro vmuls2_p {
                        vpmullw     xmm0, xmm0, [rsp+$00]
                        vmovdqa     xword [rsp+$00], xmm0
        }

        macro vmuls4_p {
                        vpmullw     xmm0, xmm0, [rsp+$00]
                        vmovdqa     xword [rsp+$00], xmm0
        }

        macro vmuls8_p {
                        vpmullw     xmm0, xmm0, [rsp+$00]
                        vmovdqa     xword [rsp+$00], xmm0
        }

        macro vmuli_p {
                        smuli_p
        }

        macro vmuli2_p {
                        vpmulld     xmm0, xmm0, [rsp+$00]
                        vmovdqa     xword [rsp+$00], xmm0
        }

        macro vmuli4_p {
                        vpmulld     xmm0, xmm0, [rsp+$00]
                        vmovdqa     xword [rsp+$00], xmm0
        }

        macro vmuli8_p {
                        vmovdqu     ymm1, [rsp+$00]
                        vpmulld     ymm0, ymm1, ymm0
                        vmovdqu     yword [rsp+$00], ymm0
        }

        macro vmull_p {
                        smull_p
        }

        macro vmull2_p {
                        vpmullq     xmm0, xmm0, [rsp+$00]
                        vmovdqa     xword [rsp+$00], xmm0
        }

        macro vmull4_p {
                        vmovdqu     ymm1, [rsp+$00]
                        vpmullq     ymm0, ymm1, ymm0
                        vmovdqu     yword [rsp+$00], ymm0
        }

        macro vmull8_p {
                        vmovdqu64   zmm1, [rsp+$00]
                        vpmullq     zmm0, zmm1, zmm0
                        vmovdqu64   zword [rsp+$00], zmm0
        }
    ; </fold>

    ; <fold первый операнд — на аккумуляторе, второй операнд — локальная переменная, результат — на аккумуляторе>
        macro vmuld_l localvarName* {
                        smuld_l     localvarName
        }

        macro vmuld2_l localvarName* {
                        vmulpd      xmm0, xmm0, [.#localvarName]
        }

        macro vmuld4_l localvarName* {
                        vmovdqu     ymm1, [.#localvarName]
                        vmulpd      ymm0, ymm0, ymm1
        }

        macro vmuld8_l localvarName* {
                        vmovdqu64   zmm1, [.#localvarName]
                        vmulpd      zmm0, zmm0, zmm1
        }

        macro vmulf_l localvarName* {
                        smulf_l     localvarName
        }

        macro vmulf2_l localvarName* {
                        vmulps      xmm0, xmm0, [.#localvarName]
        }

        macro vmulf4_l localvarName* {
                        vmulps      xmm0, xmm0, [.#localvarName]
        }

        macro vmulf8_l localvarName* {
                        vmovdqu     ymm1, [.#localvarName]
                        vmulps      ymm0, ymm0, ymm1
        }

        macro vmulb_l localvarName* {
                        smuli_l     localvarName
                        movsx       dsc0, bsc0
        }

        macro vmulb2_l localvarName* {
                        vpmovsxbw   xmm1, [.#localvarName]
                        _mulvb
        }

        macro vmulb4_l localvarName* {
                        vpmovsxbw   xmm1, [.#localvarName]
                        _mulvb
        }

        macro vmulb8_l localvarName* {
                        vpmovsxbw   xmm1, [.#localvarName]
                        _mulvb
        }

        macro vmuls_l localvarName* {
                        smuli_l     localvarName
                        movsx       dsc0, wsc0
        }

        macro vmuls2_l localvarName* {
                        vpmullw     xmm0, xmm0, [.#localvarName]
        }

        macro vmuls4_l localvarName* {
                        vpmullw     xmm0, xmm0, [.#localvarName]
        }

        macro vmuls8_l localvarName* {
                        vpmullw     xmm0, xmm0, [.#localvarName]
        }

        macro vmuli_l localvarName* {
                        smuli_l     localvarName
        }

        macro vmuli2_l localvarName* {
                        vpmulld     xmm0, xmm0, [.#localvarName]
        }

        macro vmuli4_l localvarName* {
                        vpmulld     xmm0, xmm0, [.#localvarName]
        }

        macro vmuli8_l localvarName* {
                        vmovdqu     ymm1, [.#localvarName]
                        vpmulld     ymm0, ymm0, ymm1
        }

        macro vmull_l localvarName* {
                        smull_l     localvarName
        }

        macro vmull2_l localvarName* {
                        vpmullq     xmm0, xmm0, [.#localvarName]
        }

        macro vmull4_l localvarName* {
                        vmovdqu     ymm1, [.#localvarName]
                        vpmullq     ymm0, ymm0, ymm1
        }

        macro vmull8_l localvarName* {
                        vmovdqu64   zmm1, [.#localvarName]
                        vpmullq     zmm0, zmm0, zmm1
        }
    ; </fold>

    ; <fold первый операнд — на аккумуляторе, второй операнд — глобальный член, результат — на аккумуляторе>
        macro vmuld_g globalmember* {
                        smuld_g     globalmember
        }

        macro vmuld2_g globalmember* {
                        vmulpd      xmm0, xmm0, globalmember
        }

        macro vmuld4_g globalmember* {
                        vmulpd      ymm0, ymm0, globalmember
        }

        macro vmuld8_g globalmember* {
                        vmulpd      zmm0, zmm0, globalmember
        }

        macro vmulf_g globalmember* {
                        smulf_g     globalmember
        }

        macro vmulf2_g globalmember* {
                        vmulps      xmm0, xmm0, globalmember
        }

        macro vmulf4_g globalmember* {
                        vmulps      xmm0, xmm0, globalmember
        }

        macro vmulf8_g globalmember* {
                        vmulps      ymm0, ymm0, globalmember
        }

        macro vmulb_g globalmember* {
                        smuli_g     globalmember
                        movsx       dsc0, bsc0
        }

        macro vmulb2_g globalmember* {
                        vpmovsxbw   xmm1, globalmember
                        _mulvb
        }

        macro vmulb4_g globalmember* {
                        vpmovsxbw   xmm1, globalmember
                        _mulvb
        }

        macro vmulb8_g globalmember* {
                        vpmovsxbw   xmm1, globalmember
                        _mulvb
        }

        macro vmuls_g globalmember* {
                        smuli_g     globalmember
                        movsx       dsc0, wsc0
        }

        macro vmuls2_g globalmember* {
                        vpmullw     xmm0, xmm0, globalmember
        }

        macro vmuls4_g globalmember* {
                        vpmullw     xmm0, xmm0, globalmember
        }

        macro vmuls8_g globalmember* {
                        vpmullw     xmm0, xmm0, globalmember
        }

        macro vmuli_g globalmember* {
                        smuli_g     globalmember
        }

        macro vmuli2_g globalmember* {
                        vpmulld     xmm0, xmm0, globalmember
        }

        macro vmuli4_g globalmember* {
                        vpmulld     xmm0, xmm0, globalmember
        }

        macro vmuli8_g globalmember* {
                        vpmulld     ymm0, ymm0, globalmember
        }

        macro vmull_g globalmember* {
                        smull_g     globalmember
        }

        macro vmull2_g globalmember* {
                        vpmullq     xmm0, xmm0, globalmember
        }

        macro vmull4_g globalmember* {
                        vpmullq     ymm0, ymm0, globalmember
        }

        macro vmull8_g globalmember* {
                        vpmullq     zmm0, zmm0, globalmember
        }
    ; </fold>
; </fold>