vector.le.inc

Переключить прокрутку окна
Загрузить этот исходный код

;
  ; Реализация среды исполнения языка программирования
  ; Объектно-ориентированный продвинутый векторный транслятор
  ;
  ; Copyright © 2021, 2024 Малик Разработчик
  ;
  ; Это свободная программа: вы можете перераспространять ее и/или изменять
  ; ее на условиях Меньшей Стандартной общественной лицензии GNU в том виде,
  ; в каком она была опубликована Фондом свободного программного обеспечения;
  ; либо версии 3 лицензии, либо (по вашему выбору) любой более поздней версии.
  ;
  ; Эта программа распространяется в надежде, что она будет полезной,
  ; но БЕЗО ВСЯКИХ ГАРАНТИЙ; даже без неявной гарантии ТОВАРНОГО ВИДА
  ; или ПРИГОДНОСТИ ДЛЯ ОПРЕДЕЛЕННЫХ ЦЕЛЕЙ. Подробнее см. в Меньшей Стандартной
  ; общественной лицензии GNU.
  ;
  ; Вы должны были получить копию Меньшей Стандартной общественной лицензии GNU
  ; вместе с этой программой. Если это не так, см.
  ; <https://www.gnu.org/licenses/>.
;

; <fold векторное меньше или равно>
    ; <fold первый операнд — на стаке, второй операнд — на аккумуляторе, результат — на аккумуляторе>
        macro vled {
                        vmovdqa     xmm1, [rsp+$00]
                        vcmpsd      xmm0, xmm1, xmm0, $02
                        vmovq       qsc0, xmm0
                        __pop       $01
        }

        macro vled2 {
                        vmovdqa     xmm1, [rsp+$00]
                        vcmppd      xmm0, xmm1, xmm0, $02
                        __pop       $01
        }

        macro vled4 {
                        vmovdqu     ymm1, [rsp+$00]
                        vcmppd      ymm0, ymm1, ymm0, $02
                        __cltag_y   $00
                        __pop       $02
        }

        macro vled8 {
                        vmovdqu64   zmm1, [rsp+$00]
                        vcmppd      msk1, zmm1, zmm0, $02
                        vmovdqa64   zmm0\{k1\}\{z\}, [cons$long8.m1]
                        __cltag_z   $00
                        __pop       $04
        }

        macro vlef {
                        vmovdqa     xmm1, [rsp+$00]
                        vcmpss      xmm0, xmm1, xmm0, $02
                        vmovd       dsc0, xmm0
                        __pop       $01
        }

        macro vlef2 {
                        vmovdqa     xmm1, [rsp+$00]
                        vcmpps      xmm0, xmm1, xmm0, $02
                        vpand       xmm0, xmm0, [cons$int8.mask2]
                        __pop       $01
        }

        macro vlef4 {
                        vmovdqa     xmm1, [rsp+$00]
                        vcmpps      xmm0, xmm1, xmm0, $02
                        __pop       $01
        }

        macro vlef8 {
                        vmovdqu     ymm1, [rsp+$00]
                        vcmpps      ymm0, ymm1, ymm0, $02
                        __cltag_y   $00
                        __pop       $02
        }

        macro vleb {
                        cmp         dword [rsp+$00], dsc0
                        setnle      bsc0
                        dec         bsc0
                        movsx       dsc0, bsc0
                        __pop       $01
        }

        macro vleb2 {
                        vmovdqa     xmm1, [rsp+$00]
                        vpcmpgtb    xmm0, xmm1, xmm0
                        vpxor       xmm0, xmm0, [cons$byte8.mask2]
                        __pop       $01
        }

        macro vleb4 {
                        vmovdqa     xmm1, [rsp+$00]
                        vpcmpgtb    xmm0, xmm1, xmm0
                        vpxor       xmm0, xmm0, [cons$byte8.mask4]
                        __pop       $01
        }

        macro vleb8 {
                        vmovdqa     xmm1, [rsp+$00]
                        vpcmpgtb    xmm0, xmm1, xmm0
                        vpxor       xmm0, xmm0, [cons$byte8.mask8]
                        __pop       $01
        }

        macro vles {
                        cmp         dword [rsp+$00], dsc0
                        setnle      bsc0
                        dec         bsc0
                        movsx       dsc0, bsc0
                        __pop       $01
        }

        macro vles2 {
                        vmovdqa     xmm1, [rsp+$00]
                        vpcmpgtw    xmm0, xmm1, xmm0
                        vpxor       xmm0, xmm0, [cons$short8.mask2]
                        __pop       $01
        }

        macro vles4 {
                        vmovdqa     xmm1, [rsp+$00]
                        vpcmpgtw    xmm0, xmm1, xmm0
                        vpxor       xmm0, xmm0, [cons$short8.mask4]
                        __pop       $01
        }

        macro vles8 {
                        vmovdqa     xmm1, [rsp+$00]
                        vpcmpgtw    xmm0, xmm1, xmm0
                        vpxor       xmm0, xmm0, [cons$short8.mask8]
                        __pop       $01
        }

        macro vlei {
                        cmp         dword [rsp+$00], dsc0
                        setnle      bsc0
                        dec         bsc0
                        movsx       dsc0, bsc0
                        __pop       $01
        }

        macro vlei2 {
                        vmovdqa     xmm1, [rsp+$00]
                        vpcmpgtd    xmm0, xmm1, xmm0
                        vpxor       xmm0, xmm0, [cons$int8.mask2]
                        __pop       $01
        }

        macro vlei4 {
                        vmovdqa     xmm1, [rsp+$00]
                        vpcmpgtd    xmm0, xmm1, xmm0
                        vpxor       xmm0, xmm0, [cons$int8.mask4]
                        __pop       $01
        }

        macro vlei8 {
                        vmovdqu     ymm1, [rsp+$00]
                        vpcmpgtd    ymm0, ymm1, ymm0
                        vpxor       ymm0, ymm0, [cons$int8.mask8]
                        __cltag_y   $00
                        __pop       $02
        }

        macro vlel {
                        cmp         qword [rsp+$00], qsc0
                        setnle      bsc0
                        dec         bsc0
                        movsx       qsc0, bsc0
                        __pop       $01
        }

        macro vlel2 {
                        vmovdqa     xmm1, [rsp+$00]
                        vpcmpgtq    xmm0, xmm1, xmm0
                        vpxor       xmm0, xmm0, [cons$long8.mask2]
                        __pop       $01
        }

        macro vlel4 {
                        vmovdqu     ymm1, [rsp+$00]
                        vpcmpgtq    ymm0, ymm1, ymm0
                        vpxor       ymm0, ymm0, [cons$long8.mask4]
                        __cltag_y   $00
                        __pop       $02
        }

        macro vlel8 {
                        vmovdqu64   zmm1, [rsp+$00]
                        vpcmpgtq    msk1, zmm1, zmm0
                        knotw       msk1, msk1
                        vmovdqa64   zmm0\{k1\}\{z\}, [cons$long8.m1]
                        __cltag_z   $00
                        __pop       $04
        }
    ; </fold>

    ; <fold первый операнд — на стаке, второй операнд — на аккумуляторе, результат — на стаке>
        macro vled_p {
                        vmovdqa     xmm1, [rsp+$00]
                        vcmpsd      xmm0, xmm1, xmm0, $02
                        vmovdqa     xword [rsp+$00], xmm0
        }

        macro vled2_p {
                        vmovdqa     xmm1, [rsp+$00]
                        vcmppd      xmm0, xmm1, xmm0, $02
                        vmovdqa     xword [rsp+$00], xmm0
        }

        macro vled4_p {
                        vmovdqu     ymm1, [rsp+$00]
                        vcmppd      ymm0, ymm1, ymm0, $02
                        vmovdqu     yword [rsp+$00], ymm0
                        __sttag_y   $00,  TAG_LONG4
        }

        macro vled8_p {
                        vmovdqu64   zmm1, [rsp+$00]
                        vcmppd      msk1, zmm1, zmm0, $02
                        vmovdqa64   zmm0\{k1\}\{z\}, [cons$long8.m1]
                        vmovdqu64   zword [rsp+$00], zmm0
                        __sttag_z   $00,  TAG_LONG8
        }

        macro vlef_p {
                        vmovdqa     xmm1, [rsp+$00]
                        vcmpss      xmm0, xmm1, xmm0, $02
                        vmovdqa     xword [rsp+$00], xmm0
        }

        macro vlef2_p {
                        vmovdqa     xmm1, [rsp+$00]
                        vcmpps      xmm0, xmm1, xmm0, $02
                        vpand       xmm0, xmm0, [cons$int8.mask2]
                        vmovdqa     xword [rsp+$00], xmm0
        }

        macro vlef4_p {
                        vmovdqa     xmm1, [rsp+$00]
                        vcmpps      xmm0, xmm1, xmm0, $02
                        vmovdqa     xword [rsp+$00], xmm0
        }

        macro vlef8_p {
                        vmovdqu     ymm1, [rsp+$00]
                        vcmpps      ymm0, ymm1, ymm0, $02
                        vmovdqu     yword [rsp+$00], ymm0
                        __sttag_y   $00,  TAG_INT8
        }

        macro vleb_p {
                        cmp         dword [rsp+$00], dsc0
                        setnle      bsc0
                        dec         bsc0
                        movsx       dsc0, bsc0
                        mov         dword [rsp+$00], dsc0
        }

        macro vleb2_p {
                        vmovdqa     xmm1, [rsp+$00]
                        vpcmpgtb    xmm0, xmm1, xmm0
                        vpxor       xmm0, xmm0, [cons$byte8.mask2]
                        vmovdqa     xword [rsp+$00], xmm0
        }

        macro vleb4_p {
                        vmovdqa     xmm1, [rsp+$00]
                        vpcmpgtb    xmm0, xmm1, xmm0
                        vpxor       xmm0, xmm0, [cons$byte8.mask4]
                        vmovdqa     xword [rsp+$00], xmm0
        }

        macro vleb8_p {
                        vmovdqa     xmm1, [rsp+$00]
                        vpcmpgtb    xmm0, xmm1, xmm0
                        vpxor       xmm0, xmm0, [cons$byte8.mask8]
                        vmovdqa     xword [rsp+$00], xmm0
        }

        macro vles_p {
                        cmp         dword [rsp+$00], dsc0
                        setnle      bsc0
                        dec         bsc0
                        movsx       dsc0, bsc0
                        mov         dword [rsp+$00], dsc0
        }

        macro vles2_p {
                        vmovdqa     xmm1, [rsp+$00]
                        vpcmpgtw    xmm0, xmm1, xmm0
                        vpxor       xmm0, xmm0, [cons$short8.mask2]
                        vmovdqa     xword [rsp+$00], xmm0
        }

        macro vles4_p {
                        vmovdqa     xmm1, [rsp+$00]
                        vpcmpgtw    xmm0, xmm1, xmm0
                        vpxor       xmm0, xmm0, [cons$short8.mask4]
                        vmovdqa     xword [rsp+$00], xmm0
        }

        macro vles8_p {
                        vmovdqa     xmm1, [rsp+$00]
                        vpcmpgtw    xmm0, xmm1, xmm0
                        vpxor       xmm0, xmm0, [cons$short8.mask8]
                        vmovdqa     xword [rsp+$00], xmm0
        }

        macro vlei_p {
                        cmp         dword [rsp+$00], dsc0
                        setnle      bsc0
                        dec         bsc0
                        movsx       dsc0, bsc0
                        mov         dword [rsp+$00], dsc0
        }

        macro vlei2_p {
                        vmovdqa     xmm1, [rsp+$00]
                        vpcmpgtd    xmm0, xmm1, xmm0
                        vpxor       xmm0, xmm0, [cons$int8.mask2]
                        vmovdqa     xword [rsp+$00], xmm0
        }

        macro vlei4_p {
                        vmovdqa     xmm1, [rsp+$00]
                        vpcmpgtd    xmm0, xmm1, xmm0
                        vpxor       xmm0, xmm0, [cons$int8.mask4]
                        vmovdqa     xword [rsp+$00], xmm0
        }

        macro vlei8_p {
                        vmovdqu     ymm1, [rsp+$00]
                        vpcmpgtd    ymm0, ymm1, ymm0
                        vpxor       ymm0, ymm0, [cons$int8.mask8]
                        vmovdqu     yword [rsp+$00], ymm0
        }

        macro vlel_p {
                        cmp         qword [rsp+$00], qsc0
                        setnle      bsc0
                        dec         bsc0
                        movsx       qsc0, bsc0
                        mov         qword [rsp+$00], qsc0
        }

        macro vlel2_p {
                        vmovdqa     xmm1, [rsp+$00]
                        vpcmpgtq    xmm0, xmm1, xmm0
                        vpxor       xmm0, xmm0, [cons$long8.mask2]
                        vmovdqa     xword [rsp+$00], xmm0
        }

        macro vlel4_p {
                        vmovdqu     ymm1, [rsp+$00]
                        vpcmpgtq    ymm0, ymm1, ymm0
                        vpxor       ymm0, ymm0, [cons$long8.mask4]
                        vmovdqu     yword [rsp+$00], ymm0
        }

        macro vlel8_p {
                        vmovdqu64   zmm1, [rsp+$00]
                        vpcmpgtq    msk1, zmm1, zmm0
                        knotw       msk1, msk1
                        vmovdqa64   zmm0\{k1\}\{z\}, [cons$long8.m1]
                        vmovdqu64   zword [rsp+$00], zmm0
        }
    ; </fold>

    ; <fold первый операнд — на аккумуляторе, второй операнд — локальная переменная, результат — на аккумуляторе>
        macro vled_l localvarName* {
                        vcmpsd      xmm0, xmm0, [.#localvarName], $02
                        vmovq       qsc0, xmm0
        }

        macro vled2_l localvarName* {
                        vcmppd      xmm0, xmm0, [.#localvarName], $02
        }

        macro vled4_l localvarName* {
                        vmovdqu     ymm1, [.#localvarName]
                        vcmppd      ymm0, ymm0, ymm1, $02
        }

        macro vled8_l localvarName* {
                        vmovdqu64   zmm1, [.#localvarName]
                        vcmppd      msk1, zmm0, zmm1, $02
                        vmovdqa64   zmm0\{k1\}\{z\}, [cons$long8.m1]
        }

        macro vlef_l localvarName* {
                        vcmpss      xmm0, xmm0, [.#localvarName], $02
                        vmovd       dsc0, xmm0
        }

        macro vlef2_l localvarName* {
                        vcmpps      xmm0, xmm0, [.#localvarName], $02
                        vpand       xmm0, xmm0, [cons$int8.mask2]
        }

        macro vlef4_l localvarName* {
                        vcmpps      xmm0, xmm0, [.#localvarName], $02
        }

        macro vlef8_l localvarName* {
                        vmovdqu     ymm1, [.#localvarName]
                        vcmpps      ymm0, ymm0, ymm1, $02
        }

        macro vleb_l localvarName* {
                        cmp         dsc0, [.#localvarName]
                        setnle      bsc0
                        dec         bsc0
                        movsx       dsc0, bsc0
        }

        macro vleb2_l localvarName* {
                        vpcmpgtb    xmm0, xmm0, [.#localvarName]
                        vpxor       xmm0, xmm0, [cons$byte8.mask2]
        }

        macro vleb4_l localvarName* {
                        vpcmpgtb    xmm0, xmm0, [.#localvarName]
                        vpxor       xmm0, xmm0, [cons$byte8.mask4]
        }

        macro vleb8_l localvarName* {
                        vpcmpgtb    xmm0, xmm0, [.#localvarName]
                        vpxor       xmm0, xmm0, [cons$byte8.mask8]
        }

        macro vles_l localvarName* {
                        cmp         dsc0, [.#localvarName]
                        setnle      bsc0
                        dec         bsc0
                        movsx       dsc0, bsc0
        }

        macro vles2_l localvarName* {
                        vpcmpgtw    xmm0, xmm0, [.#localvarName]
                        vpxor       xmm0, xmm0, [cons$short8.mask2]
        }

        macro vles4_l localvarName* {
                        vpcmpgtw    xmm0, xmm0, [.#localvarName]
                        vpxor       xmm0, xmm0, [cons$short8.mask4]
        }

        macro vles8_l localvarName* {
                        vpcmpgtw    xmm0, xmm0, [.#localvarName]
                        vpxor       xmm0, xmm0, [cons$short8.mask8]
        }

        macro vlei_l localvarName* {
                        cmp         dsc0, [.#localvarName]
                        setnle      bsc0
                        dec         bsc0
                        movsx       dsc0, bsc0
        }

        macro vlei2_l localvarName* {
                        vpcmpgtd    xmm0, xmm0, [.#localvarName]
                        vpxor       xmm0, xmm0, [cons$int8.mask2]
        }

        macro vlei4_l localvarName* {
                        vpcmpgtd    xmm0, xmm0, [.#localvarName]
                        vpxor       xmm0, xmm0, [cons$int8.mask4]
        }

        macro vlei8_l localvarName* {
                        vmovdqu     ymm1, [.#localvarName]
                        vpcmpgtd    ymm0, ymm0, ymm1
                        vpxor       ymm0, ymm0, [cons$int8.mask8]
        }

        macro vlel_l localvarName* {
                        cmp         qsc0, [.#localvarName]
                        setnle      bsc0
                        dec         bsc0
                        movsx       qsc0, bsc0
        }

        macro vlel2_l localvarName* {
                        vpcmpgtq    xmm0, xmm0, [.#localvarName]
                        vpxor       xmm0, xmm0, [cons$long8.mask2]
        }

        macro vlel4_l localvarName* {
                        vmovdqu     ymm1, [.#localvarName]
                        vpcmpgtq    ymm0, ymm0, ymm1
                        vpxor       ymm0, ymm0, [cons$long8.mask4]
        }

        macro vlel8_l localvarName* {
                        vmovdqu64   zmm1, [.#localvarName]
                        vpcmpgtq    msk1, zmm0, zmm1
                        knotw       msk1, msk1
                        vmovdqa64   zmm0\{k1\}\{z\}, [cons$long8.m1]
        }
    ; </fold>

    ; <fold первый операнд — на аккумуляторе, второй операнд — глобальный член, результат — на аккумуляторе>
        macro vled_g globalmember* {
                        vcmpsd      xmm0, xmm0, globalmember, $02
                        vmovq       qsc0, xmm0
        }

        macro vled2_g globalmember* {
                        vcmppd      xmm0, xmm0, globalmember, $02
        }

        macro vled4_g globalmember* {
                        vcmppd      ymm0, ymm0, globalmember, $02
        }

        macro vled8_g globalmember* {
                        vcmppd      msk1, zmm0, globalmember, $02
                        vmovdqa64   zmm0\{k1\}\{z\}, [cons$long8.m1]
        }

        macro vlef_g globalmember* {
                        vcmpss      xmm0, xmm0, globalmember, $02
                        vmovd       dsc0, xmm0
        }

        macro vlef2_g globalmember* {
                        vcmpps      xmm0, xmm0, globalmember, $02
                        vpand       xmm0, xmm0, [cons$int8.mask2]
        }

        macro vlef4_g globalmember* {
                        vcmpps      xmm0, xmm0, globalmember, $02
        }

        macro vlef8_g globalmember* {
                        vcmpps      ymm0, ymm0, globalmember, $02
        }

        macro vleb_g globalmember* {
                        cmp         dsc0, globalmember
                        setnle      bsc0
                        dec         bsc0
                        movsx       dsc0, bsc0
        }

        macro vleb2_g globalmember* {
                        vpcmpgtb    xmm0, xmm0, globalmember
                        vpxor       xmm0, xmm0, [cons$byte8.mask2]
        }

        macro vleb4_g globalmember* {
                        vpcmpgtb    xmm0, xmm0, globalmember
                        vpxor       xmm0, xmm0, [cons$byte8.mask4]
        }

        macro vleb8_g globalmember* {
                        vpcmpgtb    xmm0, xmm0, globalmember
                        vpxor       xmm0, xmm0, [cons$byte8.mask8]
        }

        macro vles_g globalmember* {
                        cmp         dsc0, globalmember
                        setnle      bsc0
                        dec         bsc0
                        movsx       dsc0, bsc0
        }

        macro vles2_g globalmember* {
                        vpcmpgtw    xmm0, xmm0, globalmember
                        vpxor       xmm0, xmm0, [cons$short8.mask2]
        }

        macro vles4_g globalmember* {
                        vpcmpgtw    xmm0, xmm0, globalmember
                        vpxor       xmm0, xmm0, [cons$short8.mask4]
        }

        macro vles8_g globalmember* {
                        vpcmpgtw    xmm0, xmm0, globalmember
                        vpxor       xmm0, xmm0, [cons$short8.mask8]
        }

        macro vlei_g globalmember* {
                        cmp         dsc0, globalmember
                        setnle      bsc0
                        dec         bsc0
                        movsx       dsc0, bsc0
        }

        macro vlei2_g globalmember* {
                        vpcmpgtd    xmm0, xmm0, globalmember
                        vpxor       xmm0, xmm0, [cons$int8.mask2]
        }

        macro vlei4_g globalmember* {
                        vpcmpgtd    xmm0, xmm0, globalmember
                        vpxor       xmm0, xmm0, [cons$int8.mask4]
        }

        macro vlei8_g globalmember* {
                        vpcmpgtd    ymm0, ymm0, globalmember
                        vpxor       ymm0, ymm0, [cons$int8.mask8]
        }

        macro vlel_g globalmember* {
                        cmp         qsc0, globalmember
                        setnle      bsc0
                        dec         bsc0
                        movsx       qsc0, bsc0
        }

        macro vlel2_g globalmember* {
                        vpcmpgtq    xmm0, xmm0, globalmember
                        vpxor       xmm0, xmm0, [cons$long8.mask2]
        }

        macro vlel4_g globalmember* {
                        vpcmpgtq    ymm0, ymm0, globalmember
                        vpxor       ymm0, ymm0, [cons$long8.mask4]
        }

        macro vlel8_g globalmember* {
                        vpcmpgtq    msk1, zmm0, globalmember
                        knotw       msk1, msk1
                        vmovdqa64   zmm0\{k1\}\{z\}, [cons$long8.m1]
        }
    ; </fold>
; </fold>