Add x86 implemention for SIMD iadd

2019-09-11 10:58:21 -07:00
parent cd426cb7bc
commit 766cf8ddfd
3 changed files with 65 additions and 4 deletions
--- a/cranelift/codegen/meta/src/isa/x86/encodings.rs
+++ b/cranelift/codegen/meta/src/isa/x86/encodings.rs
@@ -1999,6 +1999,17 @@ pub(crate) fn define(
        e.enc_32_64(bound_regmove, rec_frmov.opcodes(vec![0x0f, 0x28]));
    }
    // SIMD integer addition
    for (ty, opcodes) in &[
        (I8, &[0x66, 0x0f, 0xfc]),  // PADDB from SSE2
        (I16, &[0x66, 0x0f, 0xfd]), // PADDW from SSE2
        (I32, &[0x66, 0x0f, 0xfe]), // PADDD from SSE2
        (I64, &[0x66, 0x0f, 0xd4]), // PADDQ from SSE2
    ] {
        let iadd = iadd.bind_vector_from_lane(ty.clone(), sse_vector_size);
        e.enc_32_64(iadd, rec_fa.opcodes(opcodes.to_vec()));
    }
    // Reference type instructions
    // Null references implemented as iconst 0.
--- a/cranelift/filetests/filetests/isa/x86/iadd-simd.clif
+++ b/cranelift/filetests/filetests/isa/x86/iadd-simd.clif
@@ -0,0 +1,50 @@
 test run
 test binemit
 set enable_simd
 target x86_64 skylake
 function %iadd_i32x4() -> b1 {
 ebb0:
 [-, %xmm0]    v0 = vconst.i32x4 [1 1 1 1]
 [-, %xmm1]    v1 = vconst.i32x4 [1 2 3 4]
 [-, %xmm0]    v2 = iadd v0, v1      ; bin: 66 0f fe c1
    v3 = extractlane v2, 0
    v4 = icmp_imm eq v3, 2
    v5 = extractlane v2, 3
    v6 = icmp_imm eq v5, 5
    ; TODO replace extractlanes with vector comparison
    v7 = band v4, v6
    return v7
 }
 ; run
 function %iadd_i8x16_with_overflow() -> b1 {
 ebb0:
 [-, %xmm0]    v0 = vconst.i8x16 [255 255 255 255 255 255 255 255 255 255 255 255 255 255 255 255]
 [-, %xmm7]    v1 = vconst.i8x16 [2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2]
 [-, %xmm0]    v2 = iadd v0, v1      ; bin: 66 0f fc c7
    v3 = extractlane v2, 0
    v4 = icmp_imm eq v3, 1
    ; TODO replace extractlane with vector comparison
    return v4
 }
 ; run
 function %iadd_i16x8(i16x8, i16x8) -> i16x8 {
 ebb0(v0: i16x8 [%xmm1], v1: i16x8 [%xmm2]):
 [-, %xmm1]  v2 = iadd v0, v1      ; bin: 66 0f fd ca
            return v2
 }
 function %iadd_i64x2(i64x2, i64x2) -> i64x2 {
 ebb0(v0: i64x2 [%xmm3], v1: i64x2 [%xmm4]):
 [-, %xmm3]  v2 = iadd v0, v1      ; bin: 66 0f d4 dc
            return v2
 }
--- a/cranelift/wasm/src/code_translator.rs
+++ b/cranelift/wasm/src/code_translator.rs
@@ -986,6 +986,10 @@ pub fn translate_operator<FE: FuncEnvironment + ?Sized>(
            // to WASM using the less specific v128 type for certain operations and more specific
            // types (e.g. i8x16) for others.
        }
        Operator::I8x16Add | Operator::I16x8Add | Operator::I32x4Add | Operator::I64x2Add => {
            let (a, b) = state.pop2();
            state.push1(builder.ins().iadd(a, b))
        }
        Operator::V128Load { .. }
        | Operator::V128Store { .. }
        | Operator::I8x16Eq
@@ -1041,7 +1045,6 @@ pub fn translate_operator<FE: FuncEnvironment + ?Sized>(
        | Operator::I8x16Shl
        | Operator::I8x16ShrS
        | Operator::I8x16ShrU
        | Operator::I8x16Add
        | Operator::I8x16AddSaturateS
        | Operator::I8x16AddSaturateU
        | Operator::I8x16Sub
@@ -1054,7 +1057,6 @@ pub fn translate_operator<FE: FuncEnvironment + ?Sized>(
        | Operator::I16x8Shl
        | Operator::I16x8ShrS
        | Operator::I16x8ShrU
        | Operator::I16x8Add
        | Operator::I16x8AddSaturateS
        | Operator::I16x8AddSaturateU
        | Operator::I16x8Sub
@@ -1067,7 +1069,6 @@ pub fn translate_operator<FE: FuncEnvironment + ?Sized>(
        | Operator::I32x4Shl
        | Operator::I32x4ShrS
        | Operator::I32x4ShrU
        | Operator::I32x4Add
        | Operator::I32x4Sub
        | Operator::I32x4Mul
        | Operator::I64x2Neg
@@ -1076,7 +1077,6 @@ pub fn translate_operator<FE: FuncEnvironment + ?Sized>(
        | Operator::I64x2Shl
        | Operator::I64x2ShrS
        | Operator::I64x2ShrU
        | Operator::I64x2Add
        | Operator::I64x2Sub
        | Operator::F32x4Abs
        | Operator::F32x4Neg