Add x86 SIMD floating-point arithmetic

2019-10-29 09:32:19 -07:00
parent 04db2a9f39
commit c8eb4e9612
4 changed files with 179 additions and 0 deletions
--- a/cranelift/filetests/filetests/isa/x86/simd-arithmetic-binemit.clif
+++ b/cranelift/filetests/filetests/isa/x86/simd-arithmetic-binemit.clif
@@ -173,3 +173,27 @@ ebb0:
 [-, %xmm3]    v3 = usub_sat v0, v1 ; bin: 66 0f d9 dd
    return
 }
+
+function %float_arithmetic_f32x4(f32x4, f32x4) {
+ebb0(v0: f32x4 [%xmm3], v1: f32x4 [%xmm5]):
+[-, %xmm3]    v2 = fadd v0, v1      ; bin: 40 0f 58 dd
+[-, %xmm3]    v3 = fsub v0, v1      ; bin: 40 0f 5c dd
+[-, %xmm3]    v4 = fmul v0, v1      ; bin: 40 0f 59 dd
+[-, %xmm3]    v5 = fdiv v0, v1      ; bin: 40 0f 5e dd
+[-, %xmm3]    v6 = fmin v0, v1      ; bin: 40 0f 5d dd
+[-, %xmm3]    v7 = fmax v0, v1      ; bin: 40 0f 5f dd
+[-, %xmm3]    v8 = sqrt v0          ; bin: 40 0f 51 db
+    return
+}
+
+function %float_arithmetic_f64x2(f64x2, f64x2) {
+ebb0(v0: f64x2 [%xmm3], v1: f64x2 [%xmm5]):
+[-, %xmm3]    v2 = fadd v0, v1      ; bin: 66 40 0f 58 dd
+[-, %xmm3]    v3 = fsub v0, v1      ; bin: 66 40 0f 5c dd
+[-, %xmm3]    v4 = fmul v0, v1      ; bin: 66 40 0f 59 dd
+[-, %xmm3]    v5 = fdiv v0, v1      ; bin: 66 40 0f 5e dd
+[-, %xmm3]    v6 = fmin v0, v1      ; bin: 66 40 0f 5d dd
+[-, %xmm3]    v7 = fmax v0, v1      ; bin: 66 40 0f 5f dd
+[-, %xmm3]    v8 = sqrt v0          ; bin: 66 40 0f 51 db
+    return
+}
--- a/cranelift/filetests/filetests/isa/x86/simd-arithmetic-run.clif
+++ b/cranelift/filetests/filetests/isa/x86/simd-arithmetic-run.clif
@@ -153,3 +153,77 @@ ebb0:
    return v8
 }
 ; run
+
+function %add_sub_f32x4() -> b1 {
+ebb0:
+    v0 = vconst.f32x4 [0x4.2 0.0 0.0 0.0]
+    v1 = vconst.f32x4 [0x1.0 0x1.0 0x1.0 0x1.0]
+    v2 = vconst.f32x4 [0x5.2 0x1.0 0x1.0 0x1.0]
+
+    v3 = fadd v0, v1
+    v4 = fcmp eq v3, v2
+
+    v6 = fsub v2, v1
+    v7 = fcmp eq v6, v0
+
+    v8 = band v4, v7
+    v9 = vall_true v8
+    return v9
+}
+; run
+
+function %mul_div_f32x4() -> b1 {
+ebb0:
+    v0 = vconst.f32x4 [0x4.2 -0x2.1 0x2.0 0.0]
+    v1 = vconst.f32x4 [0x3.4 0x6.7 0x8.9 0xa.b]
+    v2 = vconst.f32x4 [0xd.68 -0xd.47 0x11.2 0x0.0]
+
+    v3 = fmul v0, v1
+    v4 = fcmp eq v3, v2
+
+    v6 = fdiv v2, v1
+    v7 = fcmp eq v6, v0
+
+    v8 = band v4, v7
+    v9 = vall_true v8
+    return v9
+}
+; run
+
+function %sqrt_f64x2() -> b1 {
+ebb0:
+    v0 = vconst.f64x2 [0x9.0 0x1.0]
+    v1 = sqrt v0
+    v2 = vconst.f64x2 [0x3.0 0x1.0]
+    v3 = fcmp eq v2, v1
+    v4 = vall_true v3
+    return v4
+}
+; run
+
+function %fmax_f64x2() -> b1 {
+ebb0:
+    v0 = vconst.f64x2 [-0.0 -0x1.0]
+    v1 = vconst.f64x2 [+0.0 +0x1.0]
+
+    v2 = fmax v0, v1
+    v3 = fcmp eq v2, v1
+    v4 = vall_true v3
+
+    return v4
+}
+; run
+
+
+function %fmin_f64x2() -> b1 {
+ebb0:
+    v0 = vconst.f64x2 [-0x1.0 -0x1.0]
+    v1 = vconst.f64x2 [+0.0 +0x1.0]
+
+    v2 = fmin v0, v1
+    v3 = fcmp eq v2, v0
+    v4 = vall_true v3
+
+    return v4
+}
+; run