sycl: Use syclcompat::dp4a (llama/10267)

author Romain Biessy <redacted>

Fri, 15 Nov 2024 03:09:12 +0000 (04:09 +0100)

committer Georgi Gerganov <redacted>

Wed, 20 Nov 2024 19:00:08 +0000 (21:00 +0200)
author Romain Biessy <redacted>
Fri, 15 Nov 2024 03:09:12 +0000 (04:09 +0100)
committer Georgi Gerganov <redacted>
Wed, 20 Nov 2024 19:00:08 +0000 (21:00 +0200)
diff --git a/ggml/src/ggml-sycl/dpct/helper.hpp b/ggml/src/ggml-sycl/dpct/helper.hpp

index fe4a8f744e2e03cbacb6b34f5c8338ed17bd142c..c2f28bb49579e9877cfe0042eafd95b2ef2055fe 100644 (file)
--- a/ggml/src/ggml-sycl/dpct/helper.hpp
+++ b/ggml/src/ggml-sycl/dpct/helper.hpp
@@ -15,6 +15,7 @@
  
  #include <sycl/sycl.hpp>
  #include <sycl/half_type.hpp>
+#include <syclcompat/math.hpp>
  #include <oneapi/mkl.hpp>
  #include <map>
  
@@ -1830,31 +1831,10 @@ namespace dpct
                                             : id);
      }
  
-    template <typename T>
-    sycl::vec<T, 4> extract_and_sign_or_zero_extend4(T val)
-    {
-        return sycl::vec<T, 1>(val)
-            .template as<sycl::vec<
-                std::conditional_t<std::is_signed_v<T>, int8_t, uint8_t>, 4>>()
-            .template convert<T>();
-    }
-
-    template <typename T1, typename T2>
-    using dot_product_acc_t =
-        std::conditional_t<std::is_unsigned_v<T1> && std::is_unsigned_v<T2>,
-                           uint32_t, int32_t>;
-
      template <typename T1, typename T2, typename T3>
      inline auto dp4a(T1 a, T2 b, T3 c)
      {
-        dot_product_acc_t<T1, T2> res = c;
-        auto va = extract_and_sign_or_zero_extend4(a);
-        auto vb = extract_and_sign_or_zero_extend4(b);
-        res += va[0] * vb[0];
-        res += va[1] * vb[1];
-        res += va[2] * vb[2];
-        res += va[3] * vb[3];
-        return res;
+        return syclcompat::dp4a(a, b, c);
      }
  
      struct sub_sat
diff --git a/ggml/src/ggml-sycl/vecdotq.hpp b/ggml/src/ggml-sycl/vecdotq.hpp

index d2dccade20bfd690b94bd4733acce8f546bf98ee..c5942008adfbdeaa6f43785d887a6babd4d6e3b6 100644 (file)
--- a/ggml/src/ggml-sycl/vecdotq.hpp
+++ b/ggml/src/ggml-sycl/vecdotq.hpp
@@ -968,8 +968,8 @@ vec_dot_iq3_xxs_q8_1(const void *__restrict__ vbq,
              grid1[0] ^ signs[0], signs[0], std::minus<>());
          const int grid_h = dpct::vectorized_binary<sycl::uchar4>(
              grid2[0] ^ signs[1], signs[1], std::minus<>());
-        sumi = dpct::dp4a(grid_l, *((int *)q8 + 0), sumi);
-        sumi = dpct::dp4a(grid_h, *((int *)q8 + 1), sumi);
+        sumi = dpct::dp4a(grid_l, *((const int *)q8 + 0), sumi);
+        sumi = dpct::dp4a(grid_h, *((const int *)q8 + 1), sumi);
          q8 += 8;
          aux32 >>= 7;
      }
@@ -1009,8 +1009,8 @@ vec_dot_iq3_s_q8_1(const void *__restrict__ vbq,
              grid1[0] ^ signs0, signs0, std::minus<>());
          const int grid_h = dpct::vectorized_binary<sycl::uchar4>(
              grid2[0] ^ signs1, signs1, std::minus<>());
-        sumi = dpct::dp4a(grid_l, *((int *)q8 + 0), sumi);
-        sumi = dpct::dp4a(grid_h, *((int *)q8 + 1), sumi);
+        sumi = dpct::dp4a(grid_l, *((const int *)q8 + 0), sumi);
+        sumi = dpct::dp4a(grid_h, *((const int *)q8 + 1), sumi);
          q8 += 8;
      }
      const float d =
author	Romain Biessy <redacted>
	Fri, 15 Nov 2024 03:09:12 +0000 (04:09 +0100)
committer	Georgi Gerganov <redacted>
	Wed, 20 Nov 2024 19:00:08 +0000 (21:00 +0200)
ggml/src/ggml-sycl/dpct/helper.hpp		patch \| blob \| history
ggml/src/ggml-sycl/vecdotq.hpp		patch \| blob \| history