sycl: GGML_SYCL_DISABLE_OPT on by default for all Intel Devices (llama/13973)

author Anton Mitkov <redacted>

Wed, 25 Jun 2025 16:09:55 +0000 (17:09 +0100)

committer Georgi Gerganov <redacted>

Tue, 1 Jul 2025 14:54:53 +0000 (17:54 +0300)
author Anton Mitkov <redacted>
Wed, 25 Jun 2025 16:09:55 +0000 (17:09 +0100)
committer Georgi Gerganov <redacted>
Tue, 1 Jul 2025 14:54:53 +0000 (17:54 +0300)
diff --git a/ggml/src/ggml-sycl/common.hpp b/ggml/src/ggml-sycl/common.hpp

index 753b4af143622d16f504b0d9c64a609627b72e7b..4e7449d06ecfe260576be5d05c28d4f6ea8f563d 100644 (file)
--- a/ggml/src/ggml-sycl/common.hpp
+++ b/ggml/src/ggml-sycl/common.hpp
@@ -199,7 +199,7 @@ struct sycl_device_info {
      // size_t  smpb;               // max. shared memory per block
      bool    vmm;                // virtual memory support
      size_t  total_vram;
-    sycl_hw_info hw_info;
+    //sycl_hw_info hw_info;     \\ device id and aarch, currently not used
      optimize_feature opt_feature;
  };
  
@@ -286,29 +286,6 @@ struct ggml_tensor_extra_gpu {
  
  void release_extra_gpu(ggml_tensor_extra_gpu * extra, std::vector<queue_ptr> streams={});
  
-inline optimize_feature check_gpu_optimize_feature(syclex::architecture &arch) {
-    optimize_feature opt;
-
-    opt.reorder =
-        (arch == syclex::architecture::intel_gpu_dg1 ||
-         arch == syclex::architecture::intel_gpu_acm_g10 ||
-         arch == syclex::architecture::intel_gpu_acm_g11 ||
-         arch == syclex::architecture::intel_gpu_acm_g12 ||
-         arch == syclex::architecture::intel_gpu_pvc ||
-         arch == syclex::architecture::intel_gpu_pvc_vg ||
-         arch == syclex::architecture::intel_gpu_mtl_u ||
-         arch == syclex::architecture::intel_gpu_mtl_s ||
-         arch == syclex::architecture::intel_gpu_mtl_h ||
-         arch == syclex::architecture::intel_gpu_arl_u ||
-         arch == syclex::architecture::intel_gpu_arl_s ||
-         arch == syclex::architecture::intel_gpu_arl_h ||
-         arch == syclex::architecture::intel_gpu_bmg_g21 ||
-         arch == syclex::architecture::intel_gpu_lnl_m
-        );
-
-    return opt;
-}
-
  namespace sycl_ex = sycl::ext::oneapi::experimental;
  struct ggml_backend_sycl_context {
      int device;
diff --git a/ggml/src/ggml-sycl/ggml-sycl.cpp b/ggml/src/ggml-sycl/ggml-sycl.cpp

index f25a96a625c51d40f951933e254ef52b00250b4e..9cb36ae99e7f57ff4706037e524df7f21e2bfe2f 100644 (file)
--- a/ggml/src/ggml-sycl/ggml-sycl.cpp
+++ b/ggml/src/ggml-sycl/ggml-sycl.cpp
@@ -83,9 +83,7 @@ static ggml_sycl_device_info ggml_sycl_init() {
  
          info.devices[i].cc =
              100 * prop.get_major_version() + 10 * prop.get_minor_version();
-        info.devices[i].hw_info = get_device_hw_info(&device);
-        info.devices[i].opt_feature = check_gpu_optimize_feature(info.devices[i].hw_info.arch);
-
+        info.devices[i].opt_feature.reorder = !device.ext_oneapi_architecture_is(syclex::arch_category::intel_gpu);
          info.max_work_group_sizes[i] = prop.get_max_work_group_size();
      }
  
@@ -195,7 +193,7 @@ static void ggml_check_sycl() try {
  
      if (!initialized) {
          g_ggml_sycl_debug = get_sycl_env("GGML_SYCL_DEBUG", 0);
-        g_ggml_sycl_disable_optimize= get_sycl_env("GGML_SYCL_DISABLE_OPT", 1);
+        g_ggml_sycl_disable_optimize = get_sycl_env("GGML_SYCL_DISABLE_OPT", 0);
          g_ggml_sycl_disable_graph = get_sycl_env("GGML_SYCL_DISABLE_GRAPH", 1);
          g_ggml_sycl_disable_dnn = get_sycl_env("GGML_SYCL_DISABLE_DNN", 0);
          g_ggml_sycl_prioritize_dmmv = get_sycl_env("GGML_SYCL_PRIORITIZE_DMMV", 0);
diff --git a/ggml/src/ggml-sycl/sycl_hw.cpp b/ggml/src/ggml-sycl/sycl_hw.cpp

index da121ffc261e8bb52722668467eafc7ff3fda627..7041140034b4576463f711b9ede4e28e4f105131 100644 (file)
--- a/ggml/src/ggml-sycl/sycl_hw.cpp
+++ b/ggml/src/ggml-sycl/sycl_hw.cpp
@@ -1,6 +1,7 @@
  #include "sycl_hw.hpp"
  
-
+// TODO: currently not used
+/*
  sycl_hw_info get_device_hw_info(sycl::device *device_ptr) {
    sycl_hw_info res;
    int32_t id = device_ptr->get_info<sycl::ext::intel::info::device::device_id>();
@@ -11,3 +12,4 @@ sycl_hw_info get_device_hw_info(sycl::device *device_ptr) {
  
    return res;
  }
+*/
diff --git a/ggml/src/ggml-sycl/sycl_hw.hpp b/ggml/src/ggml-sycl/sycl_hw.hpp

index bf689450ce61ff244b54d79b5ea1197c239e9068..36b140bf037372fadfc23983c4b2993c23528560 100644 (file)
--- a/ggml/src/ggml-sycl/sycl_hw.hpp
+++ b/ggml/src/ggml-sycl/sycl_hw.hpp
@@ -10,6 +10,8 @@
  
  namespace syclex = sycl::ext::oneapi::experimental;
  
+// TODO: currently not used
+/*
  struct sycl_hw_info {
    syclex::architecture arch;
    int32_t device_id;
@@ -18,6 +20,7 @@ struct sycl_hw_info {
  bool is_in_vector(std::vector<int> &vec, int item);
  
  sycl_hw_info get_device_hw_info(sycl::device *device_ptr);
+*/
  
  
  #endif // SYCL_HW_HPP
author	Anton Mitkov <redacted>
	Wed, 25 Jun 2025 16:09:55 +0000 (17:09 +0100)
committer	Georgi Gerganov <redacted>
	Tue, 1 Jul 2025 14:54:53 +0000 (17:54 +0300)
ggml/src/ggml-sycl/common.hpp		patch \| blob \| history
ggml/src/ggml-sycl/ggml-sycl.cpp		patch \| blob \| history
ggml/src/ggml-sycl/sycl_hw.cpp		patch \| blob \| history
ggml/src/ggml-sycl/sycl_hw.hpp		patch \| blob \| history