sycl : add ARANGE operator (llama/16362)

author GittyBurstein <redacted>

Thu, 16 Oct 2025 13:26:21 +0000 (16:26 +0300)

committer Georgi Gerganov <redacted>

Tue, 21 Oct 2025 15:14:33 +0000 (18:14 +0300)
author GittyBurstein <redacted>
Thu, 16 Oct 2025 13:26:21 +0000 (16:26 +0300)
committer Georgi Gerganov <redacted>
Tue, 21 Oct 2025 15:14:33 +0000 (18:14 +0300)
diff --git a/src/ggml-sycl/element_wise.cpp b/src/ggml-sycl/element_wise.cpp

index aeeb387595017bbebd931bd4035b0eb8b38454f8..58f5125c9cf6eb577937d45bd291835962d64b0e 100644 (file)
--- a/src/ggml-sycl/element_wise.cpp
+++ b/src/ggml-sycl/element_wise.cpp
@@ -397,6 +397,14 @@ static void acc_f32_sycl(const float *x, const float *y, float *dst,
          });
  }
  
+template<typename T>
+static void arange_kernel(T * dst, const int k, T start, T step,
+                         const sycl::nd_item<1> &item_ct1) {
+    SYCL_GLOBAL_ID_LOOP(k, item_ct1) {
+        dst[i] = start + static_cast<T>(i) * step;
+    }
+}
+
  template<typename T>
  static void upscale_sycl(const T *x, T *dst, const int nb00, const int nb01,
                               const int nb02, const int nb03, const int ne10, const int ne11,
@@ -565,6 +573,25 @@ static inline void dispatch_ggml_sycl_op_upscale(ggml_backend_sycl_context & ctx
  }
  
  
+static inline void ggml_sycl_op_arange(ggml_backend_sycl_context & ctx, ggml_tensor * dst) {
+    GGML_ASSERT(dst->type == GGML_TYPE_F32);
+    float start, stop, step;
+    memcpy(&start, dst->op_params, sizeof(float));
+    memcpy(&stop, (float *) dst->op_params + 1, sizeof(float));
+    memcpy(&step, (float *) dst->op_params + 2, sizeof(float));
+    dpct::queue_ptr stream = ctx.stream();
+    SYCL_CHECK(ggml_sycl_set_device(ctx.device));
+    float * dst_ptr = (float *)dst->data;
+    const int k = (int)ggml_nelements(dst);
+    const int num_blocks = ceil_div(k, SYCL_ARANGE_BLOCK_SIZE);
+    stream->parallel_for(
+        sycl::nd_range<1>(sycl::range<1>(num_blocks) * sycl::range<1>(SYCL_ARANGE_BLOCK_SIZE),
+                          sycl::range<1>(SYCL_ARANGE_BLOCK_SIZE)),
+        [=](sycl::nd_item<1> item_ct1) {
+            arange_kernel(dst_ptr, k, start, step, item_ct1);
+        });
+}
+
  } // namespace ggml_sycl_detail
  
  
@@ -1090,3 +1117,8 @@ void ggml_sycl_geglu_quick(ggml_backend_sycl_context & ctx, ggml_tensor * dst) {
      scope_op_debug_print scope_dbg_print(__func__, dst, /*num_src=*/1);
      ggml_sycl_op_geglu_quick(ctx, dst);
  }
+
+void ggml_sycl_arange(ggml_backend_sycl_context & ctx, ggml_tensor * dst) {
+    scope_op_debug_print scope_dbg_print(__func__, dst, /*num_src=*/0);
+    ggml_sycl_detail::ggml_sycl_op_arange(ctx, dst);
+}
diff --git a/src/ggml-sycl/element_wise.hpp b/src/ggml-sycl/element_wise.hpp

index 434743172876c11137a4a28d30dbf96a8407e4e7..ed96c55f75a7a19c11c63535e354d74a6a05f679 100644 (file)
--- a/src/ggml-sycl/element_wise.hpp
+++ b/src/ggml-sycl/element_wise.hpp
@@ -81,4 +81,6 @@ void ggml_sycl_swiglu(ggml_backend_sycl_context & ctx, ggml_tensor * dst);
  void ggml_sycl_geglu_erf(ggml_backend_sycl_context & ctx, ggml_tensor * dst);
  void ggml_sycl_geglu_quick(ggml_backend_sycl_context & ctx, ggml_tensor * dst);
  
+void ggml_sycl_arange(ggml_backend_sycl_context & ctx, ggml_tensor * dst);
+
  #endif // GGML_SYCL_ELEMENTWISE_HPP
diff --git a/src/ggml-sycl/ggml-sycl.cpp b/src/ggml-sycl/ggml-sycl.cpp

index f3407a813d731de1635523b4ef76116844fcf2cd..9e55797233412f31436559748e0cc62d9f35612f 100644 (file)
--- a/src/ggml-sycl/ggml-sycl.cpp
+++ b/src/ggml-sycl/ggml-sycl.cpp
@@ -3832,6 +3832,9 @@ static bool ggml_sycl_compute_forward(ggml_backend_sycl_context & ctx, struct gg
          case GGML_OP_GATED_LINEAR_ATTN:
              ggml_sycl_op_gated_linear_attn(ctx, dst);
              break;
+        case GGML_OP_ARANGE:
+            ggml_sycl_arange(ctx, dst);
+            break;
          default:
              return false;
      }
@@ -4478,6 +4481,8 @@ static bool ggml_backend_sycl_device_supports_op(ggml_backend_dev_t dev, const g
          case GGML_OP_RWKV_WKV7:
          case GGML_OP_GATED_LINEAR_ATTN:
              return true;
+        case GGML_OP_ARANGE:
+            return op->type == GGML_TYPE_F32;
          default:
              return false;
      }
diff --git a/src/ggml-sycl/presets.hpp b/src/ggml-sycl/presets.hpp

index af1890727df8f99576a77cb41b5a9a8dbfd20ce6..0814bd79a65049d1962c7821f422d287cc23d9ba 100644 (file)
--- a/src/ggml-sycl/presets.hpp
+++ b/src/ggml-sycl/presets.hpp
@@ -49,6 +49,7 @@
  #define SYCL_ARGMAX_BLOCK_SIZE 256
  #define SYCL_CONV_TRANPOSE_1D_BLOCK_SIZE 256
  #define SYCL_TIMESTEP_EMBEDDING_BLOCK_SIZE 256
+#define SYCL_ARANGE_BLOCK_SIZE 256
  
  // dmmv = dequantize_mul_mat_vec
  #ifndef GGML_SYCL_DMMV_X
author	GittyBurstein <redacted>
	Thu, 16 Oct 2025 13:26:21 +0000 (16:26 +0300)
committer	Georgi Gerganov <redacted>
	Tue, 21 Oct 2025 15:14:33 +0000 (18:14 +0300)
src/ggml-sycl/element_wise.cpp		patch \| blob \| history
src/ggml-sycl/element_wise.hpp		patch \| blob \| history
src/ggml-sycl/ggml-sycl.cpp		patch \| blob \| history
src/ggml-sycl/presets.hpp		patch \| blob \| history