SYCL: fix rms_norm_mul_add for tensor dim not a multiple of sg_size (llama/15592)

author Akarshan Biswas <redacted>

Tue, 26 Aug 2025 18:57:49 +0000 (00:27 +0530)

committer Georgi Gerganov <redacted>

Fri, 5 Sep 2025 09:54:05 +0000 (12:54 +0300)
author Akarshan Biswas <redacted>
Tue, 26 Aug 2025 18:57:49 +0000 (00:27 +0530)
committer Georgi Gerganov <redacted>
Fri, 5 Sep 2025 09:54:05 +0000 (12:54 +0300)
diff --git a/src/ggml-sycl/ggml-sycl.cpp b/src/ggml-sycl/ggml-sycl.cpp

index 12dd5dd2e6287a045bee3b68b4749fa65c8ddecc..18ff4e0b0c7cf1792057ce6c8bcce659cd99b425 100644 (file)
--- a/src/ggml-sycl/ggml-sycl.cpp
+++ b/src/ggml-sycl/ggml-sycl.cpp
@@ -4364,11 +4364,12 @@ static bool ggml_backend_sycl_device_supports_op(ggml_backend_dev_t dev, const g
              return (op->type == GGML_TYPE_F32 && op->src[0]->type == GGML_TYPE_F32) && (op->type == op->src[0]->type);
  #endif
          case GGML_OP_NORM:
-        case GGML_OP_RMS_NORM:
              return true;
          case GGML_OP_L2_NORM:
          case GGML_OP_GROUP_NORM:
              return ggml_is_contiguous(op->src[0]);
+        case GGML_OP_RMS_NORM:
+            return ((op->src[0]->ne[0] % WARP_SIZE) == 0);
          case GGML_OP_SCALE:
              return true;
          case GGML_OP_CONT:
author	Akarshan Biswas <redacted>
	Tue, 26 Aug 2025 18:57:49 +0000 (00:27 +0530)
committer	Georgi Gerganov <redacted>
	Fri, 5 Sep 2025 09:54:05 +0000 (12:54 +0300)