ggml-cpu : fix leftover handling in ggml_vec_scale_f32 for SVE (llama/16443)

author Daniel Bevenius <redacted>

Mon, 6 Oct 2025 12:17:12 +0000 (14:17 +0200)

committer Georgi Gerganov <redacted>

Sun, 12 Oct 2025 04:57:25 +0000 (07:57 +0300)
author Daniel Bevenius <redacted>
Mon, 6 Oct 2025 12:17:12 +0000 (14:17 +0200)
committer Georgi Gerganov <redacted>
Sun, 12 Oct 2025 04:57:25 +0000 (07:57 +0300)
diff --git a/src/ggml-cpu/vec.h b/src/ggml-cpu/vec.h

index 341e64e64f2b0da08b96cc078ec805603bd19607..f95ca94e54b16cbf27b64f1d0ba023cfd78da913 100644 (file)
--- a/src/ggml-cpu/vec.h
+++ b/src/ggml-cpu/vec.h
@@ -654,11 +654,11 @@ inline static void ggml_vec_scale_f32(const int n, float * y, const float   v) {
          }
          // leftovers
          // maximum number of leftover elements will be less that ggml_f32_epr. Apply predicated svmad on available elements only
-        if (np < n) {
-            svbool_t pg = svwhilelt_b32(np, n);
-            ay1 = svld1_f32(pg, y + np);
+        for (int i = np; i < n; i += ggml_f32_epr) {
+            svbool_t pg = svwhilelt_b32(i, n);
+            ay1 = svld1_f32(pg, y + i);
              ay1 = svmul_f32_m(pg, ay1, vx);
-            svst1_f32(pg, y + np, ay1);
+            svst1_f32(pg, y + i, ay1);
          }
      #elif defined(__riscv_v_intrinsic)
          for (int i = 0, avl; i < n; i += avl) {
author	Daniel Bevenius <redacted>
	Mon, 6 Oct 2025 12:17:12 +0000 (14:17 +0200)
committer	Georgi Gerganov <redacted>
	Sun, 12 Oct 2025 04:57:25 +0000 (07:57 +0300)