ggml-cpu/x86: fix unused changemask warning in repack (#20692)

author Shaw Nguyen <redacted>

Wed, 18 Mar 2026 16:45:06 +0000 (23:45 +0700)

committer GitHub <redacted>

Wed, 18 Mar 2026 16:45:06 +0000 (18:45 +0200)
author Shaw Nguyen <redacted>
Wed, 18 Mar 2026 16:45:06 +0000 (23:45 +0700)
committer GitHub <redacted>
Wed, 18 Mar 2026 16:45:06 +0000 (18:45 +0200)
diff --git a/ggml/src/ggml-cpu/arch/x86/repack.cpp b/ggml/src/ggml-cpu/arch/x86/repack.cpp

index 33c6cb650987d81d14ec21ecf17de445c559c209..af1cebad131d17118c26634faccb9a6e0c08a6f9 100644 (file)
--- a/ggml/src/ggml-cpu/arch/x86/repack.cpp
+++ b/ggml/src/ggml-cpu/arch/x86/repack.cpp
@@ -531,7 +531,6 @@ static void gemv_q4_b32_8x8_q8_0_lut_avx(int n, float * GGML_RESTRICT s, size_t
  
      UNUSED(bs);
  
-    __m128i changemask = _mm_set_epi8(15, 14, 7, 6, 13, 12, 5, 4, 11, 10, 3, 2, 9, 8, 1, 0);
      __m256i finalpermutemask = _mm256_set_epi32(7, 5, 3, 1, 6, 4, 2, 0);
  
      // Permute mask used for easier vector processing at later stages
@@ -580,6 +579,7 @@ static void gemv_q4_b32_8x8_q8_0_lut_avx(int n, float * GGML_RESTRICT s, size_t
                  if constexpr (
                          std::is_same_v<block_tx8, block_q4_0x8> ||
                          std::is_same_v<block_tx8, block_iq4_nlx8>) {
+                    const __m128i changemask = _mm_set_epi8(15, 14, 7, 6, 13, 12, 5, 4, 11, 10, 3, 2, 9, 8, 1, 0);
                      col_scale_f32 = GGML_F32Cx8_REARRANGE_LOAD(b_ptr[b].d, changemask);
                  } else if constexpr (std::is_same_v<block_tx8, block_mxfp4x8>) {
                      // Load 8 E8M0 exponents and convert to float via LUT
author	Shaw Nguyen <redacted>
	Wed, 18 Mar 2026 16:45:06 +0000 (23:45 +0700)
committer	GitHub <redacted>
	Wed, 18 Mar 2026 16:45:06 +0000 (18:45 +0200)