llama-graph: replace cont with reshape for alpha in qwen35 (#20640)

author Aman Gupta <redacted>

Mon, 16 Mar 2026 14:07:13 +0000 (22:07 +0800)

committer GitHub <redacted>

Mon, 16 Mar 2026 14:07:13 +0000 (22:07 +0800)
author Aman Gupta <redacted>
Mon, 16 Mar 2026 14:07:13 +0000 (22:07 +0800)
committer GitHub <redacted>
Mon, 16 Mar 2026 14:07:13 +0000 (22:07 +0800)
diff --git a/src/models/qwen35.cpp b/src/models/qwen35.cpp

index 3108bf331ac95633478c070400e847d2ceb6d340..d07579ee87e2c0eadd73b61817aa9b861e4f2456 100644 (file)
--- a/src/models/qwen35.cpp
+++ b/src/models/qwen35.cpp
@@ -224,7 +224,7 @@ ggml_tensor * llm_build_qwen35::build_layer_attn_linear(
      beta = ggml_sigmoid(ctx0, beta);
  
      ggml_tensor * alpha = build_lora_mm(model.layers[il].ssm_alpha, cur, model.layers[il].ssm_alpha_s);
-    alpha = ggml_cont_3d(ctx0, alpha, num_v_heads, n_seq_tokens, n_seqs);
+    alpha = ggml_reshape_3d(ctx0, alpha, num_v_heads, n_seq_tokens, n_seqs);
      cb(alpha, "alpha", il);
  
      ggml_tensor * alpha_biased   = ggml_add(ctx0, alpha, model.layers[il].ssm_dt);
diff --git a/src/models/qwen35moe.cpp b/src/models/qwen35moe.cpp

index 165e2412e560b913ccf5f665f3786cd88e0c1242..b38660c0bce9c7d187bb7f5a476d959cb717bb05 100644 (file)
--- a/src/models/qwen35moe.cpp
+++ b/src/models/qwen35moe.cpp
@@ -224,7 +224,7 @@ ggml_tensor * llm_build_qwen35moe ::build_layer_attn_linear(
      beta = ggml_sigmoid(ctx0, beta);
  
      ggml_tensor * alpha = build_lora_mm(model.layers[il].ssm_alpha, cur, model.layers[il].ssm_alpha_s);
-    alpha = ggml_cont_3d(ctx0, alpha, num_v_heads, n_seq_tokens, n_seqs);
+    alpha = ggml_reshape_3d(ctx0, alpha, num_v_heads, n_seq_tokens, n_seqs);
      cb(alpha, "alpha", il);
  
      ggml_tensor * alpha_biased   = ggml_add(ctx0, alpha, model.layers[il].ssm_dt);
author	Aman Gupta <redacted>
	Mon, 16 Mar 2026 14:07:13 +0000 (22:07 +0800)
committer	GitHub <redacted>
	Mon, 16 Mar 2026 14:07:13 +0000 (22:07 +0800)
src/models/qwen35.cpp		patch \| blob \| history
src/models/qwen35moe.cpp		patch \| blob \| history