Fix GLM 4.7 Lite MoE gating func (#18980)

author Piotr Wilkin (ilintar) <redacted>

Wed, 21 Jan 2026 11:35:20 +0000 (12:35 +0100)

committer GitHub <redacted>

Wed, 21 Jan 2026 11:35:20 +0000 (12:35 +0100)
author Piotr Wilkin (ilintar) <redacted>
Wed, 21 Jan 2026 11:35:20 +0000 (12:35 +0100)
committer GitHub <redacted>
Wed, 21 Jan 2026 11:35:20 +0000 (12:35 +0100)
diff --git a/src/llama-model.cpp b/src/llama-model.cpp

index 94c47dc248024532a6e5627d2284240c30ac78ff..255289b7c8848d80f3a1e222558f51babed85643 100644 (file)
--- a/src/llama-model.cpp
+++ b/src/llama-model.cpp
@@ -1713,7 +1713,12 @@ void llama_model::load_hparams(llama_model_loader & ml) {
                  if (hparams.expert_gating_func == LLAMA_EXPERT_GATING_FUNC_TYPE_NONE) {
                      // for compatibility with existing DeepSeek V2 and V2.5 GGUFs
                      // that have no expert_gating_func model parameter set
-                    hparams.expert_gating_func = LLAMA_EXPERT_GATING_FUNC_TYPE_SOFTMAX;
+                    if ((hparams.n_layer == 47 || hparams.n_layer == 48) && n_vocab == 154880) {
+                        // GLM 4.7 Lite
+                        hparams.expert_gating_func = LLAMA_EXPERT_GATING_FUNC_TYPE_SIGMOID;
+                    } else {
+                        hparams.expert_gating_func = LLAMA_EXPERT_GATING_FUNC_TYPE_SOFTMAX;
+                    }
                  }
  
                  if (ml.get_key(LLM_KV_ROPE_SCALING_YARN_LOG_MUL, hparams.rope_yarn_log_mul, 0.0f)) {
author	Piotr Wilkin (ilintar) <redacted>
	Wed, 21 Jan 2026 11:35:20 +0000 (12:35 +0100)
committer	GitHub <redacted>
	Wed, 21 Jan 2026 11:35:20 +0000 (12:35 +0100)