convert : BailingMoE : fix qkv split when head_dim is 0 (#12687)

author Sigbjørn Skjæret <redacted>

Tue, 1 Apr 2025 12:37:13 +0000 (14:37 +0200)

committer GitHub <redacted>

Tue, 1 Apr 2025 12:37:13 +0000 (14:37 +0200)
author Sigbjørn Skjæret <redacted>
Tue, 1 Apr 2025 12:37:13 +0000 (14:37 +0200)
committer GitHub <redacted>
Tue, 1 Apr 2025 12:37:13 +0000 (14:37 +0200)
diff --git a/convert_hf_to_gguf.py b/convert_hf_to_gguf.py

index 3cf8b5165fa988d42d9c59ffa9101961b96d94f4..cfe94deaf76ef38ed478f505cf3d7e517a449c77 100755 (executable)
--- a/convert_hf_to_gguf.py
+++ b/convert_hf_to_gguf.py
@@ -5146,10 +5146,7 @@ class BailingMoeModel(Model):
      def set_gguf_parameters(self):
          super().set_gguf_parameters()
          hparams = self.hparams
-        if hparams.get("head_dim"):
-            rope_dim = hparams["head_dim"]
-        else:
-            rope_dim = hparams["hidden_size"] // hparams["num_attention_heads"]
+        rope_dim = hparams.get("head_dim") or hparams["hidden_size"] // hparams["num_attention_heads"]
  
          self.gguf_writer.add_rope_dimension_count(rope_dim)
          self.gguf_writer.add_rope_scaling_type(gguf.RopeScalingType.NONE)
@@ -5175,7 +5172,7 @@ class BailingMoeModel(Model):
          n_head = self.hparams["num_attention_heads"]
          n_kv_head = self.hparams.get("num_key_value_heads")
          n_embd = self.hparams["hidden_size"]
-        head_dim = self.hparams.get("head_dim", n_embd // n_head)
+        head_dim = self.hparams.get("head_dim") or n_embd // n_head
  
          output_name = self.format_tensor_name(gguf.MODEL_TENSOR.OUTPUT)
author	Sigbjørn Skjæret <redacted>
	Tue, 1 Apr 2025 12:37:13 +0000 (14:37 +0200)
committer	GitHub <redacted>
	Tue, 1 Apr 2025 12:37:13 +0000 (14:37 +0200)