convert : fix squeeze for ssm_conv tensors (#12573)

author Georgi Gerganov <redacted>

Wed, 26 Mar 2025 12:21:05 +0000 (14:21 +0200)

committer GitHub <redacted>

Wed, 26 Mar 2025 12:21:05 +0000 (08:21 -0400)
author Georgi Gerganov <redacted>
Wed, 26 Mar 2025 12:21:05 +0000 (14:21 +0200)
committer GitHub <redacted>
Wed, 26 Mar 2025 12:21:05 +0000 (08:21 -0400)
diff --git a/convert_hf_to_gguf.py b/convert_hf_to_gguf.py

index 76ab4233ef2c1638706f4c2bdff543f077649083..52637c42f723ace99f13d76aad6bec2b9dc2f0e0 100755 (executable)
--- a/convert_hf_to_gguf.py
+++ b/convert_hf_to_gguf.py
@@ -3803,8 +3803,6 @@ class MambaModel(Model):
      _tok_embd = None
  
      def modify_tensors(self, data_torch: Tensor, name: str, bid: int | None) -> Iterable[tuple[str, Tensor]]:
-        del bid  # unused
-
          output_name = self.format_tensor_name(gguf.MODEL_TENSOR.OUTPUT)
          tok_embd_name = self.format_tensor_name(gguf.MODEL_TENSOR.TOKEN_EMBD)
  
@@ -3814,6 +3812,10 @@ class MambaModel(Model):
              logger.debug("A_log --> A ==> " + new_name)
              data_torch = -torch.exp(data_torch)
  
+        # [4 1 8192 1] -> [4 8192 1 1]
+        if self.match_model_tensor_name(new_name, gguf.MODEL_TENSOR.SSM_CONV1D, bid):
+            data_torch = data_torch.squeeze()
+
          # assuming token_embd.weight is seen before output.weight
          if self._tok_embd is not None and new_name == output_name:
              if torch.equal(self._tok_embd, data_torch):
author	Georgi Gerganov <redacted>
	Wed, 26 Mar 2025 12:21:05 +0000 (14:21 +0200)
committer	GitHub <redacted>
	Wed, 26 Mar 2025 12:21:05 +0000 (08:21 -0400)