convert : force patch_merger tensors to f16/f32 (#18124)

author Sigbjørn Skjæret <redacted>

Wed, 17 Dec 2025 21:15:53 +0000 (22:15 +0100)

committer GitHub <redacted>

Wed, 17 Dec 2025 21:15:53 +0000 (22:15 +0100)
author Sigbjørn Skjæret <redacted>
Wed, 17 Dec 2025 21:15:53 +0000 (22:15 +0100)
committer GitHub <redacted>
Wed, 17 Dec 2025 21:15:53 +0000 (22:15 +0100)
diff --git a/convert_hf_to_gguf.py b/convert_hf_to_gguf.py

index bd16ba312ff5f4415a3f223e6df7a608d41ccffc..806b3d7b4709158cece84bc49b83e7d9b1b947e7 100755 (executable)
--- a/convert_hf_to_gguf.py
+++ b/convert_hf_to_gguf.py
@@ -1838,7 +1838,7 @@ class MmprojModel(ModelBase):
  
      def tensor_force_quant(self, name, new_name, bid, n_dims):
          del bid, name, n_dims  # unused
-        if ".patch_embd.weight" in new_name:
+        if ".patch_embd.weight" in new_name or ".patch_merger.weight" in new_name:
              return gguf.GGMLQuantizationType.F16 if self.ftype == gguf.LlamaFileType.MOSTLY_F16 else gguf.GGMLQuantizationType.F32
          return False
author	Sigbjørn Skjæret <redacted>
	Wed, 17 Dec 2025 21:15:53 +0000 (22:15 +0100)
committer	GitHub <redacted>
	Wed, 17 Dec 2025 21:15:53 +0000 (22:15 +0100)