convert : better mtp check and fix return [no ci] (#20419)

author Sigbjørn Skjæret <redacted>

Thu, 12 Mar 2026 09:04:20 +0000 (10:04 +0100)

committer GitHub <redacted>

Thu, 12 Mar 2026 09:04:20 +0000 (10:04 +0100)
author Sigbjørn Skjæret <redacted>
Thu, 12 Mar 2026 09:04:20 +0000 (10:04 +0100)
committer GitHub <redacted>
Thu, 12 Mar 2026 09:04:20 +0000 (10:04 +0100)
diff --git a/convert_hf_to_gguf.py b/convert_hf_to_gguf.py

index 6e3d3ad1dc439999ff4f17008def03b6930c3af1..37834c78b8725c138c3d911f629293c34538a10e 100755 (executable)
--- a/convert_hf_to_gguf.py
+++ b/convert_hf_to_gguf.py
@@ -10092,9 +10092,9 @@ class NemotronHModel(GraniteHybridModel):
              # Skip Multi-Token Prediction (MTP) tensors. These are used for
              # for speculative decoding but we don't include them in this model
              # conversion. See https://github.com/ggml-org/llama.cpp/pull/18886
-            if "mtp" in name:
+            if name.startswith("mtp."):
                  logger.info(f"gguf: Skipping MTP (Speculative) layer: {name}")
-                return []
+                return
  
              if name.endswith("mixer.gate.e_score_correction_bias"):
                  new_name = name.replace("e_score_correction_bias", "e_score_correction.bias")
author	Sigbjørn Skjæret <redacted>
	Thu, 12 Mar 2026 09:04:20 +0000 (10:04 +0100)
committer	GitHub <redacted>
	Thu, 12 Mar 2026 09:04:20 +0000 (10:04 +0100)