]> git.djapps.eu Git - pkg/ggml/sources/llama.cpp/commitdiff
convert : fix merge conflicts (#15229)
authorSigbjørn Skjæret <redacted>
Mon, 11 Aug 2025 09:15:44 +0000 (11:15 +0200)
committerGitHub <redacted>
Mon, 11 Aug 2025 09:15:44 +0000 (11:15 +0200)
convert_hf_to_gguf.py

index 2f9ef7f5d3f58e19ee4908effecca9d3ed5cf8a2..444e2cbdfbb6a09a13f4cc74963ef748acb3caa2 100755 (executable)
@@ -572,7 +572,7 @@ class TextModel(ModelBase):
         if (rope_theta := self.hparams.get("rope_theta")) is not None:
             self.gguf_writer.add_rope_freq_base(rope_theta)
             logger.info(f"gguf: rope theta = {rope_theta}")
-        if (f_rms_eps := self.find_hparam(["rms_norm_eps", "norm_eps"])) is not None:
+        if (f_rms_eps := self.find_hparam(["rms_norm_eps", "norm_eps"], optional=True)) is not None:
             self.gguf_writer.add_layer_norm_rms_eps(f_rms_eps)
             logger.info(f"gguf: rms norm epsilon = {f_rms_eps}")
         if (f_norm_eps := self.find_hparam(["layer_norm_eps", "layer_norm_epsilon", "norm_epsilon"], optional=True)) is not None:
@@ -3598,7 +3598,7 @@ class Qwen3MoeModel(Qwen2MoeModel):
 
     def __init__(self, *args, **kwargs):
         super().__init__(*args, **kwargs)
-        hparams = ModelBase.load_hparams(self.dir_model)
+        hparams = ModelBase.load_hparams(self.dir_model, False)
         self.origin_hf_arch = hparams.get('architectures', [None])[0]
 
     def set_vocab(self):