convert : use self.block_count everywhere instead of reading hparams (#17359)

author Sigbjørn Skjæret <redacted>

Wed, 19 Nov 2025 10:52:38 +0000 (11:52 +0100)

committer GitHub <redacted>

Wed, 19 Nov 2025 10:52:38 +0000 (11:52 +0100)
author Sigbjørn Skjæret <redacted>
Wed, 19 Nov 2025 10:52:38 +0000 (11:52 +0100)
committer GitHub <redacted>
Wed, 19 Nov 2025 10:52:38 +0000 (11:52 +0100)
diff --git a/convert_hf_to_gguf.py b/convert_hf_to_gguf.py

index 0cc3df0975f458c13b2376ee5a3d0ce5907d298a..8743202ad6c963c61a8081c28403af7209ccf69c 100755 (executable)
--- a/convert_hf_to_gguf.py
+++ b/convert_hf_to_gguf.py
@@ -1673,11 +1673,9 @@ class GPTNeoXModel(TextModel):
      model_arch = gguf.MODEL_ARCH.GPTNEOX
  
      def set_gguf_parameters(self):
-        block_count = self.hparams["num_hidden_layers"]
-
          self.gguf_writer.add_context_length(self.hparams["max_position_embeddings"])
          self.gguf_writer.add_embedding_length(self.hparams["hidden_size"])
-        self.gguf_writer.add_block_count(block_count)
+        self.gguf_writer.add_block_count(self.block_count)
          self.gguf_writer.add_feed_forward_length(self.hparams["intermediate_size"])
          self.gguf_writer.add_rope_dimension_count(
              int(self.hparams["rotary_pct"] * (self.hparams["hidden_size"] // self.hparams["num_attention_heads"])),
@@ -1735,7 +1733,7 @@ class BloomModel(TextModel):
          self.gguf_writer.add_context_length(self.hparams.get("seq_length", n_embed))
          self.gguf_writer.add_embedding_length(n_embed)
          self.gguf_writer.add_feed_forward_length(4 * n_embed)
-        self.gguf_writer.add_block_count(self.hparams["n_layer"])
+        self.gguf_writer.add_block_count(self.block_count)
          self.gguf_writer.add_head_count(n_head)
          self.gguf_writer.add_head_count_kv(n_head)
          self.gguf_writer.add_layer_norm_eps(self.hparams["layer_norm_epsilon"])
@@ -1798,10 +1796,9 @@ class MPTModel(TextModel):
              self.gguf_writer.add_unk_token_id(0)
  
      def set_gguf_parameters(self):
-        block_count = self.hparams["n_layers"]
          self.gguf_writer.add_context_length(self.hparams["max_seq_len"])
          self.gguf_writer.add_embedding_length(self.hparams["d_model"])
-        self.gguf_writer.add_block_count(block_count)
+        self.gguf_writer.add_block_count(self.block_count)
          self.gguf_writer.add_feed_forward_length(4 * self.hparams["d_model"])
          self.gguf_writer.add_head_count(self.hparams["n_heads"])
          if kv_n_heads := self.hparams["attn_config"].get("kv_n_heads"):
@@ -1834,7 +1831,6 @@ class OrionModel(TextModel):
          self._set_vocab_sentencepiece()
  
      def set_gguf_parameters(self):
-        block_count = self.hparams["num_hidden_layers"]
          head_count = self.hparams["num_attention_heads"]
          head_count_kv = self.hparams.get("num_key_value_heads", head_count)
  
@@ -1852,7 +1848,7 @@ class OrionModel(TextModel):
          self.gguf_writer.add_tensor_data_layout("Meta AI original pth")
          self.gguf_writer.add_context_length(ctx_length)
          self.gguf_writer.add_embedding_length(self.hparams["hidden_size"])
-        self.gguf_writer.add_block_count(block_count)
+        self.gguf_writer.add_block_count(self.block_count)
          self.gguf_writer.add_feed_forward_length(self.hparams["intermediate_size"])
          self.gguf_writer.add_head_count(head_count)
          self.gguf_writer.add_head_count_kv(head_count_kv)
@@ -1869,7 +1865,6 @@ class BaichuanModel(TextModel):
          self._set_vocab_sentencepiece()
  
      def set_gguf_parameters(self):
-        block_count = self.hparams["num_hidden_layers"]
          head_count = self.hparams["num_attention_heads"]
          head_count_kv = self.hparams.get("num_key_value_heads", head_count)
  
@@ -1886,7 +1881,7 @@ class BaichuanModel(TextModel):
          self.gguf_writer.add_tensor_data_layout("Meta AI original pth")
          self.gguf_writer.add_context_length(ctx_length)
          self.gguf_writer.add_embedding_length(self.hparams["hidden_size"])
-        self.gguf_writer.add_block_count(block_count)
+        self.gguf_writer.add_block_count(self.block_count)
          self.gguf_writer.add_feed_forward_length(self.hparams["intermediate_size"])
          self.gguf_writer.add_rope_dimension_count(self.hparams["hidden_size"] // self.hparams["num_attention_heads"])
          self.gguf_writer.add_head_count(head_count)
@@ -1993,7 +1988,6 @@ class XverseModel(TextModel):
          special_vocab.add_to_gguf(self.gguf_writer)
  
      def set_gguf_parameters(self):
-        block_count = self.hparams["num_hidden_layers"]
          head_count = self.hparams["num_attention_heads"]
          head_count_kv = self.hparams.get("num_key_value_heads", head_count)
  
@@ -2010,7 +2004,7 @@ class XverseModel(TextModel):
          self.gguf_writer.add_tensor_data_layout("Meta AI original pth")
          self.gguf_writer.add_context_length(ctx_length)
          self.gguf_writer.add_embedding_length(self.hparams["hidden_size"])
-        self.gguf_writer.add_block_count(block_count)
+        self.gguf_writer.add_block_count(self.block_count)
          self.gguf_writer.add_feed_forward_length(self.hparams["intermediate_size"])
          self.gguf_writer.add_rope_dimension_count(self.hparams["hidden_size"] // self.hparams["num_attention_heads"])
          self.gguf_writer.add_head_count(head_count)
@@ -2053,10 +2047,6 @@ class FalconModel(TextModel):
      model_arch = gguf.MODEL_ARCH.FALCON
  
      def set_gguf_parameters(self):
-        block_count = self.hparams.get("num_hidden_layers")
-        if block_count is None:
-            block_count = self.hparams["n_layer"]  # old name
-
          n_head = self.hparams.get("num_attention_heads")
          if n_head is None:
              n_head = self.hparams["n_head"]  # old name
@@ -2069,7 +2059,7 @@ class FalconModel(TextModel):
          self.gguf_writer.add_tensor_data_layout("jploski")  # qkv tensor transform
          self.gguf_writer.add_embedding_length(self.hparams["hidden_size"])
          self.gguf_writer.add_feed_forward_length(4 * self.hparams["hidden_size"])
-        self.gguf_writer.add_block_count(block_count)
+        self.gguf_writer.add_block_count(self.block_count)
          self.gguf_writer.add_head_count(n_head)
          self.gguf_writer.add_head_count_kv(n_head_kv)
          self.gguf_writer.add_layer_norm_eps(self.hparams["layer_norm_epsilon"])
@@ -2107,12 +2097,10 @@ class StarCoderModel(TextModel):
      model_arch = gguf.MODEL_ARCH.STARCODER
  
      def set_gguf_parameters(self):
-        block_count = self.hparams["n_layer"]
-
          self.gguf_writer.add_context_length(self.hparams["n_positions"])
          self.gguf_writer.add_embedding_length(self.hparams["n_embd"])
          self.gguf_writer.add_feed_forward_length(4 * self.hparams["n_embd"])
-        self.gguf_writer.add_block_count(block_count)
+        self.gguf_writer.add_block_count(self.block_count)
          self.gguf_writer.add_head_count(self.hparams["n_head"])
          self.gguf_writer.add_head_count_kv(1)
          self.gguf_writer.add_layer_norm_eps(self.hparams["layer_norm_epsilon"])
@@ -2142,14 +2130,12 @@ class RefactModel(TextModel):
          multiple_of = 256
          ff_dim = multiple_of * ((hidden_dim + multiple_of - 1) // multiple_of)
  
-        block_count = self.hparams["n_layer"]
-
          # refact uses Alibi. So this is from config.json which might be used by training.
          self.gguf_writer.add_context_length(self.hparams["n_positions"])
          self.gguf_writer.add_embedding_length(self.hparams["n_embd"])
  
          self.gguf_writer.add_feed_forward_length(ff_dim)
-        self.gguf_writer.add_block_count(block_count)
+        self.gguf_writer.add_block_count(self.block_count)
          self.gguf_writer.add_head_count(self.hparams["n_head"])
          self.gguf_writer.add_head_count_kv(1)
          self.gguf_writer.add_layer_norm_rms_eps(self.hparams["layer_norm_epsilon"])
@@ -2196,11 +2182,10 @@ class StableLMModel(TextModel):
  
      def set_gguf_parameters(self):
          hparams = self.hparams
-        block_count = hparams["num_hidden_layers"]
  
          self.gguf_writer.add_context_length(hparams["max_position_embeddings"])
          self.gguf_writer.add_embedding_length(hparams["hidden_size"])
-        self.gguf_writer.add_block_count(block_count)
+        self.gguf_writer.add_block_count(self.block_count)
          self.gguf_writer.add_feed_forward_length(hparams["intermediate_size"])
          rotary_factor = self.find_hparam(["partial_rotary_factor", "rope_pct"])
          self.gguf_writer.add_rope_dimension_count(int(rotary_factor * (hparams["hidden_size"] // hparams["num_attention_heads"])))
@@ -3151,7 +3136,7 @@ class DbrxModel(TextModel):
      def set_gguf_parameters(self):
          ffn_config = self.hparams["ffn_config"]
          attn_config = self.hparams["attn_config"]
-        self.gguf_writer.add_block_count(self.hparams["n_layers"])
+        self.gguf_writer.add_block_count(self.block_count)
  
          self.gguf_writer.add_context_length(self.hparams["max_seq_len"])
          self.gguf_writer.add_embedding_length(self.hparams["d_model"])
@@ -3353,7 +3338,7 @@ class QwenModel(TextModel):
  
      def set_gguf_parameters(self):
          self.gguf_writer.add_context_length(self.hparams["max_position_embeddings"])
-        self.gguf_writer.add_block_count(self.hparams["num_hidden_layers"])
+        self.gguf_writer.add_block_count(self.block_count)
          self.gguf_writer.add_embedding_length(self.hparams["hidden_size"])
          self.gguf_writer.add_feed_forward_length(self.hparams["intermediate_size"])
          self.gguf_writer.add_rope_freq_base(self.hparams["rotary_emb_base"])
@@ -4384,7 +4369,7 @@ class GPT2Model(TextModel):
      model_arch = gguf.MODEL_ARCH.GPT2
  
      def set_gguf_parameters(self):
-        self.gguf_writer.add_block_count(self.hparams["n_layer"])
+        self.gguf_writer.add_block_count(self.block_count)
          self.gguf_writer.add_context_length(self.hparams["n_ctx"])
          self.gguf_writer.add_embedding_length(self.hparams["n_embd"])
          self.gguf_writer.add_feed_forward_length(4 * self.hparams["n_embd"])
@@ -4416,8 +4401,6 @@ class Phi2Model(TextModel):
      model_arch = gguf.MODEL_ARCH.PHI2
  
      def set_gguf_parameters(self):
-        block_count = self.find_hparam(["num_hidden_layers", "n_layer"])
-
          rot_pct = self.find_hparam(["partial_rotary_factor"])
          n_embd = self.find_hparam(["hidden_size", "n_embd"])
          n_head = self.find_hparam(["num_attention_heads", "n_head"])
@@ -4426,7 +4409,7 @@ class Phi2Model(TextModel):
  
          self.gguf_writer.add_embedding_length(n_embd)
          self.gguf_writer.add_feed_forward_length(4 * n_embd)
-        self.gguf_writer.add_block_count(block_count)
+        self.gguf_writer.add_block_count(self.block_count)
          self.gguf_writer.add_head_count(n_head)
          self.gguf_writer.add_head_count_kv(n_head)
          self.gguf_writer.add_layer_norm_eps(self.find_hparam(["layer_norm_epsilon", "layer_norm_eps"]))
@@ -4544,8 +4527,6 @@ class Phi3MiniModel(TextModel):
          special_vocab.add_to_gguf(self.gguf_writer)
  
      def set_gguf_parameters(self):
-        block_count = self.find_hparam(["num_hidden_layers", "n_layer"])
-
          n_embd = self.find_hparam(["hidden_size", "n_embd"])
          n_head = self.find_hparam(["num_attention_heads", "n_head"])
          n_head_kv = self.find_hparam(["num_key_value_heads", "n_head_kv"])
@@ -4559,7 +4540,7 @@ class Phi3MiniModel(TextModel):
          self.gguf_writer.add_rope_scaling_orig_ctx_len(orig_max_pos_embds)
          self.gguf_writer.add_embedding_length(n_embd)
          self.gguf_writer.add_feed_forward_length(self.find_hparam(["intermediate_size"]))
-        self.gguf_writer.add_block_count(block_count)
+        self.gguf_writer.add_block_count(self.block_count)
          self.gguf_writer.add_head_count(n_head)
          self.gguf_writer.add_head_count_kv(n_head_kv)
          self.gguf_writer.add_layer_norm_rms_eps(rms_eps)
@@ -4679,12 +4660,11 @@ class PlamoModel(TextModel):
  
      def set_gguf_parameters(self):
          hparams = self.hparams
-        block_count = hparams["num_hidden_layers"]
  
          self.gguf_writer.add_context_length(4096)  # not in config.json
          self.gguf_writer.add_embedding_length(hparams["hidden_size"])
          self.gguf_writer.add_feed_forward_length(hparams["intermediate_size"])
-        self.gguf_writer.add_block_count(block_count)
+        self.gguf_writer.add_block_count(self.block_count)
          self.gguf_writer.add_head_count(hparams["num_attention_heads"])
          self.gguf_writer.add_head_count_kv(5)  # hparams["num_key_value_heads"]) is wrong
          self.gguf_writer.add_layer_norm_rms_eps(hparams["rms_norm_eps"])
@@ -4807,7 +4787,6 @@ class Plamo2Model(TextModel):
  
      def set_gguf_parameters(self):
          hparams = self.hparams
-        block_count = hparams["num_hidden_layers"]
          self.gguf_writer.add_vocab_size(self.hparams["vocab_size"])
  
          # Which layers are Mamba layers
@@ -4819,10 +4798,10 @@ class Plamo2Model(TextModel):
          num_attention_heads = []
  
          if mamba_enabled:
-            for i in range(block_count):
-                if block_count <= (mamba_step // 2):
+            for i in range(self.block_count):
+                if self.block_count <= (mamba_step // 2):
                      # use attention in last layer
-                    is_mamba = (i != block_count - 1)
+                    is_mamba = (i != self.block_count - 1)
                  else:
                      is_mamba = (i % mamba_step) != (mamba_step // 2)
                  if is_mamba:
@@ -4840,7 +4819,7 @@ class Plamo2Model(TextModel):
          self.gguf_writer.add_embedding_length(hparams.get("hidden_size", 4096))
          self.gguf_writer.add_key_length(hparams.get("hidden_size_per_head", 128))
          self.gguf_writer.add_value_length(hparams.get("hidden_size_per_head", 128))
-        self.gguf_writer.add_block_count(block_count)
+        self.gguf_writer.add_block_count(self.block_count)
          self.gguf_writer.add_layer_norm_rms_eps(hparams.get("rms_norm_eps", 1e-06))
          self.gguf_writer.add_rope_freq_base(hparams.get("rope_theta", 10000))
  
@@ -4897,12 +4876,10 @@ class CodeShellModel(TextModel):
      model_arch = gguf.MODEL_ARCH.CODESHELL
  
      def set_gguf_parameters(self):
-        block_count = self.hparams["n_layer"]
-
          self.gguf_writer.add_context_length(self.hparams["n_positions"])
          self.gguf_writer.add_embedding_length(self.hparams["n_embd"])
          self.gguf_writer.add_feed_forward_length(4 * self.hparams["n_embd"])
-        self.gguf_writer.add_block_count(block_count)
+        self.gguf_writer.add_block_count(self.block_count)
          self.gguf_writer.add_head_count(self.hparams["n_head"])
          self.gguf_writer.add_head_count_kv(self.hparams["num_query_groups"])
          self.gguf_writer.add_layer_norm_eps(self.hparams["layer_norm_epsilon"])
@@ -5044,7 +5021,7 @@ class InternLM2Model(TextModel):
  
      def set_gguf_parameters(self):
          self.gguf_writer.add_context_length(self.hparams["max_position_embeddings"])
-        self.gguf_writer.add_block_count(self.hparams["num_hidden_layers"])
+        self.gguf_writer.add_block_count(self.block_count)
          self.gguf_writer.add_embedding_length(self.hparams["hidden_size"])
          self.gguf_writer.add_feed_forward_length(self.hparams["intermediate_size"])
          self.gguf_writer.add_rope_freq_base(self.hparams["rope_theta"])
@@ -5665,11 +5642,10 @@ class GemmaModel(TextModel):
  
      def set_gguf_parameters(self):
          hparams = self.hparams
-        block_count = hparams["num_hidden_layers"]
  
          self.gguf_writer.add_context_length(hparams["max_position_embeddings"])
          self.gguf_writer.add_embedding_length(hparams["hidden_size"])
-        self.gguf_writer.add_block_count(block_count)
+        self.gguf_writer.add_block_count(self.block_count)
          self.gguf_writer.add_feed_forward_length(hparams["intermediate_size"])
          self.gguf_writer.add_head_count(hparams["num_attention_heads"])
          self.gguf_writer.add_head_count_kv(self.hparams["num_key_value_heads"] if "num_key_value_heads" in hparams else hparams["num_attention_heads"])
@@ -5705,11 +5681,10 @@ class Gemma2Model(TextModel):
  
      def set_gguf_parameters(self):
          hparams = self.hparams
-        block_count = hparams["num_hidden_layers"]
  
          self.gguf_writer.add_context_length(hparams["max_position_embeddings"])
          self.gguf_writer.add_embedding_length(hparams["hidden_size"])
-        self.gguf_writer.add_block_count(block_count)
+        self.gguf_writer.add_block_count(self.block_count)
          self.gguf_writer.add_feed_forward_length(hparams["intermediate_size"])
          self.gguf_writer.add_head_count(hparams["num_attention_heads"])
          self.gguf_writer.add_head_count_kv(self.hparams["num_key_value_heads"] if "num_key_value_heads" in hparams else hparams["num_attention_heads"])
@@ -5753,12 +5728,11 @@ class Gemma3Model(TextModel):
  
      def set_gguf_parameters(self):
          hparams = self.hparams
-        block_count = hparams["num_hidden_layers"]
  
          # some default values are not specified in the hparams
          self.gguf_writer.add_context_length(hparams.get("max_position_embeddings", 131072))
          self.gguf_writer.add_embedding_length(hparams["hidden_size"])
-        self.gguf_writer.add_block_count(block_count)
+        self.gguf_writer.add_block_count(self.block_count)
          self.gguf_writer.add_feed_forward_length(hparams["intermediate_size"])
          self.gguf_writer.add_head_count(hparams.get("num_attention_heads", 8))
          self.gguf_writer.add_layer_norm_rms_eps(self.hparams.get("rms_norm_eps", 1e-6))
@@ -6034,7 +6008,6 @@ class Rwkv6Model(TextModel):
          self._set_vocab_rwkv_world()
  
      def set_gguf_parameters(self):
-        block_count = self.hparams["num_hidden_layers"]
          head_size = self.hparams["head_size"]
          hidden_size = self.hparams["hidden_size"]
          layer_norm_eps = self.hparams["layer_norm_epsilon"]
@@ -6046,7 +6019,7 @@ class Rwkv6Model(TextModel):
          # RWKV isn't context limited
          self.gguf_writer.add_context_length(1048576)
          self.gguf_writer.add_embedding_length(hidden_size)
-        self.gguf_writer.add_block_count(block_count)
+        self.gguf_writer.add_block_count(self.block_count)
          self.gguf_writer.add_layer_norm_eps(layer_norm_eps)
          self.gguf_writer.add_rescale_every_n_layers(rescale_every_n_layers)
          self.gguf_writer.add_wkv_head_size(head_size)
@@ -6110,7 +6083,6 @@ class RWKV6Qwen2Model(Rwkv6Model):
              self._set_vocab_gpt2()
  
      def set_gguf_parameters(self):
-        block_count = self.hparams["num_hidden_layers"]
          num_attention_heads = self.hparams["num_attention_heads"]
          num_key_value_heads = self.hparams["num_key_value_heads"]
          hidden_size = self.hparams["hidden_size"]
@@ -6123,7 +6095,7 @@ class RWKV6Qwen2Model(Rwkv6Model):
          # RWKV isn't context limited
          self.gguf_writer.add_context_length(1048576)
          self.gguf_writer.add_embedding_length(hidden_size)
-        self.gguf_writer.add_block_count(block_count)
+        self.gguf_writer.add_block_count(self.block_count)
          self.gguf_writer.add_wkv_head_size(head_size)
          self.gguf_writer.add_time_mix_extra_dim(time_mix_extra_dim)
          self.gguf_writer.add_time_decay_extra_dim(time_decay_extra_dim)
@@ -6164,7 +6136,6 @@ class Rwkv7Model(TextModel):
          return max(1, round(hidden_size ** exponent * multiplier / 32)) * 32
  
      def set_gguf_parameters(self):
-        block_count = self.hparams["num_hidden_layers"]
          try:
              head_size = self.hparams["head_size"]
              layer_norm_eps = self.hparams["layer_norm_epsilon"]
@@ -6189,7 +6160,7 @@ class Rwkv7Model(TextModel):
          # RWKV isn't context limited
          self.gguf_writer.add_context_length(1048576)
          self.gguf_writer.add_embedding_length(hidden_size)
-        self.gguf_writer.add_block_count(block_count)
+        self.gguf_writer.add_block_count(self.block_count)
          self.gguf_writer.add_layer_norm_eps(layer_norm_eps)
          self.gguf_writer.add_wkv_head_size(head_size)
          self.gguf_writer.add_decay_lora_rank(lora_rank_decay)
@@ -6283,7 +6254,6 @@ class ARwkv7Model(Rwkv7Model):
              self._set_vocab_gpt2()
  
      def set_gguf_parameters(self):
-        block_count = self.hparams["num_hidden_layers"]
          hidden_size = self.hparams["hidden_size"]
          head_size = self.hparams["head_size"]
          rms_norm_eps = self.hparams["rms_norm_eps"]
@@ -6300,7 +6270,7 @@ class ARwkv7Model(Rwkv7Model):
          # RWKV isn't context limited
          self.gguf_writer.add_context_length(1048576)
          self.gguf_writer.add_embedding_length(hidden_size)
-        self.gguf_writer.add_block_count(block_count)
+        self.gguf_writer.add_block_count(self.block_count)
          self.gguf_writer.add_layer_norm_rms_eps(rms_norm_eps)
          self.gguf_writer.add_wkv_head_size(head_size)
          self.gguf_writer.add_decay_lora_rank(lora_rank_decay)
@@ -7524,7 +7494,7 @@ class T5Model(TextModel):
          self.gguf_writer.add_context_length(n_ctx)
          self.gguf_writer.add_embedding_length(self.hparams["d_model"])
          self.gguf_writer.add_feed_forward_length(self.hparams["d_ff"])
-        self.gguf_writer.add_block_count(self.hparams["num_layers"])
+        self.gguf_writer.add_block_count(self.block_count)
          if (dec_n_layer := self.hparams.get("num_decoder_layers")) is not None:
              self.gguf_writer.add_decoder_block_count(dec_n_layer)
          self.gguf_writer.add_head_count(self.hparams["num_heads"])
@@ -7663,7 +7633,7 @@ class T5EncoderModel(TextModel):
          self.gguf_writer.add_context_length(n_ctx)
          self.gguf_writer.add_embedding_length(self.hparams["d_model"])
          self.gguf_writer.add_feed_forward_length(self.hparams["d_ff"])
-        self.gguf_writer.add_block_count(self.hparams["num_layers"])
+        self.gguf_writer.add_block_count(self.block_count)
          self.gguf_writer.add_head_count(self.hparams["num_heads"])
          self.gguf_writer.add_key_length(self.hparams["d_kv"])
          self.gguf_writer.add_value_length(self.hparams["d_kv"])
@@ -7726,7 +7696,7 @@ class JaisModel(TextModel):
          self._set_vocab_gpt2()
  
      def set_gguf_parameters(self):
-        self.gguf_writer.add_block_count(self.hparams["n_layer"])
+        self.gguf_writer.add_block_count(self.block_count)
          self.gguf_writer.add_context_length(self.hparams["n_positions"])
          self.gguf_writer.add_embedding_length(self.hparams["n_embd"])
          self.gguf_writer.add_feed_forward_length(self.hparams["n_inner"])
@@ -8068,7 +8038,7 @@ class ChatGLMModel(TextModel):
          self.gguf_writer.add_context_length(self.hparams.get("seq_length", n_embed))
          self.gguf_writer.add_embedding_length(n_embed)
          self.gguf_writer.add_feed_forward_length(self.hparams.get("ffn_hidden_size", self.hparams.get("intermediate_size", 4 * n_embed)))
-        self.gguf_writer.add_block_count(self.hparams.get("num_layers", self.hparams["num_hidden_layers"]))
+        self.gguf_writer.add_block_count(self.block_count)
          self.gguf_writer.add_head_count(n_head)
          self.gguf_writer.add_head_count_kv(n_head_kv)
          self.gguf_writer.add_layer_norm_rms_eps(self.hparams.get("layernorm_epsilon",1e-5))
@@ -8150,7 +8120,6 @@ class ExaoneModel(TextModel):
          num_kv_heads = hparams.get("num_key_value_heads", num_heads)
          layer_norm_eps = hparams["layer_norm_epsilon"]
          intermediate_size = hparams["intermediate_size"] if "intermediate_size" in hparams else 4 * embed_dim
-        num_layers = hparams["num_layers"]
          # ignore for now as EXAONE-3.0-7.8B-Instruct attentino_dropout is 0.0
          # attention_dropout_rate = hparams["attention_dropout"]
          # ignore for now as EXAONE-3.0-7.8B-Instruct embed_dropout is 0.0
@@ -8161,7 +8130,7 @@ class ExaoneModel(TextModel):
          self.gguf_writer.add_context_length(max_position_embeddings)
          self.gguf_writer.add_layer_norm_rms_eps(layer_norm_eps)
          self.gguf_writer.add_feed_forward_length(intermediate_size)
-        self.gguf_writer.add_block_count(num_layers)
+        self.gguf_writer.add_block_count(self.block_count)
          self.gguf_writer.add_file_type(self.ftype)
  
          if (rope_theta := self.hparams.get("rope_theta")) is not None:
author	Sigbjørn Skjæret <redacted>
	Wed, 19 Nov 2025 10:52:38 +0000 (11:52 +0100)
committer	GitHub <redacted>
	Wed, 19 Nov 2025 10:52:38 +0000 (11:52 +0100)