gguf-py: Support 01.AI Yi models (#3943)

author Kerfuffle <redacted>

Sat, 4 Nov 2023 22:20:34 +0000 (16:20 -0600)

committer GitHub <redacted>

Sat, 4 Nov 2023 22:20:34 +0000 (16:20 -0600)
author Kerfuffle <redacted>
Sat, 4 Nov 2023 22:20:34 +0000 (16:20 -0600)
committer GitHub <redacted>
Sat, 4 Nov 2023 22:20:34 +0000 (16:20 -0600)
diff --git a/gguf-py/gguf/gguf.py b/gguf-py/gguf/gguf.py

index 727b4e55495a76e4cf34d658ff258218bab5e0e9..a2271d225d0012ff64ed22f819e54d0385b0c6c4 100644 (file)
--- a/gguf-py/gguf/gguf.py
+++ b/gguf-py/gguf/gguf.py
@@ -393,6 +393,7 @@ class TensorNameMap:
              "layers.{bid}.attention_norm",                         # llama-pth
              "encoder.layer.{bid}.attention.output.LayerNorm",      # bert
              "language_model.encoder.layers.{bid}.input_layernorm", # persimmon
+            "model.layers.{bid}.ln1",                              # yi
          ),
  
          # Attention norm 2
@@ -464,6 +465,7 @@ class TensorNameMap:
              "layers.{bid}.ffn_norm",                                        # llama-pth
              "encoder.layer.{bid}.output.LayerNorm",                         # bert
              "language_model.encoder.layers.{bid}.post_attention_layernorm", # persimmon
+            "model.layers.{bid}.ln2",                                       # yi
          ),
  
          # Feed-forward up