llama : add missing model types

author Georgi Gerganov <redacted>

Thu, 28 Nov 2024 18:45:07 +0000 (20:45 +0200)

committer Georgi Gerganov <redacted>

Thu, 28 Nov 2024 18:45:07 +0000 (20:45 +0200)
author Georgi Gerganov <redacted>
Thu, 28 Nov 2024 18:45:07 +0000 (20:45 +0200)
committer Georgi Gerganov <redacted>
Thu, 28 Nov 2024 18:45:07 +0000 (20:45 +0200)
diff --git a/src/llama.cpp b/src/llama.cpp

index af5e686e07eda9c1748b694343ff114e4663858e..22b951ba2a94686ab332d40d15162091553031f7 100644 (file)
--- a/src/llama.cpp
+++ b/src/llama.cpp
@@ -2341,6 +2341,7 @@ enum e_model {
      MODEL_16B,
      MODEL_20B,
      MODEL_30B,
+    MODEL_32B,
      MODEL_34B,
      MODEL_35B,
      MODEL_40B,
@@ -5330,6 +5331,7 @@ static const char * llama_model_type_name(e_model type) {
          case MODEL_16B:           return "16B";
          case MODEL_20B:           return "20B";
          case MODEL_30B:           return "30B";
+        case MODEL_32B:           return "32B";
          case MODEL_34B:           return "34B";
          case MODEL_35B:           return "35B";
          case MODEL_40B:           return "40B";
@@ -5690,7 +5692,10 @@ static void llm_load_hparams(
                      case 24: model.type = hparams.n_embd == 1024 ? e_model::MODEL_0_5B : e_model::MODEL_1B; break;
                      case 28: model.type = hparams.n_embd == 1536 ? e_model::MODEL_1_5B : e_model::MODEL_7B; break;
                      case 32: model.type = e_model::MODEL_7B; break;
+                    case 36: model.type = e_model::MODEL_3B; break;
                      case 40: model.type = hparams.n_head() == 20 ? e_model::MODEL_4B : e_model::MODEL_13B; break;
+                    case 48: model.type = e_model::MODEL_14B; break;
+                    case 64: model.type = e_model::MODEL_32B; break;
                      case 80: model.type = e_model::MODEL_70B; break;
                      default: model.type = e_model::MODEL_UNKNOWN;
                  }
author	Georgi Gerganov <redacted>
	Thu, 28 Nov 2024 18:45:07 +0000 (20:45 +0200)
committer	Georgi Gerganov <redacted>
	Thu, 28 Nov 2024 18:45:07 +0000 (20:45 +0200)