llama : add additional suffixes for model params (#4834)

author Brian <redacted>

Wed, 10 Jan 2024 14:09:53 +0000 (01:09 +1100)

committer GitHub <redacted>

Wed, 10 Jan 2024 14:09:53 +0000 (16:09 +0200)
author Brian <redacted>
Wed, 10 Jan 2024 14:09:53 +0000 (01:09 +1100)
committer GitHub <redacted>
Wed, 10 Jan 2024 14:09:53 +0000 (16:09 +0200)
diff --git a/llama.cpp b/llama.cpp

index 0f09d0c2bebf541392d63eb02b824172f9a3c4f8..e1f1932baecf15721e35ad164b41831eeac45637 100644 (file)
--- a/llama.cpp
+++ b/llama.cpp
@@ -3146,7 +3146,15 @@ static void llm_load_print_meta(llama_model_loader & ml, llama_model & model) {
      LLAMA_LOG_INFO("%s: rope_finetuned   = %s\n",     __func__, hparams.rope_finetuned ? "yes" : "unknown");
      LLAMA_LOG_INFO("%s: model type       = %s\n",     __func__, llama_model_type_name(model.type));
      LLAMA_LOG_INFO("%s: model ftype      = %s\n",     __func__, llama_model_ftype_name(model.ftype).c_str());
-    LLAMA_LOG_INFO("%s: model params     = %.2f B\n", __func__, ml.n_elements*1e-9);
+    if (ml.n_elements >= 1e12) {
+        LLAMA_LOG_INFO("%s: model params     = %.2f T\n", __func__, ml.n_elements*1e-12);
+    } else if (ml.n_elements >= 1e9) {
+        LLAMA_LOG_INFO("%s: model params     = %.2f B\n", __func__, ml.n_elements*1e-9);
+    } else if (ml.n_elements >= 1e6) {
+        LLAMA_LOG_INFO("%s: model params     = %.2f M\n", __func__, ml.n_elements*1e-6);
+    } else {
+        LLAMA_LOG_INFO("%s: model params     = %.2f K\n", __func__, ml.n_elements*1e-3);
+    }
      if (ml.n_bytes < GiB) {
          LLAMA_LOG_INFO("%s: model size       = %.2f MiB (%.2f BPW) \n", __func__, ml.n_bytes/1024.0/1024.0,        ml.n_bytes*8.0/ml.n_elements);
      } else {
author	Brian <redacted>
	Wed, 10 Jan 2024 14:09:53 +0000 (01:09 +1100)
committer	GitHub <redacted>
	Wed, 10 Jan 2024 14:09:53 +0000 (16:09 +0200)