llama : update llama_model API names (#11063)

author Georgi Gerganov <redacted>

Mon, 6 Jan 2025 08:55:18 +0000 (10:55 +0200)

committer GitHub <redacted>

Mon, 6 Jan 2025 08:55:18 +0000 (10:55 +0200)
author Georgi Gerganov <redacted>
Mon, 6 Jan 2025 08:55:18 +0000 (10:55 +0200)
committer GitHub <redacted>
Mon, 6 Jan 2025 08:55:18 +0000 (10:55 +0200)
diff --git a/common/common.cpp b/common/common.cpp

index d6a7ab753f6b371238e125cf6c1862e8c4c98dce..4fd36105e42e428a486111d7823b8da22839b47a 100644 (file)
--- a/common/common.cpp
+++ b/common/common.cpp
@@ -846,7 +846,7 @@ struct common_init_result common_init_from_params(common_params & params) {
      } else if (!params.model_url.empty()) {
          model = common_load_model_from_url(params.model_url, params.model, params.hf_token, mparams);
      } else {
-        model = llama_load_model_from_file(params.model.c_str(), mparams);
+        model = llama_model_load_from_file(params.model.c_str(), mparams);
      }
  
      if (model == NULL) {
@@ -873,7 +873,7 @@ struct common_init_result common_init_from_params(common_params & params) {
          }
  
          if (!ok) {
-            llama_free_model(model);
+            llama_model_free(model);
  
              return iparams;
          }
@@ -884,7 +884,7 @@ struct common_init_result common_init_from_params(common_params & params) {
      llama_context * lctx = llama_new_context_with_model(model, cparams);
      if (lctx == NULL) {
          LOG_ERR("%s: failed to create context with model '%s'\n", __func__, params.model.c_str());
-        llama_free_model(model);
+        llama_model_free(model);
          return iparams;
      }
  
@@ -900,7 +900,7 @@ struct common_init_result common_init_from_params(common_params & params) {
          const auto cvec = common_control_vector_load(params.control_vectors);
          if (cvec.n_embd == -1) {
              llama_free(lctx);
-            llama_free_model(model);
+            llama_model_free(model);
  
              return iparams;
          }
@@ -913,7 +913,7 @@ struct common_init_result common_init_from_params(common_params & params) {
                                               params.control_vector_layer_end);
          if (err) {
              llama_free(lctx);
-            llama_free_model(model);
+            llama_model_free(model);
  
              return iparams;
          }
@@ -926,7 +926,7 @@ struct common_init_result common_init_from_params(common_params & params) {
          if (lora == nullptr) {
              LOG_ERR("%s: failed to apply lora adapter '%s'\n", __func__, la.path.c_str());
              llama_free(lctx);
-            llama_free_model(model);
+            llama_model_free(model);
              return iparams;
          }
  
@@ -1411,7 +1411,7 @@ struct llama_model * common_load_model_from_url(
          }
      }
  
-    return llama_load_model_from_file(local_path.c_str(), params);
+    return llama_model_load_from_file(local_path.c_str(), params);
  }
  
  struct llama_model * common_load_model_from_hf(
diff --git a/examples/batched-bench/batched-bench.cpp b/examples/batched-bench/batched-bench.cpp

index a3b21ad6bce4495177ddc262a89431b4cb227db0..dd75ff9f16319309611e294722fa5549a07872ba 100644 (file)
--- a/examples/batched-bench/batched-bench.cpp
+++ b/examples/batched-bench/batched-bench.cpp
@@ -38,7 +38,7 @@ int main(int argc, char ** argv) {
  
      llama_model_params model_params = common_model_params_to_llama(params);
  
-    llama_model * model = llama_load_model_from_file(params.model.c_str(), model_params);
+    llama_model * model = llama_model_load_from_file(params.model.c_str(), model_params);
  
      if (model == NULL) {
          fprintf(stderr , "%s: error: unable to load model\n" , __func__);
@@ -194,7 +194,7 @@ int main(int argc, char ** argv) {
      llama_batch_free(batch);
  
      llama_free(ctx);
-    llama_free_model(model);
+    llama_model_free(model);
  
      llama_backend_free();
  
diff --git a/examples/batched/batched.cpp b/examples/batched/batched.cpp

index 2e25b62f66b0018ef7467a0ac55b64f8d24b13cc..d34b030996ac2a44c7de69dc76dfccdbab581a7e 100644 (file)
--- a/examples/batched/batched.cpp
+++ b/examples/batched/batched.cpp
@@ -41,7 +41,7 @@ int main(int argc, char ** argv) {
  
      llama_model_params model_params = common_model_params_to_llama(params);
  
-    llama_model * model = llama_load_model_from_file(params.model.c_str(), model_params);
+    llama_model * model = llama_model_load_from_file(params.model.c_str(), model_params);
  
      if (model == NULL) {
          LOG_ERR("%s: error: unable to load model\n" , __func__);
@@ -236,7 +236,7 @@ int main(int argc, char ** argv) {
  
      llama_sampler_free(smpl);
      llama_free(ctx);
-    llama_free_model(model);
+    llama_model_free(model);
  
      llama_backend_free();
  
diff --git a/examples/gritlm/gritlm.cpp b/examples/gritlm/gritlm.cpp

index 18a945b33905fa4fc86e1b91d4cc80d373902bac..4d2db56249efcd81fc706293942e82de6cf56616 100644 (file)
--- a/examples/gritlm/gritlm.cpp
+++ b/examples/gritlm/gritlm.cpp
@@ -165,7 +165,7 @@ int main(int argc, char * argv[]) {
  
      llama_backend_init();
  
-    llama_model * model = llama_load_model_from_file(params.model.c_str(), mparams);
+    llama_model * model = llama_model_load_from_file(params.model.c_str(), mparams);
  
      // create generation context
      llama_context * ctx = llama_new_context_with_model(model, cparams);
@@ -219,7 +219,7 @@ int main(int argc, char * argv[]) {
  
      llama_sampler_free(smpl);
      llama_free(ctx);
-    llama_free_model(model);
+    llama_model_free(model);
      llama_backend_free();
  
      return 0;
diff --git a/examples/llama-bench/llama-bench.cpp b/examples/llama-bench/llama-bench.cpp

index 2338ad1067dded1d9aeada16b241f53752725e35..2a0916766099d4114999aadad145806a8660b0b1 100644 (file)
--- a/examples/llama-bench/llama-bench.cpp
+++ b/examples/llama-bench/llama-bench.cpp
@@ -1526,10 +1526,10 @@ int main(int argc, char ** argv) {
          // keep the same model between tests when possible
          if (!lmodel || !prev_inst || !inst.equal_mparams(*prev_inst)) {
              if (lmodel) {
-                llama_free_model(lmodel);
+                llama_model_free(lmodel);
              }
  
-            lmodel = llama_load_model_from_file(inst.model.c_str(), inst.to_llama_mparams());
+            lmodel = llama_model_load_from_file(inst.model.c_str(), inst.to_llama_mparams());
              if (lmodel == NULL) {
                  fprintf(stderr, "%s: error: failed to load model '%s'\n", __func__, inst.model.c_str());
                  return 1;
@@ -1540,7 +1540,7 @@ int main(int argc, char ** argv) {
          llama_context * ctx = llama_new_context_with_model(lmodel, inst.to_llama_cparams());
          if (ctx == NULL) {
              fprintf(stderr, "%s: error: failed to create context with model '%s'\n", __func__, inst.model.c_str());
-            llama_free_model(lmodel);
+            llama_model_free(lmodel);
              return 1;
          }
  
@@ -1626,7 +1626,7 @@ int main(int argc, char ** argv) {
          ggml_threadpool_free_fn(threadpool);
      }
  
-    llama_free_model(lmodel);
+    llama_model_free(lmodel);
  
      if (p) {
          p->print_footer();
diff --git a/examples/llava/llava-cli.cpp b/examples/llava/llava-cli.cpp

index 2691c6e6b2dd2c23a82d148ac87b90b5a2b268a1..27215a42e8a10a5bbbbe0cce65df24d40b306c52 100644 (file)
--- a/examples/llava/llava-cli.cpp
+++ b/examples/llava/llava-cli.cpp
@@ -221,7 +221,7 @@ static struct llama_model * llava_init(common_params * params) {
  
      llama_model_params model_params = common_model_params_to_llama(*params);
  
-    llama_model * model = llama_load_model_from_file(params->model.c_str(), model_params);
+    llama_model * model = llama_model_load_from_file(params->model.c_str(), model_params);
      if (model == NULL) {
          LOG_ERR("%s: unable to load model\n" , __func__);
          return NULL;
@@ -265,7 +265,7 @@ static void llava_free(struct llava_context * ctx_llava) {
      }
  
      llama_free(ctx_llava->ctx_llama);
-    llama_free_model(ctx_llava->model);
+    llama_model_free(ctx_llava->model);
      llama_backend_free();
  }
  
@@ -323,7 +323,7 @@ int main(int argc, char ** argv) {
          }
      }
  
-    llama_free_model(model);
+    llama_model_free(model);
  
      return 0;
  }
diff --git a/examples/llava/minicpmv-cli.cpp b/examples/llava/minicpmv-cli.cpp

index e9cbb51ed90ab8e743c7dbf00413800045b94066..2342bdd0956421daeea0d523ff8cd93cbedc7982 100644 (file)
--- a/examples/llava/minicpmv-cli.cpp
+++ b/examples/llava/minicpmv-cli.cpp
@@ -31,7 +31,7 @@ static struct llama_model * llava_init(common_params * params) {
  
      llama_model_params model_params = common_model_params_to_llama(*params);
  
-    llama_model * model = llama_load_model_from_file(params->model.c_str(), model_params);
+    llama_model * model = llama_model_load_from_file(params->model.c_str(), model_params);
      if (model == NULL) {
          LOG_ERR("%s: unable to load model\n" , __func__);
          return NULL;
@@ -75,7 +75,7 @@ static void llava_free(struct llava_context * ctx_llava) {
      }
  
      llama_free(ctx_llava->ctx_llama);
-    llama_free_model(ctx_llava->model);
+    llama_model_free(ctx_llava->model);
      llama_backend_free();
  }
  
diff --git a/examples/llava/qwen2vl-cli.cpp b/examples/llava/qwen2vl-cli.cpp

index e86a60280aed68c514a40795de77554c22f9b431..f3e5d66e2c4e86f38083c7bd9729349cdcd90877 100644 (file)
--- a/examples/llava/qwen2vl-cli.cpp
+++ b/examples/llava/qwen2vl-cli.cpp
@@ -310,7 +310,7 @@ static struct llama_model * llava_init(common_params * params) {
  
      llama_model_params model_params = common_model_params_to_llama(*params);
  
-    llama_model * model = llama_load_model_from_file(params->model.c_str(), model_params);
+    llama_model * model = llama_model_load_from_file(params->model.c_str(), model_params);
      if (model == NULL) {
          LOG_ERR("%s: unable to load model\n" , __func__);
          return NULL;
@@ -354,7 +354,7 @@ static void llava_free(struct llava_context * ctx_llava) {
      }
  
      llama_free(ctx_llava->ctx_llama);
-    llama_free_model(ctx_llava->model);
+    llama_model_free(ctx_llava->model);
      llama_backend_free();
  }
  
@@ -575,7 +575,7 @@ int main(int argc, char ** argv) {
          }
      }
  
-    llama_free_model(model);
+    llama_model_free(model);
  
      return 0;
  }
diff --git a/examples/passkey/passkey.cpp b/examples/passkey/passkey.cpp

index 09bba708f6f91bb17b660e10f07f2813d5f01ea2..ea91f376cd5373bd04581358797c5bcd0e999b04 100644 (file)
--- a/examples/passkey/passkey.cpp
+++ b/examples/passkey/passkey.cpp
@@ -63,7 +63,7 @@ int main(int argc, char ** argv) {
  
      llama_model_params model_params = common_model_params_to_llama(params);
  
-    llama_model * model = llama_load_model_from_file(params.model.c_str(), model_params);
+    llama_model * model = llama_model_load_from_file(params.model.c_str(), model_params);
  
      if (model == NULL) {
          LOG_ERR("%s: unable to load model\n" , __func__);
@@ -266,7 +266,7 @@ int main(int argc, char ** argv) {
      llama_batch_free(batch);
  
      llama_free(ctx);
-    llama_free_model(model);
+    llama_model_free(model);
  
      llama_backend_free();
  
diff --git a/examples/quantize-stats/quantize-stats.cpp b/examples/quantize-stats/quantize-stats.cpp

index ab91d0b40aa031e87c00332ca251f3080e1098b4..9bfbb88623a1617f15d296a74f8b17f38dff25aa 100644 (file)
--- a/examples/quantize-stats/quantize-stats.cpp
+++ b/examples/quantize-stats/quantize-stats.cpp
@@ -309,7 +309,7 @@ int main(int argc, char ** argv) {
          auto mparams = llama_model_default_params();
          mparams.use_mlock  = false;
  
-        model = llama_load_model_from_file(params.model.c_str(), mparams);
+        model = llama_model_load_from_file(params.model.c_str(), mparams);
  
          if (model == NULL) {
              fprintf(stderr, "%s: error: failed to load model '%s'\n", __func__, params.model.c_str());
@@ -323,7 +323,7 @@ int main(int argc, char ** argv) {
  
          if (ctx == NULL) {
              fprintf(stderr, "%s: error: failed to create context with model '%s'\n", __func__, params.model.c_str());
-            llama_free_model(model);
+            llama_model_free(model);
              return 1;
          }
      }
@@ -347,7 +347,7 @@ int main(int argc, char ** argv) {
              fprintf(stderr, "%s: error: Quantization should be tested with a float model, "
                  "this model contains already quantized layers (%s is type %d)\n", __func__, kv_tensor.first.c_str(), kv_tensor.second->type);
              llama_free(ctx);
-            llama_free_model(model);
+            llama_model_free(model);
              return 1;
          }
          included_layers++;
@@ -409,7 +409,7 @@ int main(int argc, char ** argv) {
  
  
      llama_free(ctx);
-    llama_free_model(model);
+    llama_model_free(model);
      // report timing
      {
          const int64_t t_main_end_us = ggml_time_us();
diff --git a/examples/run/run.cpp b/examples/run/run.cpp

index 75b81727202381d4fc19ea9a103e9284a699cebe..c52a7961fb3580eb39788ebde01078396e275a7a 100644 (file)
--- a/examples/run/run.cpp
+++ b/examples/run/run.cpp
@@ -664,7 +664,7 @@ class LlamaData {
              "\r%*s"
              "\rLoading model",
              get_terminal_width(), " ");
-        llama_model_ptr model(llama_load_model_from_file(opt.model_.c_str(), opt.model_params));
+        llama_model_ptr model(llama_model_load_from_file(opt.model_.c_str(), opt.model_params));
          if (!model) {
              printe("%s: error: unable to load model from file: %s\n", __func__, opt.model_.c_str());
          }
diff --git a/examples/simple-chat/simple-chat.cpp b/examples/simple-chat/simple-chat.cpp

index 7f4da666b08ecfc4bbf1c0a78cf9f3894dda4431..d72f5bcdde67c83bbb4f72b00595110a034c18a5 100644 (file)
--- a/examples/simple-chat/simple-chat.cpp
+++ b/examples/simple-chat/simple-chat.cpp
@@ -69,7 +69,7 @@ int main(int argc, char ** argv) {
      llama_model_params model_params = llama_model_default_params();
      model_params.n_gpu_layers = ngl;
  
-    llama_model * model = llama_load_model_from_file(model_path.c_str(), model_params);
+    llama_model * model = llama_model_load_from_file(model_path.c_str(), model_params);
      if (!model) {
          fprintf(stderr , "%s: error: unable to load model\n" , __func__);
          return 1;
@@ -194,7 +194,7 @@ int main(int argc, char ** argv) {
      }
      llama_sampler_free(smpl);
      llama_free(ctx);
-    llama_free_model(model);
+    llama_model_free(model);
  
      return 0;
  }
diff --git a/examples/simple/simple.cpp b/examples/simple/simple.cpp

index 3288c0250a001cea6b2772507c7eaf6201baa0bf..f691178904303fdc8ecaa0d2222b99c59add1a07 100644 (file)
--- a/examples/simple/simple.cpp
+++ b/examples/simple/simple.cpp
@@ -83,7 +83,7 @@ int main(int argc, char ** argv) {
      llama_model_params model_params = llama_model_default_params();
      model_params.n_gpu_layers = ngl;
  
-    llama_model * model = llama_load_model_from_file(model_path.c_str(), model_params);
+    llama_model * model = llama_model_load_from_file(model_path.c_str(), model_params);
  
      if (model == NULL) {
          fprintf(stderr , "%s: error: unable to load model\n" , __func__);
@@ -199,7 +199,7 @@ int main(int argc, char ** argv) {
  
      llama_sampler_free(smpl);
      llama_free(ctx);
-    llama_free_model(model);
+    llama_model_free(model);
  
      return 0;
  }
diff --git a/examples/tokenize/tokenize.cpp b/examples/tokenize/tokenize.cpp

index 57d9d431241840d9a1f228488db6746e26c26829..684ca054aa487e4bfce134efc5fbc9fe8a722c43 100644 (file)
--- a/examples/tokenize/tokenize.cpp
+++ b/examples/tokenize/tokenize.cpp
@@ -338,7 +338,7 @@ int main(int raw_argc, char ** raw_argv) {
  
      llama_model_params model_params = llama_model_default_params();
      model_params.vocab_only = true;
-    llama_model * model = llama_load_model_from_file(model_path, model_params);
+    llama_model * model = llama_model_load_from_file(model_path, model_params);
      if (!model) {
          fprintf(stderr, "Error: could not load model from file '%s'.\n", model_path);
          return 1;
@@ -408,7 +408,7 @@ int main(int raw_argc, char ** raw_argv) {
      }
      // silence valgrind
      llama_free(ctx);
-    llama_free_model(model);
+    llama_model_free(model);
  
      return 0;
  }
diff --git a/include/llama-cpp.h b/include/llama-cpp.h

index 1500cb2fc9a7d5bd75865ad870c7f3ba3ba95942..11306b17fac25ab28253b6dca14fa48c2b5cf0eb 100644 (file)
--- a/include/llama-cpp.h
+++ b/include/llama-cpp.h
@@ -9,7 +9,7 @@
  #include "llama.h"
  
  struct llama_model_deleter {
-    void operator()(llama_model * model) { llama_free_model(model); }
+    void operator()(llama_model * model) { llama_model_free(model); }
  };
  
  struct llama_context_deleter {
diff --git a/include/llama.h b/include/llama.h

index 0f619aa19b7fd7e6281225b3b5572ae753d6049c..0295a51fbee51d5a105ae424ae5bc1b81919184a 100644 (file)
--- a/include/llama.h
+++ b/include/llama.h
@@ -413,12 +413,19 @@ extern "C" {
      // Call once at the end of the program - currently only used for MPI
      LLAMA_API void llama_backend_free(void);
  
-    LLAMA_API struct llama_model * llama_load_model_from_file(
+    DEPRECATED(LLAMA_API struct llama_model * llama_load_model_from_file(
+                             const char * path_model,
+              struct llama_model_params   params),
+            "use llama_model_load_from_file instead");
+
+    LLAMA_API struct llama_model * llama_model_load_from_file(
                               const char * path_model,
                struct llama_model_params   params);
  
-    // TODO: rename to llama_model_free
-    LLAMA_API void llama_free_model(struct llama_model * model);
+    DEPRECATED(LLAMA_API void llama_free_model(struct llama_model * model),
+            "use llama_model_free instead");
+
+    LLAMA_API void llama_model_free(struct llama_model * model);
  
      // TODO: rename to llama_init_from_model
      LLAMA_API struct llama_context * llama_new_context_with_model(
diff --git a/src/llama-model.cpp b/src/llama-model.cpp

index 22596499a43ecfcb998e3d72915aeda4cce888d0..7deb3683bbccb95d044ae5e26ef80bddbdd97800 100644 (file)
--- a/src/llama-model.cpp
+++ b/src/llama-model.cpp
@@ -2009,6 +2009,10 @@ struct llama_model_params llama_model_default_params() {
  }
  
  void llama_free_model(struct llama_model * model) {
+    llama_model_free(model);
+}
+
+void llama_model_free(struct llama_model * model) {
      delete model;
  }
  
diff --git a/src/llama.cpp b/src/llama.cpp

index 4a6798f416fe9029ff7af5f0f53c378eedbdc994..7337c34ce573ebf1e3b4c3fad47764d33447f985 100644 (file)
--- a/src/llama.cpp
+++ b/src/llama.cpp
@@ -11656,6 +11656,12 @@ int64_t llama_time_us(void) {
  struct llama_model * llama_load_model_from_file(
          const char * path_model,
          struct llama_model_params params) {
+    return llama_model_load_from_file(path_model, params);
+}
+
+struct llama_model * llama_model_load_from_file(
+        const char * path_model,
+        struct llama_model_params params) {
      ggml_time_init();
  
      llama_model * model = new llama_model;
@@ -11694,7 +11700,7 @@ struct llama_model * llama_load_model_from_file(
          ggml_backend_reg_t rpc_reg = ggml_backend_reg_by_name("RPC");
          if (!rpc_reg) {
              LLAMA_LOG_ERROR("%s: failed to find RPC backend\n", __func__);
-            llama_free_model(model);
+            llama_model_free(model);
              return nullptr;
          }
  
@@ -11702,7 +11708,7 @@ struct llama_model * llama_load_model_from_file(
          ggml_backend_rpc_add_device_t ggml_backend_rpc_add_device_fn = (ggml_backend_rpc_add_device_t) ggml_backend_reg_get_proc_address(rpc_reg, "ggml_backend_rpc_add_device");
          if (!ggml_backend_rpc_add_device_fn) {
              LLAMA_LOG_ERROR("%s: failed to find RPC device add function\n", __func__);
-            llama_free_model(model);
+            llama_model_free(model);
              return nullptr;
          }
  
@@ -11712,7 +11718,7 @@ struct llama_model * llama_load_model_from_file(
                  model->devices.push_back(dev);
              } else {
                  LLAMA_LOG_ERROR("%s: failed to add RPC device for server '%s'\n", __func__, server.c_str());
-                llama_free_model(model);
+                llama_model_free(model);
                  return nullptr;
              }
          }
@@ -11744,7 +11750,7 @@ struct llama_model * llama_load_model_from_file(
      if (params.split_mode == LLAMA_SPLIT_MODE_NONE) {
          if (params.main_gpu < 0 || params.main_gpu >= (int)model->devices.size()) {
              LLAMA_LOG_ERROR("%s: invalid value for main_gpu: %d (available devices: %d)\n", __func__, params.main_gpu, (int)model->devices.size());
-            llama_free_model(model);
+            llama_model_free(model);
              return nullptr;
          }
          ggml_backend_dev_t main_gpu = model->devices[params.main_gpu];
@@ -11767,7 +11773,7 @@ struct llama_model * llama_load_model_from_file(
              LLAMA_LOG_INFO("%s: cancelled model load\n", __func__);
          }
  
-        llama_free_model(model);
+        llama_model_free(model);
          return nullptr;
      }
  
diff --git a/tests/test-autorelease.cpp b/tests/test-autorelease.cpp

index 57fa000114d5decbb9939708c3624273b05f5368..ba084a91a02ef9c60af7e25e242415bf00244b48 100644 (file)
--- a/tests/test-autorelease.cpp
+++ b/tests/test-autorelease.cpp
@@ -13,10 +13,10 @@ int main(int argc, char ** argv) {
  
      std::thread([&model_path]() {
          llama_backend_init();
-        auto * model = llama_load_model_from_file(model_path, llama_model_default_params());
+        auto * model = llama_model_load_from_file(model_path, llama_model_default_params());
          auto * ctx = llama_new_context_with_model(model, llama_context_default_params());
          llama_free(ctx);
-        llama_free_model(model);
+        llama_model_free(model);
          llama_backend_free();
      }).join();
  
diff --git a/tests/test-model-load-cancel.cpp b/tests/test-model-load-cancel.cpp

index 858535c3c40204fbe8ab026934f2167ca84e0d32..9095826fa9884f876fdb2d8265b03a49b9b68d40 100644 (file)
--- a/tests/test-model-load-cancel.cpp
+++ b/tests/test-model-load-cancel.cpp
@@ -21,7 +21,7 @@ int main(int argc, char *argv[] ) {
          (void) ctx;
          return progress > 0.50;
      };
-    auto * model = llama_load_model_from_file(model_path, params);
+    auto * model = llama_model_load_from_file(model_path, params);
      llama_backend_free();
      return model == nullptr ? EXIT_SUCCESS : EXIT_FAILURE;
  }
diff --git a/tests/test-tokenizer-0.cpp b/tests/test-tokenizer-0.cpp

index 0af85f0020e195c4c0d637a40e73f29345171ed9..121c2c60c93612238f255217feed668d089dfac8 100644 (file)
--- a/tests/test-tokenizer-0.cpp
+++ b/tests/test-tokenizer-0.cpp
@@ -152,7 +152,7 @@ int main(int argc, char **argv) {
  
          mparams.vocab_only = true;
  
-        model = llama_load_model_from_file(fname.c_str(), mparams);
+        model = llama_model_load_from_file(fname.c_str(), mparams);
  
          if (model == NULL) {
              fprintf(stderr, "%s: error: failed to load vocab '%s'\n", __func__, fname.c_str());
@@ -165,7 +165,7 @@ int main(int argc, char **argv) {
  
          if (ctx == NULL) {
              fprintf(stderr, "%s: error: failed to load vocab '%s'\n", __func__, fname.c_str());
-            llama_free_model(model);
+            llama_model_free(model);
              return 1;
          }
      }
@@ -300,7 +300,7 @@ int main(int argc, char **argv) {
          fprintf(stderr, "%s : tokens written to '%s'\n", __func__, (fname_text + ".tokcpp").c_str());
      }
  
-    llama_free_model(model);
+    llama_model_free(model);
      llama_free(ctx);
  
      llama_backend_free();
diff --git a/tests/test-tokenizer-1-bpe.cpp b/tests/test-tokenizer-1-bpe.cpp

index 0ff7fc8333d8a4f7f8e96c261bf79ec589777442..5718fab0401b80c7256c6e0ff409df1248cd802d 100644 (file)
--- a/tests/test-tokenizer-1-bpe.cpp
+++ b/tests/test-tokenizer-1-bpe.cpp
@@ -46,7 +46,7 @@ int main(int argc, char **argv) {
  
          mparams.vocab_only = true;
  
-        model = llama_load_model_from_file(fname.c_str(), mparams);
+        model = llama_model_load_from_file(fname.c_str(), mparams);
  
          if (model == NULL) {
              fprintf(stderr, "%s: error: failed to load vocab '%s'\n", __func__, fname.c_str());
@@ -59,7 +59,7 @@ int main(int argc, char **argv) {
  
          if (ctx == NULL) {
              fprintf(stderr, "%s: error: failed to load vocab '%s'\n", __func__, fname.c_str());
-            llama_free_model(model);
+            llama_model_free(model);
              return 1;
          }
      }
@@ -143,7 +143,7 @@ int main(int argc, char **argv) {
          }
      }
  
-    llama_free_model(model);
+    llama_model_free(model);
      llama_free(ctx);
  
      llama_backend_free();
diff --git a/tests/test-tokenizer-1-spm.cpp b/tests/test-tokenizer-1-spm.cpp

index 9b0716a433332a7052395c8b172ad3811869423d..ac05387c90949d63c15c509b72dd43feca1ece73 100644 (file)
--- a/tests/test-tokenizer-1-spm.cpp
+++ b/tests/test-tokenizer-1-spm.cpp
@@ -34,7 +34,7 @@ int main(int argc, char ** argv) {
  
          mparams.vocab_only = true;
  
-        model = llama_load_model_from_file(fname.c_str(), mparams);
+        model = llama_model_load_from_file(fname.c_str(), mparams);
  
          if (model == NULL) {
              fprintf(stderr, "%s: error: failed to load vocab '%s'\n", __func__, fname.c_str());
@@ -47,7 +47,7 @@ int main(int argc, char ** argv) {
  
          if (ctx == NULL) {
              fprintf(stderr, "%s: error: failed to load vocab '%s'\n", __func__, fname.c_str());
-            llama_free_model(model);
+            llama_model_free(model);
              return 1;
          }
      }
@@ -113,7 +113,7 @@ int main(int argc, char ** argv) {
          }
      }
  
-    llama_free_model(model);
+    llama_model_free(model);
      llama_free(ctx);
  
      llama_backend_free();
author	Georgi Gerganov <redacted>
	Mon, 6 Jan 2025 08:55:18 +0000 (10:55 +0200)
committer	GitHub <redacted>
	Mon, 6 Jan 2025 08:55:18 +0000 (10:55 +0200)
common/common.cpp		patch \| blob \| history
examples/batched-bench/batched-bench.cpp		patch \| blob \| history
examples/batched/batched.cpp		patch \| blob \| history
examples/gritlm/gritlm.cpp		patch \| blob \| history
examples/llama-bench/llama-bench.cpp		patch \| blob \| history
examples/llava/llava-cli.cpp		patch \| blob \| history
examples/llava/minicpmv-cli.cpp		patch \| blob \| history
examples/llava/qwen2vl-cli.cpp		patch \| blob \| history
examples/passkey/passkey.cpp		patch \| blob \| history
examples/quantize-stats/quantize-stats.cpp		patch \| blob \| history
examples/run/run.cpp		patch \| blob \| history
examples/simple-chat/simple-chat.cpp		patch \| blob \| history
examples/simple/simple.cpp		patch \| blob \| history
examples/tokenize/tokenize.cpp		patch \| blob \| history
include/llama-cpp.h		patch \| blob \| history
include/llama.h		patch \| blob \| history
src/llama-model.cpp		patch \| blob \| history
src/llama.cpp		patch \| blob \| history
tests/test-autorelease.cpp		patch \| blob \| history
tests/test-model-load-cancel.cpp		patch \| blob \| history
tests/test-tokenizer-0.cpp		patch \| blob \| history
tests/test-tokenizer-1-bpe.cpp		patch \| blob \| history
tests/test-tokenizer-1-spm.cpp		patch \| blob \| history