common : Changed tuple to struct (TODO fix) (#8823)

author Liu Jia <redacted>

Mon, 5 Aug 2024 16:14:10 +0000 (00:14 +0800)

committer GitHub <redacted>

Mon, 5 Aug 2024 16:14:10 +0000 (18:14 +0200)
author Liu Jia <redacted>
Mon, 5 Aug 2024 16:14:10 +0000 (00:14 +0800)
committer GitHub <redacted>
Mon, 5 Aug 2024 16:14:10 +0000 (18:14 +0200)
diff --git a/common/common.cpp b/common/common.cpp

index 521f849e2ce0b73b42f8886dbfca0cb494ab3e2d..ee7fbcba3c7973996583a2bad899adcda06a17d4 100644 (file)
--- a/common/common.cpp
+++ b/common/common.cpp
@@ -2039,8 +2039,8 @@ std::string fs_get_cache_file(const std::string & filename) {
  //
  // Model utils
  //
-
-std::tuple<struct llama_model *, struct llama_context *> llama_init_from_gpt_params(gpt_params & params) {
+struct llama_init_result llama_init_from_gpt_params(gpt_params & params) {
+    llama_init_result iparams;
      auto mparams = llama_model_params_from_gpt_params(params);
  
      llama_model * model = nullptr;
@@ -2055,7 +2055,7 @@ std::tuple<struct llama_model *, struct llama_context *> llama_init_from_gpt_par
  
      if (model == NULL) {
          fprintf(stderr, "%s: error: failed to load model '%s'\n", __func__, params.model.c_str());
-        return std::make_tuple(nullptr, nullptr);
+        return iparams;
      }
  
      auto cparams = llama_context_params_from_gpt_params(params);
@@ -2064,7 +2064,7 @@ std::tuple<struct llama_model *, struct llama_context *> llama_init_from_gpt_par
      if (lctx == NULL) {
          fprintf(stderr, "%s: error: failed to create context with model '%s'\n", __func__, params.model.c_str());
          llama_free_model(model);
-        return std::make_tuple(nullptr, nullptr);
+        return iparams;
      }
  
      if (!params.control_vectors.empty()) {
@@ -2075,7 +2075,7 @@ std::tuple<struct llama_model *, struct llama_context *> llama_init_from_gpt_par
          if (cvec.n_embd == -1) {
              llama_free(lctx);
              llama_free_model(model);
-            return std::make_tuple(nullptr, nullptr);
+            return iparams;
          }
  
          int err = llama_control_vector_apply(lctx,
@@ -2087,7 +2087,7 @@ std::tuple<struct llama_model *, struct llama_context *> llama_init_from_gpt_par
          if (err) {
              llama_free(lctx);
              llama_free_model(model);
-            return std::make_tuple(nullptr, nullptr);
+            return iparams;
          }
      }
  
@@ -2099,7 +2099,7 @@ std::tuple<struct llama_model *, struct llama_context *> llama_init_from_gpt_par
              fprintf(stderr, "%s: error: failed to apply lora adapter\n", __func__);
              llama_free(lctx);
              llama_free_model(model);
-            return std::make_tuple(nullptr, nullptr);
+            return iparams;
          }
          llama_lora_adapter_set(lctx, adapter, lora_scale);
      }
@@ -2135,7 +2135,9 @@ std::tuple<struct llama_model *, struct llama_context *> llama_init_from_gpt_par
          llama_reset_timings(lctx);
      }
  
-    return std::make_tuple(model, lctx);
+    iparams.model   = model;
+    iparams.context = lctx;
+    return iparams;
  }
  
  struct llama_model_params llama_model_params_from_gpt_params(const gpt_params & params) {
diff --git a/common/common.h b/common/common.h

index 8240ff99b8e2ae1f0baf2846fb44d3c4d0411fe0..51dcc0d3993f70ed8e96a2568ff7c5dec7c6d7ad 100644 (file)
--- a/common/common.h
+++ b/common/common.h
@@ -308,8 +308,12 @@ std::string fs_get_cache_file(const std::string & filename);
  // Model utils
  //
  
-// TODO: avoid tuplue, use struct
-std::tuple<struct llama_model *, struct llama_context *> llama_init_from_gpt_params(gpt_params & params);
+struct llama_init_result {
+    struct llama_model * model = nullptr;
+    struct llama_context * context = nullptr;
+};
+
+struct llama_init_result    llama_init_from_gpt_params(gpt_params & params);
  
  struct llama_model_params   llama_model_params_from_gpt_params  (const gpt_params & params);
  struct llama_context_params llama_context_params_from_gpt_params(const gpt_params & params);
diff --git a/examples/cvector-generator/cvector-generator.cpp b/examples/cvector-generator/cvector-generator.cpp

index d4e126ac22e6fdc6d1b5f3e714ee7264698b2822..a12e90d828275dd34ba2e661c23c64f7061d7e4e 100644 (file)
--- a/examples/cvector-generator/cvector-generator.cpp
+++ b/examples/cvector-generator/cvector-generator.cpp
@@ -414,9 +414,10 @@ int main(int argc, char ** argv) {
      llama_numa_init(params.numa);
  
      // load the model to get hparams
-    llama_model * model;
-    llama_context * ctx;
-    std::tie(model, ctx) = llama_init_from_gpt_params(params);
+    llama_init_result llama_init = llama_init_from_gpt_params(params);
+
+    llama_model * model = llama_init.model;
+    llama_context * ctx = llama_init.context;
  
      // int n_ctx = llama_n_ctx(ctx);
      int n_layers = llama_n_layer(model);
diff --git a/examples/embedding/embedding.cpp b/examples/embedding/embedding.cpp

index 1466e5b2bc512213008819f41c5005ac1ac123da..cd7b448a619fa3e88d0c93296b1a65d5dfe798fe 100644 (file)
--- a/examples/embedding/embedding.cpp
+++ b/examples/embedding/embedding.cpp
@@ -79,11 +79,11 @@ int main(int argc, char ** argv) {
      llama_backend_init();
      llama_numa_init(params.numa);
  
-    llama_model * model;
-    llama_context * ctx;
-
      // load the model
-    std::tie(model, ctx) = llama_init_from_gpt_params(params);
+    llama_init_result llama_init = llama_init_from_gpt_params(params);
+
+    llama_model * model = llama_init.model;
+    llama_context * ctx = llama_init.context;
      if (model == NULL) {
          fprintf(stderr, "%s: error: unable to load model\n", __func__);
          return 1;
diff --git a/examples/eval-callback/eval-callback.cpp b/examples/eval-callback/eval-callback.cpp

index 37d30ab8c6aa721d6c28e477d8d4327fc82d7cfd..ef35ba2c03942e93f312fb0389ef23b56322eb8b 100644 (file)
--- a/examples/eval-callback/eval-callback.cpp
+++ b/examples/eval-callback/eval-callback.cpp
@@ -163,9 +163,10 @@ int main(int argc, char ** argv) {
      params.warmup = false;
  
      // init
-    llama_model * model;
-    llama_context * ctx;
-    std::tie(model, ctx) = llama_init_from_gpt_params(params);
+    llama_init_result llama_init = llama_init_from_gpt_params(params);
+
+    llama_model * model = llama_init.model;
+    llama_context * ctx = llama_init.context;
      if (model == nullptr || ctx == nullptr) {
          fprintf(stderr, "%s : failed to init\n", __func__);
          return 1;
diff --git a/examples/imatrix/imatrix.cpp b/examples/imatrix/imatrix.cpp

index 6ce1863cf473e0a74f945158ed3e1c7082561522..58814b96e7d497fc3ffa42afb91b89078a07dfec 100644 (file)
--- a/examples/imatrix/imatrix.cpp
+++ b/examples/imatrix/imatrix.cpp
@@ -611,10 +611,10 @@ int main(int argc, char ** argv) {
      params.warmup = false;
  
      // init
-    llama_model * model;
-    llama_context * ctx;
+    llama_init_result llama_init = llama_init_from_gpt_params(params);
  
-    std::tie(model, ctx) = llama_init_from_gpt_params(params);
+    llama_model * model = llama_init.model;
+    llama_context * ctx = llama_init.context;
      if (model == nullptr || ctx == nullptr) {
          fprintf(stderr, "%s : failed to init\n", __func__);
          return 1;
diff --git a/examples/infill/infill.cpp b/examples/infill/infill.cpp

index dc93d2301391cb55ec0ac382f3d71ffdf281bb55..92d630b15fdf1bbb4c2e92a02aed29b49087b5e4 100644 (file)
--- a/examples/infill/infill.cpp
+++ b/examples/infill/infill.cpp
@@ -179,7 +179,10 @@ int main(int argc, char ** argv) {
  
      // load the model and apply lora adapter, if any
      LOG("%s: load the model and apply lora adapter, if any\n", __func__);
-    std::tie(model, ctx) = llama_init_from_gpt_params(params);
+    llama_init_result llama_init = llama_init_from_gpt_params(params);
+
+    model = llama_init.model;
+    ctx = llama_init.context;
  
      if (model == NULL) {
          LOG_TEE("%s: error: unable to load model\n", __func__);
diff --git a/examples/lookahead/lookahead.cpp b/examples/lookahead/lookahead.cpp

index fb20ad93f9c1d6a50e2cb16f8d5adf68ecc17634..81cf1629c5b6ae5c46eebd766c09d0317693604d 100644 (file)
--- a/examples/lookahead/lookahead.cpp
+++ b/examples/lookahead/lookahead.cpp
@@ -58,11 +58,11 @@ int main(int argc, char ** argv) {
      llama_backend_init();
      llama_numa_init(params.numa);
  
-    llama_model * model = NULL;
-    llama_context * ctx = NULL;
-
      // load the target model
-    std::tie(model, ctx) = llama_init_from_gpt_params(params);
+    llama_init_result llama_init = llama_init_from_gpt_params(params);
+
+    llama_model * model = llama_init.model;
+    llama_context * ctx = llama_init.context;
  
      // Tokenize the prompt
      std::vector<llama_token> inp;
diff --git a/examples/lookup/lookup-create.cpp b/examples/lookup/lookup-create.cpp

index d713f6f2194a84625f5698bbfd98dffba2212257..5f04709f5023179fbf54febbe8f5a023a5fa033c 100644 (file)
--- a/examples/lookup/lookup-create.cpp
+++ b/examples/lookup/lookup-create.cpp
@@ -22,11 +22,11 @@ int main(int argc, char ** argv){
      llama_backend_init();
      llama_numa_init(params.numa);
  
-    llama_model * model = NULL;
-    llama_context * ctx = NULL;
-
      // load the model
-    std::tie(model, ctx) = llama_init_from_gpt_params(params);
+    llama_init_result llama_init = llama_init_from_gpt_params(params);
+
+    llama_model * model = llama_init.model;
+    llama_context * ctx = llama_init.context;
      GGML_ASSERT(model != nullptr);
  
      // tokenize the prompt
diff --git a/examples/lookup/lookup-stats.cpp b/examples/lookup/lookup-stats.cpp

index 2fe67100e6c03b7be94be899cfef868c6bbd60c2..400f3e0b089574d642b1860502962cad28680d37 100644 (file)
--- a/examples/lookup/lookup-stats.cpp
+++ b/examples/lookup/lookup-stats.cpp
@@ -26,11 +26,11 @@ int main(int argc, char ** argv){
      llama_backend_init();
      llama_numa_init(params.numa);
  
-    llama_model * model = NULL;
-    llama_context * ctx = NULL;
-
      // load the model
-    std::tie(model, ctx) = llama_init_from_gpt_params(params);
+    llama_init_result llama_init = llama_init_from_gpt_params(params);
+
+    llama_model * model = llama_init.model;
+    llama_context * ctx = llama_init.context;
  
      // tokenize the prompt
      std::vector<llama_token> inp;
diff --git a/examples/lookup/lookup.cpp b/examples/lookup/lookup.cpp

index bb571bac4d7781ff87428bc8c52abd673c479b04..d53a9828c2ea23918c01b15b507579e5c0647213 100644 (file)
--- a/examples/lookup/lookup.cpp
+++ b/examples/lookup/lookup.cpp
@@ -34,11 +34,11 @@ int main(int argc, char ** argv){
      llama_backend_init();
      llama_numa_init(params.numa);
  
-    llama_model * model = NULL;
-    llama_context * ctx = NULL;
-
      // load the model
-    std::tie(model, ctx) = llama_init_from_gpt_params(params);
+    llama_init_result llama_init = llama_init_from_gpt_params(params);
+
+    llama_model * model = llama_init.model;
+    llama_context * ctx = llama_init.context;
  
      // tokenize the prompt
      std::vector<llama_token> inp;
diff --git a/examples/main/main.cpp b/examples/main/main.cpp

index 61e960ea2abe6a4d09b02f703ae17fb8be9b3f7c..6e0635a66cd0671e81edc6f0c3815e92ae3d8693 100644 (file)
--- a/examples/main/main.cpp
+++ b/examples/main/main.cpp
@@ -207,7 +207,10 @@ int main(int argc, char ** argv) {
  
      // load the model and apply lora adapter, if any
      LOG("%s: load the model and apply lora adapter, if any\n", __func__);
-    std::tie(model, ctx) = llama_init_from_gpt_params(params);
+    llama_init_result llama_init = llama_init_from_gpt_params(params);
+
+    model = llama_init.model;
+    ctx = llama_init.context;
      if (sparams.cfg_scale > 1.f) {
          struct llama_context_params lparams = llama_context_params_from_gpt_params(params);
          ctx_guidance = llama_new_context_with_model(model, lparams);
diff --git a/examples/parallel/parallel.cpp b/examples/parallel/parallel.cpp

index 7faeaec975ae387eece59d97e4adaafc4db8096d..621a1c959062265912993c6065e2e67e785da378 100644 (file)
--- a/examples/parallel/parallel.cpp
+++ b/examples/parallel/parallel.cpp
@@ -129,11 +129,11 @@ int main(int argc, char ** argv) {
      llama_backend_init();
      llama_numa_init(params.numa);
  
-    llama_model * model = NULL;
-    llama_context * ctx = NULL;
-
      // load the target model
-    std::tie(model, ctx) = llama_init_from_gpt_params(params);
+    llama_init_result llama_init = llama_init_from_gpt_params(params);
+
+    llama_model * model = llama_init.model;
+    llama_context * ctx = llama_init.context;
  
      // load the prompts from an external file if there are any
      if (params.prompt.empty()) {
diff --git a/examples/perplexity/perplexity.cpp b/examples/perplexity/perplexity.cpp

index dbe445391736cf4df9718300ecbddaafc563ecb3..372684f092de29e12248d3594a0a3049ab0efc7f 100644 (file)
--- a/examples/perplexity/perplexity.cpp
+++ b/examples/perplexity/perplexity.cpp
@@ -2018,11 +2018,11 @@ int main(int argc, char ** argv) {
      llama_backend_init();
      llama_numa_init(params.numa);
  
-    llama_model * model;
-    llama_context * ctx;
-
      // load the model and apply lora adapter, if any
-    std::tie(model, ctx) = llama_init_from_gpt_params(params);
+    llama_init_result llama_init = llama_init_from_gpt_params(params);
+
+    llama_model * model = llama_init.model;
+    llama_context * ctx = llama_init.context;
      if (model == NULL) {
          fprintf(stderr, "%s: error: unable to load model\n", __func__);
          return 1;
diff --git a/examples/retrieval/retrieval.cpp b/examples/retrieval/retrieval.cpp

index eb89d16daf18d7c750ab854401fc69e92cc101f0..65b19ce71cbe3e4f75062d3a19c24a9c8f8fcdfd 100644 (file)
--- a/examples/retrieval/retrieval.cpp
+++ b/examples/retrieval/retrieval.cpp
@@ -148,11 +148,12 @@ int main(int argc, char ** argv) {
      llama_backend_init();
      llama_numa_init(params.numa);
  
-    llama_model * model;
-    llama_context * ctx;
-
      // load the model
-    std::tie(model, ctx) = llama_init_from_gpt_params(params);
+    llama_init_result llama_init = llama_init_from_gpt_params(params);
+
+    llama_model * model = llama_init.model;
+    llama_context * ctx = llama_init.context;
+
      if (model == NULL) {
          fprintf(stderr, "%s: error: unable to load model\n", __func__);
          return 1;
diff --git a/examples/save-load-state/save-load-state.cpp b/examples/save-load-state/save-load-state.cpp

index d8afdc141a4a4041bbedf295a96ead51b23c0a7b..3ea7c790d2bf782138124d0ea424f109b64e08b2 100644 (file)
--- a/examples/save-load-state/save-load-state.cpp
+++ b/examples/save-load-state/save-load-state.cpp
@@ -28,10 +28,11 @@ int main(int argc, char ** argv) {
      std::string result2;
  
      // init
-    llama_model * model;
-    llama_context * ctx;
+    llama_init_result llama_init = llama_init_from_gpt_params(params);
+
+    llama_model * model = llama_init.model;
+    llama_context * ctx = llama_init.context;
  
-    std::tie(model, ctx) = llama_init_from_gpt_params(params);
      if (model == nullptr || ctx == nullptr) {
          fprintf(stderr, "%s : failed to init\n", __func__);
          return 1;
diff --git a/examples/server/server.cpp b/examples/server/server.cpp

index d5f131d9beb1389fb8255988e6a4979dca69eb6f..d178ca0f79b831141668bb144d5e08ac76228422 100644 (file)
--- a/examples/server/server.cpp
+++ b/examples/server/server.cpp
@@ -677,7 +677,10 @@ struct server_context {
          // dedicate one sequence to the system prompt
          params.n_parallel += 1;
  
-        std::tie(model, ctx) = llama_init_from_gpt_params(params);
+        llama_init_result llama_init = llama_init_from_gpt_params(params);
+
+        model = llama_init.model;
+        ctx = llama_init.context;
          params.n_parallel -= 1; // but be sneaky about it
          if (model == nullptr) {
              LOG_ERROR("unable to load model", {{"model", params.model}});
diff --git a/examples/speculative/speculative.cpp b/examples/speculative/speculative.cpp

index 0939a1a6a7a384dbf20d9031592d9ecf411d7c23..b051a18f169c2660013e35037c6e3ce3d86f465e 100644 (file)
--- a/examples/speculative/speculative.cpp
+++ b/examples/speculative/speculative.cpp
@@ -66,7 +66,9 @@ int main(int argc, char ** argv) {
      llama_context * ctx_dft = NULL;
  
      // load the target model
-    std::tie(model_tgt, ctx_tgt) = llama_init_from_gpt_params(params);
+    llama_init_result llama_init_tgt = llama_init_from_gpt_params(params);
+    model_tgt = llama_init_tgt.model;
+    ctx_tgt = llama_init_tgt.context;
  
      // load the draft model
      params.model = params.model_draft;
@@ -75,7 +77,9 @@ int main(int argc, char ** argv) {
          params.n_threads = params.n_threads_draft;
      }
      params.n_threads_batch = params.n_threads_batch_draft;
-    std::tie(model_dft, ctx_dft) = llama_init_from_gpt_params(params);
+    llama_init_result llama_init_dft = llama_init_from_gpt_params(params);
+    model_dft = llama_init_dft.model;
+    ctx_dft = llama_init_dft.context;
  
      const bool vocab_type_tgt = llama_vocab_type(model_tgt);
      LOG("vocab_type tgt: %d\n", vocab_type_tgt);
author	Liu Jia <redacted>
	Mon, 5 Aug 2024 16:14:10 +0000 (00:14 +0800)
committer	GitHub <redacted>
	Mon, 5 Aug 2024 16:14:10 +0000 (18:14 +0200)
common/common.cpp		patch \| blob \| history
common/common.h		patch \| blob \| history
examples/cvector-generator/cvector-generator.cpp		patch \| blob \| history
examples/embedding/embedding.cpp		patch \| blob \| history
examples/eval-callback/eval-callback.cpp		patch \| blob \| history
examples/imatrix/imatrix.cpp		patch \| blob \| history
examples/infill/infill.cpp		patch \| blob \| history
examples/lookahead/lookahead.cpp		patch \| blob \| history
examples/lookup/lookup-create.cpp		patch \| blob \| history
examples/lookup/lookup-stats.cpp		patch \| blob \| history
examples/lookup/lookup.cpp		patch \| blob \| history
examples/main/main.cpp		patch \| blob \| history
examples/parallel/parallel.cpp		patch \| blob \| history
examples/perplexity/perplexity.cpp		patch \| blob \| history
examples/retrieval/retrieval.cpp		patch \| blob \| history
examples/save-load-state/save-load-state.cpp		patch \| blob \| history
examples/server/server.cpp		patch \| blob \| history
examples/speculative/speculative.cpp		patch \| blob \| history