llama-run : fix context size (#11094)

author Eric Curtin <redacted>

Mon, 6 Jan 2025 22:45:28 +0000 (22:45 +0000)

committer GitHub <redacted>

Mon, 6 Jan 2025 22:45:28 +0000 (23:45 +0100)
author Eric Curtin <redacted>
Mon, 6 Jan 2025 22:45:28 +0000 (22:45 +0000)
committer GitHub <redacted>
Mon, 6 Jan 2025 22:45:28 +0000 (23:45 +0100)
diff --git a/examples/run/run.cpp b/examples/run/run.cpp

index c52a7961fb3580eb39788ebde01078396e275a7a..2888fcfed1e15576d2f9f0557900a6e82e819884 100644 (file)
--- a/examples/run/run.cpp
+++ b/examples/run/run.cpp
@@ -83,6 +83,7 @@ class Opt {
          }
  
          ctx_params.n_batch        = context_size >= 0 ? context_size : context_size_default;
+        ctx_params.n_ctx          = ctx_params.n_batch;
          model_params.n_gpu_layers = ngl >= 0 ? ngl : ngl_default;
          temperature               = temperature >= 0 ? temperature : temperature_default;
author	Eric Curtin <redacted>
	Mon, 6 Jan 2025 22:45:28 +0000 (22:45 +0000)
committer	GitHub <redacted>
	Mon, 6 Jan 2025 22:45:28 +0000 (23:45 +0100)