batched-bench : use rand tokens (#15398)

author Georgi Gerganov <redacted>

Tue, 19 Aug 2025 05:45:12 +0000 (08:45 +0300)

committer GitHub <redacted>

Tue, 19 Aug 2025 05:45:12 +0000 (08:45 +0300)
author Georgi Gerganov <redacted>
Tue, 19 Aug 2025 05:45:12 +0000 (08:45 +0300)
committer GitHub <redacted>
Tue, 19 Aug 2025 05:45:12 +0000 (08:45 +0300)
diff --git a/tools/batched-bench/batched-bench.cpp b/tools/batched-bench/batched-bench.cpp

index 03628f74b2880ec9c7266cd85d60b9adcbcb1cda..c6c601add32ac8fa98cdb6fe7b230067b512ccbe 100644 (file)
--- a/tools/batched-bench/batched-bench.cpp
+++ b/tools/batched-bench/batched-bench.cpp
@@ -57,6 +57,13 @@ int main(int argc, char ** argv) {
          return 1;
      }
  
+    const llama_vocab * vocab   = llama_model_get_vocab(model);
+    const int32_t       n_vocab = llama_vocab_n_tokens(vocab);
+
+    const auto get_token_rand = [n_vocab]() -> llama_token {
+        return std::rand() % n_vocab;
+    };
+
      auto * mem = llama_get_memory(ctx);
  
      const int32_t n_kv_max = llama_n_ctx(ctx);
@@ -93,7 +100,7 @@ int main(int argc, char ** argv) {
      // warm up
      {
          for (int i = 0; i < 16; ++i) {
-            common_batch_add(batch, 0, i, { 0 }, false);
+            common_batch_add(batch, get_token_rand(), i, { 0 }, false);
          }
  
          if (!decode_helper(ctx, batch, ctx_params.n_batch)) {
@@ -127,7 +134,7 @@ int main(int argc, char ** argv) {
  
                  for (int j = 0; j < (is_pp_shared ? 1 : pl); ++j) {
                      for (int i = 0; i < pp; ++i) {
-                        common_batch_add(batch, 0, i, { j }, i == pp - 1);
+                        common_batch_add(batch, get_token_rand(), i, { j }, i == pp - 1);
                      }
                  }
  
@@ -154,7 +161,7 @@ int main(int argc, char ** argv) {
                      common_batch_clear(batch);
  
                      for (int j = 0; j < pl; ++j) {
-                        common_batch_add(batch, 0, pp + i, { j }, true);
+                        common_batch_add(batch, get_token_rand(), pp + i, { j }, true);
                      }
  
                      if (!decode_helper(ctx, batch, ctx_params.n_batch)) {
author	Georgi Gerganov <redacted>
	Tue, 19 Aug 2025 05:45:12 +0000 (08:45 +0300)
committer	GitHub <redacted>
	Tue, 19 Aug 2025 05:45:12 +0000 (08:45 +0300)