tests: enable kv_unified to prevent cuda oom error on rtx 2060 (#20645)

author Aaron Teo <redacted>

Wed, 18 Mar 2026 09:40:22 +0000 (17:40 +0800)

committer GitHub <redacted>

Wed, 18 Mar 2026 09:40:22 +0000 (17:40 +0800)
author Aaron Teo <redacted>
Wed, 18 Mar 2026 09:40:22 +0000 (17:40 +0800)
committer GitHub <redacted>
Wed, 18 Mar 2026 09:40:22 +0000 (17:40 +0800)
diff --git a/tests/test-backend-sampler.cpp b/tests/test-backend-sampler.cpp

index d4cd62c71e728494860efac54da21f37e1bd987d..58361ae80aea11118597636eac7275fe943fa507 100644 (file)
--- a/tests/test-backend-sampler.cpp
+++ b/tests/test-backend-sampler.cpp
@@ -89,6 +89,7 @@ struct test_context {
          cparams.n_batch = 512;
          cparams.samplers = configs.data();
          cparams.n_samplers = configs.size();
+        cparams.kv_unified = true;
  
          // If n_seq_max is not specified, calculate it from configs
          if (n_seq_max < 0) {
author	Aaron Teo <redacted>
	Wed, 18 Mar 2026 09:40:22 +0000 (17:40 +0800)
committer	GitHub <redacted>
	Wed, 18 Mar 2026 09:40:22 +0000 (17:40 +0800)