llama : increase scratch buffer size for 65B (ref #1152)

author Georgi Gerganov <redacted>

Mon, 24 Apr 2023 15:47:03 +0000 (18:47 +0300)

committer Georgi Gerganov <redacted>

Mon, 24 Apr 2023 15:47:30 +0000 (18:47 +0300)
author Georgi Gerganov <redacted>
Mon, 24 Apr 2023 15:47:03 +0000 (18:47 +0300)
committer Georgi Gerganov <redacted>
Mon, 24 Apr 2023 15:47:30 +0000 (18:47 +0300)
diff --git a/llama.cpp b/llama.cpp

index bc0ef1281e37955b98aa643c7ce6f727f24f1270..28d27916a049d661af709245e62c162984a5213f 100644 (file)
--- a/llama.cpp
+++ b/llama.cpp
@@ -54,7 +54,7 @@ static const std::map<e_model, size_t> & MEM_REQ_SCRATCH0()
          { MODEL_7B,    512ull * MB },
          { MODEL_13B,   512ull * MB },
          { MODEL_30B,   512ull * MB },
-        { MODEL_65B,   512ull * MB },
+        { MODEL_65B,  1024ull * MB },
      };
      return _MEM_REQ_SCRATCH0;
  }
@@ -65,7 +65,7 @@ static const std::map<e_model, size_t> & MEM_REQ_SCRATCH1()
          { MODEL_7B,    512ull * MB },
          { MODEL_13B,   512ull * MB },
          { MODEL_30B,   512ull * MB },
-        { MODEL_65B,   512ull * MB },
+        { MODEL_65B,  1024ull * MB },
      };
      return _MEM_REQ_SCRATCH1;
  }
author	Georgi Gerganov <redacted>
	Mon, 24 Apr 2023 15:47:03 +0000 (18:47 +0300)
committer	Georgi Gerganov <redacted>
	Mon, 24 Apr 2023 15:47:30 +0000 (18:47 +0300)