]> git.djapps.eu Git - pkg/ggml/sources/llama.cpp/commitdiff
llama : increase scratch buffer size for 65B (ref #1152)
authorGeorgi Gerganov <redacted>
Mon, 24 Apr 2023 15:47:03 +0000 (18:47 +0300)
committerGeorgi Gerganov <redacted>
Mon, 24 Apr 2023 15:47:30 +0000 (18:47 +0300)
Temporary solution

llama.cpp

index bc0ef1281e37955b98aa643c7ce6f727f24f1270..28d27916a049d661af709245e62c162984a5213f 100644 (file)
--- a/llama.cpp
+++ b/llama.cpp
@@ -54,7 +54,7 @@ static const std::map<e_model, size_t> & MEM_REQ_SCRATCH0()
         { MODEL_7B,    512ull * MB },
         { MODEL_13B,   512ull * MB },
         { MODEL_30B,   512ull * MB },
-        { MODEL_65B,   512ull * MB },
+        { MODEL_65B,  1024ull * MB },
     };
     return _MEM_REQ_SCRATCH0;
 }
@@ -65,7 +65,7 @@ static const std::map<e_model, size_t> & MEM_REQ_SCRATCH1()
         { MODEL_7B,    512ull * MB },
         { MODEL_13B,   512ull * MB },
         { MODEL_30B,   512ull * MB },
-        { MODEL_65B,   512ull * MB },
+        { MODEL_65B,  1024ull * MB },
     };
     return _MEM_REQ_SCRATCH1;
 }