]> git.djapps.eu Git - pkg/ggml/sources/llama.cpp/commitdiff
server : tweak default sampling parameters (#4367)
authorkalomaze <redacted>
Tue, 12 Dec 2023 10:12:35 +0000 (04:12 -0600)
committerGitHub <redacted>
Tue, 12 Dec 2023 10:12:35 +0000 (12:12 +0200)
* Set a more typical Top P setting as the default

* Update temp max

examples/server/public/index.html

index 18a6ccf0f38473edad61c3dbf72d893ef2529e0e..451fd4a3be6020a021de3a2d00a4b7d14145fb75 100644 (file)
       repeat_last_n: 256, // 0 = disable penalty, -1 = context size
       repeat_penalty: 1.18, // 1.0 = disabled
       top_k: 40, // <= 0 to use vocab size
-      top_p: 0.5, // 1.0 = disabled
+      top_p: 0.95, // 1.0 = disabled
       min_p: 0.05, // 0 = disabled
       tfs_z: 1.0, // 1.0 = disabled
       typical_p: 1.0, // 1.0 = disabled
 
           <fieldset class="two">
             ${IntField({ label: "Predictions", max: 2048, min: -1, name: "n_predict", value: params.value.n_predict })}
-            ${FloatField({ label: "Temperature", max: 1.5, min: 0.0, name: "temperature", step: 0.01, value: params.value.temperature })}
+            ${FloatField({ label: "Temperature", max: 2.0, min: 0.0, name: "temperature", step: 0.01, value: params.value.temperature })}
             ${FloatField({ label: "Penalize repeat sequence", max: 2.0, min: 0.0, name: "repeat_penalty", step: 0.01, value: params.value.repeat_penalty })}
             ${IntField({ label: "Consider N tokens for penalize", max: 2048, min: 0, name: "repeat_last_n", value: params.value.repeat_last_n })}
             ${IntField({ label: "Top-K sampling", max: 100, min: -1, name: "top_k", value: params.value.top_k })}