]> git.djapps.eu Git - pkg/ggml/sources/llama.cpp/commitdiff
finetune : print sample-start/include-sample-start (#5072)
authorDaniel Bevenius <redacted>
Mon, 22 Jan 2024 11:11:01 +0000 (12:11 +0100)
committerGitHub <redacted>
Mon, 22 Jan 2024 11:11:01 +0000 (13:11 +0200)
This commit adds `--sample-start` and `--include-sample-start` to the
output from the main function in finetune.cpp.

The motivation for this is that even though these are set explicitly by
the user via the command line, if one forgets to set them then it is
useful to have their values printed out. Otherwise it is possible to go
through the whole training process before realizing that the values are
not what one expected.

Signed-off-by: Daniel Bevenius <redacted>
examples/finetune/finetune.cpp

index 11fcbf443326ea22257491fd6fcfeb8e778d41c0..b7e19c5fe1122a62ddb48f0ecbb3ca8964f127c0 100644 (file)
@@ -1800,6 +1800,8 @@ int main(int argc, char ** argv) {
     std::vector<size_t> train_samples_begin;
     std::vector<size_t> train_samples_size;
     printf("%s: tokenize training data from %s\n", __func__, params.common.fn_train_data);
+    printf("%s: sample-start: %s\n", __func__, params.common.sample_start.c_str());
+    printf("%s: include-sample-start: %s\n", __func__, params.common.include_sample_start ? "true" : "false");
     tokenize_file(lctx,
             params.common.fn_train_data,
             params.common.sample_start,