]> git.djapps.eu Git - pkg/ggml/sources/whisper.cpp/commit
ggml : update softmax n_task calculation (llama/5126)
authorsnadampal <redacted>
Fri, 26 Jan 2024 17:17:59 +0000 (11:17 -0600)
committerGeorgi Gerganov <redacted>
Sat, 27 Jan 2024 15:19:52 +0000 (17:19 +0200)
commit3c8d14e9c578d5531503939d48b424f6cc3a362e
tree14159e4fc986c02474fbb0d9a237c76ad91e47d4
parentc3977cb2ce39ab32c1dd5341767449ca10f5e60b
ggml : update softmax n_task calculation (llama/5126)

updated the n_task calculation to use max number of
threads possible. This has improved the prompt eval
performance by around 5% for DOT kernels and by
around 10% for MMLA kernels on AWS Graviton3.
ggml.c