]> git.djapps.eu Git - pkg/ggml/sources/ggml/commit
ggml : update softmax n_task calculation (llama/5126)
authorsnadampal <redacted>
Fri, 26 Jan 2024 17:17:59 +0000 (11:17 -0600)
committerGeorgi Gerganov <redacted>
Sat, 27 Jan 2024 15:00:48 +0000 (17:00 +0200)
commitf677ef577168263cb24230b95441de3a356f0b70
tree90bc5eb4c34f5495ca50e3ff7575b8cc0ac5b34e
parentc428151657884946d263cf18f76fec60385f801b
ggml : update softmax n_task calculation (llama/5126)

updated the n_task calculation to use max number of
threads possible. This has improved the prompt eval
performance by around 5% for DOT kernels and by
around 10% for MMLA kernels on AWS Graviton3.
src/ggml.c