]> git.djapps.eu Git - pkg/ggml/sources/ggml/commit
graph : make FA compatible with MLA + add initial Metal kernels (llama/12953)
authorGeorgi Gerganov <redacted>
Thu, 17 Apr 2025 15:16:36 +0000 (18:16 +0300)
committerGeorgi Gerganov <redacted>
Thu, 24 Apr 2025 15:36:25 +0000 (18:36 +0300)
commitb9a0a5aab8621b0429e94b27c31e5138be193831
tree3baf3776a206e2f988daaf9bb3d20b48b590036e
parentf5721f827f9f034762cb83186cd6b242c0d9f377
graph : make FA compatible with MLA + add initial Metal kernels (llama/12953)

* graph : make mla compatible with FA

* metal : add exp FA kernels for DeepSeek models

ggml-ci

* llama : minor naming updates

ggml-ci

* ggml : disable FA for DS head sizes

* tests : add FA tests for MLA shapes

ggml-ci
src/ggml-cuda/ggml-cuda.cu
src/ggml-metal/ggml-metal.m
src/ggml-metal/ggml-metal.metal
src/ggml-vulkan/ggml-vulkan.cpp
tests/test-backend-ops.cpp