]> git.djapps.eu Git - pkg/ggml/sources/whisper.cpp/commit
metal : add support for non-padded FA KV (llama/16148)
authorGeorgi Gerganov <redacted>
Tue, 7 Oct 2025 05:23:30 +0000 (08:23 +0300)
committerGeorgi Gerganov <redacted>
Sun, 12 Oct 2025 08:16:23 +0000 (11:16 +0300)
commit4bce4fa5e93b129165402450489061a9412c33e8
treee00d7390dd41051bcb470bb9b2f517b96427e51c
parent6cf0c21b094771237e9ba9da7853d6f7bfca90f9
metal : add support for non-padded FA KV (llama/16148)

* metal : pad K, V and Mask when needed

* cont : simplify

* cuda : add TODO about KV padding requirement

* metal : add comments

* metal : remove mask padding requirement
ggml/src/ggml-cuda/fattn.cu
ggml/src/ggml-metal/ggml-metal-device.cpp
ggml/src/ggml-metal/ggml-metal-device.h
ggml/src/ggml-metal/ggml-metal-impl.h
ggml/src/ggml-metal/ggml-metal-ops.cpp
ggml/src/ggml-metal/ggml-metal-ops.h
ggml/src/ggml-metal/ggml-metal.cpp
ggml/src/ggml-metal/ggml-metal.metal