git.djapps.eu Git - pkg/ggml/sources/llama.cpp/commit

]> git.djapps.eu Git - pkg/ggml/sources/llama.cpp/commit

vulkan: support flash attention GQA/split_k with small batches (#18938)

Packaging of ggml-org/llama.cpp

ggml/src/ggml-vulkan/ggml-vulkan.cpp		diff \| blob \| history
ggml/src/ggml-vulkan/vulkan-shaders/flash_attn.comp		diff \| blob \| history
ggml/src/ggml-vulkan/vulkan-shaders/flash_attn_base.glsl		diff \| blob \| history
ggml/src/ggml-vulkan/vulkan-shaders/flash_attn_cm1.comp		diff \| blob \| history
ggml/src/ggml-vulkan/vulkan-shaders/flash_attn_cm2.comp		diff \| blob \| history
ggml/src/ggml-vulkan/vulkan-shaders/flash_attn_split_k_reduce.comp		diff \| blob \| history
tests/test-backend-ops.cpp		diff \| blob \| history