]> git.djapps.eu Git - pkg/ggml/sources/llama.cpp/commit
vulkan: Support mul_mat_id with f32 accumulators (#15337)
authorJeff Bolz <redacted>
Sat, 16 Aug 2025 09:18:31 +0000 (04:18 -0500)
committerGitHub <redacted>
Sat, 16 Aug 2025 09:18:31 +0000 (11:18 +0200)
commitde2192794f4e8e04f2e8167ef2424905145e88fc
tree0fe24209577711ae492b3285164600b28d244401
parent2e2b22ba6607414a5d619ac6d2f034b5b02214e5
vulkan: Support mul_mat_id with f32 accumulators (#15337)

* vulkan: Add missing bounds checking to scalar/coopmat1 mul_mat_id

* vulkan: Support mul_mat_id with f32 accumulators, but they are not hooked up

- There's no explicit way to request f32 precision for mul_mat_id, but there
probably should be, and this gets the code in place for that.
- A couple fixes to check_results.
- Remove casts to fp16 in coopmat1 FA shader (found by inspection).
ggml/src/ggml-vulkan/ggml-vulkan.cpp
ggml/src/ggml-vulkan/vulkan-shaders/flash_attn_cm1.comp