]> git.djapps.eu Git - pkg/ggml/sources/whisper.cpp/commit
vulkan: optimizations for deepseek prompt processing (llama/14555)
authorJeff Bolz <redacted>
Sat, 12 Jul 2025 09:51:58 +0000 (04:51 -0500)
committerGeorgi Gerganov <redacted>
Sat, 12 Jul 2025 16:23:56 +0000 (19:23 +0300)
commit8670a3fd5def4cbcb5742bbc862c609acbc9c061
treedcb491b7a4aa629e305de38c743a4fec2c5d1db7
parent74f6d479049db01094a8323bcd90a47d050d1ebb
vulkan: optimizations for deepseek prompt processing (llama/14555)

* vulkan: allow unclamped loads in coopmat2 mul_mat_id shader

* vulkan: increase coopmat2 mul_mat_id tile size

* vulkan: optimize mat_mul_id row_ids search to batch loads, and port to coopmat1 path

* vulkan: use smaller FA row size when head size is large. applies to both scalar and CM2 paths (CM1 isn't used due to shared memory limits)
ggml/src/ggml-vulkan/ggml-vulkan.cpp
ggml/src/ggml-vulkan/vulkan-shaders/mul_mm.comp
ggml/src/ggml-vulkan/vulkan-shaders/mul_mm_cm2.comp