]> git.djapps.eu Git - pkg/ggml/sources/whisper.cpp/commit
Vulkan Mixture of Experts (MoE) support (llama/7628)
author0cc4m <redacted>
Mon, 3 Jun 2024 08:59:14 +0000 (10:59 +0200)
committerGeorgi Gerganov <redacted>
Sun, 16 Jun 2024 15:19:48 +0000 (18:19 +0300)
commit2a6bab5655f831a48cb418cfee9d9933f5152314
tree82c867d65bc737580eebc515c45f32c8d9255b31
parent8c01c9b85cde9f96a57eec448712559630aa4c02
Vulkan Mixture of Experts (MoE) support (llama/7628)

* Finish Vulkan mul_mat_id implementation

* Add Vulkan sum_rows and div ops

* Fix MUL_MAT_ID matrix matrix shader

* Fix MUL_MAT_ID matrix vector shader dispatch size

* Fix MUL_MAT_ID matrix vector shader and dispatch code

* Update Vulkan CPU offload for MUL_MAT_ID

* Fix crash when using split mode none and setting a main GPU
ggml-vulkan.cpp