]> git.djapps.eu Git - pkg/ggml/sources/ggml/commit
Vulkan Mixture of Experts (MoE) support (llama/7628)
author0cc4m <redacted>
Mon, 3 Jun 2024 08:59:14 +0000 (10:59 +0200)
committerGeorgi Gerganov <redacted>
Sat, 15 Jun 2024 19:05:47 +0000 (22:05 +0300)
commit1981d5bbc4526df030be0d5cbeeb1f28f7aba692
tree0fcba13dedd3f86429065fb54237a30a758e8e80
parent5ed1871585e461aece960323f0ba8044e6d54183
Vulkan Mixture of Experts (MoE) support (llama/7628)

* Finish Vulkan mul_mat_id implementation

* Add Vulkan sum_rows and div ops

* Fix MUL_MAT_ID matrix matrix shader

* Fix MUL_MAT_ID matrix vector shader dispatch size

* Fix MUL_MAT_ID matrix vector shader and dispatch code

* Update Vulkan CPU offload for MUL_MAT_ID

* Fix crash when using split mode none and setting a main GPU
src/ggml-vulkan.cpp