]> git.djapps.eu Git - pkg/ggml/sources/llama.cpp/commit
Vulkan Mixture of Experts (MoE) support (#7628)
author0cc4m <redacted>
Mon, 3 Jun 2024 08:59:14 +0000 (10:59 +0200)
committerGitHub <redacted>
Mon, 3 Jun 2024 08:59:14 +0000 (10:59 +0200)
commit3d7ebf63123b8652fb7bbecef7ba731202309901
tree8adfcc3dd20946ece9c0b8d15b131823b24455ae
parenta10cda58d3199cd85305e0f03a8c6056714ae2e8
Vulkan Mixture of Experts (MoE) support (#7628)

* Finish Vulkan mul_mat_id implementation

* Add Vulkan sum_rows and div ops

* Fix MUL_MAT_ID matrix matrix shader

* Fix MUL_MAT_ID matrix vector shader dispatch size

* Fix MUL_MAT_ID matrix vector shader and dispatch code

* Update Vulkan CPU offload for MUL_MAT_ID

* Fix crash when using split mode none and setting a main GPU
common/common.cpp
ggml-vulkan-shaders.hpp
ggml-vulkan.cpp
ggml_vk_generate_shaders.py
llama.cpp