]> git.djapps.eu Git - pkg/ggml/sources/llama.cpp/commit
Vulkan Bugfixes and Improvements (#7084)
author0cc4m <redacted>
Thu, 9 May 2024 18:39:54 +0000 (20:39 +0200)
committerGitHub <redacted>
Thu, 9 May 2024 18:39:54 +0000 (20:39 +0200)
commitbefddd0f15de6efb15d7e7f5b527dfb671f4196f
tree7c0aa80c4b4f8fef76aa284982502a3bf8dae1d5
parentd46dbc76f8770caec0175f1e57777173c70556a0
Vulkan Bugfixes and Improvements (#7084)

* Modify mat mat mul shader for mul_mat_id, modify mat vec mul shaders for single call batch operation

* Further work towards MoE, disabled for now

* Disable MoE code (not ready yet), fix a number of bugs in shaders and Vulkan code

* Add softmax with f16 mask and pos buffer support

* Disable mul_mat_id shaders for now

* Fix flake8

* Fix validation errors caused by empty buffers on larger batch sizes
ggml-vulkan-shaders.hpp
ggml-vulkan.cpp
ggml_vk_generate_shaders.py