]> git.djapps.eu Git - pkg/ggml/sources/ggml/commit
vulkan: Handle GPUs with less shared memory (llama/10468)
authorJeff Bolz <redacted>
Wed, 27 Nov 2024 07:30:27 +0000 (01:30 -0600)
committerGeorgi Gerganov <redacted>
Tue, 3 Dec 2024 19:05:37 +0000 (21:05 +0200)
commit48fe3adff0a8c2314d73f99aea6d676fcb770cad
treeb53609619671cc3457a9a0957e37bfc1091a840c
parent2f8c72b8a6073b0d0c86a47bdc0cb009b43fb0c6
vulkan: Handle GPUs with less shared memory (llama/10468)

There have been reports of failure to compile on systems with <= 32KB
of shared memory (e.g. #10037). This change makes the large tile size
fall back to a smaller size if necessary, and makes mul_mat_id fall
back to CPU if there's only 16KB of shared memory.
src/ggml-vulkan/ggml-vulkan.cpp