]> git.djapps.eu Git - pkg/ggml/sources/llama.cpp/commit
vulkan: handle device dedup on MacOS + Vega II Duo cards (#19058)
authorOleksandr Kuvshynov <redacted>
Wed, 28 Jan 2026 11:35:54 +0000 (06:35 -0500)
committerGitHub <redacted>
Wed, 28 Jan 2026 11:35:54 +0000 (12:35 +0100)
commit88d23ad515e60c64db8df22b3de23cba00d044ab
tree5b856fc62975e796085ed4d7392b7e5815fd0470
parent0a95026da9ff86ce48e7c48b802281320cbbd3bf
vulkan: handle device dedup on MacOS + Vega II Duo cards (#19058)

Deduplication here relied on the fact that vulkan would return unique
UUID for different physical GPUs. It is at the moment not always the case.
On Mac Pro 2019 running Mac OS, with 2 Vega II Duo cards (so, 4 GPU total),
MotlenVK would assign same UUID to pairs of GPUs, unless they
are connected with Infinity Fabric.

See more details here: KhronosGroup/MoltenVK#2683.

The right way is to fix that in MoltenVK, but until it is fixed,
llama.cpp would only recognize 2 of 4 GPUs in such configuration.

The deduplication logic here is changed to only filter GPUs if UUID is
same but driver is different.
ggml/src/ggml-vulkan/ggml-vulkan.cpp