]> git.djapps.eu Git - pkg/ggml/sources/whisper.cpp/commit
cuda : add RDNA4-specific MMVQ parameter table for bs=1 decode (llama/19478)
authorPikaPikachu <redacted>
Sun, 15 Mar 2026 07:33:39 +0000 (15:33 +0800)
committerGeorgi Gerganov <redacted>
Mon, 16 Mar 2026 11:10:15 +0000 (13:10 +0200)
commit55c66106afa1a7703af6af654ebc99fb4264251d
tree7b3e4026c93fa1fbeb7fe2739758882058597630
parentcd02195b8fbfe1d0ac505ed43daeb548a912b279
cuda : add RDNA4-specific MMVQ parameter table for bs=1 decode (llama/19478)

* mmvq: add RDNA3/RDNA4-specific parameter table (nwarps=8, rows=1)

* mmvq: add dedicated RDNA3 parameter table

* mmvq: exclude RDNA3.5 (gfx1150/1151) from RDNA3 table
ggml/src/ggml-cuda/mmvq.cu
ggml/src/ggml-cuda/vendors/hip.h