]> git.djapps.eu Git - pkg/ggml/sources/whisper.cpp/commit
HIP: enable WMMA-MMQ INT kernels for RDNA 3 (llama/17576)
authorJiacheng (Jason) Chen <redacted>
Fri, 5 Dec 2025 08:17:37 +0000 (03:17 -0500)
committerGeorgi Gerganov <redacted>
Fri, 12 Dec 2025 15:53:17 +0000 (17:53 +0200)
commite3f3c6ead1a0249fc4be5f391d4b126a09d27fb4
tree3ef8befccb3b04238662e665e27deb44ea39a92f
parent8d44d6181a362b9b9447baa6acf5b33cb70ef208
HIP: enable WMMA-MMQ INT kernels for RDNA 3 (llama/17576)

* enabled wmma instructions for most quantizations other than q2k

* fixed the last q2_k test case failure

* address comments: fix out of bound write for RDNA4, add comments after #endif

* clean up rebase: fix ne error in half2

* fix the EditorConfig CI
ggml/src/ggml-cuda/common.cuh
ggml/src/ggml-cuda/mma.cuh
ggml/src/ggml-cuda/mmq.cu
ggml/src/ggml-cuda/mmq.cuh