]> git.djapps.eu Git - pkg/ggml/sources/llama.cpp/commit
HIP: enable WMMA-MMQ INT kernels for RDNA 3 (#17576)
authorJiacheng (Jason) Chen <redacted>
Fri, 5 Dec 2025 08:17:37 +0000 (03:17 -0500)
committerGitHub <redacted>
Fri, 5 Dec 2025 08:17:37 +0000 (09:17 +0100)
commit668ed765742065f82c2899e101ee4384d6669f11
treeb38ba3b5cb3c8c8b160e9e2257f32f190552505e
parent03d9a77b85dd00efd807c65435bdb51bbb6a77d0
HIP: enable WMMA-MMQ INT kernels for RDNA 3 (#17576)

* enabled wmma instructions for most quantizations other than q2k

* fixed the last q2_k test case failure

* address comments: fix out of bound write for RDNA4, add comments after #endif

* clean up rebase: fix ne error in half2

* fix the EditorConfig CI
ggml/src/ggml-cuda/common.cuh
ggml/src/ggml-cuda/mma.cuh
ggml/src/ggml-cuda/mmq.cu
ggml/src/ggml-cuda/mmq.cuh