]> git.djapps.eu Git - pkg/ggml/sources/llama.cpp/commit
opencl: enable the general fp mm for non-cont input and as a fallback for specialized...
authorlhez <redacted>
Thu, 22 Jan 2026 18:29:25 +0000 (10:29 -0800)
committerGitHub <redacted>
Thu, 22 Jan 2026 18:29:25 +0000 (10:29 -0800)
commit9c96465f99e47a3a568c50969ff5c6b672ab2714
treef5f01a7b156f698cc071b06d1e2ab95629fd2585
parent4e595b250ae55d0fc1bbb56c4b42cc183806fc0f
opencl: enable the general fp mm for non-cont input and as a fallback for specialized kqv kernel for adreno (#18970)

* opencl: add `copy_to_contiguous` and utilize mm kernels

* opencl: only copy to cont for f32 and f16 tensors

* opencl: use cont mm for fallback when dst is large

* opencl: use nb local to copy-to-cont

* opencl: use local offset as well
ggml/src/ggml-opencl/ggml-opencl.cpp