]> git.djapps.eu Git - pkg/ggml/sources/ggml/commit
opencl: enable the general fp mm for non-cont input and as a fallback for specialized...
authorlhez <redacted>
Thu, 22 Jan 2026 18:29:25 +0000 (10:29 -0800)
committerGeorgi Gerganov <redacted>
Fri, 30 Jan 2026 11:49:29 +0000 (13:49 +0200)
commit8fd2b3eb2074cce14775c829e7577194015e2898
tree5d9f89c9875fcc5b77aec26e862a75d5e73494e6
parente5c8629f115096ac1a347a952c55ef616e5167c8
opencl: enable the general fp mm for non-cont input and as a fallback for specialized kqv kernel for adreno (llama/18970)

* opencl: add `copy_to_contiguous` and utilize mm kernels

* opencl: only copy to cont for f32 and f16 tensors

* opencl: use cont mm for fallback when dst is large

* opencl: use nb local to copy-to-cont

* opencl: use local offset as well
src/ggml-opencl/ggml-opencl.cpp