]> git.djapps.eu Git - pkg/ggml/sources/whisper.cpp/commit
Allow multiple copy function pointers for CUDA graph kernel param updates (llama...
authoragray3 <redacted>
Mon, 27 May 2024 17:33:42 +0000 (18:33 +0100)
committerGeorgi Gerganov <redacted>
Sun, 16 Jun 2024 15:19:48 +0000 (18:19 +0300)
commit96fdb90f5fbf7c5576ac2b512ff36752e3f04bad
tree952ffad1d02f8d0757f30efcd4024a16c49dab74
parente98f9ac554bd3e983da68ac1fa64c2c31c04686e
Allow multiple copy function pointers for CUDA graph kernel param updates (llama/7565)

CUDA graphs require parameter updates to kernels associated with
GGML_OP_CPY nodes. Previously the implementation only checked for a
single CUDA kernel in such nodes, but this caused a bug in cases where
2 such kernels exist. This fixes the issue by using a vector to allow
multiple function pointers to be stored and checked against.

Fixes #7942
ggml-cuda.cu