git.djapps.eu Git - pkg/ggml/sources/ggml/commit

]> git.djapps.eu Git - pkg/ggml/sources/ggml/commit

CUDA: broadcasting for FlashAttention mask (llama/14500)

Packaging of ggml-org/ggml

src/ggml-cuda/fattn-common.cuh		diff \| blob \| history
src/ggml-cuda/fattn-mma-f16.cuh		diff \| blob \| history
src/ggml-cuda/fattn-tile-f16.cu		diff \| blob \| history
src/ggml-cuda/fattn-tile-f32.cu		diff \| blob \| history
src/ggml-cuda/fattn-vec-f16.cuh		diff \| blob \| history
src/ggml-cuda/fattn-vec-f32.cuh		diff \| blob \| history
src/ggml-cuda/fattn-wmma-f16.cu		diff \| blob \| history