git.djapps.eu Git - pkg/ggml/sources/ggml/commit

]> git.djapps.eu Git - pkg/ggml/sources/ggml/commit

CUDA: add gqa_ratio 4 for GLM 4.7 flash (llama/18953)

Packaging of ggml-org/ggml

src/ggml-cuda/fattn-mma-f16.cuh		diff \| blob \| history
src/ggml-cuda/fattn-tile.cuh		diff \| blob \| history
src/ggml-cuda/fattn.cu		diff \| blob \| history
src/ggml-cuda/template-instances/fattn-mma-f16-instance-ncols1_16-ncols2_4.cu		diff \| blob \| history
src/ggml-cuda/template-instances/fattn-mma-f16-instance-ncols1_2-ncols2_4.cu		diff \| blob \| history
src/ggml-cuda/template-instances/fattn-mma-f16-instance-ncols1_4-ncols2_4.cu		diff \| blob \| history
src/ggml-cuda/template-instances/fattn-mma-f16-instance-ncols1_8-ncols2_4.cu		diff \| blob \| history
src/ggml-cuda/template-instances/generate_cu_files.py		diff \| blob \| history