git.djapps.eu Git - pkg/ggml/sources/llama.cpp/commit

]> git.djapps.eu Git - pkg/ggml/sources/llama.cpp/commit

overview / pkg / ggml / sources / llama.cpp / commit

author	Johannes Gäßler <redacted>
	Sat, 22 Feb 2025 11:20:17 +0000 (12:20 +0100)
committer	GitHub <redacted>
	Sat, 22 Feb 2025 11:20:17 +0000 (12:20 +0100)
commit	5fa07c2f93c73161bf09ef0b23b5d2686f9a073e
tree	81901902dd4c7630559b52003f57e27388650bbb	tree
parent	335eb04a91f481f37c0c9b302ee31b449b04c3e9	commit \| diff

CUDA: optimize FA for GQA + large batches (#12014)

32 files changed:

ggml/src/ggml-cuda/cp-async.cuh		diff \| blob \| history
ggml/src/ggml-cuda/fattn-common.cuh		diff \| blob \| history
ggml/src/ggml-cuda/fattn-mma-f16.cuh		diff \| blob \| history
ggml/src/ggml-cuda/fattn-tile-f16.cu		diff \| blob \| history
ggml/src/ggml-cuda/fattn-tile-f32.cu		diff \| blob \| history
ggml/src/ggml-cuda/fattn-vec-f16.cuh		diff \| blob \| history
ggml/src/ggml-cuda/fattn-vec-f32.cuh		diff \| blob \| history
ggml/src/ggml-cuda/fattn-wmma-f16.cu		diff \| blob \| history
ggml/src/ggml-cuda/fattn.cu		diff \| blob \| history
ggml/src/ggml-cuda/mma.cuh		diff \| blob \| history
ggml/src/ggml-cuda/template-instances/fattn-mma-f16-instance-cpb16.cu	[deleted file]	blob \| history
ggml/src/ggml-cuda/template-instances/fattn-mma-f16-instance-cpb32.cu	[deleted file]	blob \| history
ggml/src/ggml-cuda/template-instances/fattn-mma-f16-instance-cpb64.cu	[deleted file]	blob \| history
ggml/src/ggml-cuda/template-instances/fattn-mma-f16-instance-cpb8.cu	[deleted file]	blob \| history
ggml/src/ggml-cuda/template-instances/fattn-mma-f16-instance-ncols1_1-ncols2_8.cu	[new file with mode: 0644]	blob
ggml/src/ggml-cuda/template-instances/fattn-mma-f16-instance-ncols1_16-ncols2_1.cu	[new file with mode: 0644]	blob
ggml/src/ggml-cuda/template-instances/fattn-mma-f16-instance-ncols1_16-ncols2_2.cu	[new file with mode: 0644]	blob
ggml/src/ggml-cuda/template-instances/fattn-mma-f16-instance-ncols1_16-ncols2_4.cu	[new file with mode: 0644]	blob
ggml/src/ggml-cuda/template-instances/fattn-mma-f16-instance-ncols1_2-ncols2_4.cu	[new file with mode: 0644]	blob
ggml/src/ggml-cuda/template-instances/fattn-mma-f16-instance-ncols1_2-ncols2_8.cu	[new file with mode: 0644]	blob
ggml/src/ggml-cuda/template-instances/fattn-mma-f16-instance-ncols1_32-ncols2_1.cu	[new file with mode: 0644]	blob
ggml/src/ggml-cuda/template-instances/fattn-mma-f16-instance-ncols1_32-ncols2_2.cu	[new file with mode: 0644]	blob
ggml/src/ggml-cuda/template-instances/fattn-mma-f16-instance-ncols1_4-ncols2_2.cu	[new file with mode: 0644]	blob
ggml/src/ggml-cuda/template-instances/fattn-mma-f16-instance-ncols1_4-ncols2_4.cu	[new file with mode: 0644]	blob
ggml/src/ggml-cuda/template-instances/fattn-mma-f16-instance-ncols1_4-ncols2_8.cu	[new file with mode: 0644]	blob
ggml/src/ggml-cuda/template-instances/fattn-mma-f16-instance-ncols1_64-ncols2_1.cu	[new file with mode: 0644]	blob
ggml/src/ggml-cuda/template-instances/fattn-mma-f16-instance-ncols1_8-ncols2_1.cu	[new file with mode: 0644]	blob
ggml/src/ggml-cuda/template-instances/fattn-mma-f16-instance-ncols1_8-ncols2_2.cu	[new file with mode: 0644]	blob
ggml/src/ggml-cuda/template-instances/fattn-mma-f16-instance-ncols1_8-ncols2_4.cu	[new file with mode: 0644]	blob
ggml/src/ggml-cuda/template-instances/fattn-mma-f16-instance-ncols1_8-ncols2_8.cu	[new file with mode: 0644]	blob
ggml/src/ggml-cuda/template-instances/generate_cu_files.py		diff \| blob \| history
tests/test-backend-ops.cpp		diff \| blob \| history

Packaging of ggml-org/llama.cpp

RSS Atom