git.djapps.eu Git - pkg/ggml/sources/llama.cpp/commit

]> git.djapps.eu Git - pkg/ggml/sources/llama.cpp/commit

overview / pkg / ggml / sources / llama.cpp / commit

author	Johannes Gäßler <redacted>
	Tue, 6 Jun 2023 19:33:23 +0000 (21:33 +0200)
committer	GitHub <redacted>
	Tue, 6 Jun 2023 19:33:23 +0000 (21:33 +0200)
commit	17366df842e358768c0df7024484fffecfc7865b
tree	f042c8142311d45f8712db10debf89111b2c7e57	tree
parent	44f906e8537fcec965e312d621c80556d6aa9bec	commit \| diff

Multi GPU support, CUDA refactor, CUDA scratch buffer (#1703)

* CUDA multi GPU + scratch

ggml_cuda_compute_forward

Tensor parallelism

ggml_cuda_add

ggml_cuda_rms_norm

ggml_cuda_silu

CUDA scratch buffer

--main-gpu CLI option

12 files changed:

examples/common.cpp		diff \| blob \| history
examples/common.h		diff \| blob \| history
examples/main/README.md		diff \| blob \| history
examples/server/README.md		diff \| blob \| history
examples/server/server.cpp		diff \| blob \| history
ggml-cuda.cu		diff \| blob \| history
ggml-cuda.h		diff \| blob \| history
ggml-opencl.cpp		diff \| blob \| history
ggml.c		diff \| blob \| history
ggml.h		diff \| blob \| history
llama.cpp		diff \| blob \| history
llama.h		diff \| blob \| history

Packaging of ggml-org/llama.cpp

RSS Atom