git.djapps.eu Git - pkg/ggml/sources/llama.cpp/commit

]> git.djapps.eu Git - pkg/ggml/sources/llama.cpp/commit

overview / pkg / ggml / sources / llama.cpp / commit

author	Johannes Gäßler <redacted>
	Wed, 14 Jun 2023 17:47:19 +0000 (19:47 +0200)
committer	GitHub <redacted>
	Wed, 14 Jun 2023 17:47:19 +0000 (19:47 +0200)
commit	254a7a7a5ff4c874ff8488f1f5cbdd7e9c89d682
tree	65f35a2d189f3cf6f1f625b2acb343c2dd77790d	tree
parent	92549202659fc23ba9fec5e688227d0da9b06b40	commit \| diff

CUDA full GPU acceleration, KV cache in VRAM (#1827)

* Fixed CUDA RoPE

* ggml_cuda_mul_mat_vec_p021

* ggml_cuda_scale

* ggml_cuda_diag_mask_inf

* ggml_is_permuted

* ggml_cuda_cpy

* flatten rows for ggml_cuda_op

* Added a --low-vram option

* Fixed Windows performance

* Fixed LLAMA_CUDA_DMMV_Y > 1 for WizardLM

examples/common.cpp		diff \| blob \| history
examples/common.h		diff \| blob \| history
examples/main/README.md		diff \| blob \| history
examples/server/README.md		diff \| blob \| history
examples/server/server.cpp		diff \| blob \| history
ggml-cuda.cu		diff \| blob \| history
ggml-cuda.h		diff \| blob \| history
ggml.c		diff \| blob \| history
ggml.h		diff \| blob \| history
llama.cpp		diff \| blob \| history
llama.h		diff \| blob \| history

Packaging of ggml-org/llama.cpp

RSS Atom