git.djapps.eu Git - pkg/ggml/sources/llama.cpp/commit

]> git.djapps.eu Git - pkg/ggml/sources/llama.cpp/commit

overview / pkg / ggml / sources / llama.cpp / commit

author	Johannes Gäßler <redacted>
	Mon, 19 Jun 2023 08:23:56 +0000 (10:23 +0200)
committer	GitHub <redacted>
	Mon, 19 Jun 2023 08:23:56 +0000 (10:23 +0200)
commit	16b9cd193965769089881bb8ec012fccca7b37b6
tree	2ee329793e782f253966fd81f89ea05f5a1a2495	tree
parent	b24c3049d96557c24782e4d32feaae65f47277af	commit \| diff

Convert vector to f16 for dequantize mul mat vec (#1913)

* Convert vector to f16 for dmmv

* compile option

* Added compilation option description to README

* Changed cmake CUDA_ARCHITECTURES from "OFF" to "native"

CMakeLists.txt		diff \| blob \| history
Makefile		diff \| blob \| history
README.md		diff \| blob \| history
ggml-cuda.cu		diff \| blob \| history
llama.cpp		diff \| blob \| history

Packaging of ggml-org/llama.cpp

RSS Atom