]> git.djapps.eu Git - pkg/ggml/sources/ggml/commit
sync : llama.cpp (fused soft max, gpu cpy ops, etc.) (#640)
authorGeorgi Gerganov <redacted>
Thu, 7 Dec 2023 20:26:34 +0000 (22:26 +0200)
committerGitHub <redacted>
Thu, 7 Dec 2023 20:26:34 +0000 (22:26 +0200)
commitc57aa8e905b9aa46769c2c9ad6a4050b362947f7
treeb4fcf47e2be12b33cf371940a1904bedaa6a9f71
parentfc7a58d14485c5744f00e75b8df44517f90d4245
sync : llama.cpp (fused soft max, gpu cpy ops, etc.) (#640)

* sync : llama.cpp (fused soft max, gpu cpy ops, etc.)

ggml-ci

* cuda : restore accidentally deleted changes

ggml-ci

* cuda : fix rope + disable device-side dequantize

ggml-ci

* test-backend-ops : enable stablelm rope test

* cuda : remove rope assert

* sync.sh : add test-backend-ops

* ggml : fix ggml_concat + ggml_get_n_tasks logic

* sync : whisper.cpp

ggml-ci

* metal : fix assert

* ci : fix Metal path to shaders

ggml-ci

* whisper : fix bug if metal init fails

---------

Co-authored-by: slaren <redacted>
16 files changed:
.github/workflows/ci.yml
ci/run.sh
examples/whisper/main.cpp
examples/whisper/whisper.cpp
examples/whisper/whisper.h
include/ggml/ggml.h
scripts/sync-llama.sh
src/ggml-alloc.c
src/ggml-cuda.cu
src/ggml-metal.h
src/ggml-metal.m
src/ggml-metal.metal
src/ggml-opencl.cpp
src/ggml-quants.c
src/ggml.c
tests/test-backend-ops.cpp