]> git.djapps.eu Git - pkg/ggml/sources/llama.cpp/commit
sync : ggml (backend v2) (#3912)
authorGeorgi Gerganov <redacted>
Mon, 13 Nov 2023 12:16:23 +0000 (14:16 +0200)
committerGitHub <redacted>
Mon, 13 Nov 2023 12:16:23 +0000 (14:16 +0200)
commit4760e7cc0b68570d58f55e8dda469805d1759d0d
treecd983b1f2833f0094c0539f7943703c6787bf12b
parentbb50a792ec2a49944470c82694fa364345e95170
sync : ggml (backend v2) (#3912)

* sync : ggml (backend v2) (wip)

* sync : migrate examples and llama.cpp to dynamic graphs (wip)

* sync : update tests + fix max op params to 64

ggml-ci

* sync : ggml-cuda

ggml-ci

* llama : fix save/load state context size

ggml-ci

* sync : try to fix build on tvOS

* sync : pass custom graph sizes in training examples

* sync : update graph copies to new ggml API

* sync : update sync-ggml.sh with new files

* scripts : fix header in sync script

* train : fix context size calculations

* llama : increase inference graph size up to 4096 nodes

* train : allocate grads for backward graphs

* train : allocate grads for gb_tmp
22 files changed:
common/train.cpp
common/train.h
examples/benchmark/benchmark-matmult.cpp
examples/export-lora/export-lora.cpp
examples/finetune/finetune.cpp
examples/llava/clip.cpp
examples/metal/metal.cpp
examples/train-text-from-scratch/train-text-from-scratch.cpp
ggml-alloc.c
ggml-alloc.h
ggml-backend-impl.h [new file with mode: 0644]
ggml-backend.c
ggml-backend.h
ggml-cuda.cu
ggml-impl.h
ggml-metal.m
ggml.c
ggml.h
llama.cpp
scripts/sync-ggml.sh
tests/test-grad0.cpp
tests/test-opt.cpp