]> git.djapps.eu Git - pkg/ggml/sources/ggml/commit
rpc : report actual free memory (llama/16616)
authorRadoslav Gerganov <redacted>
Fri, 17 Oct 2025 15:02:52 +0000 (18:02 +0300)
committerGeorgi Gerganov <redacted>
Tue, 21 Oct 2025 15:14:33 +0000 (18:14 +0300)
commit37ac04ee71d370c7fd26310056d149150347aa8d
treeff13f54b557d242433427b6d4f32f4d9632916c4
parentfae740af78401fb7b5873512b71f177e3413932d
rpc : report actual free memory (llama/16616)

* rpc : report actual free memory

Start reporting the free memory on every device instead of using
fixed values. Now llama-cli users can get a nice memory breakdown
when using RPC devices.

* drop --mem in rpc-server
include/ggml-rpc.h
src/ggml-rpc/ggml-rpc.cpp