git.djapps.eu Git - pkg/ggml/sources/llama.cpp/commit

author	65a <redacted>
	Fri, 22 Aug 2025 08:10:14 +0000 (08:10 +0000)
committer	GitHub <redacted>
	Fri, 22 Aug 2025 08:10:14 +0000 (10:10 +0200)
commit	4afb0a746f22abaa545b3ebdb76a400d7da3a713
tree	1993ac774f3d4da6c88403ed524eb4a76d8182fb	tree
parent	e288693669cf9d0a71e2f2b8bd57305f06340257	commit \| diff

server : Support multimodal completion and embeddings prompts in JSON format (#15108)

- Use server_tokens in more places in server and util.cpp
- Convert most functions that used llama_tokens to server_tokens
- Modify input tokenizer to handle JSON objects as subprompts
- Break out MTMD prompt parsing into utility function
- Support JSON objects with multimodal_data arrays for MTMD prompts along with other existing types
- Add capability to model endpoint to indicate if client can send multimodal data
- Add tests.

tools/server/README.md		diff \| blob \| history
tools/server/server.cpp		diff \| blob \| history
tools/server/tests/unit/test_completion.py		diff \| blob \| history
tools/server/tests/unit/test_vision_api.py		diff \| blob \| history
tools/server/utils.hpp		diff \| blob \| history