]> git.djapps.eu Git - pkg/ggml/sources/llama.cpp/commit
server : output embeddings for all tokens when pooling = none (#10861)
authorGeorgi Gerganov <redacted>
Wed, 18 Dec 2024 11:01:41 +0000 (13:01 +0200)
committerGitHub <redacted>
Wed, 18 Dec 2024 11:01:41 +0000 (13:01 +0200)
commit152610eda91217ac409342cd976d05f5114ad39f
tree5dd92a6e0e3da2be8166aaa456e66e87bec28b49
parent0e70ba686e6c717a0aa41d88284e2a392c2bd0cd
server : output embeddings for all tokens when pooling = none (#10861)

* server : add "tokens" output

ggml-ci

* server : output embeddings for all tokens when pooling = none

ggml-ci

* server : update readme [no ci]

* server : fix spacing [no ci]

Co-authored-by: Xuan Son Nguyen <redacted>
* server : be explicit about the pooling type in the tests

ggml-ci

* server : update /embeddings and /v1/embeddings endpoints

ggml-ci

* server : do not normalize embeddings when there is no pooling

ggml-ci

* server : update readme

ggml-ci

* server : fixes

* tests : update server tests

ggml-ci

* server : update readme [no ci]

* server : remove rebase artifact

---------

Co-authored-by: Xuan Son Nguyen <redacted>
common/common.cpp
common/common.h
examples/gritlm/gritlm.cpp
examples/retrieval/retrieval.cpp
examples/server/README.md
examples/server/server.cpp
examples/server/tests/unit/test_embedding.py
examples/server/tests/utils.py