git.djapps.eu Git - pkg/ggml/sources/llama.cpp/commit

author	Ryan Mangeno <redacted>
	Thu, 19 Feb 2026 07:52:21 +0000 (02:52 -0500)
committer	GitHub <redacted>
	Thu, 19 Feb 2026 07:52:21 +0000 (08:52 +0100)
commit	c0d04303400e64a798506e3f2342940ae268db15
tree	e10296443d7f3e8f2c92489fee8dd937cc954c70	tree
parent	3bb2fcc8567e139a0ef70b8d43f82a3130147c00	commit \| diff

model : full modern bert support (#18330)

* full modern bert support

* added gelu op in rank pooling for modern bert

* still working on stuff, added mean calculation before classifier head

* Update convert_hf_to_gguf.py

Co-authored-by: Sigbjørn Skjæret <redacted>
* first layer is dense, as per modern bert research paper

* Update src/llama-graph.cpp

Co-authored-by: Sigbjørn Skjæret <redacted>
* fixed set input for mean pooling to check if pooling type is ranking since modern bert does mean & rank

* Update src/llama-graph.cpp

Co-authored-by: Sigbjørn Skjæret <redacted>
* Update convert_hf_to_gguf.py

Co-authored-by: Sigbjørn Skjæret <redacted>
---------

Co-authored-by: Sigbjørn Skjæret <redacted>

convert_hf_to_gguf.py		diff \| blob \| history
gguf-py/gguf/constants.py		diff \| blob \| history
gguf-py/gguf/tensor_mapping.py		diff \| blob \| history
src/llama-arch.cpp		diff \| blob \| history
src/llama-arch.h		diff \| blob \| history
src/llama-context.cpp		diff \| blob \| history
src/llama-graph.cpp		diff \| blob \| history
src/llama-graph.h		diff \| blob \| history
src/llama-model-saver.cpp		diff \| blob \| history
src/llama-model.cpp		diff \| blob \| history
src/llama-model.h		diff \| blob \| history
src/models/modern-bert.cpp		diff \| blob \| history