git.djapps.eu Git - pkg/ggml/sources/llama.cpp/commit

author	forforever73 <redacted>
	Fri, 6 Feb 2026 20:06:14 +0000 (04:06 +0800)
committer	GitHub <redacted>
	Fri, 6 Feb 2026 20:06:14 +0000 (21:06 +0100)
commit	b83111815e9a79949257e9d4b087206b320a3063
tree	bf4a72540cf16a01fb5d07c1c8884afaea329f04	tree
parent	3228e7728789e0456d0458ce38d20d0b1d60a9aa	commit \| diff

model : support Step3.5-Flash (#19283)

* Support Step3.5-Flash

* fix: norm.weight + 1 (HF zero_centered=true)

* step35: simplify GGUF conversion + drop redundant rope KVs

* Address review feedback

* rename limits -> clamp

* Apply suggestions from code review

Co-authored-by: Sigbjørn Skjæret <redacted>
* Apply suggestion from @CISC

Co-authored-by: Sigbjørn Skjæret <redacted>
* rename swiglu limits -> swiglu clamp in LLM_KV

* avoid CI fail

* Apply suggestions from code review

* Apply suggestions from code review

* disabled KV shifting for LLM_ARCH_STEP35

* Apply suggestions from code review

* mistakenly removed cmath

* add model size && apply missed suggestion

* assert partial_rotary_factors

* fix CI errors:

* load freq_base_swa

---------

Co-authored-by: lvyichen <redacted>
Co-authored-by: Sigbjørn Skjæret <redacted>

convert_hf_to_gguf.py		diff \| blob \| history
gguf-py/gguf/constants.py		diff \| blob \| history
gguf-py/gguf/gguf_writer.py		diff \| blob \| history
gguf-py/gguf/tensor_mapping.py		diff \| blob \| history
src/CMakeLists.txt		diff \| blob \| history
src/llama-arch.cpp		diff \| blob \| history
src/llama-arch.h		diff \| blob \| history
src/llama-graph.cpp		diff \| blob \| history
src/llama-hparams.h		diff \| blob \| history
src/llama-kv-cache-iswa.cpp		diff \| blob \| history
src/llama-kv-cache.cpp		diff \| blob \| history
src/llama-model.cpp		diff \| blob \| history
src/llama-model.h		diff \| blob \| history
src/models/models.h		diff \| blob \| history
src/models/step35-iswa.cpp	[new file with mode: 0644]	blob