git.djapps.eu Git - pkg/ggml/sources/llama.cpp/commit

]> git.djapps.eu Git - pkg/ggml/sources/llama.cpp/commit

overview / pkg / ggml / sources / llama.cpp / commit

author	Xuan-Son Nguyen <redacted>
	Mon, 9 Mar 2026 21:22:39 +0000 (22:22 +0100)
committer	GitHub <redacted>
	Mon, 9 Mar 2026 21:22:39 +0000 (22:22 +0100)
commit	59db9a357d9a247009c70fda34050661b17a1a5c
tree	b097f4e42b68c73af44a6488dd3a8450bc863896	tree
parent	23fbfcb1ad6c6f76b230e8895254de785000be46	commit \| diff

llama: dynamic head_dim and n_rot for SWA (#20301)

* llama: dynamic head_dim and n_rot for SWA

* also add gguf_writer wrappers

* fix build

* build_rope_shift arg reorder

112 files changed:

gguf-py/gguf/constants.py		diff \| blob \| history
gguf-py/gguf/gguf_writer.py		diff \| blob \| history
src/llama-arch.cpp		diff \| blob \| history
src/llama-arch.h		diff \| blob \| history
src/llama-context.cpp		diff \| blob \| history
src/llama-graph.cpp		diff \| blob \| history
src/llama-hparams.cpp		diff \| blob \| history
src/llama-hparams.h		diff \| blob \| history
src/llama-kv-cache.cpp		diff \| blob \| history
src/llama-kv-cache.h		diff \| blob \| history
src/llama-model-loader.cpp		diff \| blob \| history
src/llama-model-saver.cpp		diff \| blob \| history
src/llama-model.cpp		diff \| blob \| history
src/models/afmoe.cpp		diff \| blob \| history
src/models/apertus.cpp		diff \| blob \| history
src/models/arcee.cpp		diff \| blob \| history
src/models/arctic.cpp		diff \| blob \| history
src/models/baichuan.cpp		diff \| blob \| history
src/models/bailingmoe2.cpp		diff \| blob \| history
src/models/bert.cpp		diff \| blob \| history
src/models/bitnet.cpp		diff \| blob \| history
src/models/bloom.cpp		diff \| blob \| history
src/models/chameleon.cpp		diff \| blob \| history
src/models/chatglm.cpp		diff \| blob \| history
src/models/codeshell.cpp		diff \| blob \| history
src/models/cogvlm.cpp		diff \| blob \| history
src/models/cohere2-iswa.cpp		diff \| blob \| history
src/models/command-r.cpp		diff \| blob \| history
src/models/dbrx.cpp		diff \| blob \| history
src/models/deci.cpp		diff \| blob \| history
src/models/deepseek.cpp		diff \| blob \| history
src/models/deepseek2.cpp		diff \| blob \| history
src/models/dots1.cpp		diff \| blob \| history
src/models/dream.cpp		diff \| blob \| history
src/models/ernie4-5-moe.cpp		diff \| blob \| history
src/models/ernie4-5.cpp		diff \| blob \| history
src/models/eurobert.cpp		diff \| blob \| history
src/models/exaone-moe.cpp		diff \| blob \| history
src/models/exaone.cpp		diff \| blob \| history
src/models/exaone4.cpp		diff \| blob \| history
src/models/falcon-h1.cpp		diff \| blob \| history
src/models/falcon.cpp		diff \| blob \| history
src/models/gemma-embedding.cpp		diff \| blob \| history
src/models/gemma.cpp		diff \| blob \| history
src/models/gemma2-iswa.cpp		diff \| blob \| history
src/models/gemma3.cpp		diff \| blob \| history
src/models/gemma3n-iswa.cpp		diff \| blob \| history
src/models/glm4-moe.cpp		diff \| blob \| history
src/models/glm4.cpp		diff \| blob \| history
src/models/gpt2.cpp		diff \| blob \| history
src/models/gptneox.cpp		diff \| blob \| history
src/models/granite-hybrid.cpp		diff \| blob \| history
src/models/granite.cpp		diff \| blob \| history
src/models/grok.cpp		diff \| blob \| history
src/models/grovemoe.cpp		diff \| blob \| history
src/models/hunyuan-dense.cpp		diff \| blob \| history
src/models/hunyuan-moe.cpp		diff \| blob \| history
src/models/internlm2.cpp		diff \| blob \| history
src/models/jais.cpp		diff \| blob \| history
src/models/jais2.cpp		diff \| blob \| history
src/models/jamba.cpp		diff \| blob \| history
src/models/kimi-linear.cpp		diff \| blob \| history
src/models/lfm2.cpp		diff \| blob \| history
src/models/llada-moe.cpp		diff \| blob \| history
src/models/llada.cpp		diff \| blob \| history
src/models/llama-iswa.cpp		diff \| blob \| history
src/models/llama.cpp		diff \| blob \| history
src/models/maincoder.cpp		diff \| blob \| history
src/models/minicpm3.cpp		diff \| blob \| history
src/models/minimax-m2.cpp		diff \| blob \| history
src/models/mistral3.cpp		diff \| blob \| history
src/models/modern-bert.cpp		diff \| blob \| history
src/models/mpt.cpp		diff \| blob \| history
src/models/nemotron-h.cpp		diff \| blob \| history
src/models/nemotron.cpp		diff \| blob \| history
src/models/neo-bert.cpp		diff \| blob \| history
src/models/olmo.cpp		diff \| blob \| history
src/models/olmo2.cpp		diff \| blob \| history
src/models/olmoe.cpp		diff \| blob \| history
src/models/openelm.cpp		diff \| blob \| history
src/models/orion.cpp		diff \| blob \| history
src/models/paddleocr.cpp		diff \| blob \| history
src/models/pangu-embedded.cpp		diff \| blob \| history
src/models/phi2.cpp		diff \| blob \| history
src/models/phi3.cpp		diff \| blob \| history
src/models/plamo.cpp		diff \| blob \| history
src/models/plamo2.cpp		diff \| blob \| history
src/models/plamo3.cpp		diff \| blob \| history
src/models/plm.cpp		diff \| blob \| history
src/models/qwen.cpp		diff \| blob \| history
src/models/qwen2.cpp		diff \| blob \| history
src/models/qwen2moe.cpp		diff \| blob \| history
src/models/qwen2vl.cpp		diff \| blob \| history
src/models/qwen3.cpp		diff \| blob \| history
src/models/qwen35.cpp		diff \| blob \| history
src/models/qwen35moe.cpp		diff \| blob \| history
src/models/qwen3moe.cpp		diff \| blob \| history
src/models/qwen3next.cpp		diff \| blob \| history
src/models/qwen3vl-moe.cpp		diff \| blob \| history
src/models/qwen3vl.cpp		diff \| blob \| history
src/models/refact.cpp		diff \| blob \| history
src/models/rnd1.cpp		diff \| blob \| history
src/models/seed-oss.cpp		diff \| blob \| history
src/models/smallthinker.cpp		diff \| blob \| history
src/models/smollm3.cpp		diff \| blob \| history
src/models/stablelm.cpp		diff \| blob \| history
src/models/starcoder.cpp		diff \| blob \| history
src/models/starcoder2.cpp		diff \| blob \| history
src/models/step35-iswa.cpp		diff \| blob \| history
src/models/t5-dec.cpp		diff \| blob \| history
src/models/t5-enc.cpp		diff \| blob \| history
src/models/xverse.cpp		diff \| blob \| history

Packaging of ggml-org/llama.cpp

RSS Atom