]> git.djapps.eu Git - pkg/ggml/sources/ggml/commit
gguf : add file format specification (#302)
authorPhilpax <redacted>
Wed, 1 Nov 2023 17:01:49 +0000 (18:01 +0100)
committerGitHub <redacted>
Wed, 1 Nov 2023 17:01:49 +0000 (19:01 +0200)
commit54cec9f619d72144f934534e76b0ac1e2975ff61
tree12d79c0e5af9adef8f611bc2b62c2322745b3a94
parent522b3741c613e30a8b414a6ff62972a9354b54c0
gguf : add file format specification (#302)

* docs: gguf spec first pass

* docs(gguf): update with review comments

* docs(gguf): update with review comments

* docs(gguf): quant version optional for unquant

* docs(gguf): normalize naming, add whisper

* docs(gguf): more review updates

* docs(gguf): add norm eps and added_tokens

* docs(gguf): move padding

* docs(gguf): remove migration tool

* docs(gguf): make offset base explicit

* docs(gguf): fix replace oops

* docs(gguf): alignment metadata+tensor name len max

* docs(gguf): clarification, fixes, tensor names

* docs(gguf): clarify license

* docs(gguf): minor tweaks

* docs(gguf): data layout, GQA eq, no ft, LE GGUF

* docs(gguf): fix magic order

* docs(gguf): match impl

* docs(gguf): specify fallback alignment

* docs(gguf): remove TensorInfo::n_elements

* docs(gguf): filetype, rope base/linear scale

* docs(gguf): v2 - uint64 all the things

* docs(gguf): tweak extensibility wording

* docs(gguf): fix spec discrepancies

* docs(gguf): v3 + other fixes

* fix(editorconfig): use 2-space tabs for markdown

* docs(gguf): clarify big-endian
.editorconfig
docs/gguf.md [new file with mode: 0644]