]> git.djapps.eu Git - pkg/ggml/sources/llama.cpp/commit
llama : refactor unicode stuff (#5992)
authorGeorgi Gerganov <redacted>
Mon, 11 Mar 2024 15:47:47 +0000 (17:47 +0200)
committerGitHub <redacted>
Mon, 11 Mar 2024 15:47:47 +0000 (17:47 +0200)
commit83796e62bc9f6caae6228168e359890f51e60fee
tree30ea49ae9b8fbde216ca164200bea1df44e18df3
parent828defefb66fc8a25404f5de845897145bf34061
llama : refactor unicode stuff (#5992)

* llama : refactor unicode stuff

ggml-ci

* unicode : names

* make : fix c++ compiler

* unicode : names

* unicode : straighten tables

* zig : fix build

* unicode : put nfd normalization behind API

ggml-ci

* swift : fix build

* unicode : add BOM

* unicode : add <cstdint>

ggml-ci

* unicode : pass as cpts as const ref
CMakeLists.txt
Makefile
Package.swift
build.zig
llama.cpp
tests/test-tokenizer-1-bpe.cpp
tests/test-tokenizer-1-llama.cpp
unicode.cpp [new file with mode: 0644]
unicode.h