]> git.djapps.eu Git - pkg/ggml/sources/ggml/log
pkg/ggml/sources/ggml
23 months agoggml : fix Alibi implementation (#351)
Daulet Zhanguzin [Tue, 11 Jul 2023 17:26:22 +0000 (10:26 -0700)]
ggml : fix Alibi implementation (#351)

* correct Alibi implementation

* update f16 too

23 months agoggml : sync llama.cpp (fix for #341)
Georgi Gerganov [Tue, 11 Jul 2023 16:36:52 +0000 (19:36 +0300)]
ggml : sync llama.cpp (fix for #341)

23 months agoggml : fix docs about element access (close #348)
Georgi Gerganov [Mon, 10 Jul 2023 19:05:13 +0000 (22:05 +0300)]
ggml : fix docs about element access (close #348)

23 months agostarcoder : add <|end_of_turn|> token handling in order to support openchat/opencoder...
the-crypt-keeper [Mon, 10 Jul 2023 18:41:58 +0000 (14:41 -0400)]
starcoder : add <|end_of_turn|> token handling in order to support openchat/opencoderplus (#343)

* Add <|end_of_turn|> token handling to support openchat/opencoderplus

* The opencoder EOT occurs inside the prompt, so we should only break if the model actually generated it

---------

Co-authored-by: Mike <redacted>
23 months agopkg-config : fix typo in includedir (#367)
Sam Spilsbury [Mon, 10 Jul 2023 18:40:29 +0000 (21:40 +0300)]
pkg-config : fix typo in includedir (#367)

23 months agoggml : sync llama.cpp (changes to ggml_graph_compute() API) (#368)
Georgi Gerganov [Mon, 10 Jul 2023 18:40:05 +0000 (21:40 +0300)]
ggml : sync llama.cpp (changes to ggml_graph_compute() API) (#368)

23 months agoggml : minor indentation
Georgi Gerganov [Thu, 6 Jul 2023 16:41:18 +0000 (19:41 +0300)]
ggml : minor indentation

23 months agoggml : restore GGML_RESTRICT (#350)
Borislav Stanimirov [Thu, 6 Jul 2023 07:24:39 +0000 (10:24 +0300)]
ggml : restore GGML_RESTRICT (#350)

2 years agoggml : fix bug introduced in bfc6d42f8c2141383e4f21e4a030688c71560da0
Georgi Gerganov [Wed, 5 Jul 2023 17:38:55 +0000 (20:38 +0300)]
ggml : fix bug introduced in bfc6d42f8c2141383e4f21e4a030688c71560da0

2 years agotests : sync from llama.cpp and disable some obsolete tests
Georgi Gerganov [Wed, 5 Jul 2023 17:38:20 +0000 (20:38 +0300)]
tests : sync from llama.cpp and disable some obsolete tests

2 years agoggml : sync llama.cpp (generalize quantize_fns + CUDA improvements)
Georgi Gerganov [Wed, 5 Jul 2023 17:14:13 +0000 (20:14 +0300)]
ggml : sync llama.cpp (generalize quantize_fns + CUDA improvements)

2 years agocmake : fix public header path for submodules (#342)
Andrei [Tue, 4 Jul 2023 19:53:42 +0000 (15:53 -0400)]
cmake : fix public header path for submodules (#342)

2 years agowhisper : fix wrong variable name from previous commit
Georgi Gerganov [Tue, 4 Jul 2023 17:27:19 +0000 (20:27 +0300)]
whisper : fix wrong variable name from previous commit

2 years agobuild : add pkg-config file (#335)
Sam Spilsbury [Tue, 4 Jul 2023 17:35:13 +0000 (20:35 +0300)]
build : add pkg-config file (#335)

This makes it easier for other library consumers to find
the library and link to it.

Fixes #334

2 years agocmake : install the header file to ggml/ggml.h (#333)
Sam Spilsbury [Tue, 4 Jul 2023 17:34:28 +0000 (20:34 +0300)]
cmake : install the header file to ggml/ggml.h (#333)

Fixes #332

2 years agowhisper : sync whisper.cpp (tinydiarize + OpenVINO)
Georgi Gerganov [Tue, 4 Jul 2023 17:24:22 +0000 (20:24 +0300)]
whisper : sync whisper.cpp (tinydiarize + OpenVINO)

2 years agoreadme : add link to ggml-gobject (#336)
Sam Spilsbury [Tue, 4 Jul 2023 13:30:21 +0000 (16:30 +0300)]
readme : add link to ggml-gobject (#336)

This enables also some bindings to python (through pygi), gjs, vala, csharp, etc. However `ggml-gobject`s main purpose is to make the library a bit more friendly to the desktop platform, eg, by providing asynchronous operation, a DBus service, etc.

2 years agodolly : update error print behavior (#337)
Jakob Frick [Tue, 4 Jul 2023 13:26:57 +0000 (14:26 +0100)]
dolly : update error print behavior (#337)

2 years agodolly : disable interactive_port on Windows (#339)
Borislav Stanimirov [Tue, 4 Jul 2023 13:26:29 +0000 (16:26 +0300)]
dolly : disable interactive_port on Windows (#339)

2 years agodolly : add interactive prompt and port mode (#319)
Jakob Frick [Sun, 2 Jul 2023 18:48:02 +0000 (14:48 -0400)]
dolly : add interactive prompt and port mode (#319)

* update basic function to execute prompt

* try to factor our prediciton loop

* update code

* update prompt things

* only render at the end

* add basic server port

* refactor

* fix client file descriptor

* undo common.h style changes

* undo sytle changes to main.cpp

* fix check for interactive port

2 years agoexamples : remove whitespace
Georgi Gerganov [Sun, 2 Jul 2023 18:41:23 +0000 (21:41 +0300)]
examples : remove whitespace

2 years agoexamples : use GGML_FILE_MAGIC where possible (#323)
Hirochika Matsumoto [Sun, 2 Jul 2023 16:47:47 +0000 (01:47 +0900)]
examples : use GGML_FILE_MAGIC where possible (#323)

2 years agozig : add tests codes using zig (#315)
sjinzh [Sun, 2 Jul 2023 16:36:53 +0000 (00:36 +0800)]
zig : add tests codes using zig (#315)

* update build.zig

* zig : add tests by zig

* zig : add tests codes using zig

* zig : add tests codes using zig

2 years agompt : convert model weights part by part to save memory (#314)
Hugo Rosenkranz-Costa [Sun, 2 Jul 2023 16:05:24 +0000 (18:05 +0200)]
mpt : convert model weights part by part to save memory (#314)

* mpt : update conversion script to load model weights part by part

* mpt : add usage README

2 years agoggml : generalize interface for 1d and 2d convolutions (#313)
Borislav Stanimirov [Sun, 2 Jul 2023 15:54:16 +0000 (18:54 +0300)]
ggml : generalize interface for 1d and 2d convolutions (#313)

* conv_1d wip

* conv_1d opt

* conv_1d done

* conv_1 improve alias func name

* conv_2d wip

* conv size to separate func

* conv2d done

---------

Co-authored-by: Georgi Gerganov <redacted>
2 years agoggml : disable ggml_rope_back for ChatGLM
Georgi Gerganov [Sun, 2 Jul 2023 15:53:42 +0000 (18:53 +0300)]
ggml : disable ggml_rope_back for ChatGLM

2 years agoggml : remove tensor ptr from export for now (close #267)
Georgi Gerganov [Sun, 2 Jul 2023 15:33:41 +0000 (18:33 +0300)]
ggml : remove tensor ptr from export for now (close #267)

Not used for now

2 years agoggml : fix enum order for TANH (#316)
Georgi Gerganov [Sun, 2 Jul 2023 15:26:26 +0000 (18:26 +0300)]
ggml : fix enum order for TANH (#316)

2 years agoggml : add `ELU`, `TANH`, `ARGMAX` (#316)
PAB [Sun, 2 Jul 2023 15:25:37 +0000 (17:25 +0200)]
ggml : add `ELU`, `TANH`, `ARGMAX` (#316)

* add: `elu` activation

* add: `tanh` activation

* add: `argmax`

* ggml : rearrange ops - put "tanh" after "step"

---------

Co-authored-by: Georgi Gerganov <redacted>
2 years agoggml : add GGML_TENSOR_LOCALS helper macros (#309)
goerch [Sun, 2 Jul 2023 15:13:23 +0000 (17:13 +0200)]
ggml : add GGML_TENSOR_LOCALS helper macros (#309)

* [WIP] ref #292

* Further code reduction

* ggml : minor style fixes

* ggml : hide op locals in source file

---------

Co-authored-by: Georgi Gerganov <redacted>
2 years agostarcoder : add repeat penalty (#311)
the-crypt-keeper [Sun, 2 Jul 2023 14:52:52 +0000 (10:52 -0400)]
starcoder : add repeat penalty (#311)

* implement repeat penalty processing for starcoder

* show effective parameters at starcoder startup

---------

Co-authored-by: Mike Ravkine <redacted>
2 years agoggml : sync latest llama.cpp (ggml_task_type changes + GPU backends)
Georgi Gerganov [Sun, 2 Jul 2023 14:33:57 +0000 (17:33 +0300)]
ggml : sync latest llama.cpp (ggml_task_type changes + GPU backends)

2 years agozig : add tests by zig (#307)
sjinzh [Mon, 26 Jun 2023 20:48:31 +0000 (04:48 +0800)]
zig : add tests by zig (#307)

* update build.zig

* zig : add tests by zig

2 years agoggml : support ChatGLM-style RoPE (#305)
Jiahao Li [Mon, 26 Jun 2023 20:47:31 +0000 (04:47 +0800)]
ggml : support ChatGLM-style RoPE (#305)

2 years agoggml : increase max name size to 48
Georgi Gerganov [Mon, 26 Jun 2023 20:26:37 +0000 (23:26 +0300)]
ggml : increase max name size to 48

2 years agoggml : sync llama.cpp (NUMA + thread improvements + k-quants)
Georgi Gerganov [Mon, 26 Jun 2023 18:10:24 +0000 (21:10 +0300)]
ggml : sync llama.cpp (NUMA + thread improvements + k-quants)

2 years agopy : add requirements.txt (#201)
Playdev [Sun, 25 Jun 2023 13:50:39 +0000 (22:50 +0900)]
py : add requirements.txt (#201)

* Add requirements.txt

* Fix README.md files

2 years agoreadme : add link to CLIP example (#298)
M. Yusuf Sarıgöz [Sun, 25 Jun 2023 13:45:34 +0000 (16:45 +0300)]
readme : add link to CLIP example (#298)

2 years agoggml : fix invalid src0 dereference
Georgi Gerganov [Sun, 25 Jun 2023 13:39:57 +0000 (16:39 +0300)]
ggml : fix invalid src0 dereference

2 years agoggml : remove _GNU_SOURCE
Georgi Gerganov [Sun, 25 Jun 2023 13:38:17 +0000 (16:38 +0300)]
ggml : remove _GNU_SOURCE

ref : https://github.com/ggerganov/whisper.cpp/pull/1027

2 years agozig : update build.zig (#296)
sjinzh [Sun, 25 Jun 2023 13:36:09 +0000 (21:36 +0800)]
zig : update build.zig (#296)

2 years agoreadme : add roadmap + manifesto
Georgi Gerganov [Sun, 25 Jun 2023 13:09:34 +0000 (16:09 +0300)]
readme : add roadmap + manifesto

2 years agoggml : do not round up the conv 2D row size (#274)
M. Yusuf Sarıgöz [Sun, 25 Jun 2023 12:59:24 +0000 (15:59 +0300)]
ggml : do not round up the conv 2D row size (#274)

2 years agowhisper : fix ifdef
Georgi Gerganov [Sun, 25 Jun 2023 12:38:55 +0000 (15:38 +0300)]
whisper : fix ifdef

2 years agoopencl : remove ggml-opencl.c
Georgi Gerganov [Sun, 25 Jun 2023 12:37:02 +0000 (15:37 +0300)]
opencl : remove ggml-opencl.c

2 years agowhisper : sync latest whisper.cpp
Georgi Gerganov [Sun, 25 Jun 2023 12:35:05 +0000 (15:35 +0300)]
whisper : sync latest whisper.cpp

2 years agowhisper : sync latest whisper.cpp
Georgi Gerganov [Sun, 25 Jun 2023 11:31:01 +0000 (14:31 +0300)]
whisper : sync latest whisper.cpp

2 years agocommon : fix trailing whitespace
Georgi Gerganov [Sun, 25 Jun 2023 11:20:41 +0000 (14:20 +0300)]
common : fix trailing whitespace

2 years agowhisper : sync latest whisper.cpp
Georgi Gerganov [Sun, 25 Jun 2023 11:19:47 +0000 (14:19 +0300)]
whisper : sync latest whisper.cpp

2 years agoreadme : add encodec.cpp link
Georgi Gerganov [Sun, 25 Jun 2023 10:07:18 +0000 (13:07 +0300)]
readme : add encodec.cpp link

2 years agoreadme : add BioGPT example link
Georgi Gerganov [Sat, 24 Jun 2023 17:58:42 +0000 (20:58 +0300)]
readme : add BioGPT example link

2 years agoggml : add custom mapping functions (#264)
LoganDark [Sat, 24 Jun 2023 17:47:53 +0000 (10:47 -0700)]
ggml : add custom mapping functions (#264)

* Add custom mapping functions

The current mapping functions are basically jokes, add some real
ones. These ones get access to the actual tensor structs so they
can do things like

- Know the dimensions they are operating on
- Work with tensors with more than 2 dimensions, or transposed
- Operate on two differently sized tensors (like matmul)
- Use their own thread pool that does a better job than ggml does.

Among other things ...

* fix ordering mistake

* ggml : custom operators support scratch buffers

---------

Co-authored-by: Georgi Gerganov <redacted>
2 years agozig : add zig build system support (#279)
sjinzh [Sat, 24 Jun 2023 17:03:13 +0000 (01:03 +0800)]
zig : add zig build system support (#279)

* add zig build system support

* add zig build system support

2 years agotests : allow to set threads to test-grad0
Georgi Gerganov [Sat, 24 Jun 2023 16:39:32 +0000 (19:39 +0300)]
tests : allow to set threads to test-grad0

2 years agobuild : fix compilation errors and warnigns when building with MSVC (#275)
Borislav Stanimirov [Sat, 24 Jun 2023 16:11:35 +0000 (19:11 +0300)]
build : fix compilation errors and warnigns when building with MSVC (#275)

2 years agotests : increase stack size for test1 when building with MSVC (#277)
Borislav Stanimirov [Sat, 24 Jun 2023 16:06:13 +0000 (19:06 +0300)]
tests : increase stack size for test1 when building with MSVC (#277)

2 years agotests : use LBFGS optimizer instead of ADAM (close #276)
Georgi Gerganov [Sat, 24 Jun 2023 16:03:09 +0000 (19:03 +0300)]
tests : use LBFGS optimizer instead of ADAM (close #276)

ADAM seems to behave differently since the recent training changes.
Need to see how to make it work again for test2 - probably some
parameters need to be adjusted

2 years agoggml : more verbose memory allocation failure (#270)
AmbientL [Sat, 24 Jun 2023 15:31:38 +0000 (15:31 +0000)]
ggml : more verbose memory allocation failure (#270)

2 years agostarcoder : add special tokens for fill-in-the-middle task (#269)
AmbientL [Sat, 24 Jun 2023 15:30:23 +0000 (15:30 +0000)]
starcoder : add special tokens for fill-in-the-middle task (#269)

2 years agoggml : sync llama.cpp (tensor names)
Georgi Gerganov [Sat, 24 Jun 2023 15:27:46 +0000 (18:27 +0300)]
ggml : sync llama.cpp (tensor names)

2 years agoci : reduce GGML_NLOOP to 3
Georgi Gerganov [Mon, 19 Jun 2023 18:28:16 +0000 (21:28 +0300)]
ci : reduce GGML_NLOOP to 3

2 years agotests : sync test-grad0 from llama.cpp
Georgi Gerganov [Mon, 19 Jun 2023 17:43:19 +0000 (20:43 +0300)]
tests : sync test-grad0 from llama.cpp

2 years agoggml : fix bug in LBFGS optimizer
Georgi Gerganov [Mon, 19 Jun 2023 17:43:12 +0000 (20:43 +0300)]
ggml : fix bug in LBFGS optimizer

2 years agoggml : sync latest llama.cpp
Georgi Gerganov [Mon, 19 Jun 2023 17:35:08 +0000 (20:35 +0300)]
ggml : sync latest llama.cpp

2 years agogpt-2 : fix typo (#261)
Ebey Abraham [Sun, 18 Jun 2023 10:33:38 +0000 (11:33 +0100)]
gpt-2 : fix typo (#261)

Co-authored-by: Ebey Abraham <redacted>
2 years agowhisper : removed duplicate lines in convert-pt-to-ggml.py (#256)
Avi Lumelsky [Sun, 18 Jun 2023 10:32:09 +0000 (13:32 +0300)]
whisper : removed duplicate lines in convert-pt-to-ggml.py (#256)

Deleted 2 lines of .astype(float32) conversion to the model weights (No real impact, just for cleaner code)

2 years agoreplit : update inference code to match reference (#218)
Lukas Möller [Sun, 18 Jun 2023 08:34:21 +0000 (10:34 +0200)]
replit : update inference code to match reference (#218)

* Update replit inference code to match reference

* Add qntvr printf

2 years agoci : introduce Github Actions CI workflow (#247)
Adam Tazi [Sun, 18 Jun 2023 08:15:58 +0000 (01:15 -0700)]
ci : introduce Github Actions CI workflow (#247)

* Introduce Github Actions CI workflow for the ggml repo

This commit integrates a Github Actions CI workflow that compiles and tests the codebase on both Ubuntu 22.04 and macOS 12 Monterey. The workflow is triggered on pull requests against the main branch and on every push to the main branch.

To accommodate the resource constraints of the Github-hosted runners, a `GGML_NITER` environment variable is introduced, allowing tests to run within a reasonable time frame. `test-grad0.c` is modified to use this variable instead of `GGML_NLOOP`.

The workflow file includes:

- A build strategy for both Ubuntu and MacOS.
- An environment setup with variables `GGML_NLOOP` and `GGML_NITER`.
- A step to limit the number of threads used by `test2.c` for efficient execution.
- A typical build process with steps for environment creation, CMake configuration, building, and verbose testing with a timeout.

* main to master

2 years agoggml : convert interleaved addressing to sequential addressing for reduce functions...
Tanmay [Sun, 18 Jun 2023 08:09:48 +0000 (13:39 +0530)]
ggml : convert interleaved addressing to sequential addressing for reduce functions (#117)

* Convert interleaved addressing to sequential addressing for REDUCE

* update addressing on new archs

2 years agoexamples : fix c++ standard errors and pedantic warnings (#239)
Ravindra Marella [Sun, 18 Jun 2023 07:54:59 +0000 (13:24 +0530)]
examples : fix c++ standard errors and pedantic warnings (#239)

2 years agoggml : fix minor resource leak reported by static analysis (#237)
Cristiano Calcagno [Sun, 18 Jun 2023 07:45:11 +0000 (09:45 +0200)]
ggml : fix minor resource leak reported by static analysis (#237)

2 years agostarcoder : add support for starchat special tokens (#246)
Ravindra Marella [Sun, 18 Jun 2023 07:37:09 +0000 (13:07 +0530)]
starcoder : add support for starchat special tokens (#246)

* starcoder : add support for starchat special tokens

* examples : fix `gpt_tokenize()` for special tokens

2 years agoggml : return input tensor in ggml_set_name (#262)
LoganDark [Fri, 16 Jun 2023 19:39:09 +0000 (12:39 -0700)]
ggml : return input tensor in ggml_set_name (#262)

this is SO USEFUL for debugging. in order to find any cgraph node,
I can wrap it in ggml_set_name and set a conditional breakpoint.

but I can only wrap existing code if this returns its input.
otherwise the barrier becomes annoyingly high (have to move a
bunch of code around to add name to a tensor)

2 years agoggml : fix ggml_clamp (#263)
LoganDark [Fri, 16 Jun 2023 19:17:30 +0000 (12:17 -0700)]
ggml : fix ggml_clamp (#263)

This unconditionally failed before

2 years agoggml : add quick GELU (#254)
M. Yusuf Sarıgöz [Fri, 16 Jun 2023 17:36:46 +0000 (20:36 +0300)]
ggml : add quick GELU (#254)

* Implement Quick GELU

* Revert "Implement Quick GELU"

This reverts commit ff220cc1f91a184f195d19b17ed4c352cc72a6f0.

* Tidy up ggml.h

* Respect to the style of ggml

* Fix: Fix minor typo

* Rename `quick_gelu` -> `gelu_quick`

2 years agocmake : export all symbols on windows when building shared library (#234)
Andrei [Thu, 8 Jun 2023 18:51:39 +0000 (14:51 -0400)]
cmake : export all symbols on windows when building shared library (#234)

Currently building ggml on windows as a shared library does not export all symbols by default.

2 years agoggml : correct off-by-one bounds check in ggml_compute_forward_set_f32 (#229)
LoganDark [Wed, 7 Jun 2023 16:16:19 +0000 (09:16 -0700)]
ggml : correct off-by-one bounds check in ggml_compute_forward_set_f32 (#229)

without this fix you will be unable to set a zero-length tensor to the end of another tensor

this sounds stupid, but is used in my testing

2 years agogpt-neox : fix ctx size calculation (#228)
klosax [Wed, 7 Jun 2023 16:15:50 +0000 (18:15 +0200)]
gpt-neox : fix ctx size calculation (#228)

2 years agoggml : fix ggml_clamp thresholds being read as ints instead of floats (#221)
Georgi Gerganov [Wed, 7 Jun 2023 16:14:50 +0000 (19:14 +0300)]
ggml : fix ggml_clamp thresholds being read as ints instead of floats (#221)

2 years agoggml : add inplace ops api in header file (#219)
Jiahao Li [Wed, 7 Jun 2023 16:14:27 +0000 (00:14 +0800)]
ggml : add inplace ops api in header file (#219)

2 years agoggml : add ggml_conv_2d_sk_p0(), ggml_win_part(), ggml_win_unpart()
Georgi Gerganov [Fri, 2 Jun 2023 12:46:59 +0000 (15:46 +0300)]
ggml : add ggml_conv_2d_sk_p0(), ggml_win_part(), ggml_win_unpart()

2 years agoggml : fix ggml op conv_1d enum names
Georgi Gerganov [Tue, 30 May 2023 10:49:08 +0000 (13:49 +0300)]
ggml : fix ggml op conv_1d enum names

2 years agoggml : better conv_1d naming
Georgi Gerganov [Tue, 30 May 2023 10:19:55 +0000 (13:19 +0300)]
ggml : better conv_1d naming

2 years agoggml : rename conv_1d ops to reflect half-padding used
Georgi Gerganov [Tue, 30 May 2023 07:18:31 +0000 (10:18 +0300)]
ggml : rename conv_1d ops to reflect half-padding used

2 years agoggml : fix compiler warnings for printf
Georgi Gerganov [Tue, 30 May 2023 07:03:30 +0000 (10:03 +0300)]
ggml : fix compiler warnings for printf

2 years agomnist : remove redundant stuff + rename ctx0
Georgi Gerganov [Mon, 29 May 2023 18:14:52 +0000 (21:14 +0300)]
mnist : remove redundant stuff + rename ctx0

2 years agomnist : add missing header (#213)
Eldar Yusupov [Mon, 29 May 2023 16:55:13 +0000 (19:55 +0300)]
mnist : add missing header (#213)

2 years agocommon : fix compilation on Linux (#212)
Eldar Yusupov [Mon, 29 May 2023 16:47:57 +0000 (19:47 +0300)]
common : fix compilation on Linux (#212)

2 years agoggml : cgraph export/import/eval example + GPU support (#108)
Georgi Gerganov [Mon, 29 May 2023 16:28:07 +0000 (19:28 +0300)]
ggml : cgraph export/import/eval example + GPU support (#108)

* ggml : cgraph export brainstorming

* mnist : code style

* mnist : minor

* ggml : initial cgraph export

* ggml : initial graph import (wip)

* ggml : import op args correctly

* ggml : add ggml_get_tensor_by_name()

* mnist : add compute graph evaluation on CPU example

* ggml : add ggml_tensor_overhead()

* ggml : rename new functions to ggml_cgraph_...

* mnist : add Metal inference skeleton (WIP)

* mnist : working on the Metal pipeline (WIP)

* mnist : prepare the Metal encoder (WIP)

* mnist : first Metal kernel for F32 ADD

* mnist : looks like MTLHeap does not work

* mnist : initial full pass of MNIST on the GPU (not verified)

* mnist : minor cleanup

* mnist : full GPU inference works

* mnist : use custom soft_max kernel since MPSMatrixSoftMax is bugged

* mnist : use constant for soft_max instead of hardcoded 10

* mnist : check multiple predictions (Metal)

* mnist : minor

* ggml : move cgraph import / export to ggml

* mnist : remove common dependencies

* mnist : fix soft_max threadgroup size

* mnist : init no_alloc member

* ggml : improve "get tensor" API

2 years agofix : fix ggml_alibi (#204)
Tyé singwa [Sun, 28 May 2023 17:41:11 +0000 (20:41 +0300)]
fix : fix ggml_alibi (#204)

2 years agoreadme : add "development" (#203)
Skyler Celestinian-Sterling [Sun, 28 May 2023 10:45:30 +0000 (03:45 -0700)]
readme : add "development" (#203)

You are welcome lol

2 years agoggml : add CLBLAST support (#197)
apcameron [Sat, 27 May 2023 13:48:33 +0000 (14:48 +0100)]
ggml : add CLBLAST support (#197)

Enable support for the RISCV architecture

This addresses https://github.com/ggerganov/ggml/issues/129

2 years agocuda : sync latest llama.cpp (control DMMV X/Y sizes)
Georgi Gerganov [Sat, 27 May 2023 13:20:24 +0000 (16:20 +0300)]
cuda : sync latest llama.cpp (control DMMV X/Y sizes)

2 years agoggml : add ggml_tensor_overhead() + ggml_get_tensort_by_name()
Georgi Gerganov [Sat, 27 May 2023 13:18:28 +0000 (16:18 +0300)]
ggml : add ggml_tensor_overhead() + ggml_get_tensort_by_name()

2 years agoggml : sync llama.cpp (OpenCL support for GPU offload)
Georgi Gerganov [Sat, 27 May 2023 08:55:25 +0000 (11:55 +0300)]
ggml : sync llama.cpp (OpenCL support for GPU offload)

2 years agomnist : gitignore stuff
Georgi Gerganov [Sat, 27 May 2023 08:51:29 +0000 (11:51 +0300)]
mnist : gitignore stuff

2 years agoexamples : add tokenization tests and refactor codes (#186)
jaeminSon [Sat, 27 May 2023 08:47:34 +0000 (17:47 +0900)]
examples : add tokenization tests and refactor codes (#186)

* examples : [refactor] remove unnecessary lines and segments

* examples : [feature] add tokenization test for gpt-neox

* examples : [feature] handle multibyte character set

* examples : [refactor] find the longest token for word

* examples : [refactor] move test_tokenizer to common.cpp as the function affects other models

* add 'test_tokenizer' function after loading the model

* examples : [feature] add test cases for checking tokenization

* examples : [feature] tokenize with huggingface tokenizers for currently supported models

* examples : add tokenization test cases for each model

* revert conversion from string to utf-8 encoded byte strings

* [refactor] make util functions for testing tokenizers available

* [bug fix] test replit using functions and variables (e.g. tokenizer struct, tokenization method) defined in its main.cpp

* [refactor] modify function name test_tokenizer -> test_gpt_tokenizer

* [refactor] put parenthesis on single line for-loops and if-statements

* [refactor] withdraw <filesystem> and use <iostream> and <dirent.h>

* [refactor] remove 'find_test_file' function and directly set test file path from 'test_gpt_tokenizer' function

* call a function for testing tokenizer with filename specified

* revert test tokenizer in replit (replit uses seperate methods for tokenzation and decoding)

* compare vector of id to check if two tokenizations are identical.

* write token ids instead of strings.

* [refactor] use --token_test rather than --test for token-test argument

* add english test cases

* update test cases with more english prompts

* examples : tokenizer testing fixes

---------

Co-authored-by: Georgi Gerganov <redacted>
2 years agoUpdate README.md
Georgi Gerganov [Sat, 27 May 2023 06:11:10 +0000 (09:11 +0300)]
Update README.md

2 years agominor : fix printf warnings
Georgi Gerganov [Fri, 26 May 2023 09:34:29 +0000 (12:34 +0300)]
minor : fix printf warnings

2 years agomnist : smooth user input (#199)
Radoslav Gerganov [Fri, 26 May 2023 08:53:18 +0000 (11:53 +0300)]
mnist : smooth user input (#199)

Drawing on the canvas is now smooth. The final image which is used for
prediction is obtained by down-scaling the canvas to 28x28 pixels.
Download button is aslo added for downloading raw image values.