]> git.djapps.eu Git - pkg/ggml/sources/whisper.cpp/commit
llama : add qwen2moe (llama/6074)
authorShijie <redacted>
Tue, 16 Apr 2024 15:40:48 +0000 (23:40 +0800)
committerGeorgi Gerganov <redacted>
Mon, 13 May 2024 08:02:26 +0000 (11:02 +0300)
commitfdb2c8735066a788aadf8ab1f32d21d0812cd7c7
tree6c27a27a97e9c83ae4e48063b129e7b6813e2291
parent98c0b77e0cecaa34186e758c025f7b37934d786c
llama : add qwen2moe (llama/6074)

* support qwen2moe

* fix-review

* metal : support unary ops for nelements % 4 != 0

* metal : require contiguousness for float4 unary kernels

* metal : require contiguousness for float4 unary kernels (cont)

* fix-review

* names : for brevity "SHARED_EXP" -> "SHEXP"

* llama : reuse build_moe_ffn()

* llama : add model type name

---------

Co-authored-by: Georgi Gerganov <redacted>
ggml-metal.m
ggml-metal.metal