]> git.djapps.eu Git - pkg/ggml/sources/ggml/commit
llama : add qwen2moe (llama/6074)
authorShijie <redacted>
Tue, 16 Apr 2024 15:40:48 +0000 (23:40 +0800)
committerGeorgi Gerganov <redacted>
Sat, 11 May 2024 18:30:08 +0000 (21:30 +0300)
commitd5bd297e5a39e1920944bdcc36705fd146011a31
tree69d862771262bb5294768159f8a8e3251e6675c5
parentb71c6efaec34d00d5976ed0ae509792061de21b7
llama : add qwen2moe (llama/6074)

* support qwen2moe

* fix-review

* metal : support unary ops for nelements % 4 != 0

* metal : require contiguousness for float4 unary kernels

* metal : require contiguousness for float4 unary kernels (cont)

* fix-review

* names : for brevity "SHARED_EXP" -> "SHEXP"

* llama : reuse build_moe_ffn()

* llama : add model type name

---------

Co-authored-by: Georgi Gerganov <redacted>
src/ggml-metal.m
src/ggml-metal.metal
tests/test-backend-ops.cpp