]> git.djapps.eu Git - pkg/ggml/sources/ggml/commit
ggml-cpu: FA add GEMM microkernel (llama/19422)
authorAman Gupta <redacted>
Sun, 15 Feb 2026 05:39:24 +0000 (11:09 +0530)
committerGeorgi Gerganov <redacted>
Wed, 25 Feb 2026 10:32:13 +0000 (12:32 +0200)
commitcf9ac0c856a1fc3c19c3261bc2d144a8fb0b1e9f
tree685f18cf1e866052a947ceea399da2e0de1fc4bb
parentee937d5758d5582f6ce9489c4c638bcb1e8218f8
ggml-cpu: FA add GEMM microkernel (llama/19422)

* ggml-cpu: FA add GEMM microkernel

* add guard for sizeless vector types

* fix case where DV % GGML_F32_EPR !=0

* move memset out of the loop

* move another memset out of the loop

* use RM=4 for arm

* simd_gemm: convert everything to int

* convert everything to size_t to avoid warnings

* fixup

* add pragma for ignoring aggressive loop optimizations
src/ggml-cpu/common.h
src/ggml-cpu/ggml-cpu.c
src/ggml-cpu/ops.cpp
src/ggml-cpu/simd-gemm.h [new file with mode: 0644]