]> git.djapps.eu Git - pkg/ggml/sources/whisper.cpp/commit
ggml-cpu: FA add GEMM microkernel (llama/19422)
authorAman Gupta <redacted>
Sun, 15 Feb 2026 05:39:24 +0000 (11:09 +0530)
committerGeorgi Gerganov <redacted>
Fri, 27 Feb 2026 18:57:58 +0000 (20:57 +0200)
commit76f769d06fe831a6c2c13bcbec341bab92455bd6
treee4dab3332221f81359ffd0f9d4b28428c5ced7a3
parent7ee772ab2becef7adbba13b53e74dd8d4a481583
ggml-cpu: FA add GEMM microkernel (llama/19422)

* ggml-cpu: FA add GEMM microkernel

* add guard for sizeless vector types

* fix case where DV % GGML_F32_EPR !=0

* move memset out of the loop

* move another memset out of the loop

* use RM=4 for arm

* simd_gemm: convert everything to int

* convert everything to size_t to avoid warnings

* fixup

* add pragma for ignoring aggressive loop optimizations
ggml/src/ggml-cpu/common.h
ggml/src/ggml-cpu/ggml-cpu.c
ggml/src/ggml-cpu/ops.cpp
ggml/src/ggml-cpu/simd-gemm.h [new file with mode: 0644]