]> git.djapps.eu Git - pkg/ggml/sources/llama.cpp/commit
ggml-cpu: Fix gcc 15 ICE on ppc64le (#20083) (#20130)
authorshalinib-ibm <redacted>
Fri, 6 Mar 2026 15:22:39 +0000 (20:52 +0530)
committerGitHub <redacted>
Fri, 6 Mar 2026 15:22:39 +0000 (23:22 +0800)
commitc6980ff29ddc8e59c9c002dcaeec14182d893ed7
tree8b5d65b951a9f744dd2d55fb37f1c6e485dca6b7
parent1e38a7a6fa115de0a2731cb67ce554b7df5e8e2c
ggml-cpu: Fix gcc 15 ICE on ppc64le (#20083) (#20130)

This patch addresses an Internal Compiler Error (Segmentation fault)
observed with gcc 15 by replacing the intrinsic + cast by doing
a cat on the data first and then calling the intrinsic. This bypasses the
buggy compiler path while maintaining identical instruction selection.

Performance Verification:
Assembly analysis on RHEL 9 (GCC 15.1.1) confirms that both the original
code and this fix generate the identical Power10 prefixed load instruction:
    `plxv 40, 2(14)`

This ensures zero performance regression while unblocking builds on
newer toolchains.

Reproduced on:
- Alpine Linux + GCC 15.2.0-r2
- RHEL 9  + GCC 15.1.1 (gcc-toolset-15)

Signed-off-by: Shalini Salomi Bodapati <redacted>
ggml/src/ggml-cpu/llamafile/sgemm.cpp