]> git.djapps.eu Git - pkg/ggml/sources/ggml/commit
CANN: add support for partial RoPE and Vision mode (llama/17543)
authorChenguang Li <redacted>
Tue, 9 Dec 2025 09:53:23 +0000 (17:53 +0800)
committerGeorgi Gerganov <redacted>
Thu, 11 Dec 2025 13:32:59 +0000 (15:32 +0200)
commitbe9bd7d4aae687132d99b70bfbc43897d4b32d8a
treef01ef2942bbb225291087639437ff3c6c7811d64
parent16e3125bd9523fa250bede0c30de8a4f1c983e58
CANN: add support for partial RoPE and Vision mode (llama/17543)

* cann: add support for partial RoPE and Vision mode

Add support for two important RoPE variants: partial rotation (rope_dims < ne0)
and Vision mode rotation.

1. Support for partial RoPE (rope_dims < ne0):
   - Split tensor into head (first rope_dims dimensions) and tail portions
   - Apply rotation only to head portion using RotaryPositionEmbedding operator
   - Copy unrotated tail portion directly from source to destination
   - Handle both contiguous and non-contiguous tensor layouts

2. Support for Vision mode (GGML_ROPE_TYPE_VISION):
   - Set rope_dims = ne0 for Vision mode to rotate entire tensor
   - Vision mode pairs dimension i with dimension i+n_dims (where n_dims = ne0/2)
   - No tail handling needed since entire tensor is rotated

Implementation details:
   - Use has_tail flag to determine execution path: head/tail splitting when
     rope_dims < ne0, or full tensor rotation when rope_dims == ne0
   - Support both F32 and F16 data types with intermediate F32 conversion
   - Copy non-contiguous tensors to contiguous buffers before calling
     RotaryPositionEmbedding operator for compatibility
   - Improve cache invalidation logic to include rope_dims and indep_sects
     parameters

These enhancements enable CANN backend to handle various RoPE configurations
used in modern vision-language models and models with partial rotation.

* cann: fix review comment
src/ggml-cann/aclnn_ops.cpp
src/ggml-cann/common.h
src/ggml-cann/ggml-cann.cpp