CANN: FIx compiler warnings (#15661)

author Chenguang Li <redacted>

Sat, 30 Aug 2025 02:18:35 +0000 (10:18 +0800)

committer GitHub <redacted>

Sat, 30 Aug 2025 02:18:35 +0000 (10:18 +0800)
author Chenguang Li <redacted>
Sat, 30 Aug 2025 02:18:35 +0000 (10:18 +0800)
committer GitHub <redacted>
Sat, 30 Aug 2025 02:18:35 +0000 (10:18 +0800)
diff --git a/ggml/src/ggml-cann/ggml-cann.cpp b/ggml/src/ggml-cann/ggml-cann.cpp

index 558121dff780b8e536e9ebce62c3a1a43e3c09ec..7b3aca9db97578af5ac0c00f6d6bfc88ddeba223 100755 (executable)
--- a/ggml/src/ggml-cann/ggml-cann.cpp
+++ b/ggml/src/ggml-cann/ggml-cann.cpp
@@ -1155,7 +1155,7 @@ namespace {
   * @note The workspace buffer used in this function is managed globally and reused
   *       across calls. This reduces overhead from repeated memory allocation and deallocation.
   */
-static void weight_format_to_nz(ggml_tensor *tensor, const void *data, size_t offset) {
+static void weight_format_to_nz(ggml_tensor *tensor, size_t offset) {
      aclTensor* weightTransposed = ggml_cann_create_tensor(tensor, tensor->ne,
                                      tensor->nb, 2, ACL_FORMAT_ND, offset);
      uint64_t workspaceSize = 0;
@@ -1203,7 +1203,7 @@ static void ggml_backend_cann_buffer_set_tensor(
          if (weight_to_nz && is_matmul_weight((const ggml_tensor*)tensor)) {
              GGML_ASSERT(tensor->ne[2] == 1);
              GGML_ASSERT(tensor->ne[3] == 1);
-            weight_format_to_nz(tensor, data, offset);
+            weight_format_to_nz(tensor, offset);
          }
      } else {
          void *transform_buffer = malloc(size);
@@ -2491,7 +2491,7 @@ static bool ggml_backend_cann_supports_op(ggml_backend_dev_t dev,
              return true;
          case GGML_OP_SCALE:
              float bias;
-            memcpy(&bias, (float*)op->op_params + 1, sizeof(float));
+            memcpy(&bias, (const float *)(op->op_params) + 1, sizeof(float));
              return bias == 0.0f; // TODO: support bias != 0.0f
          case GGML_OP_SOFT_MAX:
              // TODO: support attention sinks [TAG_ATTN_SINKS]
@@ -2534,7 +2534,7 @@ static bool ggml_backend_cann_supports_op(ggml_backend_dev_t dev,
                  return false;
              }
              float logitSoftcap = 0.0f;
-            memcpy(&logitSoftcap,  (float*)op->op_params + 2, sizeof(float));
+            memcpy(&logitSoftcap, (const float *)(op->op_params) + 2, sizeof(float));
              if(logitSoftcap != 0.0f) {
                  return false;
              }
author	Chenguang Li <redacted>
	Sat, 30 Aug 2025 02:18:35 +0000 (10:18 +0800)
committer	GitHub <redacted>
	Sat, 30 Aug 2025 02:18:35 +0000 (10:18 +0800)