cpu: skip NOPs to avoid barriers (#17133)

author Max Krasnyansky <redacted>

Mon, 10 Nov 2025 20:44:49 +0000 (12:44 -0800)

committer GitHub <redacted>

Mon, 10 Nov 2025 20:44:49 +0000 (12:44 -0800)
author Max Krasnyansky <redacted>
Mon, 10 Nov 2025 20:44:49 +0000 (12:44 -0800)
committer GitHub <redacted>
Mon, 10 Nov 2025 20:44:49 +0000 (12:44 -0800)
diff --git a/ggml/src/ggml-cpu/ggml-cpu.c b/ggml/src/ggml-cpu/ggml-cpu.c

index b5466dd703d1d14fbb1e950cb06b11388c83ef8b..086708bae0b297b2af7b69e44efbe0248571595a 100644 (file)
--- a/ggml/src/ggml-cpu/ggml-cpu.c
+++ b/ggml/src/ggml-cpu/ggml-cpu.c
@@ -1807,22 +1807,6 @@ static void ggml_compute_forward(struct ggml_compute_params * params, struct ggm
              {
                  ggml_compute_forward_cont(params, tensor);
              } break;
-        case GGML_OP_RESHAPE:
-            {
-                ggml_compute_forward_reshape(params, tensor);
-            } break;
-        case GGML_OP_VIEW:
-            {
-                ggml_compute_forward_view(params, tensor);
-            } break;
-        case GGML_OP_PERMUTE:
-            {
-                ggml_compute_forward_permute(params, tensor);
-            } break;
-        case GGML_OP_TRANSPOSE:
-            {
-                ggml_compute_forward_transpose(params, tensor);
-            } break;
          case GGML_OP_GET_ROWS:
              {
                  ggml_compute_forward_get_rows(params, tensor);
@@ -2042,6 +2026,22 @@ static void ggml_compute_forward(struct ggml_compute_params * params, struct ggm
              {
                  // nop
              } break;
+        case GGML_OP_RESHAPE:
+            {
+                // nop
+            } break;
+        case GGML_OP_PERMUTE:
+            {
+                // nop
+            } break;
+        case GGML_OP_VIEW:
+            {
+                // nop
+            } break;
+        case GGML_OP_TRANSPOSE:
+            {
+                // nop
+            } break;
          case GGML_OP_COUNT:
              {
                  GGML_ABORT("fatal error");
@@ -2884,6 +2884,11 @@ static thread_ret_t ggml_graph_compute_thread(void * data) {
      for (int node_n = 0; node_n < cgraph->n_nodes && atomic_load_explicit(&tp->abort, memory_order_relaxed) != node_n; node_n++) {
          struct ggml_tensor * node = cgraph->nodes[node_n];
  
+        if (ggml_op_is_empty(node->op)) {
+            // skip NOPs
+            continue;
+        }
+
          ggml_compute_forward(&params, node);
  
          if (state->ith == 0 && cplan->abort_callback &&
diff --git a/ggml/src/ggml-cpu/ops.cpp b/ggml/src/ggml-cpu/ops.cpp

index 8235f6959439184d72d9ed0ec84d7183bad583ca..7c42fb78b4a4f95fd80200ce961f470325a665ac 100644 (file)
--- a/ggml/src/ggml-cpu/ops.cpp
+++ b/ggml/src/ggml-cpu/ops.cpp
@@ -4455,46 +4455,6 @@ void ggml_compute_forward_cont(
      ggml_compute_forward_dup(params, dst);
  }
  
-// ggml_compute_forward_reshape
-
-void ggml_compute_forward_reshape(
-        const ggml_compute_params * params,
-        ggml_tensor * dst) {
-    // NOP
-    GGML_UNUSED(params);
-    GGML_UNUSED(dst);
-}
-
-// ggml_compute_forward_view
-
-void ggml_compute_forward_view(
-        const ggml_compute_params * params,
-        ggml_tensor * dst) {
-    // NOP
-    GGML_UNUSED(params);
-    GGML_UNUSED(dst);
-}
-
-// ggml_compute_forward_permute
-
-void ggml_compute_forward_permute(
-        const ggml_compute_params * params,
-        ggml_tensor * dst) {
-    // NOP
-    GGML_UNUSED(params);
-    GGML_UNUSED(dst);
-}
-
-// ggml_compute_forward_transpose
-
-void ggml_compute_forward_transpose(
-        const ggml_compute_params * params,
-        ggml_tensor * dst) {
-    // NOP
-    GGML_UNUSED(params);
-    GGML_UNUSED(dst);
-}
-
  // ggml_compute_forward_get_rows
  
  static void ggml_compute_forward_get_rows_q(
diff --git a/ggml/src/ggml-cpu/ops.h b/ggml/src/ggml-cpu/ops.h

index 9824a03b458336b9f40806a39fd402007ec77e0d..2b4127c12b15e92de018adefc5a00f502a88dc0a 100644 (file)
--- a/ggml/src/ggml-cpu/ops.h
+++ b/ggml/src/ggml-cpu/ops.h
@@ -51,10 +51,6 @@ void ggml_compute_forward_scale(const struct ggml_compute_params * params, struc
  void ggml_compute_forward_set(const struct ggml_compute_params * params, struct ggml_tensor * dst);
  void ggml_compute_forward_cpy(const struct ggml_compute_params * params, struct ggml_tensor * dst);
  void ggml_compute_forward_cont(const struct ggml_compute_params * params, struct ggml_tensor * dst);
-void ggml_compute_forward_reshape(const struct ggml_compute_params * params, struct ggml_tensor * dst);
-void ggml_compute_forward_view(const struct ggml_compute_params * params, struct ggml_tensor * dst);
-void ggml_compute_forward_permute(const struct ggml_compute_params * params, struct ggml_tensor * dst);
-void ggml_compute_forward_transpose(const struct ggml_compute_params * params, struct ggml_tensor * dst);
  void ggml_compute_forward_get_rows(const struct ggml_compute_params * params, struct ggml_tensor * dst);
  void ggml_compute_forward_get_rows_back(const struct ggml_compute_params * params, struct ggml_tensor * dst);
  void ggml_compute_forward_set_rows(const struct ggml_compute_params * params, struct ggml_tensor * dst);
author	Max Krasnyansky <redacted>
	Mon, 10 Nov 2025 20:44:49 +0000 (12:44 -0800)
committer	GitHub <redacted>
	Mon, 10 Nov 2025 20:44:49 +0000 (12:44 -0800)
ggml/src/ggml-cpu/ggml-cpu.c		patch \| blob \| history
ggml/src/ggml-cpu/ops.cpp		patch \| blob \| history
ggml/src/ggml-cpu/ops.h		patch \| blob \| history