ggml-alloc : fix backend assignments of views (#3982)

author slaren <redacted>

Wed, 8 Nov 2023 12:15:14 +0000 (13:15 +0100)

committer GitHub <redacted>

Wed, 8 Nov 2023 12:15:14 +0000 (13:15 +0100)
author slaren <redacted>
Wed, 8 Nov 2023 12:15:14 +0000 (13:15 +0100)
committer GitHub <redacted>
Wed, 8 Nov 2023 12:15:14 +0000 (13:15 +0100)
diff --git a/ggml-alloc.c b/ggml-alloc.c

index 34eba3f830e8496a7d9bc77edb3b0ddc2bd93017..b553eb7c13271914f647fc67ba47ed195f56cfda 100644 (file)
--- a/ggml-alloc.c
+++ b/ggml-alloc.c
@@ -378,9 +378,13 @@ static bool ggml_op_can_inplace(enum ggml_op op) {
      }
  }
  
-static void init_view(struct ggml_allocr * alloc, struct ggml_tensor * view) {
+static void init_view(struct ggml_allocr * alloc, struct ggml_tensor * view, bool update_backend) {
      assert(view->view_src != NULL && view->view_src->data != NULL);
-    view->backend = view->view_src->backend;
+
+    if (update_backend) {
+        view->backend = view->view_src->backend;
+    }
+
      view->buffer  = view->view_src->buffer;
      view->data    = (char *)view->view_src->data + view->view_offs;
  
@@ -394,7 +398,7 @@ static void allocate_node(struct ggml_allocr * alloc, struct ggml_tensor * node)
      struct hash_node * ht = alloc->hash_table;
      if (node->data == NULL) {
          if (ggml_is_view(node)) {
-            init_view(alloc, node);
+            init_view(alloc, node, true);
          } else {
              // see if we can reuse a parent's buffer (inplace)
              if (ggml_op_can_inplace(node->op)) {
@@ -424,15 +428,14 @@ static void allocate_node(struct ggml_allocr * alloc, struct ggml_tensor * node)
                                  AT_PRINTF("reusing view parent %s (%s) for %s\n", parent->name, view_src->name, node->name);
                                  node->view_src = view_src;
                                  view_src_hn->n_views += 1;
-                                init_view(alloc, node);
+                                init_view(alloc, node, false);
                                  return;
                              }
-                        }
-                        else {
+                        } else {
                              AT_PRINTF("reusing parent %s for %s\n", parent->name, node->name);
                              node->view_src = parent;
                              p_hn->n_views += 1;
-                            init_view(alloc, node);
+                            init_view(alloc, node, false);
                              return;
                          }
                      }
@@ -463,7 +466,7 @@ size_t ggml_allocr_alloc_graph_n(
                  hash_get(ht, view_src)->n_views += 1;
                  if (node->buffer == NULL && node->data != NULL) {
                      // view of a pre-allocated tensor, didn't call init_view() yet
-                    init_view(alloc, node);
+                    init_view(alloc, node, true);
                  }
              }
  
@@ -474,7 +477,7 @@ size_t ggml_allocr_alloc_graph_n(
                  }
                  hash_get(ht, parent)->n_children += 1;
                  if (ggml_is_view(parent) && parent->buffer == NULL && parent->data != NULL) {
-                    init_view(alloc, parent);
+                    init_view(alloc, parent, true);
                  }
              }
          }
author	slaren <redacted>
	Wed, 8 Nov 2023 12:15:14 +0000 (13:15 +0100)
committer	GitHub <redacted>
	Wed, 8 Nov 2023 12:15:14 +0000 (13:15 +0100)