whisper : use ggml_backend_sched (whisper/2239)

author Georgi Gerganov <redacted>

Tue, 18 Jun 2024 06:37:20 +0000 (09:37 +0300)

committer Georgi Gerganov <redacted>

Tue, 18 Jun 2024 06:50:40 +0000 (09:50 +0300)
author Georgi Gerganov <redacted>
Tue, 18 Jun 2024 06:37:20 +0000 (09:37 +0300)
committer Georgi Gerganov <redacted>
Tue, 18 Jun 2024 06:50:40 +0000 (09:50 +0300)
diff --git a/ggml-backend.c b/ggml-backend.c

index 26dce7f72421396b433f5aca4c078dc1d5f1ac7c..13c71c310c446d66d99e57167c2588618e8f1026 100644 (file)
--- a/ggml-backend.c
+++ b/ggml-backend.c
@@ -1706,14 +1706,16 @@ static void ggml_backend_sched_split_graph(ggml_backend_sched_t sched, struct gg
  static bool ggml_backend_sched_alloc_splits(ggml_backend_sched_t sched) {
      bool backend_ids_changed = false;
      for (int i = 0; i < sched->graph->n_nodes; i++) {
-        if (sched->node_backend_ids[i] != sched->prev_node_backend_ids[i]) {
+        if (sched->node_backend_ids[i] != sched->prev_node_backend_ids[i] &&
+            sched->bufts[sched->node_backend_ids[i]] != sched->bufts[sched->prev_node_backend_ids[i]]) {
              backend_ids_changed = true;
              break;
          }
      }
      if (!backend_ids_changed) {
          for (int i = 0; i < sched->graph->n_leafs; i++) {
-            if (sched->leaf_backend_ids[i] != sched->prev_leaf_backend_ids[i]) {
+            if (sched->leaf_backend_ids[i] != sched->prev_leaf_backend_ids[i] &&
+                sched->bufts[sched->leaf_backend_ids[i]] != sched->bufts[sched->prev_leaf_backend_ids[i]]) {
                  backend_ids_changed = true;
                  break;
              }
@@ -1977,6 +1979,15 @@ int ggml_backend_sched_get_n_copies(ggml_backend_sched_t sched) {
      return sched->n_copies;
  }
  
+int ggml_backend_sched_get_n_backends(ggml_backend_sched_t sched) {
+    return sched->n_backends;
+}
+
+ggml_backend_t ggml_backend_sched_get_backend(ggml_backend_sched_t sched, int i) {
+    GGML_ASSERT(i >= 0 && i < sched->n_backends);
+    return sched->backends[i];
+}
+
  size_t ggml_backend_sched_get_buffer_size(ggml_backend_sched_t sched, ggml_backend_t backend) {
      int backend_index = ggml_backend_sched_backend_id(sched, backend);
      GGML_ASSERT(backend_index >= 0 && backend_index < sched->n_backends);
diff --git a/ggml-backend.h b/ggml-backend.h

index 47fd8147517954088e9952eefc9f2ecf0d21fcd3..4a38eeb5c23bde451dc4b79ad9e0e8e7eb194ae8 100644 (file)
--- a/ggml-backend.h
+++ b/ggml-backend.h
@@ -182,6 +182,9 @@ extern "C" {
      // Initialize backend buffers from a measure graph
      GGML_API bool                 ggml_backend_sched_reserve(ggml_backend_sched_t sched, struct ggml_cgraph * measure_graph);
  
+    GGML_API int                  ggml_backend_sched_get_n_backends(ggml_backend_sched_t sched);
+    GGML_API ggml_backend_t       ggml_backend_sched_get_backend(ggml_backend_sched_t sched, int i);
+
      // Get the number of splits of the last graph
      GGML_API int                  ggml_backend_sched_get_n_splits(ggml_backend_sched_t sched);
      GGML_API int                  ggml_backend_sched_get_n_copies(ggml_backend_sched_t sched);
author	Georgi Gerganov <redacted>
	Tue, 18 Jun 2024 06:37:20 +0000 (09:37 +0300)
committer	Georgi Gerganov <redacted>
	Tue, 18 Jun 2024 06:50:40 +0000 (09:50 +0300)
ggml-backend.c		patch \| blob \| history
ggml-backend.h		patch \| blob \| history