fix : cuda order of synchronization when setting a buffer (ggml/679)

author Erik Scholz <redacted>

Fri, 5 Jan 2024 15:00:00 +0000 (16:00 +0100)

committer Georgi Gerganov <redacted>

Fri, 5 Jan 2024 15:01:59 +0000 (17:01 +0200)
author Erik Scholz <redacted>
Fri, 5 Jan 2024 15:00:00 +0000 (16:00 +0100)
committer Georgi Gerganov <redacted>
Fri, 5 Jan 2024 15:01:59 +0000 (17:01 +0200)
diff --git a/extra/sync-ggml.last b/extra/sync-ggml.last

index fe7f3202f4bb6dd29c91c2e1dc7435c1200051f3..0e11d4accd69951df581cebf4032d25c8295b596 100644 (file)
--- a/extra/sync-ggml.last
+++ b/extra/sync-ggml.last
@@ -1 +1 @@
-f96711108d55bdbbd277e6be07204dce6a94fb93
+3eace58911ea8d2cf35defdc59848d99b91a57f5
diff --git a/ggml-cuda.cu b/ggml-cuda.cu

index 10c21615e6b71f57381d3559e98c29f3b0873a29..7578d21c6cf140bdae12951d1370b3d4d18557d0 100644 (file)
--- a/ggml-cuda.cu
+++ b/ggml-cuda.cu
@@ -9689,8 +9689,8 @@ static void ggml_backend_cuda_buffer_set_tensor(ggml_backend_buffer_t buffer, gg
  
      ggml_cuda_set_device(ctx->device);
      CUDA_CHECK(cudaDeviceSynchronize());
-
      CUDA_CHECK(cudaMemcpy((char *)tensor->data + offset, data, size, cudaMemcpyHostToDevice));
+    CUDA_CHECK(cudaDeviceSynchronize());
  }
  
  static void ggml_backend_cuda_buffer_get_tensor(ggml_backend_buffer_t buffer, const ggml_tensor * tensor, void * data, size_t offset, size_t size) {
author	Erik Scholz <redacted>
	Fri, 5 Jan 2024 15:00:00 +0000 (16:00 +0100)
committer	Georgi Gerganov <redacted>
	Fri, 5 Jan 2024 15:01:59 +0000 (17:01 +0200)
extra/sync-ggml.last		patch \| blob \| history
ggml-cuda.cu		patch \| blob \| history