]> git.djapps.eu Git - pkg/ggml/sources/whisper.cpp/commitdiff
cuda : add error checking for cudaMemcpyAsync in argsort (llama/17599)
authorMahekk Shaikh <redacted>
Sun, 30 Nov 2025 00:16:28 +0000 (19:16 -0500)
committerGeorgi Gerganov <redacted>
Fri, 12 Dec 2025 15:53:13 +0000 (17:53 +0200)
* cuda : add error checking for cudaMemcpyAsync in argsort (llama/12836)

* fix indentation

ggml/src/ggml-cuda/argsort.cu

index 3722cf3ab26ee7bc9e677636349f9c4bcd565e26..da9652c3be8c9d9ea0431b16e2803da2888f37d3 100644 (file)
@@ -44,7 +44,7 @@ static void argsort_f32_i32_cuda_cub(ggml_cuda_pool & pool,
     const dim3 offset_grid((nrows + block_size - 1) / block_size);
     init_offsets<<<offset_grid, block_size, 0, stream>>>(d_offsets, ncols, nrows);
 
-    cudaMemcpyAsync(temp_keys, x, ncols * nrows * sizeof(float), cudaMemcpyDeviceToDevice, stream);
+    CUDA_CHECK(cudaMemcpyAsync(temp_keys, x, ncols * nrows * sizeof(float), cudaMemcpyDeviceToDevice, stream));
 
     size_t temp_storage_bytes = 0;