]> git.djapps.eu Git - pkg/ggml/sources/ggml/commitdiff
cuda : fix im2col_f32_f16 (#658)
authorleejet <redacted>
Mon, 18 Dec 2023 16:46:10 +0000 (00:46 +0800)
committerGitHub <redacted>
Mon, 18 Dec 2023 16:46:10 +0000 (17:46 +0100)
src/ggml-cuda.cu

index 019648bddc4d9e23d363d289b432f10dbc481853..2e07bc66277eff1d864cd301d7076a66001e16c7 100644 (file)
@@ -5259,17 +5259,17 @@ static  __global__ void im2col_f32_f16(
     const int ky = (i - kd) / OW;
     const int ix = i % OW;
 
-    const int iiw = ix * s0 + kx * d0 - p0;
-    const int iih = blockIdx.y * s1 + ky * d1 - p1;
+    const int64_t iiw = ix * s0 + kx * d0 - p0;
+    const int64_t iih = blockIdx.y * s1 + ky * d1 - p1;
 
-    const int offset_dst =
+    const int64_t offset_dst =
         (blockIdx.y * OW + ix) * CHW +
         (blockIdx.z * (KW * KH) + ky * KW + kx);
 
     if (iih < 0 || iih >= IH || iiw < 0 || iiw >= IW) {
         dst[offset_dst] = __float2half(0.0f);
     } else {
-        const int offset_src = blockIdx.z * offset_delta;
+        const int64_t offset_src = blockIdx.z * offset_delta;
         dst[offset_dst] = __float2half(x[offset_src + iih * IW + iiw]);
     }
 }