CUDA: fix 1D im2col, add tests (ggml/993)

author Johannes Gäßler <redacted>

Fri, 18 Oct 2024 07:24:44 +0000 (09:24 +0200)

committer Georgi Gerganov <redacted>

Fri, 1 Nov 2024 08:19:05 +0000 (10:19 +0200)
author Johannes Gäßler <redacted>
Fri, 18 Oct 2024 07:24:44 +0000 (09:24 +0200)
committer Georgi Gerganov <redacted>
Fri, 1 Nov 2024 08:19:05 +0000 (10:19 +0200)
diff --git a/ggml/src/ggml-cuda.cu b/ggml/src/ggml-cuda.cu

index 1338bd45836bb58e7841b6184ce52e6333c34241..fa280b529bcb8d9546358cb00a024b412ceafad8 100644 (file)
--- a/ggml/src/ggml-cuda.cu
+++ b/ggml/src/ggml-cuda.cu
@@ -3141,7 +3141,6 @@ static bool ggml_backend_cuda_device_supports_op(ggml_backend_dev_t dev, const g
          case GGML_OP_ROPE:
              return ggml_is_contiguous(op->src[0]);
          case GGML_OP_IM2COL:
-            return op->src[0]->type == GGML_TYPE_F16;
          case GGML_OP_POOL_2D:
          case GGML_OP_SUM:
          case GGML_OP_SUM_ROWS:
diff --git a/ggml/src/ggml-cuda/im2col.cu b/ggml/src/ggml-cuda/im2col.cu

index 16463ab0fb683cf8e24095bc9eb3209e24e7d933..86a54e42bb7e64d4d2b574b9b51e7ba4b20c9ee5 100644 (file)
--- a/ggml/src/ggml-cuda/im2col.cu
+++ b/ggml/src/ggml-cuda/im2col.cu
@@ -91,9 +91,9 @@ void ggml_cuda_op_im2col(ggml_backend_cuda_context & ctx, ggml_tensor * dst) {
      const int64_t OH = is_2D ? dst->ne[2] : 1;
      const int64_t OW =         dst->ne[1];
  
-    const size_t delta_offset = src1->nb[is_2D ? 2 : 1] / 4; // nb is byte offset, src is type float32
-    const int64_t batch = src1->ne[3];
-    const size_t batch_offset = src1->nb[3] / 4; // nb is byte offset, src is type float32
+    const size_t  delta_offset = src1->nb[is_2D ? 2 : 1] / 4; // nb is byte offset, src is type float32
+    const int64_t batch        = src1->ne[is_2D ? 3 : 2];
+    const size_t  batch_offset = src1->nb[is_2D ? 3 : 2] / 4; // nb is byte offset, src is type float32
  
      if(dst->type == GGML_TYPE_F16) {
          im2col_cuda_f16(src1_d, (half *) dst_d, IW, IH, OW, OH, KW, KH, IC, batch, batch_offset, delta_offset, s0, s1, p0, p1, d0, d1, stream);
author	Johannes Gäßler <redacted>
	Fri, 18 Oct 2024 07:24:44 +0000 (09:24 +0200)
committer	Georgi Gerganov <redacted>
	Fri, 1 Nov 2024 08:19:05 +0000 (10:19 +0200)
ggml/src/ggml-cuda.cu		patch \| blob \| history
ggml/src/ggml-cuda/im2col.cu		patch \| blob \| history