opencl : no need to allocate cl_mem on heap (#1612)

author Howard Su <redacted>

Sun, 28 May 2023 17:13:36 +0000 (01:13 +0800)

committer GitHub <redacted>

Sun, 28 May 2023 17:13:36 +0000 (20:13 +0300)
author Howard Su <redacted>
Sun, 28 May 2023 17:13:36 +0000 (01:13 +0800)
committer GitHub <redacted>
Sun, 28 May 2023 17:13:36 +0000 (20:13 +0300)
diff --git a/ggml-opencl.cpp b/ggml-opencl.cpp

index 8f2e5fbca8263af9b72f94e9a445ddf41a9f37ba..9a5cb0535a49ebb49b27fbcf1263ea706e98fa81 100644 (file)
--- a/ggml-opencl.cpp
+++ b/ggml-opencl.cpp
@@ -667,7 +667,7 @@ static void ggml_cl_mul_mat_f32(const ggml_tensor * src0, const ggml_tensor * sr
      size_t d_size;
      cl_mem d_X;
      if (src0->backend == GGML_BACKEND_CL) {
-        d_X = *(cl_mem*) src0->data;
+        d_X = (cl_mem) src0->data;
      } else {
          d_X = ggml_cl_pool_malloc(sizeof(ggml_fp16_t) * x_ne, &x_size, CL_MEM_READ_ONLY);
      }
@@ -743,7 +743,7 @@ static void ggml_cl_mul_mat_f16(const ggml_tensor * src0, const ggml_tensor * sr
      size_t d_size;
      cl_mem d_X;
      if (src0->backend == GGML_BACKEND_CL) {
-        d_X = *(cl_mem*) src0->data;
+        d_X = (cl_mem) src0->data;
      } else {
          d_X = ggml_cl_pool_malloc(sizeof(ggml_fp16_t) * x_ne, &x_size, CL_MEM_READ_ONLY);
      }
@@ -868,7 +868,7 @@ static void ggml_cl_mul_mat_q_f32(const ggml_tensor * src0, const ggml_tensor *
              if (src0->backend == GGML_BACKEND_CPU) {
                  CL_CHECK(ggml_cl_h2d_tensor_2d(queue, d_Q, 0, src0, i03, i02, NULL));
              } else if (src0->backend == GGML_BACKEND_CL) {
-                d_Q = *(cl_mem*) src0->data;
+                d_Q = (cl_mem) src0->data;
              } else {
                  GGML_ASSERT(false);
              }
@@ -1011,14 +1011,13 @@ void ggml_cl_transform_tensor(ggml_tensor * tensor) {
      const size_t q_sz = ggml_type_size(type) * ne0 * ne1 * ne2 * ne3 / ggml_blck_size(type);
  
      size_t q_size;
-    cl_mem* dst = (cl_mem*) malloc(sizeof(cl_mem));
-    *dst = ggml_cl_pool_malloc(q_sz, &q_size, CL_MEM_READ_ONLY);
+    cl_mem dst = ggml_cl_pool_malloc(q_sz, &q_size, CL_MEM_READ_ONLY);
  
      // copy tensor to device
      for (int64_t i3 = 0; i3 < ne3; i3++) {
          for (int64_t i2 = 0; i2 < ne2; i2++) {
              int i = i3*ne2 + i2;
-            CL_CHECK(ggml_cl_h2d_tensor_2d(queue, *dst, i*ne0*ne1, tensor, i3, i2, NULL));
+            CL_CHECK(ggml_cl_h2d_tensor_2d(queue, dst, i*ne0*ne1, tensor, i3, i2, NULL));
          }
      }
author	Howard Su <redacted>
	Sun, 28 May 2023 17:13:36 +0000 (01:13 +0800)
committer	GitHub <redacted>
	Sun, 28 May 2023 17:13:36 +0000 (20:13 +0300)