CUDA/HIP: add warp_size to cuda_device_info

author uvos <redacted>

Wed, 29 Jan 2025 16:46:23 +0000 (17:46 +0100)

committer Georgi Gerganov <redacted>

Mon, 3 Feb 2025 20:00:57 +0000 (22:00 +0200)
author uvos <redacted>
Wed, 29 Jan 2025 16:46:23 +0000 (17:46 +0100)
committer Georgi Gerganov <redacted>
Mon, 3 Feb 2025 20:00:57 +0000 (22:00 +0200)
diff --git a/ggml/src/ggml-cuda/common.cuh b/ggml/src/ggml-cuda/common.cuh

index a66322da05a364f11df6f2f6896b2a0788aca8a3..eec227dce3a1e878f8dd7a6e2ed90a35cd26b6ac 100644 (file)
--- a/ggml/src/ggml-cuda/common.cuh
+++ b/ggml/src/ggml-cuda/common.cuh
@@ -520,6 +520,7 @@ struct ggml_cuda_device_info {
          bool    vmm;                // virtual memory support
          size_t  vmm_granularity;    // granularity of virtual memory
          size_t  total_vram;
+        int     warp_size;          // Number of threads in a dispatch
      };
  
      cuda_device_info devices[GGML_CUDA_MAX_DEVICES] = {};
diff --git a/ggml/src/ggml-cuda/ggml-cuda.cu b/ggml/src/ggml-cuda/ggml-cuda.cu

index de3f9c2ca1ed5bc4b272d979f7a1f2354de4c118..ecf06fec408bb822b1e96368bc80334e067369c4 100644 (file)
--- a/ggml/src/ggml-cuda/ggml-cuda.cu
+++ b/ggml/src/ggml-cuda/ggml-cuda.cu
@@ -242,6 +242,7 @@ static ggml_cuda_device_info ggml_cuda_init() {
  
          info.devices[id].nsm   = prop.multiProcessorCount;
          info.devices[id].smpb  = prop.sharedMemPerBlock;
+        info.devices[id].warp_size = prop.warpSize;
  #if defined(GGML_USE_HIP) && defined(__HIP_PLATFORM_AMD__)
          info.devices[id].smpbo = prop.sharedMemPerBlock;
  
@@ -256,8 +257,9 @@ static ggml_cuda_device_info ggml_cuda_init() {
                  info.devices[id].cc += prop.minor * 0x10;
              }
          }
-        GGML_LOG_INFO("  Device %d: %s, %s (0x%x), VMM: %s\n",
-                        id, prop.name, prop.gcnArchName, info.devices[id].cc & 0xffff, device_vmm ? "yes" : "no");
+        GGML_LOG_INFO("  Device %d: %s, %s (0x%x), VMM: %s, Wave Size: %d\n",
+                      id, prop.name, prop.gcnArchName, info.devices[id].cc & 0xffff,
+                      device_vmm ? "yes" : "no", prop.warpSize);
  #else
          info.devices[id].smpbo = prop.sharedMemPerBlockOptin;
          info.devices[id].cc = 100*prop.major + 10*prop.minor;
author	uvos <redacted>
	Wed, 29 Jan 2025 16:46:23 +0000 (17:46 +0100)
committer	Georgi Gerganov <redacted>
	Mon, 3 Feb 2025 20:00:57 +0000 (22:00 +0200)
ggml/src/ggml-cuda/common.cuh		patch \| blob \| history
ggml/src/ggml-cuda/ggml-cuda.cu		patch \| blob \| history