HIP: disable rocwmma on gfx12 by default until rocm 7.0 (#14202)

author uvos <redacted>

Mon, 16 Jun 2025 11:47:38 +0000 (13:47 +0200)

committer GitHub <redacted>

Mon, 16 Jun 2025 11:47:38 +0000 (13:47 +0200)
author uvos <redacted>
Mon, 16 Jun 2025 11:47:38 +0000 (13:47 +0200)
committer GitHub <redacted>
Mon, 16 Jun 2025 11:47:38 +0000 (13:47 +0200)
diff --git a/ggml/CMakeLists.txt b/ggml/CMakeLists.txt

index 727139cf385b7556646a5caa396c88d773f20ea5..7b398ae8e30ed41e509a8a074c217cf6b318a2e1 100644 (file)
--- a/ggml/CMakeLists.txt
+++ b/ggml/CMakeLists.txt
@@ -172,6 +172,7 @@ option(GGML_HIP                             "ggml: use HIP"
  option(GGML_HIP_GRAPHS                      "ggml: use HIP graph, experimental, slow"         OFF)
  option(GGML_HIP_NO_VMM                      "ggml: do not try to use HIP VMM"                 ON)
  option(GGML_HIP_ROCWMMA_FATTN               "ggml: enable rocWMMA for FlashAttention"         OFF)
+option(GGML_HIP_FORCE_ROCWMMA_FATTN_GFX12   "ggml: enable rocWMMA FlashAttention on GFX12"    OFF)
  option(GGML_VULKAN                          "ggml: use Vulkan"                                OFF)
  option(GGML_VULKAN_CHECK_RESULTS            "ggml: run Vulkan op checks"                      OFF)
  option(GGML_VULKAN_DEBUG                    "ggml: enable Vulkan debug output"                OFF)
diff --git a/ggml/src/ggml-cuda/common.cuh b/ggml/src/ggml-cuda/common.cuh

index 563a7828bdd14c8ab1b4a5cf66f3f54b8e1a071b..c14a12f54a8d6cb73b0fad9ecc0c6a1c05b60ac9 100644 (file)
--- a/ggml/src/ggml-cuda/common.cuh
+++ b/ggml/src/ggml-cuda/common.cuh
@@ -207,9 +207,9 @@ typedef float2 dfloat2;
  #define FP16_MMA_AVAILABLE
  #endif // !(defined(GGML_USE_HIP) && defined(__HIP_PLATFORM_AMD__)) && __CUDA_ARCH__ >= GGML_CUDA_CC_VOLTA
  
-#if defined(GGML_HIP_ROCWMMA_FATTN) && (defined(CDNA) || defined(RDNA3) || defined(RDNA4))
+#if defined(GGML_HIP_ROCWMMA_FATTN) && (defined(CDNA) || defined(RDNA3) || (defined(GGML_HIP_ROCWMMA_FATTN_GFX12) && defined(RDNA4)))
  #define FP16_MMA_AVAILABLE
-#endif // defined(GGML_HIP_ROCWMMA_FATTN) && (defined(CDNA) || defined(RDNA3) || defined(RDNA4))
+#endif // defined(GGML_HIP_ROCWMMA_FATTN) && (defined(CDNA) || defined(RDNA3) || (defined(GGML_HIP_ROCWMMA_FATTN_GFX12) && defined(RDNA4)))
  
  #if !(defined(GGML_USE_HIP) && defined(__HIP_PLATFORM_AMD__)) && __CUDA_ARCH__ >= GGML_CUDA_CC_TURING
  #define NEW_MMA_AVAILABLE
diff --git a/ggml/src/ggml-hip/CMakeLists.txt b/ggml/src/ggml-hip/CMakeLists.txt

index 1fe8fe3b8d079167267d7b4efb9d935a13b57c31..e29df98560e077e95e424e1a6a33fd1f920654b9 100644 (file)
--- a/ggml/src/ggml-hip/CMakeLists.txt
+++ b/ggml/src/ggml-hip/CMakeLists.txt
@@ -113,6 +113,10 @@ if (GGML_HIP_ROCWMMA_FATTN)
      add_compile_definitions(GGML_HIP_ROCWMMA_FATTN)
  endif()
  
+if (GGML_HIP_FORCE_ROCWMMA_FATTN_GFX12 OR ${hip_VERSION} VERSION_GREATER_EQUAL 7.0)
+    add_compile_definitions(GGML_HIP_ROCWMMA_FATTN_GFX12)
+endif()
+
  if (NOT GGML_CUDA_FA)
      add_compile_definitions(GGML_CUDA_NO_FA)
  endif()
author	uvos <redacted>
	Mon, 16 Jun 2025 11:47:38 +0000 (13:47 +0200)
committer	GitHub <redacted>
	Mon, 16 Jun 2025 11:47:38 +0000 (13:47 +0200)
ggml/CMakeLists.txt		patch \| blob \| history
ggml/src/ggml-cuda/common.cuh		patch \| blob \| history
ggml/src/ggml-hip/CMakeLists.txt		patch \| blob \| history