vulkan : mul_mat: fix UB with small warps (ggml/952)

author Salvatore Mesoraca <redacted>

Mon, 30 Sep 2024 07:14:09 +0000 (09:14 +0200)

committer Georgi Gerganov <redacted>

Thu, 3 Oct 2024 09:22:17 +0000 (12:22 +0300)
author Salvatore Mesoraca <redacted>
Mon, 30 Sep 2024 07:14:09 +0000 (09:14 +0200)
committer Georgi Gerganov <redacted>
Thu, 3 Oct 2024 09:22:17 +0000 (12:22 +0300)
diff --git a/ggml/src/ggml-vulkan.cpp b/ggml/src/ggml-vulkan.cpp

index c677a27287cc0ca5d1abb6f2fcedb9dd117e9b9c..00ad13bb9567bc5509ad2c73f8096f9fe8cb527c 100644 (file)
--- a/ggml/src/ggml-vulkan.cpp
+++ b/ggml/src/ggml-vulkan.cpp
@@ -1164,11 +1164,11 @@ static void ggml_vk_load_shaders(vk_device& device) {
      // mulmat
      std::initializer_list<uint32_t> warptile_l = { 128, 128, 128, 16, device->subgroup_size * 2, 64, 2, 4, 4, device->subgroup_size };
      std::initializer_list<uint32_t> warptile_m = { 128,  64,  64, 16, device->subgroup_size, 32, 2, 4, 2, device->subgroup_size };
-    std::initializer_list<uint32_t> warptile_s = { device->subgroup_size,  32,  32, 16, 32, 32, 2, 2, 2, device->subgroup_size };
+    std::initializer_list<uint32_t> warptile_s = { std::max(device->subgroup_size, 16u),  32,  32, 16, 32, 32, 2, 2, 2, device->subgroup_size };
  
      std::initializer_list<uint32_t> warptile_mmq_l = { 128, 128, 128, 32, device->subgroup_size * 2, 64, 2, 4, 4, device->subgroup_size };
      std::initializer_list<uint32_t> warptile_mmq_m = { 128,  64,  64, 32, device->subgroup_size, 32, 2, 4, 2, device->subgroup_size };
-    std::initializer_list<uint32_t> warptile_mmq_s = { device->subgroup_size,  32,  32, 32, 32, 32, 2, 2, 2, device->subgroup_size };
+    std::initializer_list<uint32_t> warptile_mmq_s = { std::max(device->subgroup_size, 16u),  32,  32, 32, 32, 32, 2, 2, 2, device->subgroup_size };
  
      std::array<uint32_t, 3> l_wg_denoms = {128, 128, 1 };
      std::array<uint32_t, 3> m_wg_denoms = { 64,  64, 1 };
author	Salvatore Mesoraca <redacted>
	Mon, 30 Sep 2024 07:14:09 +0000 (09:14 +0200)
committer	Georgi Gerganov <redacted>
	Thu, 3 Oct 2024 09:22:17 +0000 (12:22 +0300)