cuda : get_row_rounding F32 (#4095)

author Andrew Godfrey <redacted>

Fri, 17 Nov 2023 08:01:15 +0000 (00:01 -0800)

committer GitHub <redacted>

Fri, 17 Nov 2023 08:01:15 +0000 (10:01 +0200)
author Andrew Godfrey <redacted>
Fri, 17 Nov 2023 08:01:15 +0000 (00:01 -0800)
committer GitHub <redacted>
Fri, 17 Nov 2023 08:01:15 +0000 (10:01 +0200)
diff --git a/ggml-cuda.cu b/ggml-cuda.cu

index 9aa61fe4da7b04cce8d2fb0bd7e0c14b5e58af36..874ad9ac4e8eca03ffbc07443e6cf98b732bb87e 100644 (file)
--- a/ggml-cuda.cu
+++ b/ggml-cuda.cu
@@ -6356,6 +6356,7 @@ static int64_t get_row_rounding(ggml_type type) {
          case GGML_TYPE_Q8_0:
              return max_compute_capability >= CC_RDNA2 ? 128 : 64;
          case GGML_TYPE_F16:
+        case GGML_TYPE_F32:
              return 1;
          case GGML_TYPE_Q2_K:
              return max_compute_capability >= CC_RDNA2 ? 128 : 32;
@@ -6378,6 +6379,7 @@ static int64_t get_row_rounding(ggml_type type) {
          case GGML_TYPE_Q8_0:
              return 64;
          case GGML_TYPE_F16:
+        case GGML_TYPE_F32:
              return 1;
          case GGML_TYPE_Q2_K:
          case GGML_TYPE_Q3_K:
author	Andrew Godfrey <redacted>
	Fri, 17 Nov 2023 08:01:15 +0000 (00:01 -0800)
committer	GitHub <redacted>
	Fri, 17 Nov 2023 08:01:15 +0000 (10:01 +0200)