ggml : update softmax n_task calculation (llama/5126)

author snadampal <redacted>

Fri, 26 Jan 2024 17:17:59 +0000 (11:17 -0600)

committer Georgi Gerganov <redacted>

Sat, 27 Jan 2024 15:19:52 +0000 (17:19 +0200)
author snadampal <redacted>
Fri, 26 Jan 2024 17:17:59 +0000 (11:17 -0600)
committer Georgi Gerganov <redacted>
Sat, 27 Jan 2024 15:19:52 +0000 (17:19 +0200)
diff --git a/ggml.c b/ggml.c

index 6a1e218730af95b5bd01d6a12b0fd8b5dd682a66..cb7b74743071bcd041292349cb72da21548f229f 100644 (file)
--- a/ggml.c
+++ b/ggml.c
@@ -16602,7 +16602,7 @@ static int ggml_get_n_tasks(struct ggml_tensor * node, int n_threads) {
              } break;
          case GGML_OP_SOFT_MAX:
              {
-                n_tasks = MIN(MIN(4, n_threads), ggml_nrows(node->src[0]));
+                n_tasks = MIN(n_threads, ggml_nrows(node->src[0]));
              } break;
          case GGML_OP_CONV_TRANSPOSE_1D:
              {
author	snadampal <redacted>
	Fri, 26 Jan 2024 17:17:59 +0000 (11:17 -0600)
committer	Georgi Gerganov <redacted>
	Sat, 27 Jan 2024 15:19:52 +0000 (17:19 +0200)