whisper : fix overriding the audio context

author Georgi Gerganov <redacted>

Sun, 19 Nov 2023 08:32:32 +0000 (10:32 +0200)

committer Georgi Gerganov <redacted>

Sun, 19 Nov 2023 08:32:32 +0000 (10:32 +0200)
author Georgi Gerganov <redacted>
Sun, 19 Nov 2023 08:32:32 +0000 (10:32 +0200)
committer Georgi Gerganov <redacted>
Sun, 19 Nov 2023 08:32:32 +0000 (10:32 +0200)
diff --git a/whisper.cpp b/whisper.cpp

index e2197ff262c993ae7ac14ed393e1d116242fe45f..f848ee0b3e8c3eb346862da4da6bdbb3fc45d4df 100644 (file)
--- a/whisper.cpp
+++ b/whisper.cpp
@@ -1732,22 +1732,20 @@ static struct ggml_cgraph * whisper_build_graph_conv(
          // convolution + gelu
          {
              cur = ggml_conv_1d_ph(ctx0, model.e_conv_1_w, mel, 1, 1);
-            cur = ggml_add(ctx0, cur, model.e_conv_1_b);
-            //cur = ggml_add(ctx0,
-            //        ggml_repeat(ctx0,
-            //            model.e_conv_1_b,
-            //            cur),
-            //        cur);
+            if (n_ctx == hparams.n_audio_ctx) {
+                cur = ggml_add(ctx0, cur, model.e_conv_1_b);
+            } else {
+                cur = ggml_add(ctx0, cur, ggml_cont(ctx0, ggml_view_2d(ctx0, model.e_conv_1_b, cur->ne[0], cur->ne[1], model.e_conv_1_b->nb[1], 0)));
+            }
  
              cur = ggml_gelu(ctx0, cur);
  
              cur = ggml_conv_1d_ph(ctx0, model.e_conv_2_w, cur, 2, 1);
-            cur = ggml_add(ctx0, cur, model.e_conv_2_b);
-            //cur = ggml_add(ctx0,
-            //        ggml_repeat(ctx0,
-            //            model.e_conv_2_b,
-            //            cur),
-            //        cur);
+            if (n_ctx == hparams.n_audio_ctx) {
+                cur = ggml_add(ctx0, cur, model.e_conv_2_b);
+            } else {
+                cur = ggml_add(ctx0, cur, ggml_cont(ctx0, ggml_view_2d(ctx0, model.e_conv_2_b, cur->ne[0], cur->ne[1], model.e_conv_2_b->nb[1], 0)));
+            }
  
              cur = ggml_gelu(ctx0, cur);
          }
author	Georgi Gerganov <redacted>
	Sun, 19 Nov 2023 08:32:32 +0000 (10:32 +0200)
committer	Georgi Gerganov <redacted>
	Sun, 19 Nov 2023 08:32:32 +0000 (10:32 +0200)