]> git.djapps.eu Git - pkg/ggml/sources/whisper.cpp/commitdiff
binding : Expose the audio_ctx param through the Go binding (#1368)
authorJohan <redacted>
Sun, 15 Oct 2023 12:35:06 +0000 (05:35 -0700)
committerGitHub <redacted>
Sun, 15 Oct 2023 12:35:06 +0000 (13:35 +0100)
* expose the audio_ctx param through the go binding

* expose the audio_ctx param to the go binding context

bindings/go/params.go
bindings/go/pkg/whisper/context.go
bindings/go/pkg/whisper/interface.go

index b480ccf84e5885215c27eabd1aefadd77f2a77b9..3c9dd5ce8ec1ca812fbabb46a9fbcb7ae23c7860 100644 (file)
@@ -118,6 +118,11 @@ func (p *Params) SetMaxTokensPerSegment(n int) {
        p.max_tokens = C.int(n)
 }
 
+// Set audio encoder context
+func (p *Params) SetAudioCtx(n int) {
+       p.audio_ctx = C.int(n)
+}
+
 ///////////////////////////////////////////////////////////////////////////////
 // PRIVATE METHODS
 
@@ -141,6 +146,7 @@ func (p *Params) String() string {
        str += fmt.Sprintf(" n_max_text_ctx=%d", p.n_max_text_ctx)
        str += fmt.Sprintf(" offset_ms=%d", p.offset_ms)
        str += fmt.Sprintf(" duration_ms=%d", p.duration_ms)
+       str += fmt.Sprintf(" audio_ctx=%d", p.audio_ctx)
        if p.translate {
                str += " translate"
        }
index 6f3c2c747a0d4b257a5583690ebbb7875b0f415d..f51d4f89ac0a238b384ca1c71550d985c468b666 100644 (file)
@@ -82,7 +82,7 @@ func (context *context) SetSpeedup(v bool) {
 }
 
 func (context *context) SetSplitOnWord(v bool) {
-        context.params.SetSplitOnWord(v)
+       context.params.SetSplitOnWord(v)
 }
 
 // Set number of threads to use
@@ -125,6 +125,11 @@ func (context *context) SetMaxTokensPerSegment(n uint) {
        context.params.SetMaxTokensPerSegment(int(n))
 }
 
+// Set audio encoder context
+func (context *context) SetAudioCtx(n uint) {
+       context.params.SetAudioCtx(int(n))
+}
+
 // ResetTimings resets the mode timings. Should be called before processing
 func (context *context) ResetTimings() {
        context.model.ctx.Whisper_reset_timings()
index 771961abf5b846566960bc9635be05cbc1a4f801..4744271d21f979c92d946f95da7418abed1eacaa 100644 (file)
@@ -48,6 +48,7 @@ type Context interface {
        SetMaxSegmentLength(uint)     // Set max segment length in characters
        SetTokenTimestamps(bool)      // Set token timestamps flag
        SetMaxTokensPerSegment(uint)  // Set max tokens per segment (0 = no limit)
+       SetAudioCtx(uint)             // Set audio encoder context
 
        // Process mono audio data and return any errors.
        // If defined, newly generated segments are passed to the