]> git.djapps.eu Git - pkg/ggml/sources/whisper.cpp/commit
whisper : support speaker segmentation (local diarization) of mono audio via tinydiar...
authorAkash Mahajan <redacted>
Tue, 4 Jul 2023 06:45:00 +0000 (23:45 -0700)
committerGitHub <redacted>
Tue, 4 Jul 2023 06:45:00 +0000 (09:45 +0300)
commitc8d0f5fe9801862bdd7f63a949937a804d02cfb5
treef56bb4c0dbe8b3f1ebd80f17c90aeea672e320d8
parentfdf58a66688909adeb782634442b1b7fa357e837
whisper : support speaker segmentation (local diarization) of mono audio via tinydiarize (#1058)

* add HuggingFace mirror to download  ggml model

* support tdrz via simple hack overriding solm tokens

* fix incorrect translate/transcribe token_ids that are not static const

* add apollo 13 sample for tdrz demo

* render [SPEAKER TURN] consistently in all terminal output using vocab.id_to_token

* extend whisper_segment with speaker_turn_next field and save in json output

* fix failing go build

* slipped in some python syntax whoops

* whisper : finalize tinydiarize support (add flag + fixes)

* whisper : tdrz support for word-level timestamps (respect max_len)

* java : try to fix tests after adding tdrz_enable flag

* main : remove TODO leftover

* java : fix params order list after adding "tdrz_enable"

* whisper : fix solm and add nosp token

* main : print tinydiarize help

---------

Co-authored-by: Georgi Gerganov <redacted>
Makefile
bindings/go/whisper.go
bindings/java/src/main/java/io/github/ggerganov/whispercpp/WhisperCppJnaLibrary.java
bindings/java/src/main/java/io/github/ggerganov/whispercpp/params/WhisperFullParams.java
examples/main/main.cpp
models/download-ggml-model.sh
whisper.cpp
whisper.h