examples : use -dev/--device and WHISPER_ARG_DEVICE (#3557)

author Bráulio Oliveira <redacted>

Wed, 21 Jan 2026 07:40:30 +0000 (04:40 -0300)

committer GitHub <redacted>

Wed, 21 Jan 2026 07:40:30 +0000 (08:40 +0100)
author Bráulio Oliveira <redacted>
Wed, 21 Jan 2026 07:40:30 +0000 (04:40 -0300)
committer GitHub <redacted>
Wed, 21 Jan 2026 07:40:30 +0000 (08:40 +0100)
diff --git a/examples/cli/cli.cpp b/examples/cli/cli.cpp

index 9a54742fe1d7db5e1371bd4a98cefae1dd517e27..4e84c1b27505ce4c2cdd3b62a0404bb3d172fd95 100644 (file)
--- a/examples/cli/cli.cpp
+++ b/examples/cli/cli.cpp
@@ -77,6 +77,7 @@ struct whisper_params {
      bool log_score       = false;
      bool use_gpu         = true;
      bool flash_attn      = true;
+    int32_t gpu_device   = 0;
      bool suppress_nst    = false;
      bool carry_initial_prompt = false;
  
@@ -129,6 +130,10 @@ static char * requires_value_error(const std::string & arg) {
  }
  
  static bool whisper_params_parse(int argc, char ** argv, whisper_params & params) {
+    if (const char * env_device = std::getenv("WHISPER_ARG_DEVICE")) {
+        params.gpu_device = std::stoi(env_device);
+    }
+
      for (int i = 1; i < argc; i++) {
          std::string arg = argv[i];
  
@@ -195,6 +200,7 @@ static bool whisper_params_parse(int argc, char ** argv, whisper_params & params
          else if (arg == "-dtw"  || arg == "--dtw")                  { params.dtw             = ARGV_NEXT; }
          else if (arg == "-ls"   || arg == "--log-score")            { params.log_score       = true; }
          else if (arg == "-ng"   || arg == "--no-gpu")               { params.use_gpu         = false; }
+        else if (arg == "-dev"  || arg == "--device")               { params.gpu_device      = std::stoi(ARGV_NEXT); }
          else if (arg == "-fa"   || arg == "--flash-attn")           { params.flash_attn      = true; }
          else if (arg == "-nfa"  || arg == "--no-flash-attn")        { params.flash_attn      = false; }
          else if (arg == "-sns"  || arg == "--suppress-nst")         { params.suppress_nst    = true; }
@@ -276,6 +282,7 @@ static void whisper_print_usage(int /*argc*/, char ** argv, const whisper_params
      fprintf(stderr, "  -dtw MODEL --dtw MODEL            [%-7s] compute token-level timestamps\n",                 params.dtw.c_str());
      fprintf(stderr, "  -ls,       --log-score            [%-7s] log best decoder scores of tokens\n",              params.log_score?"true":"false");
      fprintf(stderr, "  -ng,       --no-gpu               [%-7s] disable GPU\n",                                    params.use_gpu ? "false" : "true");
+    fprintf(stderr, "  -dev N,    --device N             [%-7d] GPU device ID (default: 0)\n",                     params.gpu_device);
      fprintf(stderr, "  -fa,       --flash-attn           [%-7s] enable flash attention\n",                         params.flash_attn ? "true" : "false");
      fprintf(stderr, "  -nfa,      --no-flash-attn        [%-7s] disable flash attention\n",                        params.flash_attn ? "false" : "true");
      fprintf(stderr, "  -sns,      --suppress-nst         [%-7s] suppress non-speech tokens\n",                     params.suppress_nst ? "true" : "false");
@@ -1003,6 +1010,7 @@ int main(int argc, char ** argv) {
      struct whisper_context_params cparams = whisper_context_default_params();
  
      cparams.use_gpu    = params.use_gpu;
+    cparams.gpu_device = params.gpu_device;
      cparams.flash_attn = params.flash_attn;
  
      if (!params.dtw.empty()) {
diff --git a/examples/server/server.cpp b/examples/server/server.cpp

index 866ac4eafaab0262ad60fb02ec978653e4cf9e4e..b77d8a3ed46b7920e3f0f1f25120dff51fd6400d 100644 (file)
--- a/examples/server/server.cpp
+++ b/examples/server/server.cpp
@@ -103,6 +103,7 @@ struct whisper_params {
      bool no_timestamps   = false;
      bool use_gpu         = true;
      bool flash_attn      = true;
+    int32_t gpu_device   = 0;
      bool suppress_nst    = false;
      bool no_context      = true;
      bool no_language_probabilities = false;
@@ -179,6 +180,7 @@ void whisper_print_usage(int /*argc*/, char ** argv, const whisper_params & para
      fprintf(stderr, "  -sns,      --suppress-nst      [%-7s] suppress non-speech tokens\n", params.suppress_nst ? "true" : "false");
      fprintf(stderr, "  -nth N,    --no-speech-thold N [%-7.2f] no speech threshold\n",   params.no_speech_thold);
      fprintf(stderr, "  -ng,       --no-gpu            [%-7s] do not use gpu\n", params.use_gpu ? "false" : "true");
+    fprintf(stderr, "  -dev N,    --device N          [%-7d] GPU device ID (default: 0)\n", params.gpu_device);
      fprintf(stderr, "  -fa,       --flash-attn        [%-7s] enable flash attention\n", params.flash_attn ? "true" : "false");
      fprintf(stderr, "  -nfa,      --no-flash-attn     [%-7s] disable flash attention\n", params.flash_attn ? "false" : "true");
      fprintf(stderr, "  -nlp,      --no-language-probabilities [%-7s] exclude language probabilities from verbose_json output\n", params.no_language_probabilities ? "true" : "false");
@@ -198,6 +200,10 @@ void whisper_print_usage(int /*argc*/, char ** argv, const whisper_params & para
  }
  
  bool whisper_params_parse(int argc, char ** argv, whisper_params & params, server_params & sparams) {
+    if (const char * env_device = std::getenv("WHISPER_ARG_DEVICE")) {
+        params.gpu_device = std::stoi(env_device);
+    }
+
      for (int i = 1; i < argc; i++) {
          std::string arg = argv[i];
  
@@ -237,6 +243,7 @@ bool whisper_params_parse(int argc, char ** argv, whisper_params & params, serve
          else if (arg == "-oved" || arg == "--ov-e-device")     { params.openvino_encode_device = argv[++i]; }
          else if (arg == "-dtw"  || arg == "--dtw")             { params.dtw             = argv[++i]; }
          else if (arg == "-ng"   || arg == "--no-gpu")          { params.use_gpu         = false; }
+        else if (arg == "-dev"  || arg == "--device")          { params.gpu_device      = std::stoi(argv[++i]); }
          else if (arg == "-fa"   || arg == "--flash-attn")      { params.flash_attn      = true; }
          else if (arg == "-nfa"  || arg == "--no-flash-attn")   { params.flash_attn      = false; }
          else if (arg == "-sns"  || arg == "--suppress-nst")    { params.suppress_nst    = true; }
@@ -643,6 +650,7 @@ int main(int argc, char ** argv) {
      struct whisper_context_params cparams = whisper_context_default_params();
  
      cparams.use_gpu    = params.use_gpu;
+    cparams.gpu_device = params.gpu_device;
      cparams.flash_attn = params.flash_attn;
  
      if (!params.dtw.empty()) {
author	Bráulio Oliveira <redacted>
	Wed, 21 Jan 2026 07:40:30 +0000 (04:40 -0300)
committer	GitHub <redacted>
	Wed, 21 Jan 2026 07:40:30 +0000 (08:40 +0100)
examples/cli/cli.cpp		patch \| blob \| history
examples/server/server.cpp		patch \| blob \| history