mtmd: add mtmd_log_set (#17268)

author Xuan-Son Nguyen <redacted>

Fri, 14 Nov 2025 14:56:19 +0000 (15:56 +0100)

committer GitHub <redacted>

Fri, 14 Nov 2025 14:56:19 +0000 (15:56 +0100)
author Xuan-Son Nguyen <redacted>
Fri, 14 Nov 2025 14:56:19 +0000 (15:56 +0100)
committer GitHub <redacted>
Fri, 14 Nov 2025 14:56:19 +0000 (15:56 +0100)
diff --git a/common/common.cpp b/common/common.cpp

index a8d709ab1d0508d7b31b959195355665c3141995..4dc95dcba2260a4c181499df8b2f511ceed44531 100644 (file)
--- a/common/common.cpp
+++ b/common/common.cpp
@@ -355,11 +355,7 @@ bool parse_cpu_mask(const std::string & mask, bool (&boolmask)[GGML_MAX_N_THREAD
  }
  
  void common_init() {
-    llama_log_set([](ggml_log_level level, const char * text, void * /*user_data*/) {
-        if (LOG_DEFAULT_LLAMA <= common_log_verbosity_thold) {
-            common_log_add(common_log_main(), level, "%s", text);
-        }
-    }, NULL);
+    llama_log_set(common_log_default_callback, NULL);
  
  #ifdef NDEBUG
      const char * build_type = "";
diff --git a/common/log.cpp b/common/log.cpp

index 4ccdbd17cd7265176cfdf5d16dde32dd77bd551f..a24782b7399580ef9073362201c951f5f82e106a 100644 (file)
--- a/common/log.cpp
+++ b/common/log.cpp
@@ -442,3 +442,9 @@ void common_log_set_prefix(struct common_log * log, bool prefix) {
  void common_log_set_timestamps(struct common_log * log, bool timestamps) {
      log->set_timestamps(timestamps);
  }
+
+void common_log_default_callback(enum ggml_log_level level, const char * text, void * /*user_data*/) {
+    if (LOG_DEFAULT_LLAMA <= common_log_verbosity_thold) {
+        common_log_add(common_log_main(), level, "%s", text);
+    }
+}
diff --git a/common/log.h b/common/log.h

index f329b434c93958c989cb6257b5ea42b41c84768f..7edb239a3395407078104e95c2900dc75b5344b7 100644 (file)
--- a/common/log.h
+++ b/common/log.h
@@ -36,6 +36,8 @@ extern int common_log_verbosity_thold;
  
  void common_log_set_verbosity_thold(int verbosity); // not thread-safe
  
+void common_log_default_callback(enum ggml_log_level level, const char * text, void * user_data);
+
  // the common_log uses an internal worker thread to print/write log messages
  // when the worker thread is paused, incoming log messages are discarded
  struct common_log;
diff --git a/tools/mtmd/clip-impl.h b/tools/mtmd/clip-impl.h

index 722b1a4948d6fba8a4cb19adf6b561d33aa7bf66..cd47865bf4a783a6ad259ad3ccbb2dd769c68c50 100644 (file)
--- a/tools/mtmd/clip-impl.h
+++ b/tools/mtmd/clip-impl.h
@@ -224,7 +224,6 @@ static void clip_log_callback_default(enum ggml_log_level level, const char * te
  }
  
  struct clip_logger_state {
-    ggml_log_level verbosity_thold;
      ggml_log_callback log_callback;
      void * log_callback_user_data;
  };
@@ -258,17 +257,11 @@ static void clip_log_internal(enum ggml_log_level level, const char * format, ..
      va_end(args);
  }
  
-#define LOG_TMPL(level, ...) \
-    do { \
-        if ((level) >= g_logger_state.verbosity_thold) { \
-            clip_log_internal((level), __VA_ARGS__); \
-        } \
-    } while (0)
-#define LOG_INF(...) LOG_TMPL(GGML_LOG_LEVEL_INFO,  __VA_ARGS__)
-#define LOG_WRN(...) LOG_TMPL(GGML_LOG_LEVEL_WARN,  __VA_ARGS__)
-#define LOG_ERR(...) LOG_TMPL(GGML_LOG_LEVEL_ERROR, __VA_ARGS__)
-#define LOG_DBG(...) LOG_TMPL(GGML_LOG_LEVEL_DEBUG, __VA_ARGS__)
-#define LOG_CNT(...) LOG_TMPL(GGML_LOG_LEVEL_CONT,  __VA_ARGS__)
+#define LOG_INF(...) clip_log_internal(GGML_LOG_LEVEL_INFO,  __VA_ARGS__)
+#define LOG_WRN(...) clip_log_internal(GGML_LOG_LEVEL_WARN,  __VA_ARGS__)
+#define LOG_ERR(...) clip_log_internal(GGML_LOG_LEVEL_ERROR, __VA_ARGS__)
+#define LOG_DBG(...) clip_log_internal(GGML_LOG_LEVEL_DEBUG, __VA_ARGS__)
+#define LOG_CNT(...) clip_log_internal(GGML_LOG_LEVEL_CONT,  __VA_ARGS__)
  
  //
  // cpp wrappers
diff --git a/tools/mtmd/clip.cpp b/tools/mtmd/clip.cpp

index 1d78f5954ed6604007da5098bbc86b7d3508dc5a..abdb778f7afb87d4fdeec2adae2b525ad61437f9 100644 (file)
--- a/tools/mtmd/clip.cpp
+++ b/tools/mtmd/clip.cpp
@@ -24,8 +24,7 @@
  #include <array>
  #include <functional>
  
-// TODO: allow to pass callback from user code
-struct clip_logger_state g_logger_state = {GGML_LOG_LEVEL_CONT, clip_log_callback_default, NULL};
+struct clip_logger_state g_logger_state = {clip_log_callback_default, NULL};
  
  enum ffn_op_type {
      FFN_GELU,
@@ -3507,7 +3506,6 @@ struct clip_model_loader {
  };
  
  struct clip_init_result clip_init(const char * fname, struct clip_context_params ctx_params) {
-    g_logger_state.verbosity_thold = ctx_params.verbosity;
      clip_ctx * ctx_vision = nullptr;
      clip_ctx * ctx_audio = nullptr;
  
diff --git a/tools/mtmd/clip.h b/tools/mtmd/clip.h

index 3e4c985f117b905eee87d4a096b818923d26c896..c1442afe6b252992cf75e4ac41d75a3ec0023afd 100644 (file)
--- a/tools/mtmd/clip.h
+++ b/tools/mtmd/clip.h
@@ -31,7 +31,6 @@ enum clip_flash_attn_type {
  
  struct clip_context_params {
      bool use_gpu;
-    enum ggml_log_level verbosity;
      enum clip_flash_attn_type flash_attn_type;
      int image_min_tokens;
      int image_max_tokens;
diff --git a/tools/mtmd/mtmd-cli.cpp b/tools/mtmd/mtmd-cli.cpp

index 3e19e95958a2f413995e86212e7d8923a799b9a8..bd20aad947e92912e1fe7ff4823cf38ed9c8d0c2 100644 (file)
--- a/tools/mtmd/mtmd-cli.cpp
+++ b/tools/mtmd/mtmd-cli.cpp
@@ -135,7 +135,6 @@ struct mtmd_cli_context {
          mparams.use_gpu          = params.mmproj_use_gpu;
          mparams.print_timings    = true;
          mparams.n_threads        = params.cpuparams.n_threads;
-        mparams.verbosity        = params.verbosity > 0 ? GGML_LOG_LEVEL_DEBUG : GGML_LOG_LEVEL_INFO;
          mparams.flash_attn_type  = params.flash_attn_type;
          mparams.image_min_tokens = params.image_min_tokens;
          mparams.image_max_tokens = params.image_max_tokens;
@@ -277,6 +276,7 @@ int main(int argc, char ** argv) {
      }
  
      common_init();
+    mtmd_helper_log_set(common_log_default_callback, nullptr);
  
      if (params.mmproj.path.empty()) {
          show_additional_info(argc, argv);
diff --git a/tools/mtmd/mtmd-helper.cpp b/tools/mtmd/mtmd-helper.cpp

index 89e3355bbab2763bf1371c3116dfb8672fa4eb9f..f0891bba30dd5d07116336de4769d9071595bc1a 100644 (file)
--- a/tools/mtmd/mtmd-helper.cpp
+++ b/tools/mtmd/mtmd-helper.cpp
@@ -32,8 +32,65 @@
  #define STB_IMAGE_IMPLEMENTATION
  #include "stb/stb_image.h"
  
-#define LOG_INF(...) fprintf(stdout, __VA_ARGS__)
-#define LOG_ERR(...) fprintf(stderr, __VA_ARGS__)
+//
+// internal logging functions
+//
+
+struct mtmd_helper_logger {
+    ggml_log_callback default_callback = [](ggml_log_level level, const char * text, void * user_data) {
+        (void) level;
+        (void) user_data;
+        fputs(text, stderr);
+        fflush(stderr);
+    };
+
+    ggml_log_callback log_callback = default_callback;
+    void * log_callback_user_data;
+
+    void log_v(enum ggml_log_level level, const char * format, va_list args) {
+        if (format == NULL) {
+            return;
+        }
+        va_list args_copy;
+        va_copy(args_copy, args);
+        char buffer[128];
+        int len = vsnprintf(buffer, 128, format, args);
+        if (len < 128) {
+            log_callback(level, buffer, log_callback_user_data);
+        } else {
+            char * buffer2 = (char *) calloc(len + 1, sizeof(char));
+            vsnprintf(buffer2, len + 1, format, args_copy);
+            buffer2[len] = 0;
+            log_callback(level, buffer2, log_callback_user_data);
+            free(buffer2);
+        }
+        va_end(args_copy);
+    }
+
+    void log(enum ggml_log_level level, const char * format, ...) {
+        va_list args;
+        va_start(args, format);
+        log_v(level, format, args);
+        va_end(args);
+    }
+} g_logger;
+
+#define LOG_INF(...) g_logger.log(GGML_LOG_LEVEL_INFO,  __VA_ARGS__)
+#define LOG_WRN(...) g_logger.log(GGML_LOG_LEVEL_WARN,  __VA_ARGS__)
+#define LOG_ERR(...) g_logger.log(GGML_LOG_LEVEL_ERROR, __VA_ARGS__)
+
+void mtmd_helper_log_set(ggml_log_callback log_callback, void * user_data) {
+    if (log_callback == nullptr) {
+        log_callback = g_logger.default_callback;
+    }
+    g_logger.log_callback = log_callback;
+    g_logger.log_callback_user_data = user_data;
+    mtmd_log_set(log_callback, user_data);
+}
+
+//
+// helper functions
+//
  
  size_t mtmd_helper_get_n_tokens(const mtmd_input_chunks * chunks) {
      size_t n_tokens = 0;
@@ -325,7 +382,7 @@ int32_t mtmd_helper_eval_chunks(mtmd_context * ctx,
                                  llama_pos * new_n_past) {
      size_t n_chunks = mtmd_input_chunks_size(chunks);
      if (n_chunks == 0) {
-        LOG_ERR("no chunks to eval\n");
+        LOG_WRN("no chunks to eval\n");
          return 0;
      }
  
diff --git a/tools/mtmd/mtmd-helper.h b/tools/mtmd/mtmd-helper.h

index 5c0edc6937eee9a4aa8cd386f680d5a9a5263132..5036b92442a28cf5ed45f2539d926a5b3aa2d0b3 100644 (file)
--- a/tools/mtmd/mtmd-helper.h
+++ b/tools/mtmd/mtmd-helper.h
@@ -20,6 +20,11 @@ extern "C" {
  // BREAKING CHANGES are expected.
  //
  
+// Set callback for all future logging events.
+// If this is not called, or NULL is supplied, everything is output on stderr.
+// Note: this also call mtmd_log_set() internally
+MTMD_API void mtmd_helper_log_set(ggml_log_callback log_callback, void * user_data);
+
  // helper function to construct a mtmd_bitmap from a file
  // it calls mtmd_helper_bitmap_init_from_buf() internally
  // returns nullptr on failure
diff --git a/tools/mtmd/mtmd.cpp b/tools/mtmd/mtmd.cpp

index e599137769963337b350117a218c532872ba107d..dfad9cd795766a62a52bf44eed92bcd540f9dabf 100644 (file)
--- a/tools/mtmd/mtmd.cpp
+++ b/tools/mtmd/mtmd.cpp
@@ -105,7 +105,6 @@ mtmd_context_params mtmd_context_params_default() {
          /* use_gpu           */ true,
          /* print_timings     */ true,
          /* n_threads         */ 4,
-        /* verbosity         */ GGML_LOG_LEVEL_INFO,
          /* image_marker      */ MTMD_DEFAULT_IMAGE_MARKER,
          /* media_marker      */ mtmd_default_marker(),
          /* flash_attn_type   */ LLAMA_FLASH_ATTN_TYPE_AUTO,
@@ -175,7 +174,6 @@ struct mtmd_context {
  
          clip_context_params ctx_clip_params {
              /* use_gpu           */ ctx_params.use_gpu,
-            /* verbosity         */ ctx_params.verbosity,
              /* flash_attn_type   */ CLIP_FLASH_ATTN_TYPE_AUTO,
              /* image_min_tokens  */ ctx_params.image_min_tokens,
              /* image_max_tokens  */ ctx_params.image_max_tokens,
@@ -1096,3 +1094,8 @@ mtmd_input_chunks * mtmd_test_create_input_chunks() {
  
      return chunks;
  }
+
+void mtmd_log_set(ggml_log_callback log_callback, void * user_data) {
+    g_logger_state.log_callback = log_callback ? log_callback : clip_log_callback_default;
+    g_logger_state.log_callback_user_data = user_data;
+}
diff --git a/tools/mtmd/mtmd.h b/tools/mtmd/mtmd.h

index 775fba6215c7ca72aaad29ead9e9948aaf3f10d8..015119be89759f642ffffa1eb5a3b1809c6b0da8 100644 (file)
--- a/tools/mtmd/mtmd.h
+++ b/tools/mtmd/mtmd.h
@@ -79,7 +79,6 @@ struct mtmd_context_params {
      bool use_gpu;
      bool print_timings;
      int n_threads;
-    enum ggml_log_level verbosity;
      const char * image_marker; // deprecated, use media_marker instead
      const char * media_marker;
      enum llama_flash_attn_type flash_attn_type;
@@ -215,6 +214,10 @@ MTMD_API int32_t mtmd_encode_chunk(mtmd_context * ctx,
  // llama_model_n_embd(model) * mtmd_input_chunk_get_n_tokens(chunk) * sizeof(float)
  MTMD_API float * mtmd_get_output_embd(mtmd_context * ctx);
  
+// Set callback for all future logging events.
+// If this is not called, or NULL is supplied, everything is output on stderr.
+MTMD_API void mtmd_log_set(ggml_log_callback log_callback, void * user_data);
+
  /////////////////////////////////////////
  
  // test function, to be used in test-mtmd-c-api.c
diff --git a/tools/server/server.cpp b/tools/server/server.cpp

index 535d2c450e21eb64704de91b3e1bdf9452e6c087..2681eab646cc723f2220c68f51c7d18fc1e01eed 100644 (file)
--- a/tools/server/server.cpp
+++ b/tools/server/server.cpp
@@ -2454,11 +2454,12 @@ struct server_context {
  
          std::string & mmproj_path = params_base.mmproj.path;
          if (!mmproj_path.empty()) {
+            mtmd_helper_log_set(common_log_default_callback, nullptr);
+
              mtmd_context_params mparams = mtmd_context_params_default();
              mparams.use_gpu          = params_base.mmproj_use_gpu;
              mparams.print_timings    = false;
              mparams.n_threads        = params_base.cpuparams.n_threads;
-            mparams.verbosity        = params_base.verbosity > 0 ? GGML_LOG_LEVEL_DEBUG : GGML_LOG_LEVEL_INFO;
              mparams.flash_attn_type  = params_base.flash_attn_type;
              mparams.image_min_tokens = params_base.image_min_tokens;
              mparams.image_max_tokens = params_base.image_max_tokens;
author	Xuan-Son Nguyen <redacted>
	Fri, 14 Nov 2025 14:56:19 +0000 (15:56 +0100)
committer	GitHub <redacted>
	Fri, 14 Nov 2025 14:56:19 +0000 (15:56 +0100)
common/common.cpp		patch \| blob \| history
common/log.cpp		patch \| blob \| history
common/log.h		patch \| blob \| history
tools/mtmd/clip-impl.h		patch \| blob \| history
tools/mtmd/clip.cpp		patch \| blob \| history
tools/mtmd/clip.h		patch \| blob \| history
tools/mtmd/mtmd-cli.cpp		patch \| blob \| history
tools/mtmd/mtmd-helper.cpp		patch \| blob \| history
tools/mtmd/mtmd-helper.h		patch \| blob \| history
tools/mtmd/mtmd.cpp		patch \| blob \| history
tools/mtmd/mtmd.h		patch \| blob \| history
tools/server/server.cpp		patch \| blob \| history