arg : list RPC devices first when using --list-devices (#11655)

author Radoslav Gerganov <redacted>

Tue, 4 Feb 2025 16:16:20 +0000 (18:16 +0200)

committer GitHub <redacted>

Tue, 4 Feb 2025 16:16:20 +0000 (18:16 +0200)
author Radoslav Gerganov <redacted>
Tue, 4 Feb 2025 16:16:20 +0000 (18:16 +0200)
committer GitHub <redacted>
Tue, 4 Feb 2025 16:16:20 +0000 (18:16 +0200)
diff --git a/common/arg.cpp b/common/arg.cpp

index f5e9b294f304802a2a6eae04a11aad54bdeaf9c6..76b8988819cda0f169d4e5fba9597be5783404c8 100644 (file)
--- a/common/arg.cpp
+++ b/common/arg.cpp
@@ -1465,15 +1465,28 @@ common_params_context common_params_parser_init(common_params & params, llama_ex
          {"--list-devices"},
          "print list of available devices and exit",
          [](common_params &) {
-            printf("Available devices:\n");
+            std::vector<ggml_backend_dev_t> rpc_devices;
+            std::vector<ggml_backend_dev_t> all_devices;
              for (size_t i = 0; i < ggml_backend_dev_count(); ++i) {
                  auto * dev = ggml_backend_dev_get(i);
                  if (ggml_backend_dev_type(dev) == GGML_BACKEND_DEVICE_TYPE_GPU) {
-                    size_t free, total;
-                    ggml_backend_dev_memory(dev, &free, &total);
-                    printf("  %s: %s (%zu MiB, %zu MiB free)\n", ggml_backend_dev_name(dev), ggml_backend_dev_description(dev), total / 1024 / 1024, free / 1024 / 1024);
+                    ggml_backend_reg_t reg = ggml_backend_dev_backend_reg(dev);
+                    if (ggml_backend_reg_name(reg) == std::string("RPC")) {
+                        rpc_devices.push_back(dev);
+                    } else {
+                        all_devices.push_back(dev);
+                    }
                  }
              }
+            // insert RPC devices in front
+            all_devices.insert(all_devices.begin(), rpc_devices.begin(), rpc_devices.end());
+            printf("Available devices:\n");
+            for (size_t i = 0; i < all_devices.size(); ++i) {
+                auto * dev = all_devices[i];
+                size_t free, total;
+                ggml_backend_dev_memory(dev, &free, &total);
+                printf("  %s: %s (%zu MiB, %zu MiB free)\n", ggml_backend_dev_name(dev), ggml_backend_dev_description(dev), total / 1024 / 1024, free / 1024 / 1024);
+            }
              exit(0);
          }
      ));
author	Radoslav Gerganov <redacted>
	Tue, 4 Feb 2025 16:16:20 +0000 (18:16 +0200)
committer	GitHub <redacted>
	Tue, 4 Feb 2025 16:16:20 +0000 (18:16 +0200)