mtgpu: Add MUSA_DOCKER_ARCH in Dockerfiles && update cmake and make (#10516)

author R0CKSTAR <redacted>

Tue, 26 Nov 2024 16:00:41 +0000 (00:00 +0800)

committer GitHub <redacted>

Tue, 26 Nov 2024 16:00:41 +0000 (17:00 +0100)
author R0CKSTAR <redacted>
Tue, 26 Nov 2024 16:00:41 +0000 (00:00 +0800)
committer GitHub <redacted>
Tue, 26 Nov 2024 16:00:41 +0000 (17:00 +0100)
diff --git a/.devops/full-musa.Dockerfile b/.devops/full-musa.Dockerfile

index 575e81b486d13cbb8bf0aee0c65c917f2f496053..3193fea1e9ae58d81f9c32ba7d057d1e30d4d68d 100644 (file)
--- a/.devops/full-musa.Dockerfile
+++ b/.devops/full-musa.Dockerfile
@@ -6,6 +6,9 @@ ARG BASE_MUSA_DEV_CONTAINER=mthreads/musa:${MUSA_VERSION}-devel-ubuntu${UBUNTU_V
  
  FROM ${BASE_MUSA_DEV_CONTAINER} AS build
  
+# MUSA architecture to build for (defaults to all supported archs)
+ARG MUSA_DOCKER_ARCH=default
+
  RUN apt-get update && \
      apt-get install -y build-essential cmake python3 python3-pip git libcurl4-openssl-dev libgomp1
  
@@ -19,7 +22,11 @@ WORKDIR /app
  
  COPY . .
  
-RUN cmake -B build -DGGML_NATIVE=OFF -DGGML_MUSA=ON -DLLAMA_CURL=ON ${CMAKE_ARGS} -DCMAKE_EXE_LINKER_FLAGS=-Wl,--allow-shlib-undefined . && \
+# Use the default MUSA archs if not specified
+RUN if [ "${MUSA_DOCKER_ARCH}" != "default" ]; then \
+        export CMAKE_ARGS="-DMUSA_ARCHITECTURES=${MUSA_DOCKER_ARCH}"; \
+    fi && \
+    cmake -B build -DGGML_NATIVE=OFF -DGGML_MUSA=ON -DLLAMA_CURL=ON ${CMAKE_ARGS} -DCMAKE_EXE_LINKER_FLAGS=-Wl,--allow-shlib-undefined . && \
      cmake --build build --config Release -j$(nproc) && \
      cp build/bin/* .
  
diff --git a/.devops/llama-cli-musa.Dockerfile b/.devops/llama-cli-musa.Dockerfile

index 3372749bee70ea5a787af8cf572b8c6e9c24ff99..e7c75af20e2650258cedc4dbe3d96b45d424f067 100644 (file)
--- a/.devops/llama-cli-musa.Dockerfile
+++ b/.devops/llama-cli-musa.Dockerfile
@@ -8,6 +8,9 @@ ARG BASE_MUSA_RUN_CONTAINER=mthreads/musa:${MUSA_VERSION}-runtime-ubuntu${UBUNTU
  
  FROM ${BASE_MUSA_DEV_CONTAINER} AS build
  
+# MUSA architecture to build for (defaults to all supported archs)
+ARG MUSA_DOCKER_ARCH=default
+
  RUN apt-get update && \
      apt-get install -y build-essential git cmake
  
@@ -15,7 +18,11 @@ WORKDIR /app
  
  COPY . .
  
-RUN cmake -B build -DGGML_NATIVE=OFF -DGGML_MUSA=ON ${CMAKE_ARGS} -DCMAKE_EXE_LINKER_FLAGS=-Wl,--allow-shlib-undefined . && \
+# Use the default MUSA archs if not specified
+RUN if [ "${MUSA_DOCKER_ARCH}" != "default" ]; then \
+        export CMAKE_ARGS="-DMUSA_ARCHITECTURES=${MUSA_DOCKER_ARCH}"; \
+    fi && \
+    cmake -B build -DGGML_NATIVE=OFF -DGGML_MUSA=ON ${CMAKE_ARGS} -DCMAKE_EXE_LINKER_FLAGS=-Wl,--allow-shlib-undefined . && \
      cmake --build build --config Release --target llama-cli -j$(nproc) && \
      mkdir -p /app/lib && \
      find build -name "*.so" -exec cp {} /app/lib \;
diff --git a/.devops/llama-server-musa.Dockerfile b/.devops/llama-server-musa.Dockerfile

index eb67201c187755479a7e0d430644f86aee665c66..cebe51d42fa95ac51d7ffa8d4f2495c335a6e8f3 100644 (file)
--- a/.devops/llama-server-musa.Dockerfile
+++ b/.devops/llama-server-musa.Dockerfile
@@ -8,6 +8,9 @@ ARG BASE_MUSA_RUN_CONTAINER=mthreads/musa:${MUSA_VERSION}-runtime-ubuntu${UBUNTU
  
  FROM ${BASE_MUSA_DEV_CONTAINER} AS build
  
+# MUSA architecture to build for (defaults to all supported archs)
+ARG MUSA_DOCKER_ARCH=default
+
  RUN apt-get update && \
      apt-get install -y build-essential git cmake libcurl4-openssl-dev
  
@@ -15,7 +18,11 @@ WORKDIR /app
  
  COPY . .
  
-RUN cmake -B build -DGGML_NATIVE=OFF -DGGML_MUSA=ON -DLLAMA_CURL=ON ${CMAKE_ARGS} -DCMAKE_EXE_LINKER_FLAGS=-Wl,--allow-shlib-undefined . && \
+# Use the default MUSA archs if not specified
+RUN if [ "${MUSA_DOCKER_ARCH}" != "default" ]; then \
+        export CMAKE_ARGS="-DMUSA_ARCHITECTURES=${MUSA_DOCKER_ARCH}"; \
+    fi && \
+    cmake -B build -DGGML_NATIVE=OFF -DGGML_MUSA=ON -DLLAMA_CURL=ON ${CMAKE_ARGS} -DCMAKE_EXE_LINKER_FLAGS=-Wl,--allow-shlib-undefined . && \
      cmake --build build --config Release --target llama-server -j$(nproc) && \
      mkdir -p /app/lib && \
      find build -name "*.so" -exec cp {} /app/lib \;
diff --git a/Makefile b/Makefile

index cfc74c1dc71b27ca7e0bd85059a0f7a36f347290..9a079a2377205dad5d066e3847ee23c2eb535084 100644 (file)
--- a/Makefile
+++ b/Makefile
@@ -815,7 +815,7 @@ ifdef GGML_MUSA
         else
                 MUSA_PATH ?= /opt/musa
         endif
-       MTGPU_TARGETS ?= mp_21 mp_22
+       MUSA_ARCHITECTURES ?= 21;22
  
         MK_CPPFLAGS += -DGGML_USE_MUSA -DGGML_USE_CUDA
         MK_LDFLAGS += -L$(MUSA_PATH)/lib -Wl,-rpath=$(MUSA_PATH)/lib
@@ -834,7 +834,8 @@ ifdef GGML_MUSA
         CXX := $(MUSA_PATH)/bin/clang++
         MCC := $(CCACHE) $(MUSA_PATH)/bin/mcc
  
-       MUSAFLAGS += $(addprefix --cuda-gpu-arch=, $(MTGPU_TARGETS))
+       MUSAFLAGS  = -x musa -mtgpu
+       MUSAFLAGS += $(foreach arch,$(subst ;, ,$(MUSA_ARCHITECTURES)),--cuda-gpu-arch=mp_$(arch))
  
  ifdef GGML_CUDA_FORCE_MMQ
         MUSAFLAGS += -DGGML_CUDA_FORCE_MMQ
@@ -878,14 +879,14 @@ ggml/src/ggml-cuda/ggml-cuda.o: \
         ggml/src/ggml-backend-impl.h \
         ggml/src/ggml-common.h \
         $(wildcard ggml/src/ggml-cuda/*.cuh)
-       $(MCC) $(CXXFLAGS) $(MUSAFLAGS) -x musa -mtgpu -c -o $@ $<
+       $(MCC) $(CXXFLAGS) $(MUSAFLAGS) -c -o $@ $<
  
  ggml/src/ggml-cuda/%.o: \
         ggml/src/ggml-cuda/%.cu \
         ggml/include/ggml.h \
         ggml/src/ggml-common.h \
         ggml/src/ggml-cuda/common.cuh
-       $(MCC) $(CXXFLAGS) $(MUSAFLAGS) -x musa -mtgpu -c -o $@ $<
+       $(MCC) $(CXXFLAGS) $(MUSAFLAGS) -c -o $@ $<
  endif # GGML_MUSA
  
  ifdef GGML_METAL
diff --git a/ggml/src/ggml-musa/CMakeLists.txt b/ggml/src/ggml-musa/CMakeLists.txt

index e1a69186e669fdf4c0174ca47dbd603733ee2c52..415b2b2e09c1b3514a30bd2d1cd90d372bf3a2c8 100644 (file)
--- a/ggml/src/ggml-musa/CMakeLists.txt
+++ b/ggml/src/ggml-musa/CMakeLists.txt
@@ -20,6 +20,11 @@ find_package(MUSAToolkit)
  if (MUSAToolkit_FOUND)
      message(STATUS "MUSA Toolkit found")
  
+    if (NOT DEFINED MUSA_ARCHITECTURES)
+        set(MUSA_ARCHITECTURES "21;22")
+    endif()
+    message(STATUS "Using MUSA architectures: ${MUSA_ARCHITECTURES}")
+
      file(GLOB   GGML_HEADERS_MUSA "../ggml-cuda/*.cuh")
      list(APPEND GGML_HEADERS_MUSA "../../include/ggml-cuda.h")
  
@@ -44,7 +49,11 @@ if (MUSAToolkit_FOUND)
  
      set_source_files_properties(${GGML_SOURCES_MUSA} PROPERTIES LANGUAGE CXX)
      foreach(SOURCE ${GGML_SOURCES_MUSA})
-        set_property(SOURCE ${SOURCE} PROPERTY COMPILE_FLAGS "-x musa -mtgpu --cuda-gpu-arch=mp_21 --cuda-gpu-arch=mp_22")
+        set(COMPILE_FLAGS "-x musa -mtgpu")
+        foreach(ARCH ${MUSA_ARCHITECTURES})
+            set(COMPILE_FLAGS "${COMPILE_FLAGS} --cuda-gpu-arch=mp_${ARCH}")
+        endforeach()
+        set_property(SOURCE ${SOURCE} PROPERTY COMPILE_FLAGS ${COMPILE_FLAGS})
      endforeach()
  
      ggml_add_backend_library(ggml-musa
author	R0CKSTAR <redacted>
	Tue, 26 Nov 2024 16:00:41 +0000 (00:00 +0800)
committer	GitHub <redacted>
	Tue, 26 Nov 2024 16:00:41 +0000 (17:00 +0100)
.devops/full-musa.Dockerfile		patch \| blob \| history
.devops/llama-cli-musa.Dockerfile		patch \| blob \| history
.devops/llama-server-musa.Dockerfile		patch \| blob \| history
Makefile		patch \| blob \| history
ggml/src/ggml-musa/CMakeLists.txt		patch \| blob \| history