arm64 support for windows (#3007)

author Eric Sommerlade <redacted>

Wed, 13 Sep 2023 01:54:20 +0000 (02:54 +0100)

committer GitHub <redacted>

Wed, 13 Sep 2023 01:54:20 +0000 (21:54 -0400)
author Eric Sommerlade <redacted>
Wed, 13 Sep 2023 01:54:20 +0000 (02:54 +0100)
committer GitHub <redacted>
Wed, 13 Sep 2023 01:54:20 +0000 (21:54 -0400)
diff --git a/CMakeLists.txt b/CMakeLists.txt

index 537eadc27b9132d72dbcb79f97cee80aec9d9ecc..4f7b05fc2bfc54ed5a4cc945ef52dbbdfc27478b 100644 (file)
--- a/CMakeLists.txt
+++ b/CMakeLists.txt
@@ -461,6 +461,13 @@ endif()
  # TODO: probably these flags need to be tweaked on some architectures
  #       feel free to update the Makefile for your architecture and send a pull request or issue
  message(STATUS "CMAKE_SYSTEM_PROCESSOR: ${CMAKE_SYSTEM_PROCESSOR}")
+if (MSVC)
+  string(TOLOWER "${CMAKE_GENERATOR_PLATFORM}" CMAKE_GENERATOR_PLATFORM_LWR)
+  message(STATUS "CMAKE_GENERATOR_PLATFORM: ${CMAKE_GENERATOR_PLATFORM}")
+else ()
+  set(CMAKE_GENERATOR_PLATFORM_LWR "")
+endif ()
+
  if (NOT MSVC)
      if (LLAMA_STATIC)
          add_link_options(-static)
@@ -476,10 +483,14 @@ if (NOT MSVC)
      endif()
  endif()
  
-if ((${CMAKE_SYSTEM_PROCESSOR} MATCHES "arm") OR (${CMAKE_SYSTEM_PROCESSOR} MATCHES "aarch64"))
+if ((${CMAKE_SYSTEM_PROCESSOR} MATCHES "arm") OR (${CMAKE_SYSTEM_PROCESSOR} MATCHES "aarch64") OR ("${CMAKE_GENERATOR_PLATFORM_LWR}" MATCHES "arm64"))
      message(STATUS "ARM detected")
      if (MSVC)
-        # TODO: arm msvc?
+        add_compile_definitions(__ARM_NEON)
+        add_compile_definitions(__ARM_FEATURE_FMA)
+        add_compile_definitions(__ARM_FEATURE_DOTPROD)
+        # add_compile_definitions(__ARM_FEATURE_FP16_VECTOR_ARITHMETIC) # MSVC doesn't support vdupq_n_f16, vld1q_f16, vst1q_f16
+        add_compile_definitions(__aarch64__) # MSVC defines _M_ARM64 instead
      else()
          if (${CMAKE_SYSTEM_PROCESSOR} MATCHES "armv6")
              # Raspberry Pi 1, Zero
@@ -494,7 +505,7 @@ if ((${CMAKE_SYSTEM_PROCESSOR} MATCHES "arm") OR (${CMAKE_SYSTEM_PROCESSOR} MATC
              add_compile_options(-mfp16-format=ieee -mno-unaligned-access)
          endif()
      endif()
-elseif (${CMAKE_SYSTEM_PROCESSOR} MATCHES "^(x86_64|i686|AMD64)$")
+elseif (${CMAKE_SYSTEM_PROCESSOR} MATCHES "^(x86_64|i686|AMD64)$" OR "${CMAKE_GENERATOR_PLATFORM_LWR}" MATCHES "^(x86_64|i686|amd64|x64)$" )
      message(STATUS "x86 detected")
      if (MSVC)
          if (LLAMA_AVX512)
diff --git a/ggml.c b/ggml.c

index 3f72379c3553e27bc3f685f8756f163a4aa5f860..a9cffb439a2e6131ad6b46cb7f4cdaceba86bfe1 100644 (file)
--- a/ggml.c
+++ b/ggml.c
@@ -283,7 +283,7 @@ typedef double ggml_float;
  // 16-bit float
  // on Arm, we use __fp16
  // on x86, we use uint16_t
-#ifdef __ARM_NEON
+#if defined(__ARM_NEON) && !defined(_MSC_VER)
  
  // if YCM cannot find <arm_neon.h>, make a symbolic link to it, for example:
  //
diff --git a/ggml.h b/ggml.h

index c936823d661404434484bebf1c88ed0d2c822e48..6d4cf465d62b56df3561504d42f796ae24e8762d 100644 (file)
--- a/ggml.h
+++ b/ggml.h
@@ -270,7 +270,7 @@ extern "C" {
  
  #if defined(__ARM_NEON) && defined(__CUDACC__)
      typedef half ggml_fp16_t;
-#elif defined(__ARM_NEON)
+#elif defined(__ARM_NEON) && !defined(_MSC_VER)
      typedef __fp16 ggml_fp16_t;
  #else
      typedef uint16_t ggml_fp16_t;
diff --git a/k_quants.c b/k_quants.c

index eb702ce86acd98bf8bc4e626853bdd16437d799c..62085882df71c4b2e78c687c839e877a850669b5 100644 (file)
--- a/k_quants.c
+++ b/k_quants.c
@@ -2609,7 +2609,10 @@ void ggml_vec_dot_q4_K_q8_K(const int n, float * restrict s, const void * restri
  
          memcpy(utmp, x[i].scales, 12);
  
-        const uint32x2_t mins8 = {utmp[1] & kmask1, ((utmp[2] >> 4) & kmask2) | (((utmp[1] >> 6) & kmask3) << 4)};
+        uint32x2_t mins8 = { 0 };
+        mins8 = vset_lane_u32(utmp[1] & kmask1, mins8, 0);
+        mins8 = vset_lane_u32(((utmp[2] >> 4) & kmask2) | (((utmp[1] >> 6) & kmask3) << 4), mins8, 1);
+
          utmp[1] = (utmp[2] & kmask2) | (((utmp[0] >> 6) & kmask3) << 4);
          utmp[0] &= kmask1;
author	Eric Sommerlade <redacted>
	Wed, 13 Sep 2023 01:54:20 +0000 (02:54 +0100)
committer	GitHub <redacted>
	Wed, 13 Sep 2023 01:54:20 +0000 (21:54 -0400)
CMakeLists.txt		patch \| blob \| history
ggml.c		patch \| blob \| history
ggml.h		patch \| blob \| history
k_quants.c		patch \| blob \| history