[SYCL] Windows default build instructions without -DLLAMA_SYCL_F16 flag activated...

author Anas Ahouzi <redacted>

Tue, 23 Apr 2024 00:53:18 +0000 (02:53 +0200)

committer GitHub <redacted>

Tue, 23 Apr 2024 00:53:18 +0000 (08:53 +0800)
author Anas Ahouzi <redacted>
Tue, 23 Apr 2024 00:53:18 +0000 (02:53 +0200)
committer GitHub <redacted>
Tue, 23 Apr 2024 00:53:18 +0000 (08:53 +0800)
diff --git a/README-sycl.md b/README-sycl.md

index 2aa46507094dcea542cfead4514453b0dbbd1f8c..dc98c7b3ebd9ce2e99df5c4ef1754c7f483802ba 100644 (file)
--- a/README-sycl.md
+++ b/README-sycl.md
@@ -229,12 +229,12 @@ source /opt/intel/oneapi/setvars.sh
  # Build LLAMA with MKL BLAS acceleration for intel GPU
  mkdir -p build && cd build
  
-# Option 1: Use FP16 for better performance in long-prompt inference
-#cmake .. -DLLAMA_SYCL=ON -DCMAKE_C_COMPILER=icx -DCMAKE_CXX_COMPILER=icpx -DLLAMA_SYCL_F16=ON
-
-# Option 2: Use FP32 by default
+# Option 1: Use FP32 (recommended for better performance in most cases)
  cmake .. -DLLAMA_SYCL=ON -DCMAKE_C_COMPILER=icx -DCMAKE_CXX_COMPILER=icpx
  
+# Option 2: Use FP16
+cmake .. -DLLAMA_SYCL=ON -DCMAKE_C_COMPILER=icx -DCMAKE_CXX_COMPILER=icpx -DLLAMA_SYCL_F16=ON
+
  #build all binary
  cmake --build . --config Release -j -v
  ```
@@ -250,12 +250,12 @@ export CPLUS_INCLUDE_DIR=/path/to/oneMKL/include:$CPLUS_INCLUDE_DIR
  # Build LLAMA with Nvidia BLAS acceleration through SYCL
  mkdir -p build && cd build
  
-# Option 1: Use FP16 for better performance in long-prompt  inference
-cmake .. -DLLAMA_SYCL=ON -DLLAMA_SYCL_TARGET=NVIDIA -DCMAKE_C_COMPILER=icx -DCMAKE_CXX_COMPILER=icpx -DLLAMA_SYCL_F16=ON
-
-# Option 2: Use FP32 by default
+# Option 1: Use FP32 (recommended for better performance in most cases)
  cmake .. -DLLAMA_SYCL=ON -DLLAMA_SYCL_TARGET=NVIDIA -DCMAKE_C_COMPILER=icx -DCMAKE_CXX_COMPILER=icpx
  
+# Option 2: Use FP16
+cmake .. -DLLAMA_SYCL=ON -DLLAMA_SYCL_TARGET=NVIDIA -DCMAKE_C_COMPILER=icx -DCMAKE_CXX_COMPILER=icpx -DLLAMA_SYCL_F16=ON
+
  #build all binary
  cmake --build . --config Release -j -v
  
@@ -416,6 +416,10 @@ mkdir -p build
  cd build
  @call "C:\Program Files (x86)\Intel\oneAPI\setvars.bat" intel64 --force
  
+# Option 1: Use FP32 (recommended for better performance in most cases)
+cmake -G "MinGW Makefiles" ..  -DLLAMA_SYCL=ON -DCMAKE_C_COMPILER=icx -DCMAKE_CXX_COMPILER=icx  -DCMAKE_BUILD_TYPE=Release
+
+# Option 2: Or FP16
  cmake -G "MinGW Makefiles" ..  -DLLAMA_SYCL=ON -DCMAKE_C_COMPILER=icx -DCMAKE_CXX_COMPILER=icx  -DCMAKE_BUILD_TYPE=Release -DLLAMA_SYCL_F16=ON
  
  make -j
author	Anas Ahouzi <redacted>
	Tue, 23 Apr 2024 00:53:18 +0000 (02:53 +0200)
committer	GitHub <redacted>
	Tue, 23 Apr 2024 00:53:18 +0000 (08:53 +0800)