llama : minor style

author Georgi Gerganov <redacted>

Mon, 2 Sep 2024 08:52:04 +0000 (11:52 +0300)

committer Georgi Gerganov <redacted>

Mon, 2 Sep 2024 08:52:37 +0000 (11:52 +0300)
author Georgi Gerganov <redacted>
Mon, 2 Sep 2024 08:52:04 +0000 (11:52 +0300)
committer Georgi Gerganov <redacted>
Mon, 2 Sep 2024 08:52:37 +0000 (11:52 +0300)
diff --git a/src/llama.cpp b/src/llama.cpp

index 2113c72f3c90b95abb8284e51deeb3d7b255492f..4e203471ce724586c4bc79691ae2a86af8cdcb60 100644 (file)
--- a/src/llama.cpp
+++ b/src/llama.cpp
@@ -8711,8 +8711,7 @@ static void llm_build_kv_store(
  
      GGML_ASSERT(kv.size == n_ctx);
  
-    struct ggml_tensor * k_cache_view = ggml_view_1d(ctx, kv.k_l[il], n_tokens*n_embd_k_gqa,
-            (ggml_row_size(kv.k_l[il]->type, n_embd_k_gqa))*kv_head);
+    struct ggml_tensor * k_cache_view = ggml_view_1d(ctx, kv.k_l[il], n_tokens*n_embd_k_gqa, ggml_row_size(kv.k_l[il]->type, n_embd_k_gqa)*kv_head);
      cb(k_cache_view, "k_cache_view", il);
  
      // note: storing RoPE-ed version of K in the KV cache
@@ -8723,8 +8722,7 @@ static void llm_build_kv_store(
      struct ggml_tensor * v_cache_view = nullptr;
  
      if (cparams.flash_attn) {
-        v_cache_view = ggml_view_1d(ctx, kv.v_l[il], n_tokens*n_embd_v_gqa,
-                (kv_head)*ggml_row_size(kv.v_l[il]->type, n_embd_v_gqa));
+        v_cache_view = ggml_view_1d(ctx, kv.v_l[il], n_tokens*n_embd_v_gqa, ggml_row_size(kv.v_l[il]->type, n_embd_v_gqa)*kv_head);
      } else {
          // note: the V cache is transposed when not using flash attention
          v_cache_view = ggml_view_2d(ctx, kv.v_l[il], n_tokens, n_embd_v_gqa,
@@ -9211,8 +9209,7 @@ static struct ggml_tensor * llm_build_kv(
  
      struct ggml_tensor * cur;
  
-    cur  = llm_build_kqv(ctx, lctx, kv, graph, wo, wo_b,
-            q_cur, kq_mask, n_tokens, n_kv, kq_scale, cb, il);
+    cur  = llm_build_kqv(ctx, lctx, kv, graph, wo, wo_b, q_cur, kq_mask, n_tokens, n_kv, kq_scale, cb, il);
      cb(cur, "kqv_out", il);
  
      return cur;
author	Georgi Gerganov <redacted>
	Mon, 2 Sep 2024 08:52:04 +0000 (11:52 +0300)
committer	Georgi Gerganov <redacted>
	Mon, 2 Sep 2024 08:52:37 +0000 (11:52 +0300)