export-lora : fix tok_embd tensor (#11330)

author Xuan Son Nguyen <redacted>

Tue, 21 Jan 2025 13:07:12 +0000 (14:07 +0100)

committer GitHub <redacted>

Tue, 21 Jan 2025 13:07:12 +0000 (14:07 +0100)
author Xuan Son Nguyen <redacted>
Tue, 21 Jan 2025 13:07:12 +0000 (14:07 +0100)
committer GitHub <redacted>
Tue, 21 Jan 2025 13:07:12 +0000 (14:07 +0100)
diff --git a/examples/export-lora/export-lora.cpp b/examples/export-lora/export-lora.cpp

index 99063b5d5344953d6893bc595ce298423305355b..91238e4beb26c8f4fbc05076e336efb608ad75f6 100644 (file)
--- a/examples/export-lora/export-lora.cpp
+++ b/examples/export-lora/export-lora.cpp
@@ -345,8 +345,18 @@ struct lora_merge_ctx {
              gf = ggml_new_graph(ctx0);
              struct ggml_tensor * cur = inp_base;
              for (size_t i = 0; i < adapters.size(); ++i) {
-                struct ggml_tensor * a_T = ggml_cont(ctx0, ggml_transpose(ctx0, ggml_cast(ctx0, inp_a[i], GGML_TYPE_F32)));
-                struct ggml_tensor * delta = ggml_mul_mat(ctx0, a_T, ggml_cast(ctx0, inp_b[i], GGML_TYPE_F32));
+                struct ggml_tensor * delta;
+                bool is_tok_embd = string_starts_with(name_base, "token_embd");
+                if (is_tok_embd) {
+                    printf("%s :     detected token embeddings tensor\n", __func__);
+                    delta = ggml_mul_mat(ctx0,
+                        ggml_cast(ctx0, inp_b[i], GGML_TYPE_F32),
+                        ggml_cast(ctx0, inp_a[i], GGML_TYPE_F32));
+                } else {
+                    delta = ggml_mul_mat(ctx0,
+                        ggml_cont(ctx0, ggml_transpose(ctx0, ggml_cast(ctx0, inp_a[i], GGML_TYPE_F32))),
+                        ggml_cast(ctx0, inp_b[i], GGML_TYPE_F32));
+                }
                  // scale
                  const float alpha = adapters[i]->alpha;
                  const float rank  = (float) inp_b[i]->ne[0];
author	Xuan Son Nguyen <redacted>
	Tue, 21 Jan 2025 13:07:12 +0000 (14:07 +0100)
committer	GitHub <redacted>
	Tue, 21 Jan 2025 13:07:12 +0000 (14:07 +0100)