gguf : remove special-case code for GGUFv1 (#3901)

author Georgi Gerganov <redacted>

Thu, 2 Nov 2023 09:20:21 +0000 (11:20 +0200)

committer GitHub <redacted>

Thu, 2 Nov 2023 09:20:21 +0000 (11:20 +0200)
author Georgi Gerganov <redacted>
Thu, 2 Nov 2023 09:20:21 +0000 (11:20 +0200)
committer GitHub <redacted>
Thu, 2 Nov 2023 09:20:21 +0000 (11:20 +0200)
diff --git a/ggml.c b/ggml.c

index 2c7fe476b176d587e212ad71b5670f4e1b88440e..d5a49d8e4f3148ede4c7f26ae1bee253e580cef5 100644 (file)
--- a/ggml.c
+++ b/ggml.c
@@ -18811,8 +18811,7 @@ static bool gguf_fread_el(FILE * file, void * dst, size_t size, size_t * offset)
      return n == size;
  }
  
-// NOTE: temporary handling of GGUFv1 >> remove after Oct 2023
-static bool gguf_fread_str_cur(FILE * file, struct gguf_str * p, size_t * offset) {
+static bool gguf_fread_str(FILE * file, struct gguf_str * p, size_t * offset) {
      p->n    = 0;
      p->data = NULL;
  
@@ -18824,19 +18823,6 @@ static bool gguf_fread_str_cur(FILE * file, struct gguf_str * p, size_t * offset
      return ok;
  }
  
-static bool gguf_fread_str_v1(FILE * file, struct gguf_str * p, size_t * offset) {
-    p->n    = 0;
-    p->data = NULL;
-
-    bool ok = true;
-
-    uint32_t n = 0;
-    ok = ok && gguf_fread_el(file, &n,       sizeof(n), offset); p->data = calloc(n + 1, 1); p->n = n;
-    ok = ok && gguf_fread_el(file,  p->data, p->n,      offset);
-
-    return ok;
-}
-
  struct gguf_context * gguf_init_empty(void) {
      struct gguf_context * ctx = GGML_ALIGNED_MALLOC(sizeof(struct gguf_context));
  
@@ -18895,21 +18881,8 @@ struct gguf_context * gguf_init_from_file(const char * fname, struct gguf_init_p
          ctx->data  = NULL;
  
          ok = ok && gguf_fread_el(file, &ctx->header.version,   sizeof(ctx->header.version),   &offset);
-
-        if (ctx->header.version == 1) {
-            // NOTE: temporary handling of GGUFv1 >> remove after Oct 2023
-            uint32_t n_tensors = 0;
-            uint32_t n_kv      = 0;
-
-            ok = ok && gguf_fread_el(file, &n_tensors, sizeof(n_tensors), &offset);
-            ok = ok && gguf_fread_el(file, &n_kv,      sizeof(n_kv),      &offset);
-
-            ctx->header.n_tensors = n_tensors;
-            ctx->header.n_kv      = n_kv;
-        } else {
-            ok = ok && gguf_fread_el(file, &ctx->header.n_tensors, sizeof(ctx->header.n_tensors), &offset);
-            ok = ok && gguf_fread_el(file, &ctx->header.n_kv,      sizeof(ctx->header.n_kv),      &offset);
-        }
+        ok = ok && gguf_fread_el(file, &ctx->header.n_tensors, sizeof(ctx->header.n_tensors), &offset);
+        ok = ok && gguf_fread_el(file, &ctx->header.n_kv,      sizeof(ctx->header.n_kv),      &offset);
  
          if (!ok) {
              fprintf(stderr, "%s: failed to read header\n", __func__);
@@ -18919,12 +18892,6 @@ struct gguf_context * gguf_init_from_file(const char * fname, struct gguf_init_p
          }
      }
  
-    // NOTE: temporary handling of GGUFv1 >> remove after Oct 2023
-    bool (* gguf_fread_str)(FILE *, struct gguf_str *, size_t *) = gguf_fread_str_cur;
-    if (ctx->header.version == 1) {
-        gguf_fread_str = gguf_fread_str_v1;
-    }
-
      // read the kv pairs
      {
          ctx->kv = malloc(ctx->header.n_kv * sizeof(struct gguf_kv));
@@ -18955,15 +18922,7 @@ struct gguf_context * gguf_init_from_file(const char * fname, struct gguf_init_p
                  case GGUF_TYPE_ARRAY:
                      {
                          ok = ok && gguf_fread_el(file, &kv->value.arr.type, sizeof(kv->value.arr.type), &offset);
-
-                        if (ctx->header.version == 1) {
-                            // NOTE: temporary handling of GGUFv1 >> remove after Oct 2023
-                            uint32_t n = 0;
-                            ok = ok && gguf_fread_el(file, &n, sizeof(n), &offset);
-                            kv->value.arr.n = n;
-                        } else {
-                            ok = ok && gguf_fread_el(file, &kv->value.arr.n, sizeof(kv->value.arr.n), &offset);
-                        }
+                        ok = ok && gguf_fread_el(file, &kv->value.arr.n,    sizeof(kv->value.arr.n), &offset);
  
                          switch (kv->value.arr.type) {
                              case GGUF_TYPE_UINT8:
@@ -19022,14 +18981,7 @@ struct gguf_context * gguf_init_from_file(const char * fname, struct gguf_init_p
              ok = ok && gguf_fread_str(file, &info->name,                          &offset);
              ok = ok && gguf_fread_el (file, &info->n_dims, sizeof(info->n_dims),  &offset);
              for (uint32_t j = 0; j < info->n_dims; ++j) {
-                if (ctx->header.version == 1) {
-                    // NOTE: temporary handling of GGUFv1 >> remove after Oct 2023
-                    uint32_t t = 0;
-                    ok = ok && gguf_fread_el(file, &t, sizeof(t), &offset);
-                    info->ne[j] = t;
-                } else {
-                    ok = ok && gguf_fread_el(file, &info->ne[j], sizeof(info->ne[j]), &offset);
-                }
+                ok = ok && gguf_fread_el(file, &info->ne[j], sizeof(info->ne[j]), &offset);
              }
              ok = ok && gguf_fread_el (file, &info->type,   sizeof(info->type),    &offset);
              ok = ok && gguf_fread_el (file, &info->offset, sizeof(info->offset),  &offset);
diff --git a/models/ggml-vocab-llama.gguf b/models/ggml-vocab-llama.gguf

index 63bfaf672f382c0f5bbcffe54736e2698ef3ac55..549eed8c53f438a61f1b00c9bd3b7d02325f2479 100644 (file)

Binary files a/models/ggml-vocab-llama.gguf and b/models/ggml-vocab-llama.gguf differ
author	Georgi Gerganov <redacted>
	Thu, 2 Nov 2023 09:20:21 +0000 (11:20 +0200)
committer	GitHub <redacted>
	Thu, 2 Nov 2023 09:20:21 +0000 (11:20 +0200)
ggml.c		patch \| blob \| history
models/ggml-vocab-llama.gguf		patch \| blob \| history