context : fix state io for memory-less contexts (#13470)

author Georgi Gerganov <redacted>

Mon, 12 May 2025 12:12:27 +0000 (15:12 +0300)

committer GitHub <redacted>

Mon, 12 May 2025 12:12:27 +0000 (15:12 +0300)
author Georgi Gerganov <redacted>
Mon, 12 May 2025 12:12:27 +0000 (15:12 +0300)
committer GitHub <redacted>
Mon, 12 May 2025 12:12:27 +0000 (15:12 +0300)
diff --git a/src/llama-context.cpp b/src/llama-context.cpp

index a12849f0e0df459bab806862b7a17ef07e73e880..0cb6ebc9fe9c057410544418d1eaa2476a99c4ed 100644 (file)
--- a/src/llama-context.cpp
+++ b/src/llama-context.cpp
@@ -1788,10 +1788,13 @@ size_t llama_context::state_read_data(llama_io_read_i & io) {
          }
      }
  
-    LLAMA_LOG_DEBUG("%s: - reading KV self\n", __func__);
-    llama_kv_cache * kv_self = static_cast<llama_kv_cache *>(memory.get());
+    if (memory) {
+        LLAMA_LOG_DEBUG("%s: - reading KV self\n", __func__);
  
-    kv_self->state_read(io);
+        llama_kv_cache * kv_self = static_cast<llama_kv_cache *>(memory.get());
+
+        kv_self->state_read(io);
+    }
  
      return io.n_bytes();
  }
@@ -1799,9 +1802,11 @@ size_t llama_context::state_read_data(llama_io_read_i & io) {
  size_t llama_context::state_seq_write_data(llama_io_write_i & io, llama_seq_id seq_id) {
      GGML_UNUSED(seq_id);
  
-    llama_kv_cache * kv_self = static_cast<llama_kv_cache *>(memory.get());
+    if (memory) {
+        llama_kv_cache * kv_self = static_cast<llama_kv_cache *>(memory.get());
  
-    kv_self->state_write(io, seq_id);
+        kv_self->state_write(io, seq_id);
+    }
  
      return io.n_bytes();
  }
@@ -1809,9 +1814,11 @@ size_t llama_context::state_seq_write_data(llama_io_write_i & io, llama_seq_id s
  size_t llama_context::state_seq_read_data(llama_io_read_i & io, llama_seq_id seq_id) {
      GGML_UNUSED(seq_id);
  
-    llama_kv_cache * kv_self = static_cast<llama_kv_cache *>(memory.get());
+    if (memory) {
+        llama_kv_cache * kv_self = static_cast<llama_kv_cache *>(memory.get());
  
-    kv_self->state_read(io, seq_id);
+        kv_self->state_read(io, seq_id);
+    }
  
      return io.n_bytes();
  }
author	Georgi Gerganov <redacted>
	Mon, 12 May 2025 12:12:27 +0000 (15:12 +0300)
committer	GitHub <redacted>
	Mon, 12 May 2025 12:12:27 +0000 (15:12 +0300)