]> git.djapps.eu Git - pkg/ggml/sources/ggml/commit
cuda : CUDA Graph Compute Function Refactor (precursor for performance improvements...
authorAndreas Kieslinger <redacted>
Mon, 13 Jan 2025 15:45:53 +0000 (16:45 +0100)
committerGeorgi Gerganov <redacted>
Tue, 14 Jan 2025 07:36:36 +0000 (09:36 +0200)
commite7bd447ba2536689f5ddf0b017c192d31ac45362
tree4fa5ab8b1484822c629d3c5503dcfe71c066464e
parentac76d16d0c6f07341a27a7ce2c81df85ef92e278
cuda : CUDA Graph Compute Function Refactor (precursor for performance improvements) (llama/11042)

* Refactor: Moves cuda graph executable update step to separate function.

* Refactor: Moves cuda graph update check to separate function.

* Refactor: Moves cuda graph maintenance (update or adjusting copy parameters) to separate function for improved readability.

* Fix: Adds missing reference to maintain_cuda_graph() definition.

* Refactor: Improves structure and abstractions by moving CUDA graph evaluation and capture to its own function.

* Refactor: Moves node graph checks and copy ops into individual function for improved readability.

* Refactor: Removes code permanently excluded from compilation to increase readability.

* Style: Adds missing newline

* Style: Consolidates several neighboring '#ifdef USE_CUDA_GRAPH' into a single one

* Refactor: Makes 'cuda_graph_update_required' a local variable

* remove double lines between functions

---------

Co-authored-by: slaren <redacted>
src/ggml-cuda/ggml-cuda.cu