]> git.djapps.eu Git - pkg/ggml/sources/llama.cpp/commit
ggml webgpu: quantized buffers to u32 + wider browser/device support (#21046)
authorReese Levine <redacted>
Wed, 1 Apr 2026 05:38:24 +0000 (22:38 -0700)
committerGitHub <redacted>
Wed, 1 Apr 2026 05:38:24 +0000 (08:38 +0300)
commit82764c341a182218f9c391774e2013400e5f4b29
tree1d4bea1d816fa682dbfa4c6577712fbb57a721a2
parent825eb91a66f824242761014c0cd8aea9e9191772
ggml webgpu: quantized buffers to u32 + wider browser/device support (#21046)

* Work towards removing bitcast

* Move rest of existing types over

* Add timeout back to wait and remove synchronous set_tensor/memset_tensor

* move to unpackf16 for wider compatibility

* cleanup

* Remove deadlock condition in free_bufs
ggml/src/ggml-webgpu/ggml-webgpu-shader-lib.hpp
ggml/src/ggml-webgpu/ggml-webgpu.cpp
ggml/src/ggml-webgpu/wgsl-shaders/common_decls.tmpl
ggml/src/ggml-webgpu/wgsl-shaders/flash_attn.wgsl
ggml/src/ggml-webgpu/wgsl-shaders/mul_mat_decls.tmpl
ggml/src/ggml-webgpu/wgsl-shaders/mul_mat_vec.wgsl