]> git.djapps.eu Git - pkg/ggml/sources/llama.cpp/commitdiff
ggml : update ggml_backend_cpu_device_supports_op (#10867)
authorGeorgi Gerganov <redacted>
Tue, 17 Dec 2024 16:35:42 +0000 (18:35 +0200)
committerGitHub <redacted>
Tue, 17 Dec 2024 16:35:42 +0000 (18:35 +0200)
* ggml : fix cpy op for IQ-quants to use reference impl

ggml-ci

* ggml : disable tests involving i-matrix quantization

* ggml : update ggml_backend_cpu_device_supports_op

ggml-ci

ggml/src/ggml-cpu/ggml-cpu.cpp
tests/test-backend-ops.cpp

index c390957afa8e3230c0d612315676b470acea65fe..0b6419f83f0c202ff33f5bbc58529e35b819252e 100644 (file)
@@ -394,8 +394,11 @@ static bool ggml_backend_cpu_device_supports_op(ggml_backend_dev_t dev, const st
     switch (op->op) {
         case GGML_OP_CPY:
             return
+                op->type != GGML_TYPE_IQ3_XXS &&
+                op->type != GGML_TYPE_IQ3_S   &&
                 op->type != GGML_TYPE_IQ2_XXS &&
                 op->type != GGML_TYPE_IQ2_XS  &&
+                op->type != GGML_TYPE_IQ2_S   &&
                 op->type != GGML_TYPE_IQ1_S   &&
                 op->type != GGML_TYPE_IQ1_M; // missing type_traits.from_float
         case GGML_OP_MUL_MAT:
index b9454ba596c212f867580ff015e9bd0751385534..ccdd3fb57a5041452fa0cc7d275a4e45fe95f5e7 100644 (file)
@@ -3549,8 +3549,8 @@ static std::vector<std::unique_ptr<test_case>> make_test_cases_eval() {
 
     for (ggml_type type_src : {GGML_TYPE_F16, GGML_TYPE_F32}) {
         for (ggml_type type_dst : all_types) {
-           test_cases.emplace_back(new test_cpy(type_src, type_dst, {256, 4, 4, 4}));
-           test_cases.emplace_back(new test_cpy(type_src, type_dst, {256, 2, 3, 4}, {0, 2, 1, 3})); // cpy by rows
+            test_cases.emplace_back(new test_cpy(type_src, type_dst, {256, 4, 4, 4}));
+            test_cases.emplace_back(new test_cpy(type_src, type_dst, {256, 2, 3, 4}, {0, 2, 1, 3})); // cpy by rows
         }
     }
     for (ggml_type type_src : {GGML_TYPE_F16, GGML_TYPE_F32}) {