3.36 MB

Ctrl+K

1 contributor

History: 3 commits

OpenTransformer

perf: maddubs kernel + nrc=4 multi-row for Q1_0_g128 (3.5-3.75 t/s)

570ff77 verified about 3 hours ago

amx
Q1_0_g128 CPU kernel fix + AVX2 SIMD (fork of PrismML-Eng/llama.cpp) 10 days ago
arch
perf: maddubs kernel + nrc=4 multi-row for Q1_0_g128 (3.5-3.75 t/s) about 3 hours ago
cmake
Q1_0_g128 CPU kernel fix + AVX2 SIMD (fork of PrismML-Eng/llama.cpp) 10 days ago
kleidiai
Q1_0_g128 CPU kernel fix + AVX2 SIMD (fork of PrismML-Eng/llama.cpp) 10 days ago
llamafile
Q1_0_g128 CPU kernel fix + AVX2 SIMD (fork of PrismML-Eng/llama.cpp) 10 days ago
spacemit
Q1_0_g128 CPU kernel fix + AVX2 SIMD (fork of PrismML-Eng/llama.cpp) 10 days ago
CMakeLists.txt

32.8 kB
Q1_0_g128 CPU kernel fix + AVX2 SIMD (fork of PrismML-Eng/llama.cpp) 10 days ago
arch-fallback.h

21 kB
Q1_0_g128 CPU kernel fix + AVX2 SIMD (fork of PrismML-Eng/llama.cpp) 10 days ago
binary-ops.cpp

6.71 kB
Q1_0_g128 CPU kernel fix + AVX2 SIMD (fork of PrismML-Eng/llama.cpp) 10 days ago
binary-ops.h

518 Bytes
Q1_0_g128 CPU kernel fix + AVX2 SIMD (fork of PrismML-Eng/llama.cpp) 10 days ago
common.h

2.33 kB
Q1_0_g128 CPU kernel fix + AVX2 SIMD (fork of PrismML-Eng/llama.cpp) 10 days ago
ggml-cpu-impl.h

13.2 kB
Q1_0_g128 CPU kernel fix + AVX2 SIMD (fork of PrismML-Eng/llama.cpp) 10 days ago
ggml-cpu.c

129 kB
perf: maddubs kernel + nrc=4 multi-row for Q1_0_g128 (3.5-3.75 t/s) about 3 hours ago
ggml-cpu.cpp

24 kB
Q1_0_g128 CPU kernel fix + AVX2 SIMD (fork of PrismML-Eng/llama.cpp) 10 days ago
hbm.cpp

2 kB
Q1_0_g128 CPU kernel fix + AVX2 SIMD (fork of PrismML-Eng/llama.cpp) 10 days ago
hbm.h

155 Bytes
Q1_0_g128 CPU kernel fix + AVX2 SIMD (fork of PrismML-Eng/llama.cpp) 10 days ago
ops.cpp

372 kB
Q1_0_g128 CPU kernel fix + AVX2 SIMD (fork of PrismML-Eng/llama.cpp) 10 days ago
ops.h

9.19 kB
Q1_0_g128 CPU kernel fix + AVX2 SIMD (fork of PrismML-Eng/llama.cpp) 10 days ago
quants.c

43.2 kB
Q1_0_g128 CPU kernel fix + AVX2 SIMD (fork of PrismML-Eng/llama.cpp) 10 days ago
quants.h

10.4 kB
Q1_0_g128 CPU kernel fix + AVX2 SIMD (fork of PrismML-Eng/llama.cpp) 10 days ago
repack.cpp

151 kB
Q1_0_g128 CPU kernel fix + AVX2 SIMD (fork of PrismML-Eng/llama.cpp) 10 days ago
repack.h

14.9 kB
Q1_0_g128 CPU kernel fix + AVX2 SIMD (fork of PrismML-Eng/llama.cpp) 10 days ago
simd-gemm.h

3.77 kB
Q1_0_g128 CPU kernel fix + AVX2 SIMD (fork of PrismML-Eng/llama.cpp) 10 days ago
simd-mappings.h

52.3 kB
Q1_0_g128 CPU kernel fix + AVX2 SIMD (fork of PrismML-Eng/llama.cpp) 10 days ago
traits.cpp

1.23 kB
Q1_0_g128 CPU kernel fix + AVX2 SIMD (fork of PrismML-Eng/llama.cpp) 10 days ago
traits.h

1.16 kB
Q1_0_g128 CPU kernel fix + AVX2 SIMD (fork of PrismML-Eng/llama.cpp) 10 days ago
unary-ops.cpp

11.6 kB
Q1_0_g128 CPU kernel fix + AVX2 SIMD (fork of PrismML-Eng/llama.cpp) 10 days ago
unary-ops.h

2.44 kB
Q1_0_g128 CPU kernel fix + AVX2 SIMD (fork of PrismML-Eng/llama.cpp) 10 days ago
vec.cpp

25.3 kB
Q1_0_g128 CPU kernel fix + AVX2 SIMD (fork of PrismML-Eng/llama.cpp) 10 days ago
vec.h

66.6 kB
Q1_0_g128 CPU kernel fix + AVX2 SIMD (fork of PrismML-Eng/llama.cpp) 10 days ago