gitextract_56lzr4bw/ ├── .clang-format ├── .gitignore ├── CMakeLists.txt ├── CONTRIBUTING.md ├── LICENSE ├── README.md ├── benches/ │ └── benches.hpp ├── build.nsconfig ├── doc/ │ ├── Makefile.nix │ ├── Makefile.win │ ├── markdown/ │ │ ├── compilers_and_versions.md │ │ ├── concepts.md │ │ ├── defines.md │ │ ├── faq.md │ │ ├── fp16.md │ │ ├── how_tests_are_done.md │ │ ├── memory.md │ │ ├── modules/ │ │ │ ├── .gitignore │ │ │ └── fixed_point/ │ │ │ └── overview.md │ │ ├── pack.md │ │ └── tutorial.md │ ├── md2html.cpp │ └── what_is_wrapped.cpp ├── egg/ │ ├── __init__.py │ ├── common.py │ ├── cuda.py │ ├── experiments/ │ │ ├── gen_sleef_operators.py │ │ ├── round-ppc.c │ │ └── upcvt-sve.c │ ├── gen_adv_c_api.py │ ├── gen_adv_cxx_api.py │ ├── gen_archis.py │ ├── gen_base_apis.py │ ├── gen_benches.py │ ├── gen_doc.py │ ├── gen_friendly_but_not_optimized.py │ ├── gen_modules.py │ ├── gen_scalar_utilities.py │ ├── gen_src.py │ ├── gen_tests.py │ ├── get_sleef_code.py │ ├── hatch.py │ ├── modules/ │ │ ├── fixed_point/ │ │ │ ├── gen_doc.py │ │ │ ├── gen_tests.py │ │ │ └── hatch.py │ │ ├── memory_management/ │ │ │ └── hatch.py │ │ ├── random/ │ │ │ └── hatch.py │ │ ├── spmd/ │ │ │ └── hatch.py │ │ └── tet1d/ │ │ └── hatch.py │ ├── oneapi.py │ ├── operators.py │ ├── platform_arm.py │ ├── platform_cpu.py │ ├── platform_ppc.py │ ├── platform_x86.py │ ├── rocm.py │ ├── scalar.py │ └── x86_load_store_deg234.py ├── examples/ │ ├── module_fixed_point.cpp │ └── tutorial.cpp ├── include/ │ └── nsimd/ │ ├── c_adv_api.h │ ├── cxx_adv_api.hpp │ ├── cxx_adv_api_aliases.hpp │ ├── modules/ │ │ ├── fixed_point.hpp │ │ ├── memory_management.hpp │ │ ├── spmd.hpp │ │ └── tet1d.hpp │ ├── nsimd-all.h │ ├── nsimd-all.hpp │ └── nsimd.h ├── scripts/ │ ├── FindNSIMD.cmake │ ├── aarch64-linux-gnu-clang++.sh │ ├── aarch64-linux-gnu-clang.sh │ ├── build-tests.bat │ ├── build-tests.sh │ ├── build.bat │ ├── build.sh │ ├── ci-clang.txt │ ├── ci-scale.txt │ ├── ci-test.txt │ ├── ci.sh │ ├── compile-gmp-mpfr-for-wasm.sh │ ├── gen_github_doc.sh │ ├── hipcc.sh │ ├── init-benches-deps.sh │ ├── local-ci-rerun.ini │ ├── local-ci.ini │ ├── local-ci.sh │ ├── one-liner.c │ ├── powerpc64le-linux-gnu-clang++.sh │ ├── powerpc64le-linux-gnu-clang.sh │ ├── setup.bat │ └── setup.sh ├── src/ │ ├── dd.h │ ├── df.h │ ├── estrin.h │ ├── fp16.cpp │ ├── gpu.cpp │ ├── helperadvsimd.h │ ├── helperavx.h │ ├── helperavx2.h │ ├── helperavx512f.h │ ├── helperneon32.h │ ├── helperpower_128.h │ ├── helpersse2.h │ ├── helpersve.h │ ├── memory.cpp │ ├── misc.h │ ├── rempitab.c │ ├── rename.h │ ├── renameadvsimd.h │ ├── renameavx.h │ ├── renameavx2.h │ ├── renameavx512f.h │ ├── renameneon32.h │ ├── renamesse2.h │ ├── renamesse4.h │ ├── renamesve.h │ ├── renamevsx.h │ ├── sleefdp.c │ ├── sleefsimddp.c │ ├── sleefsimddp_emulation.c │ ├── sleefsimdsp.c │ ├── sleefsimdsp_emulation.c │ ├── sleefsp.c │ └── ufp.cpp └── tests/ ├── CMakeLists.txt.sh ├── FindNSIMD.cmake.sh ├── allocator.cpp ├── assign_arith.cpp ├── booleans.cpp ├── c11_vec.c ├── cxx_adv_api_aliases.cpp ├── fp16.prec11.c ├── get_pack.cpp ├── memory.cpp ├── memory.prec11.c ├── modules/ │ └── common.hpp ├── nsimd-all.cpp ├── nsimd.cpp ├── nsimd.prec11.c ├── operator_vector_scalar.cpp ├── shifts.cpp ├── templated_loads_stores.cpp ├── tests_helpers.hpp ├── to_pack.cpp ├── to_pack_interleave.cpp └── ufp.cpp