gitextract_uxq8hg2y/ ├── .gitignore ├── .gitmodules ├── CMakeLists.txt ├── CODE_OF_CONDUCT.md ├── LICENSE ├── README.md ├── SECURITY.md ├── docs/ │ └── codegen.md ├── gpu/ │ ├── README.md │ ├── bitnet_kernels/ │ │ ├── bitnet_kernels.cu │ │ ├── bitnet_kernels.h │ │ ├── compile.sh │ │ └── setup.py │ ├── convert_checkpoint.py │ ├── convert_safetensors.py │ ├── generate.py │ ├── model.py │ ├── pack_weight.py │ ├── requirements.txt │ ├── sample_utils.py │ ├── stats.py │ ├── test.py │ ├── tokenizer.model │ └── tokenizer.py ├── include/ │ ├── gemm-config.h │ └── ggml-bitnet.h ├── preset_kernels/ │ ├── Llama3-8B-1.58-100B-tokens/ │ │ ├── bitnet-lut-kernels-tl1.h │ │ ├── bitnet-lut-kernels-tl2.h │ │ ├── kernel_config_tl1.ini │ │ └── kernel_config_tl2.ini │ ├── bitnet_b1_58-3B/ │ │ ├── bitnet-lut-kernels-tl1.h │ │ ├── bitnet-lut-kernels-tl2.h │ │ ├── kernel_config_tl1.ini │ │ └── kernel_config_tl2.ini │ └── bitnet_b1_58-large/ │ ├── bitnet-lut-kernels-tl1.h │ ├── bitnet-lut-kernels-tl2.h │ ├── kernel_config_tl1.ini │ └── kernel_config_tl2.ini ├── requirements.txt ├── run_inference.py ├── run_inference_server.py ├── setup_env.py ├── src/ │ ├── CMakeLists.txt │ ├── README.md │ ├── ggml-bitnet-lut.cpp │ └── ggml-bitnet-mad.cpp └── utils/ ├── codegen_tl1.py ├── codegen_tl2.py ├── convert-helper-bitnet.py ├── convert-hf-to-gguf-bitnet.py ├── convert-ms-to-gguf-bitnet.py ├── convert.py ├── e2e_benchmark.py ├── generate-dummy-bitnet-model.py ├── preprocess-huggingface-bitnet.py ├── quantize_embeddings.py ├── test_gemm_kernel.sh ├── test_perplexity.py ├── test_power.sh └── tune_gemm_config.py