gitextract_0u4zluxv/ ├── .gitignore ├── LICENSE ├── README.md ├── assets/ │ ├── diffusion/ │ │ └── .gitkeep │ └── llm/ │ └── .gitkeep ├── deepcompressor/ │ ├── __init__.py │ ├── app/ │ │ ├── __init__.py │ │ ├── diffusion/ │ │ │ ├── __init__.py │ │ │ ├── cache/ │ │ │ │ ├── __init__.py │ │ │ │ └── config.py │ │ │ ├── config.py │ │ │ ├── dataset/ │ │ │ │ ├── __init__.py │ │ │ │ ├── base.py │ │ │ │ ├── calib.py │ │ │ │ ├── collect/ │ │ │ │ │ ├── calib.py │ │ │ │ │ └── utils.py │ │ │ │ └── data/ │ │ │ │ ├── COCO/ │ │ │ │ │ ├── COCO.py │ │ │ │ │ └── __init__.py │ │ │ │ ├── DCI/ │ │ │ │ │ ├── DCI.py │ │ │ │ │ └── __init__.py │ │ │ │ ├── MJHQ/ │ │ │ │ │ ├── MJHQ.py │ │ │ │ │ └── __init__.py │ │ │ │ ├── __init__.py │ │ │ │ └── dump.py │ │ │ ├── eval/ │ │ │ │ ├── __init__.py │ │ │ │ ├── config.py │ │ │ │ └── metrics/ │ │ │ │ ├── __init__.py │ │ │ │ ├── fid.py │ │ │ │ ├── image_reward.py │ │ │ │ ├── multimodal.py │ │ │ │ ├── run.py │ │ │ │ └── similarity.py │ │ │ ├── nn/ │ │ │ │ ├── __init__.py │ │ │ │ ├── attention.py │ │ │ │ ├── patch.py │ │ │ │ └── struct.py │ │ │ ├── pipeline/ │ │ │ │ ├── __init__.py │ │ │ │ └── config.py │ │ │ ├── ptq.py │ │ │ ├── quant/ │ │ │ │ ├── __init__.py │ │ │ │ ├── activation.py │ │ │ │ ├── config.py │ │ │ │ ├── quantizer/ │ │ │ │ │ ├── __init__.py │ │ │ │ │ ├── config.py │ │ │ │ │ └── quantizer.py │ │ │ │ ├── rotate.py │ │ │ │ ├── smooth.py │ │ │ │ ├── utils.py │ │ │ │ └── weight.py │ │ │ └── utils.py │ │ └── llm/ │ │ ├── __init__.py │ │ ├── cache/ │ │ │ ├── __init__.py │ │ │ └── config.py │ │ ├── config.py │ │ ├── eval/ │ │ │ ├── __init__.py │ │ │ ├── base.py │ │ │ ├── config.py │ │ │ ├── custom.py │ │ │ ├── lm_eval.py │ │ │ └── longbench/ │ │ │ ├── __init__.py │ │ │ ├── eval.py │ │ │ ├── metrics.py │ │ │ └── task2prompt.json │ │ ├── model/ │ │ │ ├── __init__.py │ │ │ └── config.py │ │ ├── nn/ │ │ │ ├── __init__.py │ │ │ ├── patch.py │ │ │ └── struct.py │ │ ├── ptq.py │ │ └── quant/ │ │ ├── __init__.py │ │ ├── activation.py │ │ ├── config.py │ │ ├── dataset.py │ │ ├── quantizer/ │ │ │ ├── __init__.py │ │ │ ├── config.py │ │ │ └── quantizer.py │ │ ├── reorder.py │ │ ├── rotate.py │ │ ├── smooth.py │ │ ├── utils.py │ │ └── weight.py │ ├── backend/ │ │ ├── __init__.py │ │ ├── nunchaku/ │ │ │ ├── __init__.py │ │ │ ├── convert.py │ │ │ ├── convert_lora.py │ │ │ └── utils.py │ │ ├── qserve/ │ │ │ ├── __init__.py │ │ │ ├── convert.py │ │ │ └── utils.py │ │ ├── tinychat/ │ │ │ ├── __init__.py │ │ │ ├── convert.py │ │ │ ├── csrc/ │ │ │ │ ├── load.py │ │ │ │ ├── pybind.cpp │ │ │ │ ├── quantization/ │ │ │ │ │ ├── dequantize.cuh │ │ │ │ │ ├── gemm/ │ │ │ │ │ │ ├── gemm_cuda.cu │ │ │ │ │ │ ├── gemm_cuda.h │ │ │ │ │ │ └── semaphore.h │ │ │ │ │ └── gemv/ │ │ │ │ │ ├── gemv_cuda.cu │ │ │ │ │ └── gemv_cuda.h │ │ │ │ └── utils.cuh │ │ │ ├── linear.py │ │ │ └── utils.py │ │ └── utils.py │ ├── calib/ │ │ ├── __init__.py │ │ ├── config/ │ │ │ ├── __init__.py │ │ │ ├── lowrank.py │ │ │ ├── range.py │ │ │ ├── reorder.py │ │ │ ├── rotation.py │ │ │ ├── search.py │ │ │ └── smooth.py │ │ ├── lowrank.py │ │ ├── metric.py │ │ ├── range.py │ │ ├── reorder.py │ │ ├── rotate.py │ │ ├── search.py │ │ └── smooth.py │ ├── csrc/ │ │ ├── load.py │ │ ├── pybind.cpp │ │ └── quantize/ │ │ ├── quantize.cu │ │ └── quantize.h │ ├── data/ │ │ ├── __init__.py │ │ ├── cache.py │ │ ├── codebook.py │ │ ├── common.py │ │ ├── dtype.py │ │ ├── range.py │ │ ├── scale.py │ │ ├── tensor.py │ │ ├── utils/ │ │ │ ├── __init__.py │ │ │ ├── dtype.py │ │ │ ├── reshape.py │ │ │ ├── scale.py │ │ │ └── shape.py │ │ └── zero.py │ ├── dataset/ │ │ ├── __init__.py │ │ ├── action.py │ │ ├── cache.py │ │ └── config.py │ ├── nn/ │ │ ├── __init__.py │ │ ├── patch/ │ │ │ ├── __init__.py │ │ │ ├── conv.py │ │ │ ├── linear.py │ │ │ ├── lowrank.py │ │ │ └── sdpa.py │ │ └── struct/ │ │ ├── __init__.py │ │ ├── attn.py │ │ └── base.py │ ├── quantizer/ │ │ ├── __init__.py │ │ ├── config/ │ │ │ ├── __init__.py │ │ │ ├── base.py │ │ │ ├── kernel.py │ │ │ └── lowrank.py │ │ ├── impl/ │ │ │ ├── __init__.py │ │ │ ├── base.py │ │ │ ├── info.py │ │ │ ├── scale.py │ │ │ ├── simple.py │ │ │ └── ste.py │ │ ├── kernel/ │ │ │ ├── __init__.py │ │ │ ├── gptq.py │ │ │ └── rtn.py │ │ └── processor.py │ ├── utils/ │ │ ├── __init__.py │ │ ├── common.py │ │ ├── config/ │ │ │ ├── __init__.py │ │ │ ├── base.py │ │ │ ├── model.py │ │ │ ├── output.py │ │ │ └── path.py │ │ ├── dataclass.py │ │ ├── hooks/ │ │ │ ├── __init__.py │ │ │ ├── branch.py │ │ │ ├── hook.py │ │ │ ├── packager.py │ │ │ └── processor.py │ │ ├── math/ │ │ │ ├── __init__.py │ │ │ ├── functional.py │ │ │ └── hadamard.py │ │ ├── patch.py │ │ └── tools/ │ │ ├── __init__.py │ │ ├── logging.py │ │ └── sys.py │ └── version.py ├── environment.yml ├── examples/ │ ├── diffusion/ │ │ ├── .gitignore │ │ ├── README.md │ │ ├── configs/ │ │ │ ├── __default__.yaml │ │ │ ├── collect/ │ │ │ │ └── qdiff.yaml │ │ │ ├── lora/ │ │ │ │ ├── __default__.yaml │ │ │ │ └── flux.1-dev/ │ │ │ │ ├── anime.yaml │ │ │ │ ├── ghibsky.yaml │ │ │ │ ├── realism.yaml │ │ │ │ ├── sketch.yaml │ │ │ │ └── yarn.yaml │ │ │ ├── model/ │ │ │ │ ├── flux.1-dev.yaml │ │ │ │ ├── flux.1-schnell.yaml │ │ │ │ ├── pixart-sigma.yaml │ │ │ │ └── sana-1.6b.yaml │ │ │ ├── svdquant/ │ │ │ │ ├── __default__.yaml │ │ │ │ ├── fast.yaml │ │ │ │ ├── gptq.yaml │ │ │ │ ├── int4.yaml │ │ │ │ └── nvfp4.yaml │ │ │ └── text/ │ │ │ ├── __default__.yaml │ │ │ └── awq.yaml │ │ ├── prompts/ │ │ │ ├── lora/ │ │ │ │ ├── anime.yaml │ │ │ │ ├── ghibsky.yaml │ │ │ │ ├── realism.yaml │ │ │ │ ├── sketch.yaml │ │ │ │ └── yarn.yaml │ │ │ └── qdiff.yaml │ │ └── scripts/ │ │ └── svdquant.sh │ └── llm/ │ ├── .gitignore │ ├── README.md │ ├── configs/ │ │ ├── __default__.yaml │ │ ├── awq.yaml │ │ ├── gptq.yaml │ │ ├── ooo.yaml │ │ ├── qoq-g128.yaml │ │ ├── qoq-gchn.yaml │ │ ├── smoothquant-dynamic.yaml │ │ └── smoothquant-static.yaml │ └── scripts/ │ ├── awq.sh │ ├── gptq.sh │ ├── qoq.sh │ └── smoothquant.sh └── pyproject.toml