gitextract_941i2ph3/ ├── .github/ │ ├── CODEOWNERS │ └── workflows/ │ └── publish-to-test-pypi.yml ├── .gitignore ├── .pre-commit-config.yaml ├── .ruff.toml ├── CODE_OF_CONDUCT.md ├── CONTRIBUTING.md ├── LICENSE ├── MANIFEST.in ├── README.md ├── SECURITY.md ├── docs/ │ └── license_header.txt ├── models/ │ ├── __init__.py │ ├── checkpoint.py │ ├── cli/ │ │ ├── __init__.py │ │ ├── describe.py │ │ ├── download.py │ │ ├── list.py │ │ ├── llama.py │ │ ├── prompt_format.py │ │ ├── remove.py │ │ ├── safety_models.py │ │ ├── subcommand.py │ │ ├── table.py │ │ ├── utils.py │ │ └── verify_download.py │ ├── datatypes.py │ ├── llama2/ │ │ ├── LICENSE │ │ ├── MODEL_CARD.md │ │ └── USE_POLICY.md │ ├── llama3/ │ │ ├── LICENSE │ │ ├── MODEL_CARD.md │ │ ├── USE_POLICY.md │ │ ├── __init__.py │ │ ├── args.py │ │ ├── chat_format.py │ │ ├── generation.py │ │ ├── model.py │ │ ├── multimodal/ │ │ │ ├── __init__.py │ │ │ ├── encoder_utils.py │ │ │ ├── image_transform.py │ │ │ ├── model.py │ │ │ └── utils.py │ │ ├── quantization/ │ │ │ └── loader.py │ │ ├── requirements.txt │ │ ├── scripts/ │ │ │ ├── __init__.py │ │ │ ├── chat_completion.py │ │ │ └── completion.py │ │ ├── tests/ │ │ │ └── api/ │ │ │ ├── test_generation.py │ │ │ ├── test_tokenizer.py │ │ │ └── test_tool_utils.py │ │ ├── tokenizer.model │ │ ├── tokenizer.py │ │ └── tool_utils.py │ ├── llama3_1/ │ │ ├── LICENSE │ │ ├── MODEL_CARD.md │ │ ├── USE_POLICY.md │ │ ├── eval_details.md │ │ └── prompt_format.md │ ├── llama3_2/ │ │ ├── LICENSE │ │ ├── MODEL_CARD.md │ │ ├── MODEL_CARD_VISION.md │ │ ├── USE_POLICY.md │ │ ├── eval_details.md │ │ ├── text_prompt_format.md │ │ └── vision_prompt_format.md │ ├── llama3_3/ │ │ ├── LICENSE │ │ ├── MODEL_CARD.md │ │ ├── USE_POLICY.md │ │ ├── eval_details.md │ │ └── prompt_format.md │ ├── llama4/ │ │ ├── LICENSE │ │ ├── MODEL_CARD.md │ │ ├── USE_POLICY.md │ │ ├── __init__.py │ │ ├── args.py │ │ ├── chat_format.py │ │ ├── datatypes.py │ │ ├── ffn.py │ │ ├── generation.py │ │ ├── model.py │ │ ├── moe.py │ │ ├── preprocess.py │ │ ├── prompt_format.md │ │ ├── quantization/ │ │ │ ├── __init__.py │ │ │ └── loader.py │ │ ├── scripts/ │ │ │ ├── chat_completion.py │ │ │ ├── completion.py │ │ │ └── quantize.py │ │ ├── tests/ │ │ │ ├── __init__.py │ │ │ └── api/ │ │ │ ├── __init__.py │ │ │ └── test_chat_format.py │ │ ├── tokenizer.model │ │ ├── tokenizer.py │ │ └── vision/ │ │ ├── embedding.py │ │ └── encoder.py │ ├── quantize_impls.py │ ├── sku_list.py │ ├── sku_types.py │ ├── tokenizer_utils.py │ └── utils/ │ ├── __init__.py │ ├── config.py │ └── model_utils.py ├── pyproject.toml └── requirements.txt