gitextract_6ui6sr19/ ├── .gitattributes ├── .github/ │ └── workflows/ │ ├── ci.yml │ ├── clear-cache.yml │ └── python-publish.yml ├── .gitignore ├── CITATION.cff ├── HISTORY.md ├── LICENSE ├── MANIFEST.in ├── Makefile ├── README.md ├── docs/ │ ├── Interacting_with_open_clip.ipynb │ ├── Interacting_with_open_coca.ipynb │ ├── LOW_ACC.md │ ├── PRETRAINED.md │ ├── clip_conceptual_captions.md │ ├── clipa.md │ ├── datacomp_models.md │ ├── model_profile.csv │ ├── openclip_classification_results.csv │ ├── openclip_multilingual_retrieval_results.csv │ ├── openclip_results.csv │ ├── openclip_retrieval_results.csv │ └── script_examples/ │ ├── clipa/ │ │ ├── vit_b16/ │ │ │ ├── i50_t16_finetune.sh │ │ │ └── i50_t16_pretrain.sh │ │ └── vit_l16/ │ │ ├── i17_t16_finetune.sh │ │ ├── i17_t16_pretrain.sh │ │ ├── i37_t8_finetune.sh │ │ └── i37_t8_pretrain.sh │ ├── clipav2/ │ │ └── vit_h14/ │ │ ├── i257_t32_finetunex4.sh │ │ ├── i50_t8_pretrain.sh │ │ └── i577_t32_finetunex1.sh │ └── stability_example.sh ├── pyproject.toml ├── pytest.ini ├── requirements-test.txt ├── requirements-training.txt ├── requirements.txt ├── scripts/ │ ├── clipav1_vit_l16_i37_t8.sh │ ├── clipav2_vit_h14_i84_224_336_cl32_gap_datacomp1b.sh │ ├── h14_224_32_finetune.sh │ └── h14_84_8_pretrain.sh ├── src/ │ ├── open_clip/ │ │ ├── __init__.py │ │ ├── coca_model.py │ │ ├── constants.py │ │ ├── convert.py │ │ ├── factory.py │ │ ├── hf_configs.py │ │ ├── hf_model.py │ │ ├── loss.py │ │ ├── model.py │ │ ├── model_configs/ │ │ │ ├── EVA01-g-14-plus.json │ │ │ ├── EVA01-g-14.json │ │ │ ├── EVA02-B-16.json │ │ │ ├── EVA02-E-14-plus.json │ │ │ ├── EVA02-E-14.json │ │ │ ├── EVA02-L-14-336.json │ │ │ ├── EVA02-L-14.json │ │ │ ├── MobileCLIP-B.json │ │ │ ├── MobileCLIP-S1.json │ │ │ ├── MobileCLIP-S2.json │ │ │ ├── MobileCLIP2-B.json │ │ │ ├── MobileCLIP2-L-14.json │ │ │ ├── MobileCLIP2-S0.json │ │ │ ├── MobileCLIP2-S2.json │ │ │ ├── MobileCLIP2-S3.json │ │ │ ├── MobileCLIP2-S4.json │ │ │ ├── PE-Core-B-16.json │ │ │ ├── PE-Core-L-14-336.json │ │ │ ├── PE-Core-S-16-384.json │ │ │ ├── PE-Core-T-16-384.json │ │ │ ├── PE-Core-bigG-14-448.json │ │ │ ├── RN101-quickgelu.json │ │ │ ├── RN101.json │ │ │ ├── RN50-quickgelu.json │ │ │ ├── RN50.json │ │ │ ├── RN50x16-quickgelu.json │ │ │ ├── RN50x16.json │ │ │ ├── RN50x4-quickgelu.json │ │ │ ├── RN50x4.json │ │ │ ├── RN50x64-quickgelu.json │ │ │ ├── RN50x64.json │ │ │ ├── ViT-B-16-SigLIP-256.json │ │ │ ├── ViT-B-16-SigLIP-384.json │ │ │ ├── ViT-B-16-SigLIP-512.json │ │ │ ├── ViT-B-16-SigLIP-i18n-256.json │ │ │ ├── ViT-B-16-SigLIP.json │ │ │ ├── ViT-B-16-SigLIP2-256.json │ │ │ ├── ViT-B-16-SigLIP2-384.json │ │ │ ├── ViT-B-16-SigLIP2-512.json │ │ │ ├── ViT-B-16-SigLIP2.json │ │ │ ├── ViT-B-16-plus-240.json │ │ │ ├── ViT-B-16-plus.json │ │ │ ├── ViT-B-16-quickgelu.json │ │ │ ├── ViT-B-16.json │ │ │ ├── ViT-B-32-256.json │ │ │ ├── ViT-B-32-SigLIP2-256.json │ │ │ ├── ViT-B-32-plus-256.json │ │ │ ├── ViT-B-32-quickgelu.json │ │ │ ├── ViT-B-32.json │ │ │ ├── ViT-H-14-378-quickgelu.json │ │ │ ├── ViT-H-14-378.json │ │ │ ├── ViT-H-14-CLIPA-336.json │ │ │ ├── ViT-H-14-CLIPA.json │ │ │ ├── ViT-H-14-quickgelu.json │ │ │ ├── ViT-H-14-worldwide-378.json │ │ │ ├── ViT-H-14-worldwide-quickgelu.json │ │ │ ├── ViT-H-14-worldwide.json │ │ │ ├── ViT-H-14.json │ │ │ ├── ViT-H-16.json │ │ │ ├── ViT-L-14-280.json │ │ │ ├── ViT-L-14-336-quickgelu.json │ │ │ ├── ViT-L-14-336.json │ │ │ ├── ViT-L-14-CLIPA-336.json │ │ │ ├── ViT-L-14-CLIPA.json │ │ │ ├── ViT-L-14-quickgelu.json │ │ │ ├── ViT-L-14-worldwide-quickgelu.json │ │ │ ├── ViT-L-14-worldwide.json │ │ │ ├── ViT-L-14.json │ │ │ ├── ViT-L-16-320.json │ │ │ ├── ViT-L-16-SigLIP-256.json │ │ │ ├── ViT-L-16-SigLIP-384.json │ │ │ ├── ViT-L-16-SigLIP2-256.json │ │ │ ├── ViT-L-16-SigLIP2-384.json │ │ │ ├── ViT-L-16-SigLIP2-512.json │ │ │ ├── ViT-L-16.json │ │ │ ├── ViT-M-16-alt.json │ │ │ ├── ViT-M-16.json │ │ │ ├── ViT-M-32-alt.json │ │ │ ├── ViT-M-32.json │ │ │ ├── ViT-S-16-alt.json │ │ │ ├── ViT-S-16.json │ │ │ ├── ViT-S-32-alt.json │ │ │ ├── ViT-S-32.json │ │ │ ├── ViT-SO400M-14-SigLIP-378.json │ │ │ ├── ViT-SO400M-14-SigLIP-384.json │ │ │ ├── ViT-SO400M-14-SigLIP.json │ │ │ ├── ViT-SO400M-14-SigLIP2-378.json │ │ │ ├── ViT-SO400M-14-SigLIP2.json │ │ │ ├── ViT-SO400M-16-SigLIP-i18n-256.json │ │ │ ├── ViT-SO400M-16-SigLIP2-256.json │ │ │ ├── ViT-SO400M-16-SigLIP2-384.json │ │ │ ├── ViT-SO400M-16-SigLIP2-512.json │ │ │ ├── ViT-bigG-14-CLIPA-336.json │ │ │ ├── ViT-bigG-14-CLIPA.json │ │ │ ├── ViT-bigG-14-quickgelu.json │ │ │ ├── ViT-bigG-14-worldwide-378.json │ │ │ ├── ViT-bigG-14-worldwide.json │ │ │ ├── ViT-bigG-14.json │ │ │ ├── ViT-e-14.json │ │ │ ├── ViT-g-14.json │ │ │ ├── ViT-gopt-16-SigLIP2-256.json │ │ │ ├── ViT-gopt-16-SigLIP2-384.json │ │ │ ├── ViTamin-B-LTT.json │ │ │ ├── ViTamin-B.json │ │ │ ├── ViTamin-L-256.json │ │ │ ├── ViTamin-L-336.json │ │ │ ├── ViTamin-L-384.json │ │ │ ├── ViTamin-L.json │ │ │ ├── ViTamin-L2-256.json │ │ │ ├── ViTamin-L2-336.json │ │ │ ├── ViTamin-L2-384.json │ │ │ ├── ViTamin-L2.json │ │ │ ├── ViTamin-S-LTT.json │ │ │ ├── ViTamin-S.json │ │ │ ├── ViTamin-XL-256.json │ │ │ ├── ViTamin-XL-336.json │ │ │ ├── ViTamin-XL-384.json │ │ │ ├── coca_ViT-B-32.json │ │ │ ├── coca_ViT-L-14.json │ │ │ ├── coca_base.json │ │ │ ├── coca_roberta-ViT-B-32.json │ │ │ ├── convnext_base.json │ │ │ ├── convnext_base_w.json │ │ │ ├── convnext_base_w_320.json │ │ │ ├── convnext_large.json │ │ │ ├── convnext_large_d.json │ │ │ ├── convnext_large_d_320.json │ │ │ ├── convnext_small.json │ │ │ ├── convnext_tiny.json │ │ │ ├── convnext_xlarge.json │ │ │ ├── convnext_xxlarge.json │ │ │ ├── convnext_xxlarge_320.json │ │ │ ├── mt5-base-ViT-B-32.json │ │ │ ├── mt5-xl-ViT-H-14.json │ │ │ ├── nllb-clip-base-siglip.json │ │ │ ├── nllb-clip-base.json │ │ │ ├── nllb-clip-large-siglip.json │ │ │ ├── nllb-clip-large.json │ │ │ ├── roberta-ViT-B-32.json │ │ │ ├── swin_base_patch4_window7_224.json │ │ │ ├── vit_medium_patch16_gap_256.json │ │ │ ├── vit_relpos_medium_patch16_cls_224.json │ │ │ ├── xlm-roberta-base-ViT-B-32.json │ │ │ └── xlm-roberta-large-ViT-H-14.json │ │ ├── modified_resnet.py │ │ ├── openai.py │ │ ├── pos_embed.py │ │ ├── pretrained.py │ │ ├── push_to_hf_hub.py │ │ ├── timm_model.py │ │ ├── tokenizer.py │ │ ├── transform.py │ │ ├── transformer.py │ │ ├── utils.py │ │ ├── version.py │ │ ├── zero_shot_classifier.py │ │ └── zero_shot_metadata.py │ └── open_clip_train/ │ ├── __init__.py │ ├── data.py │ ├── distributed.py │ ├── file_utils.py │ ├── logger.py │ ├── main.py │ ├── params.py │ ├── precision.py │ ├── profiler.py │ ├── scheduler.py │ ├── train.py │ └── zero_shot.py ├── tests/ │ ├── test_download_pretrained.py │ ├── test_hf_model.py │ ├── test_inference.py │ ├── test_inference_simple.py │ ├── test_num_shards.py │ ├── test_training_simple.py │ ├── test_wds.py │ └── util_test.py └── tutorials/ └── int8_tutorial.ipynb