gitextract_fz6ux05f/ ├── .gitignore ├── CITATION.cff ├── HISTORY.md ├── LICENSE ├── MANIFEST.in ├── Makefile ├── README.md ├── data/ │ ├── annotation/ │ │ ├── kaggle_bird/ │ │ │ └── metadata.csv │ │ ├── meta-album/ │ │ │ ├── FNG_Mini/ │ │ │ │ └── metadata.csv │ │ │ ├── INS_2_Mini/ │ │ │ │ └── metadata.csv │ │ │ ├── INS_Mini/ │ │ │ │ └── metadata.csv │ │ │ ├── MED_LF_Mini/ │ │ │ │ └── metadata.csv │ │ │ ├── PLK_Mini/ │ │ │ │ └── metadata.csv │ │ │ ├── PLT_DOC_Mini/ │ │ │ │ └── metadata.csv │ │ │ ├── PLT_NET_Mini/ │ │ │ │ └── metadata.csv │ │ │ └── PLT_VIL_Mini/ │ │ │ └── metadata.csv │ │ └── rare_species/ │ │ └── metadata.csv │ ├── eol/ │ │ └── scraped_page_ids.csv │ ├── inat/ │ │ └── common-names-mapping.json │ └── rarespecies/ │ ├── seen_in_training.json │ └── unseen_in_training.json ├── docs/ │ ├── imageomics/ │ │ ├── BioCLIP_ModelCard.md │ │ ├── RareSpecies_DatasetCard.md │ │ ├── ToL-10M_DatasetCard.md │ │ ├── evaluation.md │ │ ├── figure-creation.md │ │ ├── training-data-osc.md │ │ ├── training-data-sources.md │ │ ├── training.md │ │ └── treeoflife10m.md │ └── open_clip/ │ ├── Interacting_with_open_clip.ipynb │ ├── Interacting_with_open_coca.ipynb │ └── clip_conceptual_captions.md ├── eval_few_shot.sh ├── eval_zero_shot.sh ├── justfile ├── pyproject.toml ├── requirements-training.txt ├── requirements-training.yml ├── requirements-viz.txt ├── requirements.txt ├── requirements.yml ├── scripts/ │ ├── README.md │ ├── download_data.sh │ ├── evobio10m/ │ │ ├── check_taxa.py │ │ ├── check_wds.py │ │ ├── get_data_stats.py │ │ ├── make_catalog.py │ │ ├── make_catalog_reproduce.py │ │ ├── make_license_files.py │ │ ├── make_mapping.py │ │ ├── make_metadata.py │ │ ├── make_splits.py │ │ ├── make_wds.py │ │ ├── make_wds_reproduce.py │ │ └── taxa_viz.py │ ├── get_media_manifest.py │ ├── get_missing_page_ids.py │ ├── global_names_resolver.py │ ├── inat21_to_wds.py │ ├── inat_common_names.py │ ├── reproduce_tree-of-life-10m.sh │ ├── setup_download_tol-10m_components.bash │ └── submit_download_tol-10m_components.bash ├── setup.py ├── slurm/ │ ├── check-wds.slurm │ ├── download_bioscan.slurm │ ├── download_eol.slurm │ ├── download_inat21.slurm │ ├── download_metadata.slurm │ ├── make-catalog_reproduce.slurm │ ├── make-dataset-mapping.sh │ ├── make-dataset-wds.sh │ ├── make-dataset-wds_reproduce.sh │ └── train.sh ├── src/ │ ├── evaluation/ │ │ ├── README.md │ │ ├── __init__.py │ │ ├── create_final_figure.py │ │ ├── create_zoom_figure.py │ │ ├── data.py │ │ ├── extract_features.py │ │ ├── few_shot.py │ │ ├── hierarchy_tree_image.py │ │ ├── params.py │ │ ├── utils.py │ │ └── zero_shot_iid.py │ ├── imageomics/ │ │ ├── __init__.py │ │ ├── disk.py │ │ ├── disk_reproduce.py │ │ ├── eol.py │ │ ├── eol_reproduce.py │ │ ├── evobio10m.py │ │ ├── evobio10m_reproduce.py │ │ ├── helpers.py │ │ ├── naming.py │ │ ├── naming_eval.py │ │ ├── naming_reproduce.py │ │ ├── test_naming.py │ │ ├── test_wds.py │ │ └── wds.py │ ├── open_clip/ │ │ ├── __init__.py │ │ ├── coca_model.py │ │ ├── constants.py │ │ ├── factory.py │ │ ├── generation_utils.py │ │ ├── hf_configs.py │ │ ├── hf_model.py │ │ ├── loss.py │ │ ├── model.py │ │ ├── model_configs/ │ │ │ ├── RN101-quickgelu.json │ │ │ ├── RN101.json │ │ │ ├── RN50-quickgelu.json │ │ │ ├── RN50.json │ │ │ ├── RN50x16.json │ │ │ ├── RN50x4.json │ │ │ ├── RN50x64.json │ │ │ ├── ViT-B-16-plus-240.json │ │ │ ├── ViT-B-16-plus.json │ │ │ ├── ViT-B-16.json │ │ │ ├── ViT-B-32-plus-256.json │ │ │ ├── ViT-B-32-quickgelu.json │ │ │ ├── ViT-B-32.json │ │ │ ├── ViT-H-14.json │ │ │ ├── ViT-H-16.json │ │ │ ├── ViT-L-14-280.json │ │ │ ├── ViT-L-14-336.json │ │ │ ├── ViT-L-14.json │ │ │ ├── ViT-L-16-320.json │ │ │ ├── ViT-L-16.json │ │ │ ├── ViT-M-16-alt.json │ │ │ ├── ViT-M-16.json │ │ │ ├── ViT-M-32-alt.json │ │ │ ├── ViT-M-32.json │ │ │ ├── ViT-S-16-alt.json │ │ │ ├── ViT-S-16.json │ │ │ ├── ViT-S-32-alt.json │ │ │ ├── ViT-S-32.json │ │ │ ├── ViT-bigG-14.json │ │ │ ├── ViT-e-14.json │ │ │ ├── ViT-g-14.json │ │ │ ├── coca_ViT-B-32.json │ │ │ ├── coca_ViT-L-14.json │ │ │ ├── coca_base.json │ │ │ ├── coca_roberta-ViT-B-32.json │ │ │ ├── convnext_base.json │ │ │ ├── convnext_base_w.json │ │ │ ├── convnext_base_w_320.json │ │ │ ├── convnext_large.json │ │ │ ├── convnext_large_d.json │ │ │ ├── convnext_large_d_320.json │ │ │ ├── convnext_small.json │ │ │ ├── convnext_tiny.json │ │ │ ├── convnext_xlarge.json │ │ │ ├── convnext_xxlarge.json │ │ │ ├── convnext_xxlarge_320.json │ │ │ ├── mt5-base-ViT-B-32.json │ │ │ ├── mt5-xl-ViT-H-14.json │ │ │ ├── roberta-ViT-B-32.json │ │ │ ├── swin_base_patch4_window7_224.json │ │ │ ├── vit_medium_patch16_gap_256.json │ │ │ ├── vit_relpos_medium_patch16_cls_224.json │ │ │ ├── xlm-roberta-base-ViT-B-32.json │ │ │ └── xlm-roberta-large-ViT-H-14.json │ │ ├── modified_resnet.py │ │ ├── openai.py │ │ ├── pretrained.py │ │ ├── push_to_hf_hub.py │ │ ├── timm_model.py │ │ ├── tokenizer.py │ │ ├── transform.py │ │ ├── transformer.py │ │ ├── utils.py │ │ └── version.py │ └── training/ │ ├── .gitignore │ ├── __init__.py │ ├── data.py │ ├── distributed.py │ ├── file_utils.py │ ├── imagenet_zeroshot_data.py │ ├── logger.py │ ├── main.py │ ├── params.py │ ├── precision.py │ ├── profile.py │ ├── scheduler.py │ ├── train.py │ └── zero_shot.py └── train.sh