gitextract_6h_zq3l4/ ├── LICENSE ├── README.md ├── data/ │ ├── lxmert/ │ │ └── .gitignore │ ├── mscoco/ │ │ └── .gitignore │ ├── vg/ │ │ └── .gitignore │ ├── wiki/ │ │ ├── get_data_cased.bash │ │ ├── get_data_cased_untokenized.bash │ │ ├── install-tools.sh │ │ └── tools/ │ │ ├── remove_accent.py │ │ ├── segment_th.py │ │ └── tokenize.sh │ └── wiki103/ │ ├── get_data_cased.sh │ └── get_data_uncased.sh ├── requirements.txt ├── scripts/ │ ├── base_vlm_wiki.bash │ ├── base_vlm_wiki_glue.bash │ ├── base_wiki.bash │ ├── base_wiki_glue.bash │ ├── extract_keys.bash │ ├── mpvokenize_wiki.bash │ ├── mpvokenize_wiki103.bash │ ├── run_glue_at_epoch.bash │ ├── run_glue_epochs.bash │ ├── run_xmatching.bash │ ├── small_vlm_wiki103.bash │ ├── small_vlm_wiki103_glue.bash │ ├── small_wiki103.bash │ ├── small_wiki103_glue.bash │ └── xmatching_benchmark.bash ├── snap/ │ ├── bert/ │ │ └── .gitkeep │ ├── vlm/ │ │ └── .gitkeep │ └── xmatching/ │ └── .gitkeep ├── tokenization/ │ ├── to_hdf5.py │ ├── tokenize_dataset.py │ ├── tokenize_wiki103_bert.bash │ ├── tokenize_wiki103_roberta.bash │ ├── tokenize_wiki_bert.bash │ └── tokenize_wiki_roberta.bash ├── vlm/ │ ├── __init__.py │ ├── configs/ │ │ ├── bert-12L-768H.json │ │ ├── bert-4L-768H.json │ │ ├── bert-6L-512H.json │ │ └── bert_base.json │ ├── data.py │ ├── model.py │ ├── param.py │ ├── run_glue.py │ ├── run_glue_epochs.py │ ├── run_lm_distributed.py │ ├── run_vlm_distributed.py │ └── show_glue_results_epochs.py ├── vokenization/ │ ├── __init__.py │ ├── common.py │ ├── create_image_ids.py │ ├── evaluate_diversity.py │ ├── evaluate_retrieval.py │ ├── extract_vision_keys.py │ ├── indexing.py │ ├── revokenization.py │ ├── revokenize_corpus_mp.py │ ├── vokenization.py │ └── vokenize_corpus_mp.py └── xmatching/ ├── __init__.py ├── data.py ├── frozen_batch_norm.py ├── loss.py ├── main.py ├── metric.py ├── model.py └── param.py