gitextract_egeq4lt4/ ├── .gitignore ├── CODEOWNERS ├── CODE_OF_CONDUCT.md ├── CONTRIBUTING-ARCHIVED.md ├── LICENSE ├── README.md ├── SECURITY.md ├── config_release/ │ ├── base_model.json │ ├── didemo_ret.json │ ├── msrvtt_qa.json │ ├── msrvtt_ret.json │ ├── msvd_qa.json │ ├── pretrain_alpro.json │ ├── pretrain_prompter.json │ ├── timesformer_divst_8x32_224_k600.json │ └── timesformer_divst_8x32_224_k600_gc.json ├── env/ │ ├── install_pkg.sh │ └── requirements.txt ├── run_scripts/ │ ├── clear_cuda_cache.sh │ ├── ft_didemo_ret.sh │ ├── ft_msrvtt_qa.sh │ ├── ft_msrvtt_ret.sh │ ├── ft_msvd_qa.sh │ ├── inf_didemo_ret.sh │ ├── inf_msrvtt_qa.sh │ ├── inf_msrvtt_ret.sh │ ├── inf_msvd_qa.sh │ ├── pt_alpro.sh │ └── pt_prompter.sh └── src/ ├── __init__.py ├── configs/ │ └── config.py ├── datasets/ │ ├── data_utils.py │ ├── dataloader.py │ ├── dataset_base.py │ ├── dataset_pretrain_sparse.py │ ├── dataset_video_qa.py │ ├── dataset_video_retrieval.py │ └── randaugment.py ├── modeling/ │ ├── alpro_models.py │ ├── timesformer/ │ │ ├── __init__.py │ │ ├── conv2d_same.py │ │ ├── features.py │ │ ├── helpers.py │ │ ├── linear.py │ │ ├── operators.py │ │ ├── vit.py │ │ └── vit_utils.py │ ├── transformers.py │ └── xbert.py ├── optimization/ │ ├── adamw.py │ ├── sched.py │ └── utils.py ├── pretrain/ │ ├── run_pretrain_contrastive_only.py │ └── run_pretrain_sparse.py ├── tasks/ │ ├── run_video_qa.py │ └── run_video_retrieval.py └── utils/ ├── basic_utils.py ├── distributed.py ├── grad_ckpt.py ├── load_save.py ├── logger.py └── misc.py