gitextract_bls1cq2k/ ├── CODE_OF_CONDUCT.md ├── CONTRIBUTING.md ├── GETTING_STARTED.md ├── INSTALL.md ├── LICENSE ├── MODEL_ZOO.md ├── README.md ├── VISUALIZATION_TOOLS.md ├── ava_evaluation/ │ ├── README.md │ ├── ava_action_list_v2.1_for_activitynet_2018.pbtxt.txt │ ├── label_map_util.py │ ├── metrics.py │ ├── np_box_list.py │ ├── np_box_list_ops.py │ ├── np_box_mask_list.py │ ├── np_box_mask_list_ops.py │ ├── np_box_ops.py │ ├── np_mask_ops.py │ ├── object_detection_evaluation.py │ ├── per_image_evaluation.py │ └── standard_fields.py ├── configs/ │ ├── AVA/ │ │ ├── SLOWFAST_32x2_R50_SHORT.yaml │ │ ├── SLOW_8x8_R50_SHORT.yaml │ │ └── c2/ │ │ ├── SLOWFAST_32x2_R101_50_50.yaml │ │ ├── SLOWFAST_32x2_R101_50_50_v2.1.yaml │ │ ├── SLOWFAST_32x2_R50.yaml │ │ ├── SLOWFAST_64x2_R101_50_50.yaml │ │ └── SLOW_8x8_R50.yaml │ ├── Charades/ │ │ ├── SLOWFAST_16x8_R50.yaml │ │ ├── SLOWFAST_16x8_R50_multigrid.yaml │ │ └── pytorchvideo/ │ │ ├── SLOWFAST_8x8_R50.yaml │ │ └── SLOW_8x8_R50.yaml │ ├── ImageNet/ │ │ ├── MVIT_B_16_CONV.yaml │ │ ├── MVITv2_B.yaml │ │ ├── MVITv2_S.yaml │ │ ├── MVITv2_T.yaml │ │ ├── RES_R50.yaml │ │ ├── REV_MVIT_B_16_CONV.yaml │ │ ├── REV_VIT_B.yaml │ │ └── REV_VIT_S.yaml │ ├── Kinetics/ │ │ ├── C2D_8x8_R50.yaml │ │ ├── C2D_8x8_R50_IN1K.yaml │ │ ├── C2D_NLN_8x8_R50.yaml │ │ ├── C2D_NLN_8x8_R50_IN1K.yaml │ │ ├── I3D_8x8_R101.yaml │ │ ├── I3D_8x8_R50.yaml │ │ ├── I3D_8x8_R50_IN1K.yaml │ │ ├── I3D_NLN_8x8_R101.yaml │ │ ├── I3D_NLN_8x8_R50.yaml │ │ ├── I3D_NLN_8x8_R50_IN1K.yaml │ │ ├── MVIT_B_16x4_CONV.yaml │ │ ├── MVIT_B_32x3_CONV.yaml │ │ ├── MVITv2_B_32x3.yaml │ │ ├── MVITv2_L_40x3_test.yaml │ │ ├── MVITv2_S_16x4.yaml │ │ ├── REV_MVIT_B_16x4_CONV.yaml │ │ ├── SLOWFAST_4x16_R50.yaml │ │ ├── SLOWFAST_8x8_R50.yaml │ │ ├── SLOWFAST_8x8_R50_stepwise.yaml │ │ ├── SLOWFAST_8x8_R50_stepwise_multigrid.yaml │ │ ├── SLOWFAST_NLN_4x16_R50.yaml │ │ ├── SLOWFAST_NLN_8x8_R50.yaml │ │ ├── SLOW_4x16_R50.yaml │ │ ├── SLOW_8x8_R50.yaml │ │ ├── SLOW_NLN_4x16_R50.yaml │ │ ├── SLOW_NLN_8x8_R50.yaml │ │ ├── X3D_L.yaml │ │ ├── X3D_M.yaml │ │ ├── X3D_S.yaml │ │ ├── X3D_XS.yaml │ │ ├── c2/ │ │ │ ├── C2D_NOPOOL_8x8_R50.yaml │ │ │ ├── I3D_8x8_R50.yaml │ │ │ ├── I3D_NLN_8x8_R50.yaml │ │ │ ├── SLOWFAST_16x8_R101_50_50.yaml │ │ │ ├── SLOWFAST_4x16_R50.yaml │ │ │ ├── SLOWFAST_8x8_R101_101_101.yaml │ │ │ ├── SLOWFAST_8x8_R101_50_101.yaml │ │ │ ├── SLOWFAST_8x8_R101_50_50.yaml │ │ │ ├── SLOWFAST_8x8_R50.yaml │ │ │ ├── SLOWFAST_NLN_16x8_R101_50_50.yaml │ │ │ ├── SLOW_4x16_R50.yaml │ │ │ └── SLOW_8x8_R50.yaml │ │ └── pytorchvideo/ │ │ ├── C2D_8x8_R50.yaml │ │ ├── CSN_32x2_R101.yaml │ │ ├── I3D_8x8_R50.yaml │ │ ├── MVIT_B_16x4_CONV.yaml │ │ ├── R2PLUS1D_16x4_R50.yaml │ │ ├── SLOWFAST_16x8_R101_50_50.yaml │ │ ├── SLOWFAST_4x16_R50.yaml │ │ ├── SLOWFAST_8x8_R101.yaml │ │ ├── SLOWFAST_8x8_R50.yaml │ │ ├── SLOW_4x16_R50.yaml │ │ ├── SLOW_8x8_R50.yaml │ │ ├── X3D_L.yaml │ │ ├── X3D_M.yaml │ │ ├── X3D_S.yaml │ │ └── X3D_XS.yaml │ ├── SSv2/ │ │ ├── MVITv2_B_32x3.yaml │ │ ├── MVITv2_L_40x3.yaml │ │ ├── MVITv2_S_16x4.yaml │ │ ├── SLOWFAST_16x8_R50.yaml │ │ ├── SLOWFAST_16x8_R50_multigrid.yaml │ │ └── pytorchvideo/ │ │ ├── SLOWFAST_8x8_R50.yaml │ │ └── SLOW_8x8_R50.yaml │ ├── contrastive_ssl/ │ │ ├── BYOL_SlowR50_8x8.yaml │ │ ├── MoCo_SlowR50_8x8.yaml │ │ ├── SimCLR_SlowR50_8x8.yaml │ │ ├── SwAV_Slow_R50_8x8.yaml │ │ ├── finetune_SSv2_Slow_R50_syn0.yaml │ │ ├── finetune_SSv2_Slow_R50_syn8.yaml │ │ ├── finetune_ava_Slow_R50_syn0.yaml │ │ ├── finetune_ava_Slow_R50_syn8.yaml │ │ ├── finetune_ucf_Slow_R50_syn0.yaml │ │ ├── finetune_ucf_Slow_R50_syn8.yaml │ │ ├── linear_k400_Slow_8x8_R50_syn0.yaml │ │ └── linear_k400_Slow_8x8_R50_syn8.yaml │ └── masked_ssl/ │ ├── in1k_VIT_B_MaskFeat_FT.yaml │ ├── in1k_VIT_B_MaskFeat_PT.yaml │ ├── in1k_VIT_L_MaskFeat_FT.yaml │ ├── in1k_VIT_L_MaskFeat_PT.yaml │ ├── k400_MVITv2_L_16x4_FT.yaml │ ├── k400_MVITv2_L_16x4_MaskFeat_PT.yaml │ ├── k400_MVITv2_S_16x4_FT.yaml │ ├── k400_MVITv2_S_16x4_MaskFeat_PT.yaml │ ├── k400_VIT_B_16x4_FT.yaml │ ├── k400_VIT_B_16x4_MAE_PT.yaml │ ├── k400_VIT_H_16x4_FT.yaml │ ├── k400_VIT_H_16x4_MAE_PT.yaml │ ├── k400_VIT_L_16x4_FT.yaml │ └── k400_VIT_L_16x4_MAE_PT.yaml ├── demo/ │ ├── AVA/ │ │ └── SLOWFAST_32x2_R101_50_50.yaml │ └── Kinetics/ │ └── SLOWFAST_8x8_R50.yaml ├── linter.sh ├── projects/ │ ├── contrastive_ssl/ │ │ └── README.md │ ├── mae/ │ │ └── README.md │ ├── maskfeat/ │ │ └── README.md │ ├── multigrid/ │ │ └── README.md │ ├── mvit/ │ │ └── README.md │ ├── mvitv2/ │ │ └── README.md │ ├── pytorchvideo/ │ │ └── README.md │ ├── rev/ │ │ └── README.md │ └── x3d/ │ └── README.md ├── setup.cfg ├── setup.py ├── slowfast/ │ ├── __init__.py │ ├── config/ │ │ ├── __init__.py │ │ ├── custom_config.py │ │ └── defaults.py │ ├── datasets/ │ │ ├── DATASET.md │ │ ├── __init__.py │ │ ├── ava_dataset.py │ │ ├── ava_helper.py │ │ ├── build.py │ │ ├── charades.py │ │ ├── cv2_transform.py │ │ ├── decoder.py │ │ ├── imagenet.py │ │ ├── kinetics.py │ │ ├── loader.py │ │ ├── mixup.py │ │ ├── multigrid_helper.py │ │ ├── ptv_datasets.py │ │ ├── rand_augment.py │ │ ├── random_erasing.py │ │ ├── ssv2.py │ │ ├── transform.py │ │ ├── utils.py │ │ └── video_container.py │ ├── models/ │ │ ├── __init__.py │ │ ├── attention.py │ │ ├── batchnorm_helper.py │ │ ├── build.py │ │ ├── common.py │ │ ├── contrastive.py │ │ ├── custom_video_model_builder.py │ │ ├── head_helper.py │ │ ├── losses.py │ │ ├── masked.py │ │ ├── nonlocal_helper.py │ │ ├── operators.py │ │ ├── optimizer.py │ │ ├── ptv_model_builder.py │ │ ├── resnet_helper.py │ │ ├── reversible_mvit.py │ │ ├── stem_helper.py │ │ ├── utils.py │ │ └── video_model_builder.py │ ├── utils/ │ │ ├── __init__.py │ │ ├── ava_eval_helper.py │ │ ├── benchmark.py │ │ ├── bn_helper.py │ │ ├── c2_model_loading.py │ │ ├── checkpoint.py │ │ ├── distributed.py │ │ ├── env.py │ │ ├── logging.py │ │ ├── lr_policy.py │ │ ├── meters.py │ │ ├── metrics.py │ │ ├── misc.py │ │ ├── multigrid.py │ │ ├── multiprocessing.py │ │ ├── parser.py │ │ └── weight_init_helper.py │ └── visualization/ │ ├── __init__.py │ ├── async_predictor.py │ ├── ava_demo_precomputed_boxes.py │ ├── demo_loader.py │ ├── gradcam_utils.py │ ├── prediction_vis.py │ ├── predictor.py │ ├── tensorboard_vis.py │ ├── utils.py │ └── video_visualizer.py └── tools/ ├── benchmark.py ├── demo_net.py ├── run_net.py ├── test_net.py ├── train_net.py └── visualization.py