gitextract_mycvvgja/ ├── CogVideo/ │ ├── .github/ │ │ ├── ISSUE_TEMPLATE/ │ │ │ ├── bug_report.yaml │ │ │ └── feature-request.yaml │ │ └── PULL_REQUEST_TEMPLATE/ │ │ └── pr_template.md │ ├── .gitignore │ ├── LICENSE │ ├── MODEL_LICENSE │ ├── README.md │ ├── README_ja.md │ ├── README_zh.md │ ├── download.sh │ ├── finetune/ │ │ ├── README.md │ │ ├── README_ja.md │ │ ├── README_zh.md │ │ ├── accelerate_config_machine_single.yaml │ │ ├── accelerate_config_machine_single_debug.yaml │ │ ├── finetune_single_rank_injector.sh │ │ ├── finetune_single_rank_lora.sh │ │ ├── hostfile.txt │ │ ├── models/ │ │ │ ├── attention.py │ │ │ ├── attention_processor.py │ │ │ ├── cogvideox_transformer_3d.py │ │ │ ├── embeddings.py │ │ │ ├── pipeline_cogvideox.py │ │ │ ├── pipeline_output.py │ │ │ └── utils.py │ │ ├── train_cogvideox_injector.py │ │ └── train_cogvideox_lora.py │ ├── inference/ │ │ ├── 3dtrajmaster_inference.py │ │ ├── entity_zoo.txt │ │ └── location_zoo.txt │ ├── pyproject.toml │ ├── requirements.txt │ ├── tools/ │ │ ├── caption/ │ │ │ ├── README.md │ │ │ ├── README_ja.md │ │ │ ├── README_zh.md │ │ │ ├── requirements.txt │ │ │ └── video_caption.py │ │ ├── convert_weight_sat2hf.py │ │ ├── export_sat_lora_weight.py │ │ ├── llm_flux_cogvideox/ │ │ │ ├── generate.sh │ │ │ ├── gradio_page.py │ │ │ └── llm_flux_cogvideox.py │ │ ├── load_cogvideox_lora.py │ │ ├── parallel_inference/ │ │ │ ├── parallel_inference_xdit.py │ │ │ └── run.sh │ │ ├── replicate/ │ │ │ ├── cog.yaml │ │ │ ├── predict_i2v.py │ │ │ └── predict_t2v.py │ │ └── venhancer/ │ │ ├── README.md │ │ ├── README_ja.md │ │ └── README_zh.md │ └── weights/ │ └── put weights here.txt ├── README.md ├── dataset/ │ ├── load_dataset.py │ ├── traj_vis/ │ │ ├── D_loc1_61_t3n13_003d_Hemi12_1.json │ │ ├── Hemi12_transforms.json │ │ └── location_data_desert.json │ ├── utils.py │ └── vis_trajectory.py └── eval/ ├── GVHMR/ │ ├── .gitignore │ ├── .gitmodules │ ├── LICENSE │ ├── README.md │ ├── docs/ │ │ └── INSTALL.md │ ├── download_eval_pose.sh │ ├── eval.sh │ ├── hmr4d/ │ │ ├── __init__.py │ │ ├── build_gvhmr.py │ │ ├── configs/ │ │ │ ├── __init__.py │ │ │ ├── data/ │ │ │ │ └── mocap/ │ │ │ │ ├── testY.yaml │ │ │ │ └── trainX_testY.yaml │ │ │ ├── demo.yaml │ │ │ ├── exp/ │ │ │ │ └── gvhmr/ │ │ │ │ └── mixed/ │ │ │ │ └── mixed.yaml │ │ │ ├── global/ │ │ │ │ ├── debug/ │ │ │ │ │ ├── debug_train.yaml │ │ │ │ │ └── debug_train_limit_data.yaml │ │ │ │ └── task/ │ │ │ │ └── gvhmr/ │ │ │ │ ├── test_3dpw.yaml │ │ │ │ ├── test_3dpw_emdb_rich.yaml │ │ │ │ ├── test_emdb.yaml │ │ │ │ └── test_rich.yaml │ │ │ ├── hydra/ │ │ │ │ └── default.yaml │ │ │ ├── siga24_release.yaml │ │ │ ├── store_gvhmr.py │ │ │ └── train.yaml │ │ ├── datamodule/ │ │ │ └── mocap_trainX_testY.py │ │ ├── dataset/ │ │ │ ├── bedlam/ │ │ │ │ ├── bedlam.py │ │ │ │ ├── resource/ │ │ │ │ │ └── vname2lwh.pt │ │ │ │ └── utils.py │ │ │ ├── emdb/ │ │ │ │ ├── emdb_motion_test.py │ │ │ │ └── utils.py │ │ │ ├── h36m/ │ │ │ │ ├── camera-parameters.json │ │ │ │ ├── h36m.py │ │ │ │ └── utils.py │ │ │ ├── imgfeat_motion/ │ │ │ │ └── base_dataset.py │ │ │ ├── pure_motion/ │ │ │ │ ├── amass.py │ │ │ │ ├── base_dataset.py │ │ │ │ ├── cam_traj_utils.py │ │ │ │ └── utils.py │ │ │ ├── rich/ │ │ │ │ ├── resource/ │ │ │ │ │ ├── cam2params.pt │ │ │ │ │ ├── seqname2imgrange.json │ │ │ │ │ ├── test.txt │ │ │ │ │ ├── train.txt │ │ │ │ │ ├── val.txt │ │ │ │ │ └── w2az_sahmr.json │ │ │ │ ├── rich_motion_test.py │ │ │ │ └── rich_utils.py │ │ │ └── threedpw/ │ │ │ ├── threedpw_motion_test.py │ │ │ ├── threedpw_motion_train.py │ │ │ └── utils.py │ │ ├── model/ │ │ │ ├── common_utils/ │ │ │ │ ├── optimizer.py │ │ │ │ ├── scheduler.py │ │ │ │ └── scheduler_cfg.py │ │ │ └── gvhmr/ │ │ │ ├── callbacks/ │ │ │ │ ├── metric_3dpw.py │ │ │ │ ├── metric_emdb.py │ │ │ │ └── metric_rich.py │ │ │ ├── gvhmr_pl.py │ │ │ ├── gvhmr_pl_demo.py │ │ │ ├── pipeline/ │ │ │ │ └── gvhmr_pipeline.py │ │ │ └── utils/ │ │ │ ├── endecoder.py │ │ │ ├── postprocess.py │ │ │ └── stats_compose.py │ │ ├── network/ │ │ │ ├── base_arch/ │ │ │ │ ├── embeddings/ │ │ │ │ │ └── rotary_embedding.py │ │ │ │ └── transformer/ │ │ │ │ ├── encoder_rope.py │ │ │ │ └── layer.py │ │ │ ├── gvhmr/ │ │ │ │ └── relative_transformer.py │ │ │ └── hmr2/ │ │ │ ├── __init__.py │ │ │ ├── components/ │ │ │ │ ├── __init__.py │ │ │ │ ├── pose_transformer.py │ │ │ │ └── t_cond_mlp.py │ │ │ ├── configs/ │ │ │ │ ├── __init__.py │ │ │ │ ├── model_config.yaml │ │ │ │ └── smpl_mean_params.npz │ │ │ ├── hmr2.py │ │ │ ├── smpl_head.py │ │ │ ├── utils/ │ │ │ │ ├── geometry.py │ │ │ │ ├── preproc.py │ │ │ │ └── smpl_wrapper.py │ │ │ └── vit.py │ │ └── utils/ │ │ ├── body_model/ │ │ │ ├── README.md │ │ │ ├── __init__.py │ │ │ ├── body_model.py │ │ │ ├── body_model_smplh.py │ │ │ ├── body_model_smplx.py │ │ │ ├── coco_aug_dict.pth │ │ │ ├── min_lbs.py │ │ │ ├── seg_part_info.npy │ │ │ ├── smpl_3dpw14_J_regressor_sparse.pt │ │ │ ├── smpl_coco17_J_regressor.pt │ │ │ ├── smpl_lite.py │ │ │ ├── smpl_neutral_J_regressor.pt │ │ │ ├── smpl_vert_segmentation.json │ │ │ ├── smplx2smpl_sparse.pt │ │ │ ├── smplx_lite.py │ │ │ ├── smplx_verts437.pt │ │ │ └── utils.py │ │ ├── callbacks/ │ │ │ ├── lr_monitor.py │ │ │ ├── prog_bar.py │ │ │ ├── simple_ckpt_saver.py │ │ │ └── train_speed_timer.py │ │ ├── comm/ │ │ │ └── gather.py │ │ ├── eval/ │ │ │ └── eval_utils.py │ │ ├── geo/ │ │ │ ├── augment_noisy_pose.py │ │ │ ├── flip_utils.py │ │ │ ├── hmr_cam.py │ │ │ ├── hmr_global.py │ │ │ ├── quaternion.py │ │ │ └── transforms.py │ │ ├── geo_transform.py │ │ ├── ik/ │ │ │ └── ccd_ik.py │ │ ├── kpts/ │ │ │ └── kp2d_utils.py │ │ ├── matrix.py │ │ ├── net_utils.py │ │ ├── preproc/ │ │ │ ├── __init__.py │ │ │ ├── slam.py │ │ │ ├── tracker.py │ │ │ ├── vitfeat_extractor.py │ │ │ ├── vitpose.py │ │ │ └── vitpose_pytorch/ │ │ │ ├── __init__.py │ │ │ └── src/ │ │ │ └── vitpose_infer/ │ │ │ ├── __init__.py │ │ │ ├── builder/ │ │ │ │ ├── __init__.py │ │ │ │ ├── backbones/ │ │ │ │ │ ├── __init__.py │ │ │ │ │ ├── alexnet.py │ │ │ │ │ ├── cpm.py │ │ │ │ │ ├── hourglass.py │ │ │ │ │ ├── hourglass_ae.py │ │ │ │ │ ├── hrformer.py │ │ │ │ │ ├── litehrnet.py │ │ │ │ │ ├── mobilenet_v2.py │ │ │ │ │ ├── mobilenet_v3.py │ │ │ │ │ ├── mspn.py │ │ │ │ │ ├── regnet.py │ │ │ │ │ ├── resnest.py │ │ │ │ │ ├── resnext.py │ │ │ │ │ ├── rsn.py │ │ │ │ │ ├── scnet.py │ │ │ │ │ ├── seresnet.py │ │ │ │ │ ├── seresnext.py │ │ │ │ │ ├── shufflenet_v1.py │ │ │ │ │ ├── shufflenet_v2.py │ │ │ │ │ ├── tcn.py │ │ │ │ │ ├── test_torch.py │ │ │ │ │ ├── utils/ │ │ │ │ │ │ ├── __init__.py │ │ │ │ │ │ ├── channel_shuffle.py │ │ │ │ │ │ ├── inverted_residual.py │ │ │ │ │ │ ├── make_divisible.py │ │ │ │ │ │ ├── se_layer.py │ │ │ │ │ │ └── utils.py │ │ │ │ │ ├── vgg.py │ │ │ │ │ ├── vipnas_mbv3.py │ │ │ │ │ ├── vipnas_resnet.py │ │ │ │ │ └── vit.py │ │ │ │ ├── configs/ │ │ │ │ │ └── coco/ │ │ │ │ │ ├── ViTPose_base_coco_256x192.py │ │ │ │ │ ├── ViTPose_base_simple_coco_256x192.py │ │ │ │ │ ├── ViTPose_huge_coco_256x192.py │ │ │ │ │ ├── ViTPose_huge_simple_coco_256x192.py │ │ │ │ │ ├── ViTPose_large_coco_256x192.py │ │ │ │ │ ├── ViTPose_large_simple_coco_256x192.py │ │ │ │ │ └── __init__.py │ │ │ │ ├── heads/ │ │ │ │ │ ├── __init__.py │ │ │ │ │ ├── deconv_head.py │ │ │ │ │ ├── deeppose_regression_head.py │ │ │ │ │ ├── hmr_head.py │ │ │ │ │ ├── interhand_3d_head.py │ │ │ │ │ ├── temporal_regression_head.py │ │ │ │ │ ├── topdown_heatmap_base_head.py │ │ │ │ │ ├── topdown_heatmap_multi_stage_head.py │ │ │ │ │ ├── topdown_heatmap_simple_head.py │ │ │ │ │ ├── vipnas_heatmap_simple_head.py │ │ │ │ │ └── voxelpose_head.py │ │ │ │ └── model_builder.py │ │ │ ├── model_builder.py │ │ │ └── pose_utils/ │ │ │ ├── ViTPose_trt.py │ │ │ ├── __init__.py │ │ │ ├── convert_to_trt.py │ │ │ ├── general_utils.py │ │ │ ├── inference_test.py │ │ │ ├── logger_helper.py │ │ │ ├── pose_utils.py │ │ │ ├── pose_viz.py │ │ │ ├── timerr.py │ │ │ └── visualizer.py │ │ ├── pylogger.py │ │ ├── seq_utils.py │ │ ├── smplx_utils.py │ │ ├── video_io_utils.py │ │ ├── vis/ │ │ │ ├── README.md │ │ │ ├── cv2_utils.py │ │ │ ├── renderer.py │ │ │ ├── renderer_tools.py │ │ │ ├── renderer_utils.py │ │ │ └── rich_logger.py │ │ └── wis3d_utils.py │ ├── pyproject.toml │ ├── pyrightconfig.json │ ├── requirements.txt │ ├── setup.py │ └── tools/ │ ├── demo/ │ │ ├── colab_demo.ipynb │ │ ├── demo.py │ │ └── demo_folder.py │ ├── eval_pose.py │ ├── train.py │ ├── unitest/ │ │ ├── make_hydra_cfg.py │ │ └── run_dataset.py │ └── video/ │ ├── merge_folder.py │ ├── merge_horizontal.py │ └── merge_vertical.py └── common_metrics_on_video_quality/ ├── .gitignore ├── README.md ├── calculate_clip.py ├── calculate_fvd.py ├── calculate_fvd_styleganv.py ├── calculate_lpips.py ├── calculate_psnr.py ├── calculate_ssim.py ├── download_eval_visual.sh ├── eval_prompts.json └── eval_visual.sh