gitextract_wjd3xpkj/ ├── .github/ │ ├── ISSUE_TEMPLATE/ │ │ ├── bug_report.yml │ │ └── config.yml │ └── workflows/ │ ├── lint.yaml │ └── tests.yml ├── .gitignore ├── LICENSE ├── README.md ├── annotator/ │ ├── __init__.py │ ├── anime_face_segment/ │ │ ├── LICENSE │ │ └── __init__.py │ ├── annotator_path.py │ ├── binary/ │ │ └── __init__.py │ ├── canny/ │ │ └── __init__.py │ ├── clipvision/ │ │ ├── __init__.py │ │ ├── clip_vision_h_uc.data │ │ └── clip_vision_vith_uc.data │ ├── color/ │ │ └── __init__.py │ ├── densepose/ │ │ ├── __init__.py │ │ └── densepose.py │ ├── depth_anything.py │ ├── depth_anything_v2.py │ ├── hed/ │ │ └── __init__.py │ ├── keypose/ │ │ ├── __init__.py │ │ ├── faster_rcnn_r50_fpn_coco.py │ │ └── hrnet_w48_coco_256x192.py │ ├── lama/ │ │ ├── __init__.py │ │ ├── config.yaml │ │ └── saicinpainting/ │ │ ├── __init__.py │ │ ├── training/ │ │ │ ├── __init__.py │ │ │ ├── data/ │ │ │ │ ├── __init__.py │ │ │ │ └── masks.py │ │ │ ├── losses/ │ │ │ │ ├── __init__.py │ │ │ │ ├── adversarial.py │ │ │ │ ├── constants.py │ │ │ │ ├── distance_weighting.py │ │ │ │ ├── feature_matching.py │ │ │ │ ├── perceptual.py │ │ │ │ ├── segmentation.py │ │ │ │ └── style_loss.py │ │ │ ├── modules/ │ │ │ │ ├── __init__.py │ │ │ │ ├── base.py │ │ │ │ ├── depthwise_sep_conv.py │ │ │ │ ├── fake_fakes.py │ │ │ │ ├── ffc.py │ │ │ │ ├── multidilated_conv.py │ │ │ │ ├── multiscale.py │ │ │ │ ├── pix2pixhd.py │ │ │ │ ├── spatial_transform.py │ │ │ │ └── squeeze_excitation.py │ │ │ ├── trainers/ │ │ │ │ ├── __init__.py │ │ │ │ ├── base.py │ │ │ │ └── default.py │ │ │ └── visualizers/ │ │ │ ├── __init__.py │ │ │ ├── base.py │ │ │ ├── colors.py │ │ │ ├── directory.py │ │ │ └── noop.py │ │ └── utils.py │ ├── leres/ │ │ ├── __init__.py │ │ ├── leres/ │ │ │ ├── LICENSE │ │ │ ├── Resnet.py │ │ │ ├── Resnext_torch.py │ │ │ ├── depthmap.py │ │ │ ├── multi_depth_model_woauxi.py │ │ │ ├── net_tools.py │ │ │ └── network_auxi.py │ │ └── pix2pix/ │ │ ├── LICENSE │ │ ├── models/ │ │ │ ├── __init__.py │ │ │ ├── base_model.py │ │ │ ├── base_model_hg.py │ │ │ ├── networks.py │ │ │ └── pix2pix4depth_model.py │ │ ├── options/ │ │ │ ├── __init__.py │ │ │ ├── base_options.py │ │ │ └── test_options.py │ │ └── util/ │ │ ├── __init__.py │ │ ├── get_data.py │ │ ├── guidedfilter.py │ │ ├── html.py │ │ ├── image_pool.py │ │ ├── util.py │ │ └── visualizer.py │ ├── lineart/ │ │ ├── LICENSE │ │ └── __init__.py │ ├── lineart_anime/ │ │ ├── LICENSE │ │ └── __init__.py │ ├── manga_line/ │ │ ├── LICENSE │ │ └── __init__.py │ ├── mediapipe_face/ │ │ ├── __init__.py │ │ └── mediapipe_face_common.py │ ├── midas/ │ │ ├── LICENSE │ │ ├── __init__.py │ │ ├── api.py │ │ ├── midas/ │ │ │ ├── __init__.py │ │ │ ├── base_model.py │ │ │ ├── blocks.py │ │ │ ├── dpt_depth.py │ │ │ ├── midas_net.py │ │ │ ├── midas_net_custom.py │ │ │ ├── transforms.py │ │ │ └── vit.py │ │ └── utils.py │ ├── mlsd/ │ │ ├── LICENSE │ │ ├── __init__.py │ │ ├── models/ │ │ │ ├── mbv2_mlsd_large.py │ │ │ └── mbv2_mlsd_tiny.py │ │ └── utils.py │ ├── mmpkg/ │ │ ├── mmcv/ │ │ │ ├── __init__.py │ │ │ ├── arraymisc/ │ │ │ │ ├── __init__.py │ │ │ │ └── quantization.py │ │ │ ├── cnn/ │ │ │ │ ├── __init__.py │ │ │ │ ├── alexnet.py │ │ │ │ ├── bricks/ │ │ │ │ │ ├── __init__.py │ │ │ │ │ ├── activation.py │ │ │ │ │ ├── context_block.py │ │ │ │ │ ├── conv.py │ │ │ │ │ ├── conv2d_adaptive_padding.py │ │ │ │ │ ├── conv_module.py │ │ │ │ │ ├── conv_ws.py │ │ │ │ │ ├── depthwise_separable_conv_module.py │ │ │ │ │ ├── drop.py │ │ │ │ │ ├── generalized_attention.py │ │ │ │ │ ├── hsigmoid.py │ │ │ │ │ ├── hswish.py │ │ │ │ │ ├── non_local.py │ │ │ │ │ ├── norm.py │ │ │ │ │ ├── padding.py │ │ │ │ │ ├── plugin.py │ │ │ │ │ ├── registry.py │ │ │ │ │ ├── scale.py │ │ │ │ │ ├── swish.py │ │ │ │ │ ├── transformer.py │ │ │ │ │ ├── upsample.py │ │ │ │ │ └── wrappers.py │ │ │ │ ├── builder.py │ │ │ │ ├── resnet.py │ │ │ │ ├── utils/ │ │ │ │ │ ├── __init__.py │ │ │ │ │ ├── flops_counter.py │ │ │ │ │ ├── fuse_conv_bn.py │ │ │ │ │ ├── sync_bn.py │ │ │ │ │ └── weight_init.py │ │ │ │ └── vgg.py │ │ │ ├── engine/ │ │ │ │ ├── __init__.py │ │ │ │ └── test.py │ │ │ ├── fileio/ │ │ │ │ ├── __init__.py │ │ │ │ ├── file_client.py │ │ │ │ ├── handlers/ │ │ │ │ │ ├── __init__.py │ │ │ │ │ ├── base.py │ │ │ │ │ ├── json_handler.py │ │ │ │ │ ├── pickle_handler.py │ │ │ │ │ └── yaml_handler.py │ │ │ │ ├── io.py │ │ │ │ └── parse.py │ │ │ ├── image/ │ │ │ │ ├── __init__.py │ │ │ │ ├── colorspace.py │ │ │ │ ├── geometric.py │ │ │ │ ├── io.py │ │ │ │ ├── misc.py │ │ │ │ └── photometric.py │ │ │ ├── model_zoo/ │ │ │ │ ├── deprecated.json │ │ │ │ ├── mmcls.json │ │ │ │ └── open_mmlab.json │ │ │ ├── ops/ │ │ │ │ ├── __init__.py │ │ │ │ ├── assign_score_withk.py │ │ │ │ ├── ball_query.py │ │ │ │ ├── bbox.py │ │ │ │ ├── border_align.py │ │ │ │ ├── box_iou_rotated.py │ │ │ │ ├── carafe.py │ │ │ │ ├── cc_attention.py │ │ │ │ ├── contour_expand.py │ │ │ │ ├── corner_pool.py │ │ │ │ ├── correlation.py │ │ │ │ ├── deform_conv.py │ │ │ │ ├── deform_roi_pool.py │ │ │ │ ├── deprecated_wrappers.py │ │ │ │ ├── focal_loss.py │ │ │ │ ├── furthest_point_sample.py │ │ │ │ ├── fused_bias_leakyrelu.py │ │ │ │ ├── gather_points.py │ │ │ │ ├── group_points.py │ │ │ │ ├── info.py │ │ │ │ ├── iou3d.py │ │ │ │ ├── knn.py │ │ │ │ ├── masked_conv.py │ │ │ │ ├── merge_cells.py │ │ │ │ ├── modulated_deform_conv.py │ │ │ │ ├── multi_scale_deform_attn.py │ │ │ │ ├── nms.py │ │ │ │ ├── pixel_group.py │ │ │ │ ├── point_sample.py │ │ │ │ ├── points_in_boxes.py │ │ │ │ ├── points_sampler.py │ │ │ │ ├── psa_mask.py │ │ │ │ ├── roi_align.py │ │ │ │ ├── roi_align_rotated.py │ │ │ │ ├── roi_pool.py │ │ │ │ ├── roiaware_pool3d.py │ │ │ │ ├── roipoint_pool3d.py │ │ │ │ ├── saconv.py │ │ │ │ ├── scatter_points.py │ │ │ │ ├── sync_bn.py │ │ │ │ ├── three_interpolate.py │ │ │ │ ├── three_nn.py │ │ │ │ ├── tin_shift.py │ │ │ │ ├── upfirdn2d.py │ │ │ │ └── voxelize.py │ │ │ ├── parallel/ │ │ │ │ ├── __init__.py │ │ │ │ ├── _functions.py │ │ │ │ ├── collate.py │ │ │ │ ├── data_container.py │ │ │ │ ├── data_parallel.py │ │ │ │ ├── distributed.py │ │ │ │ ├── distributed_deprecated.py │ │ │ │ ├── registry.py │ │ │ │ ├── scatter_gather.py │ │ │ │ └── utils.py │ │ │ ├── runner/ │ │ │ │ ├── __init__.py │ │ │ │ ├── base_module.py │ │ │ │ ├── base_runner.py │ │ │ │ ├── builder.py │ │ │ │ ├── checkpoint.py │ │ │ │ ├── default_constructor.py │ │ │ │ ├── dist_utils.py │ │ │ │ ├── epoch_based_runner.py │ │ │ │ ├── fp16_utils.py │ │ │ │ ├── hooks/ │ │ │ │ │ ├── __init__.py │ │ │ │ │ ├── checkpoint.py │ │ │ │ │ ├── closure.py │ │ │ │ │ ├── ema.py │ │ │ │ │ ├── evaluation.py │ │ │ │ │ ├── hook.py │ │ │ │ │ ├── iter_timer.py │ │ │ │ │ ├── logger/ │ │ │ │ │ │ ├── __init__.py │ │ │ │ │ │ ├── base.py │ │ │ │ │ │ ├── dvclive.py │ │ │ │ │ │ ├── mlflow.py │ │ │ │ │ │ ├── neptune.py │ │ │ │ │ │ ├── pavi.py │ │ │ │ │ │ ├── tensorboard.py │ │ │ │ │ │ ├── text.py │ │ │ │ │ │ └── wandb.py │ │ │ │ │ ├── lr_updater.py │ │ │ │ │ ├── memory.py │ │ │ │ │ ├── momentum_updater.py │ │ │ │ │ ├── optimizer.py │ │ │ │ │ ├── profiler.py │ │ │ │ │ ├── sampler_seed.py │ │ │ │ │ └── sync_buffer.py │ │ │ │ ├── iter_based_runner.py │ │ │ │ ├── log_buffer.py │ │ │ │ ├── optimizer/ │ │ │ │ │ ├── __init__.py │ │ │ │ │ ├── builder.py │ │ │ │ │ └── default_constructor.py │ │ │ │ ├── priority.py │ │ │ │ └── utils.py │ │ │ ├── utils/ │ │ │ │ ├── __init__.py │ │ │ │ ├── config.py │ │ │ │ ├── env.py │ │ │ │ ├── ext_loader.py │ │ │ │ ├── logging.py │ │ │ │ ├── misc.py │ │ │ │ ├── parrots_jit.py │ │ │ │ ├── parrots_wrapper.py │ │ │ │ ├── path.py │ │ │ │ ├── progressbar.py │ │ │ │ ├── registry.py │ │ │ │ ├── testing.py │ │ │ │ ├── timer.py │ │ │ │ ├── trace.py │ │ │ │ └── version_utils.py │ │ │ ├── version.py │ │ │ ├── video/ │ │ │ │ ├── __init__.py │ │ │ │ ├── io.py │ │ │ │ ├── optflow.py │ │ │ │ └── processing.py │ │ │ └── visualization/ │ │ │ ├── __init__.py │ │ │ ├── color.py │ │ │ ├── image.py │ │ │ └── optflow.py │ │ └── mmseg/ │ │ ├── apis/ │ │ │ ├── __init__.py │ │ │ ├── inference.py │ │ │ ├── test.py │ │ │ └── train.py │ │ ├── core/ │ │ │ ├── __init__.py │ │ │ ├── evaluation/ │ │ │ │ ├── __init__.py │ │ │ │ ├── class_names.py │ │ │ │ ├── eval_hooks.py │ │ │ │ └── metrics.py │ │ │ ├── seg/ │ │ │ │ ├── __init__.py │ │ │ │ ├── builder.py │ │ │ │ └── sampler/ │ │ │ │ ├── __init__.py │ │ │ │ ├── base_pixel_sampler.py │ │ │ │ └── ohem_pixel_sampler.py │ │ │ └── utils/ │ │ │ ├── __init__.py │ │ │ └── misc.py │ │ ├── datasets/ │ │ │ ├── __init__.py │ │ │ ├── ade.py │ │ │ ├── builder.py │ │ │ ├── chase_db1.py │ │ │ ├── cityscapes.py │ │ │ ├── custom.py │ │ │ ├── dataset_wrappers.py │ │ │ ├── drive.py │ │ │ ├── hrf.py │ │ │ ├── pascal_context.py │ │ │ ├── pipelines/ │ │ │ │ ├── __init__.py │ │ │ │ ├── compose.py │ │ │ │ ├── formating.py │ │ │ │ ├── loading.py │ │ │ │ ├── test_time_aug.py │ │ │ │ └── transforms.py │ │ │ ├── stare.py │ │ │ └── voc.py │ │ ├── models/ │ │ │ ├── __init__.py │ │ │ ├── backbones/ │ │ │ │ ├── __init__.py │ │ │ │ ├── cgnet.py │ │ │ │ ├── fast_scnn.py │ │ │ │ ├── hrnet.py │ │ │ │ ├── mobilenet_v2.py │ │ │ │ ├── mobilenet_v3.py │ │ │ │ ├── resnest.py │ │ │ │ ├── resnet.py │ │ │ │ ├── resnext.py │ │ │ │ ├── unet.py │ │ │ │ └── vit.py │ │ │ ├── builder.py │ │ │ ├── decode_heads/ │ │ │ │ ├── __init__.py │ │ │ │ ├── ann_head.py │ │ │ │ ├── apc_head.py │ │ │ │ ├── aspp_head.py │ │ │ │ ├── cascade_decode_head.py │ │ │ │ ├── cc_head.py │ │ │ │ ├── da_head.py │ │ │ │ ├── decode_head.py │ │ │ │ ├── dm_head.py │ │ │ │ ├── dnl_head.py │ │ │ │ ├── ema_head.py │ │ │ │ ├── enc_head.py │ │ │ │ ├── fcn_head.py │ │ │ │ ├── fpn_head.py │ │ │ │ ├── gc_head.py │ │ │ │ ├── lraspp_head.py │ │ │ │ ├── nl_head.py │ │ │ │ ├── ocr_head.py │ │ │ │ ├── point_head.py │ │ │ │ ├── psa_head.py │ │ │ │ ├── psp_head.py │ │ │ │ ├── sep_aspp_head.py │ │ │ │ ├── sep_fcn_head.py │ │ │ │ └── uper_head.py │ │ │ ├── losses/ │ │ │ │ ├── __init__.py │ │ │ │ ├── accuracy.py │ │ │ │ ├── cross_entropy_loss.py │ │ │ │ ├── dice_loss.py │ │ │ │ ├── lovasz_loss.py │ │ │ │ └── utils.py │ │ │ ├── necks/ │ │ │ │ ├── __init__.py │ │ │ │ ├── fpn.py │ │ │ │ └── multilevel_neck.py │ │ │ ├── segmentors/ │ │ │ │ ├── __init__.py │ │ │ │ ├── base.py │ │ │ │ ├── cascade_encoder_decoder.py │ │ │ │ └── encoder_decoder.py │ │ │ └── utils/ │ │ │ ├── __init__.py │ │ │ ├── drop.py │ │ │ ├── inverted_residual.py │ │ │ ├── make_divisible.py │ │ │ ├── res_layer.py │ │ │ ├── se_layer.py │ │ │ ├── self_attention_block.py │ │ │ ├── up_conv_block.py │ │ │ └── weight_init.py │ │ ├── ops/ │ │ │ ├── __init__.py │ │ │ ├── encoding.py │ │ │ └── wrappers.py │ │ └── utils/ │ │ ├── __init__.py │ │ ├── collect_env.py │ │ └── logger.py │ ├── mobile_sam/ │ │ └── __init__.py │ ├── normalbae/ │ │ ├── LICENSE │ │ ├── __init__.py │ │ └── models/ │ │ ├── NNET.py │ │ ├── baseline.py │ │ └── submodules/ │ │ ├── decoder.py │ │ ├── efficientnet_repo/ │ │ │ ├── .gitignore │ │ │ ├── BENCHMARK.md │ │ │ ├── LICENSE │ │ │ ├── README.md │ │ │ ├── caffe2_benchmark.py │ │ │ ├── caffe2_validate.py │ │ │ ├── geffnet/ │ │ │ │ ├── __init__.py │ │ │ │ ├── activations/ │ │ │ │ │ ├── __init__.py │ │ │ │ │ ├── activations.py │ │ │ │ │ ├── activations_jit.py │ │ │ │ │ └── activations_me.py │ │ │ │ ├── config.py │ │ │ │ ├── conv2d_layers.py │ │ │ │ ├── efficientnet_builder.py │ │ │ │ ├── gen_efficientnet.py │ │ │ │ ├── helpers.py │ │ │ │ ├── mobilenetv3.py │ │ │ │ ├── model_factory.py │ │ │ │ └── version.py │ │ │ ├── hubconf.py │ │ │ ├── onnx_export.py │ │ │ ├── onnx_optimize.py │ │ │ ├── onnx_to_caffe.py │ │ │ ├── onnx_validate.py │ │ │ ├── requirements.txt │ │ │ ├── setup.py │ │ │ ├── utils.py │ │ │ └── validate.py │ │ ├── encoder.py │ │ └── submodules.py │ ├── normaldsine/ │ │ ├── LICENSE │ │ └── __init__.py │ ├── oneformer/ │ │ ├── LICENSE │ │ ├── __init__.py │ │ ├── api.py │ │ ├── configs/ │ │ │ ├── ade20k/ │ │ │ │ ├── Base-ADE20K-UnifiedSegmentation.yaml │ │ │ │ ├── oneformer_R50_bs16_160k.yaml │ │ │ │ └── oneformer_swin_large_IN21k_384_bs16_160k.yaml │ │ │ └── coco/ │ │ │ ├── Base-COCO-UnifiedSegmentation.yaml │ │ │ ├── oneformer_R50_bs16_50ep.yaml │ │ │ └── oneformer_swin_large_IN21k_384_bs16_100ep.yaml │ │ ├── detectron2/ │ │ │ ├── __init__.py │ │ │ ├── checkpoint/ │ │ │ │ ├── __init__.py │ │ │ │ ├── c2_model_loading.py │ │ │ │ ├── catalog.py │ │ │ │ └── detection_checkpoint.py │ │ │ ├── config/ │ │ │ │ ├── __init__.py │ │ │ │ ├── compat.py │ │ │ │ ├── config.py │ │ │ │ ├── defaults.py │ │ │ │ ├── instantiate.py │ │ │ │ └── lazy.py │ │ │ ├── data/ │ │ │ │ ├── __init__.py │ │ │ │ ├── benchmark.py │ │ │ │ ├── build.py │ │ │ │ ├── catalog.py │ │ │ │ ├── common.py │ │ │ │ ├── dataset_mapper.py │ │ │ │ ├── datasets/ │ │ │ │ │ ├── README.md │ │ │ │ │ ├── __init__.py │ │ │ │ │ ├── builtin.py │ │ │ │ │ ├── builtin_meta.py │ │ │ │ │ ├── cityscapes.py │ │ │ │ │ ├── cityscapes_panoptic.py │ │ │ │ │ ├── coco.py │ │ │ │ │ ├── coco_panoptic.py │ │ │ │ │ ├── lvis.py │ │ │ │ │ ├── lvis_v0_5_categories.py │ │ │ │ │ ├── lvis_v1_categories.py │ │ │ │ │ ├── lvis_v1_category_image_count.py │ │ │ │ │ ├── pascal_voc.py │ │ │ │ │ └── register_coco.py │ │ │ │ ├── detection_utils.py │ │ │ │ ├── samplers/ │ │ │ │ │ ├── __init__.py │ │ │ │ │ ├── distributed_sampler.py │ │ │ │ │ └── grouped_batch_sampler.py │ │ │ │ └── transforms/ │ │ │ │ ├── __init__.py │ │ │ │ ├── augmentation.py │ │ │ │ ├── augmentation_impl.py │ │ │ │ └── transform.py │ │ │ ├── engine/ │ │ │ │ ├── __init__.py │ │ │ │ ├── defaults.py │ │ │ │ ├── hooks.py │ │ │ │ ├── launch.py │ │ │ │ └── train_loop.py │ │ │ ├── evaluation/ │ │ │ │ ├── __init__.py │ │ │ │ ├── cityscapes_evaluation.py │ │ │ │ ├── coco_evaluation.py │ │ │ │ ├── evaluator.py │ │ │ │ ├── fast_eval_api.py │ │ │ │ ├── lvis_evaluation.py │ │ │ │ ├── panoptic_evaluation.py │ │ │ │ ├── pascal_voc_evaluation.py │ │ │ │ ├── rotated_coco_evaluation.py │ │ │ │ ├── sem_seg_evaluation.py │ │ │ │ └── testing.py │ │ │ ├── export/ │ │ │ │ ├── README.md │ │ │ │ ├── __init__.py │ │ │ │ ├── api.py │ │ │ │ ├── c10.py │ │ │ │ ├── caffe2_export.py │ │ │ │ ├── caffe2_inference.py │ │ │ │ ├── caffe2_modeling.py │ │ │ │ ├── caffe2_patch.py │ │ │ │ ├── flatten.py │ │ │ │ ├── shared.py │ │ │ │ ├── torchscript.py │ │ │ │ └── torchscript_patch.py │ │ │ ├── layers/ │ │ │ │ ├── __init__.py │ │ │ │ ├── aspp.py │ │ │ │ ├── batch_norm.py │ │ │ │ ├── blocks.py │ │ │ │ ├── csrc/ │ │ │ │ │ ├── README.md │ │ │ │ │ ├── ROIAlignRotated/ │ │ │ │ │ │ ├── ROIAlignRotated.h │ │ │ │ │ │ ├── ROIAlignRotated_cpu.cpp │ │ │ │ │ │ └── ROIAlignRotated_cuda.cu │ │ │ │ │ ├── box_iou_rotated/ │ │ │ │ │ │ ├── box_iou_rotated.h │ │ │ │ │ │ ├── box_iou_rotated_cpu.cpp │ │ │ │ │ │ ├── box_iou_rotated_cuda.cu │ │ │ │ │ │ └── box_iou_rotated_utils.h │ │ │ │ │ ├── cocoeval/ │ │ │ │ │ │ ├── cocoeval.cpp │ │ │ │ │ │ └── cocoeval.h │ │ │ │ │ ├── cuda_version.cu │ │ │ │ │ ├── deformable/ │ │ │ │ │ │ ├── deform_conv.h │ │ │ │ │ │ ├── deform_conv_cuda.cu │ │ │ │ │ │ └── deform_conv_cuda_kernel.cu │ │ │ │ │ ├── nms_rotated/ │ │ │ │ │ │ ├── nms_rotated.h │ │ │ │ │ │ ├── nms_rotated_cpu.cpp │ │ │ │ │ │ └── nms_rotated_cuda.cu │ │ │ │ │ └── vision.cpp │ │ │ │ ├── deform_conv.py │ │ │ │ ├── losses.py │ │ │ │ ├── mask_ops.py │ │ │ │ ├── nms.py │ │ │ │ ├── roi_align.py │ │ │ │ ├── roi_align_rotated.py │ │ │ │ ├── rotated_boxes.py │ │ │ │ ├── shape_spec.py │ │ │ │ └── wrappers.py │ │ │ ├── model_zoo/ │ │ │ │ ├── __init__.py │ │ │ │ └── model_zoo.py │ │ │ ├── modeling/ │ │ │ │ ├── __init__.py │ │ │ │ ├── anchor_generator.py │ │ │ │ ├── backbone/ │ │ │ │ │ ├── __init__.py │ │ │ │ │ ├── backbone.py │ │ │ │ │ ├── build.py │ │ │ │ │ ├── fpn.py │ │ │ │ │ ├── mvit.py │ │ │ │ │ ├── regnet.py │ │ │ │ │ ├── resnet.py │ │ │ │ │ ├── swin.py │ │ │ │ │ ├── utils.py │ │ │ │ │ └── vit.py │ │ │ │ ├── box_regression.py │ │ │ │ ├── matcher.py │ │ │ │ ├── meta_arch/ │ │ │ │ │ ├── __init__.py │ │ │ │ │ ├── build.py │ │ │ │ │ ├── dense_detector.py │ │ │ │ │ ├── fcos.py │ │ │ │ │ ├── panoptic_fpn.py │ │ │ │ │ ├── rcnn.py │ │ │ │ │ ├── retinanet.py │ │ │ │ │ └── semantic_seg.py │ │ │ │ ├── mmdet_wrapper.py │ │ │ │ ├── poolers.py │ │ │ │ ├── postprocessing.py │ │ │ │ ├── proposal_generator/ │ │ │ │ │ ├── __init__.py │ │ │ │ │ ├── build.py │ │ │ │ │ ├── proposal_utils.py │ │ │ │ │ ├── rpn.py │ │ │ │ │ └── rrpn.py │ │ │ │ ├── roi_heads/ │ │ │ │ │ ├── __init__.py │ │ │ │ │ ├── box_head.py │ │ │ │ │ ├── cascade_rcnn.py │ │ │ │ │ ├── fast_rcnn.py │ │ │ │ │ ├── keypoint_head.py │ │ │ │ │ ├── mask_head.py │ │ │ │ │ ├── roi_heads.py │ │ │ │ │ └── rotated_fast_rcnn.py │ │ │ │ ├── sampling.py │ │ │ │ └── test_time_augmentation.py │ │ │ ├── projects/ │ │ │ │ ├── README.md │ │ │ │ ├── __init__.py │ │ │ │ └── deeplab/ │ │ │ │ ├── __init__.py │ │ │ │ ├── build_solver.py │ │ │ │ ├── config.py │ │ │ │ ├── loss.py │ │ │ │ ├── lr_scheduler.py │ │ │ │ ├── resnet.py │ │ │ │ └── semantic_seg.py │ │ │ ├── solver/ │ │ │ │ ├── __init__.py │ │ │ │ ├── build.py │ │ │ │ └── lr_scheduler.py │ │ │ ├── structures/ │ │ │ │ ├── __init__.py │ │ │ │ ├── boxes.py │ │ │ │ ├── image_list.py │ │ │ │ ├── instances.py │ │ │ │ ├── keypoints.py │ │ │ │ ├── masks.py │ │ │ │ └── rotated_boxes.py │ │ │ ├── tracking/ │ │ │ │ ├── __init__.py │ │ │ │ ├── base_tracker.py │ │ │ │ ├── bbox_iou_tracker.py │ │ │ │ ├── hungarian_tracker.py │ │ │ │ ├── iou_weighted_hungarian_bbox_iou_tracker.py │ │ │ │ ├── utils.py │ │ │ │ └── vanilla_hungarian_bbox_iou_tracker.py │ │ │ └── utils/ │ │ │ ├── README.md │ │ │ ├── __init__.py │ │ │ ├── analysis.py │ │ │ ├── collect_env.py │ │ │ ├── colormap.py │ │ │ ├── comm.py │ │ │ ├── develop.py │ │ │ ├── env.py │ │ │ ├── events.py │ │ │ ├── file_io.py │ │ │ ├── logger.py │ │ │ ├── memory.py │ │ │ ├── registry.py │ │ │ ├── serialize.py │ │ │ ├── testing.py │ │ │ ├── tracing.py │ │ │ ├── video_visualizer.py │ │ │ └── visualizer.py │ │ ├── oneformer/ │ │ │ ├── __init__.py │ │ │ ├── config.py │ │ │ ├── data/ │ │ │ │ ├── __init__.py │ │ │ │ ├── build.py │ │ │ │ ├── dataset_mappers/ │ │ │ │ │ ├── __init__.py │ │ │ │ │ ├── coco_unified_new_baseline_dataset_mapper.py │ │ │ │ │ ├── dataset_mapper.py │ │ │ │ │ └── oneformer_unified_dataset_mapper.py │ │ │ │ ├── datasets/ │ │ │ │ │ ├── __init__.py │ │ │ │ │ ├── register_ade20k_instance.py │ │ │ │ │ ├── register_ade20k_panoptic.py │ │ │ │ │ ├── register_cityscapes_panoptic.py │ │ │ │ │ ├── register_coco_panoptic2instance.py │ │ │ │ │ └── register_coco_panoptic_annos_semseg.py │ │ │ │ └── tokenizer.py │ │ │ ├── demo/ │ │ │ │ ├── colormap.py │ │ │ │ ├── defaults.py │ │ │ │ ├── predictor.py │ │ │ │ └── visualizer.py │ │ │ ├── evaluation/ │ │ │ │ ├── __init__.py │ │ │ │ ├── cityscapes_evaluation.py │ │ │ │ ├── coco_evaluator.py │ │ │ │ ├── detection_coco_evaluator.py │ │ │ │ ├── evaluator.py │ │ │ │ └── instance_evaluation.py │ │ │ ├── modeling/ │ │ │ │ ├── __init__.py │ │ │ │ ├── backbone/ │ │ │ │ │ ├── __init__.py │ │ │ │ │ ├── dinat.py │ │ │ │ │ └── swin.py │ │ │ │ ├── matcher.py │ │ │ │ ├── meta_arch/ │ │ │ │ │ ├── __init__.py │ │ │ │ │ └── oneformer_head.py │ │ │ │ ├── pixel_decoder/ │ │ │ │ │ ├── __init__.py │ │ │ │ │ ├── fpn.py │ │ │ │ │ ├── msdeformattn.py │ │ │ │ │ └── ops/ │ │ │ │ │ ├── functions/ │ │ │ │ │ │ ├── __init__.py │ │ │ │ │ │ └── ms_deform_attn_func.py │ │ │ │ │ ├── make.sh │ │ │ │ │ ├── modules/ │ │ │ │ │ │ ├── __init__.py │ │ │ │ │ │ └── ms_deform_attn.py │ │ │ │ │ ├── setup.py │ │ │ │ │ ├── src/ │ │ │ │ │ │ ├── cpu/ │ │ │ │ │ │ │ ├── ms_deform_attn_cpu.cpp │ │ │ │ │ │ │ └── ms_deform_attn_cpu.h │ │ │ │ │ │ ├── cuda/ │ │ │ │ │ │ │ ├── ms_deform_attn_cuda.cu │ │ │ │ │ │ │ ├── ms_deform_attn_cuda.h │ │ │ │ │ │ │ └── ms_deform_im2col_cuda.cuh │ │ │ │ │ │ ├── ms_deform_attn.h │ │ │ │ │ │ └── vision.cpp │ │ │ │ │ └── test.py │ │ │ │ └── transformer_decoder/ │ │ │ │ ├── __init__.py │ │ │ │ ├── oneformer_transformer_decoder.py │ │ │ │ ├── position_encoding.py │ │ │ │ ├── text_transformer.py │ │ │ │ └── transformer.py │ │ │ ├── oneformer_model.py │ │ │ └── utils/ │ │ │ ├── __init__.py │ │ │ ├── box_ops.py │ │ │ ├── events.py │ │ │ ├── misc.py │ │ │ └── pos_embed.py │ │ └── pycocotools/ │ │ ├── __init__.py │ │ ├── coco.py │ │ ├── cocoeval.py │ │ └── mask.py │ ├── openpose/ │ │ ├── LICENSE │ │ ├── __init__.py │ │ ├── animalpose.py │ │ ├── body.py │ │ ├── cv_ox_det.py │ │ ├── cv_ox_pose.py │ │ ├── face.py │ │ ├── hand.py │ │ ├── model.py │ │ ├── types.py │ │ ├── util.py │ │ └── wholebody.py │ ├── pidinet/ │ │ ├── LICENSE │ │ ├── __init__.py │ │ └── model.py │ ├── shuffle/ │ │ └── __init__.py │ ├── teed/ │ │ ├── Fmish.py │ │ ├── Fsmish.py │ │ ├── LICENSE.txt │ │ ├── Xmish.py │ │ ├── Xsmish.py │ │ ├── __init__.py │ │ └── ted.py │ ├── uniformer/ │ │ ├── LICENSE │ │ ├── __init__.py │ │ ├── configs/ │ │ │ └── _base_/ │ │ │ ├── datasets/ │ │ │ │ ├── ade20k.py │ │ │ │ ├── chase_db1.py │ │ │ │ ├── cityscapes.py │ │ │ │ ├── cityscapes_769x769.py │ │ │ │ ├── drive.py │ │ │ │ ├── hrf.py │ │ │ │ ├── pascal_context.py │ │ │ │ ├── pascal_context_59.py │ │ │ │ ├── pascal_voc12.py │ │ │ │ ├── pascal_voc12_aug.py │ │ │ │ └── stare.py │ │ │ ├── default_runtime.py │ │ │ ├── models/ │ │ │ │ ├── ann_r50-d8.py │ │ │ │ ├── apcnet_r50-d8.py │ │ │ │ ├── ccnet_r50-d8.py │ │ │ │ ├── cgnet.py │ │ │ │ ├── danet_r50-d8.py │ │ │ │ ├── deeplabv3_r50-d8.py │ │ │ │ ├── deeplabv3_unet_s5-d16.py │ │ │ │ ├── deeplabv3plus_r50-d8.py │ │ │ │ ├── dmnet_r50-d8.py │ │ │ │ ├── dnl_r50-d8.py │ │ │ │ ├── emanet_r50-d8.py │ │ │ │ ├── encnet_r50-d8.py │ │ │ │ ├── fast_scnn.py │ │ │ │ ├── fcn_hr18.py │ │ │ │ ├── fcn_r50-d8.py │ │ │ │ ├── fcn_unet_s5-d16.py │ │ │ │ ├── fpn_r50.py │ │ │ │ ├── fpn_uniformer.py │ │ │ │ ├── gcnet_r50-d8.py │ │ │ │ ├── lraspp_m-v3-d8.py │ │ │ │ ├── nonlocal_r50-d8.py │ │ │ │ ├── ocrnet_hr18.py │ │ │ │ ├── ocrnet_r50-d8.py │ │ │ │ ├── pointrend_r50.py │ │ │ │ ├── psanet_r50-d8.py │ │ │ │ ├── pspnet_r50-d8.py │ │ │ │ ├── pspnet_unet_s5-d16.py │ │ │ │ ├── upernet_r50.py │ │ │ │ └── upernet_uniformer.py │ │ │ └── schedules/ │ │ │ ├── schedule_160k.py │ │ │ ├── schedule_20k.py │ │ │ ├── schedule_40k.py │ │ │ └── schedule_80k.py │ │ ├── inference.py │ │ ├── mmcv_custom/ │ │ │ ├── __init__.py │ │ │ └── checkpoint.py │ │ ├── uniformer.py │ │ └── upernet_global_small.py │ ├── util.py │ └── zoe/ │ ├── LICENSE │ ├── __init__.py │ └── zoedepth/ │ ├── models/ │ │ ├── __init__.py │ │ ├── base_models/ │ │ │ ├── __init__.py │ │ │ ├── midas.py │ │ │ └── midas_repo/ │ │ │ ├── .gitignore │ │ │ ├── Dockerfile │ │ │ ├── LICENSE │ │ │ ├── README.md │ │ │ ├── environment.yaml │ │ │ ├── hubconf.py │ │ │ ├── input/ │ │ │ │ └── .placeholder │ │ │ ├── midas/ │ │ │ │ ├── backbones/ │ │ │ │ │ ├── beit.py │ │ │ │ │ ├── levit.py │ │ │ │ │ ├── next_vit.py │ │ │ │ │ ├── swin.py │ │ │ │ │ ├── swin2.py │ │ │ │ │ ├── swin_common.py │ │ │ │ │ ├── utils.py │ │ │ │ │ └── vit.py │ │ │ │ ├── base_model.py │ │ │ │ ├── blocks.py │ │ │ │ ├── dpt_depth.py │ │ │ │ ├── midas_net.py │ │ │ │ ├── midas_net_custom.py │ │ │ │ ├── model_loader.py │ │ │ │ └── transforms.py │ │ │ ├── output/ │ │ │ │ └── .placeholder │ │ │ ├── ros/ │ │ │ │ ├── LICENSE │ │ │ │ ├── README.md │ │ │ │ ├── additions/ │ │ │ │ │ ├── do_catkin_make.sh │ │ │ │ │ ├── downloads.sh │ │ │ │ │ ├── install_ros_melodic_ubuntu_17_18.sh │ │ │ │ │ ├── install_ros_noetic_ubuntu_20.sh │ │ │ │ │ └── make_package_cpp.sh │ │ │ │ ├── launch_midas_cpp.sh │ │ │ │ ├── midas_cpp/ │ │ │ │ │ ├── CMakeLists.txt │ │ │ │ │ ├── launch/ │ │ │ │ │ │ ├── midas_cpp.launch │ │ │ │ │ │ └── midas_talker_listener.launch │ │ │ │ │ ├── package.xml │ │ │ │ │ ├── scripts/ │ │ │ │ │ │ ├── listener.py │ │ │ │ │ │ ├── listener_original.py │ │ │ │ │ │ └── talker.py │ │ │ │ │ └── src/ │ │ │ │ │ └── main.cpp │ │ │ │ └── run_talker_listener_test.sh │ │ │ ├── run.py │ │ │ ├── tf/ │ │ │ │ ├── README.md │ │ │ │ ├── input/ │ │ │ │ │ └── .placeholder │ │ │ │ ├── make_onnx_model.py │ │ │ │ ├── output/ │ │ │ │ │ └── .placeholder │ │ │ │ ├── run_onnx.py │ │ │ │ ├── run_pb.py │ │ │ │ ├── transforms.py │ │ │ │ └── utils.py │ │ │ ├── utils.py │ │ │ └── weights/ │ │ │ └── .placeholder │ │ ├── builder.py │ │ ├── depth_model.py │ │ ├── layers/ │ │ │ ├── attractor.py │ │ │ ├── dist_layers.py │ │ │ ├── localbins_layers.py │ │ │ └── patch_transformer.py │ │ ├── model_io.py │ │ ├── zoedepth/ │ │ │ ├── __init__.py │ │ │ ├── config_zoedepth.json │ │ │ ├── config_zoedepth_kitti.json │ │ │ └── zoedepth_v1.py │ │ └── zoedepth_nk/ │ │ ├── __init__.py │ │ ├── config_zoedepth_nk.json │ │ └── zoedepth_nk_v1.py │ └── utils/ │ ├── __init__.py │ ├── arg_utils.py │ ├── config.py │ ├── easydict/ │ │ └── __init__.py │ ├── geometry.py │ └── misc.py ├── example/ │ ├── advanced_weighting_example/ │ │ └── api_advanced_weighting.py │ ├── chatgpt.py │ ├── inpaint_example/ │ │ └── api_inpaint.py │ ├── txt2img_example/ │ │ └── api_txt2img.py │ └── visual_chatgpt.ipynb ├── extract_controlnet.py ├── extract_controlnet_diff.py ├── install.py ├── internal_controlnet/ │ ├── __init__.py │ ├── args.py │ └── external_code.py ├── javascript/ │ ├── canvas.js │ ├── controlnet_unit.mjs │ ├── index.mjs │ ├── modal.mjs │ ├── openpose_editor.mjs │ └── photopea.mjs ├── models/ │ └── put_controlnet_models_here.txt ├── patch_version.py ├── preload.py ├── pyproject.toml ├── requirements.txt ├── scripts/ │ ├── adapter.py │ ├── animate_diff/ │ │ └── batch.py │ ├── api.py │ ├── batch_hijack.py │ ├── cldm.py │ ├── controlnet.py │ ├── controlnet_core/ │ │ └── controlnet_union.py │ ├── controlnet_diffusers.py │ ├── controlnet_lllite.py │ ├── controlnet_lora.py │ ├── controlnet_model_guess.py │ ├── controlnet_sparsectrl.py │ ├── controlnet_ui/ │ │ ├── advanced_weight_control.py │ │ ├── controlnet_ui_group.py │ │ ├── modal.py │ │ ├── openpose_editor.py │ │ └── photopea.py │ ├── controlnet_version.py │ ├── enums.py │ ├── external_code.py │ ├── global_state.py │ ├── hook.py │ ├── infotext.py │ ├── ipadapter/ │ │ ├── __init__.py │ │ ├── image_proj_models.py │ │ ├── ipadapter_model.py │ │ ├── plugable_ipadapter.py │ │ ├── presets.py │ │ ├── pulid_attn.py │ │ └── weight.py │ ├── logging.py │ ├── lvminthin.py │ ├── movie2movie.py │ ├── preprocessor/ │ │ ├── __init__.py │ │ ├── inpaint.py │ │ ├── ip_adapter_auto.py │ │ ├── lama_inpaint.py │ │ ├── legacy/ │ │ │ ├── legacy_preprocessors.py │ │ │ ├── preprocessor_compiled.py │ │ │ └── processor.py │ │ ├── mobile_sam.py │ │ ├── model_free_preprocessors.py │ │ ├── normal_dsine.py │ │ ├── pulid.py │ │ └── teed.py │ ├── supported_preprocessor.py │ ├── utils.py │ └── xyz_grid_support.py ├── style.css ├── tests/ │ ├── README.md │ ├── annotator_tests/ │ │ └── openpose_tests/ │ │ ├── body_test.py │ │ ├── detection_test.py │ │ ├── json_encode_test.py │ │ └── openpose_e2e_test_disabled.py │ ├── cn_script/ │ │ ├── __init__.py │ │ ├── batch_hijack_test.py │ │ ├── cn_script_test.py │ │ └── utils_test.py │ ├── conftest.py │ ├── external_code_api/ │ │ ├── __init__.py │ │ └── external_code_test.py │ ├── utils.py │ └── web_api/ │ ├── __init__.py │ ├── animal_pose.json │ ├── clip_mask_test.py │ ├── detect_test.py │ ├── effective_region_test.py │ ├── full_coverage/ │ │ ├── README.md │ │ ├── __init__.py │ │ ├── depth_test.py │ │ ├── inpaint_test.py │ │ ├── ipadapter_test.py │ │ └── template.py │ ├── generation_test.py │ ├── ipadapter_advanced_weighting.py │ ├── ipadapter_clip_api.py │ ├── modules_test.py │ ├── pose.json │ ├── render_openpose_json.py │ └── template.py ├── unit_tests/ │ ├── __init__.py │ └── args_test.py └── web_tests/ ├── README.md └── main.py