gitextract_rhfo6abb/ ├── .github/ │ └── workflows/ │ └── lint.yaml ├── .gitignore ├── CODE_OF_CONDUCT.md ├── CONTRIBUTING.md ├── LICENSE ├── LICENSE_CELL_DINO_CODE ├── LICENSE_CELL_DINO_MODELS ├── LICENSE_XRAY_DINO_MODEL ├── MODEL_CARD.md ├── README.md ├── conda-extras.yaml ├── conda.yaml ├── dinov2/ │ ├── __init__.py │ ├── configs/ │ │ ├── __init__.py │ │ ├── eval/ │ │ │ ├── cell_dino/ │ │ │ │ ├── vitl16_channel_adaptive_pretrain.yaml │ │ │ │ └── vitl16_pretrain.yaml │ │ │ ├── vitb14_pretrain.yaml │ │ │ ├── vitb14_reg4_pretrain.yaml │ │ │ ├── vitg14_pretrain.yaml │ │ │ ├── vitg14_reg4_pretrain.yaml │ │ │ ├── vitl14_pretrain.yaml │ │ │ ├── vitl14_reg4_pretrain.yaml │ │ │ ├── vits14_pretrain.yaml │ │ │ └── vits14_reg4_pretrain.yaml │ │ ├── ssl_default_config.yaml │ │ └── train/ │ │ ├── cell_dino/ │ │ │ ├── vitl16_boc_hpafov.yaml │ │ │ ├── vitl16_hpafov.yaml │ │ │ └── vitl16_hpaone.yaml │ │ ├── vitg14.yaml │ │ ├── vitl14.yaml │ │ └── vitl16_short.yaml │ ├── data/ │ │ ├── __init__.py │ │ ├── accumulators.py │ │ ├── adapters.py │ │ ├── augmentations.py │ │ ├── cell_dino/ │ │ │ ├── augmentations.py │ │ │ └── transforms.py │ │ ├── collate.py │ │ ├── datasets/ │ │ │ ├── __init__.py │ │ │ ├── cell_dino/ │ │ │ │ ├── chammi_cp.py │ │ │ │ ├── chammi_hpa.py │ │ │ │ ├── chammi_wtc.py │ │ │ │ ├── hpafov.py │ │ │ │ └── hpaone.py │ │ │ ├── decoders.py │ │ │ ├── extended.py │ │ │ ├── image_net.py │ │ │ └── image_net_22k.py │ │ ├── loaders.py │ │ ├── masking.py │ │ ├── samplers.py │ │ └── transforms.py │ ├── distributed/ │ │ └── __init__.py │ ├── eval/ │ │ ├── __init__.py │ │ ├── cell_dino/ │ │ │ ├── knn.py │ │ │ ├── linear.py │ │ │ └── utils.py │ │ ├── depth/ │ │ │ ├── __init__.py │ │ │ ├── models/ │ │ │ │ ├── __init__.py │ │ │ │ ├── backbones/ │ │ │ │ │ ├── __init__.py │ │ │ │ │ └── vision_transformer.py │ │ │ │ ├── builder.py │ │ │ │ ├── decode_heads/ │ │ │ │ │ ├── __init__.py │ │ │ │ │ ├── decode_head.py │ │ │ │ │ ├── dpt_head.py │ │ │ │ │ └── linear_head.py │ │ │ │ ├── depther/ │ │ │ │ │ ├── __init__.py │ │ │ │ │ ├── base.py │ │ │ │ │ └── encoder_decoder.py │ │ │ │ └── losses/ │ │ │ │ ├── __init__.py │ │ │ │ ├── gradientloss.py │ │ │ │ └── sigloss.py │ │ │ └── ops/ │ │ │ ├── __init__.py │ │ │ └── wrappers.py │ │ ├── knn.py │ │ ├── linear.py │ │ ├── log_regression.py │ │ ├── metrics.py │ │ ├── segmentation/ │ │ │ ├── __init__.py │ │ │ ├── hooks/ │ │ │ │ ├── __init__.py │ │ │ │ └── optimizer.py │ │ │ ├── models/ │ │ │ │ ├── __init__.py │ │ │ │ ├── backbones/ │ │ │ │ │ ├── __init__.py │ │ │ │ │ └── vision_transformer.py │ │ │ │ └── decode_heads/ │ │ │ │ ├── __init__.py │ │ │ │ └── linear_head.py │ │ │ └── utils/ │ │ │ ├── __init__.py │ │ │ └── colormaps.py │ │ ├── segmentation_m2f/ │ │ │ ├── __init__.py │ │ │ ├── core/ │ │ │ │ ├── __init__.py │ │ │ │ ├── anchor/ │ │ │ │ │ ├── __init__.py │ │ │ │ │ ├── builder.py │ │ │ │ │ └── point_generator.py │ │ │ │ ├── box/ │ │ │ │ │ ├── __init__.py │ │ │ │ │ ├── builder.py │ │ │ │ │ └── samplers/ │ │ │ │ │ ├── __init__.py │ │ │ │ │ ├── base_sampler.py │ │ │ │ │ ├── mask_pseudo_sampler.py │ │ │ │ │ ├── mask_sampling_result.py │ │ │ │ │ └── sampling_result.py │ │ │ │ └── utils/ │ │ │ │ ├── __init__.py │ │ │ │ ├── dist_utils.py │ │ │ │ └── misc.py │ │ │ ├── models/ │ │ │ │ ├── __init__.py │ │ │ │ ├── backbones/ │ │ │ │ │ ├── __init__.py │ │ │ │ │ ├── adapter_modules.py │ │ │ │ │ ├── drop_path.py │ │ │ │ │ ├── vit.py │ │ │ │ │ └── vit_adapter.py │ │ │ │ ├── builder.py │ │ │ │ ├── decode_heads/ │ │ │ │ │ ├── __init__.py │ │ │ │ │ └── mask2former_head.py │ │ │ │ ├── losses/ │ │ │ │ │ ├── __init__.py │ │ │ │ │ ├── cross_entropy_loss.py │ │ │ │ │ ├── dice_loss.py │ │ │ │ │ └── match_costs.py │ │ │ │ ├── plugins/ │ │ │ │ │ ├── __init__.py │ │ │ │ │ └── msdeformattn_pixel_decoder.py │ │ │ │ ├── segmentors/ │ │ │ │ │ ├── __init__.py │ │ │ │ │ └── encoder_decoder_mask2former.py │ │ │ │ └── utils/ │ │ │ │ ├── __init__.py │ │ │ │ ├── assigner.py │ │ │ │ ├── point_sample.py │ │ │ │ ├── positional_encoding.py │ │ │ │ └── transformer.py │ │ │ └── ops/ │ │ │ └── modules/ │ │ │ ├── __init__.py │ │ │ └── ms_deform_attn.py │ │ ├── setup.py │ │ └── utils.py │ ├── fsdp/ │ │ └── __init__.py │ ├── hub/ │ │ ├── __init__.py │ │ ├── backbones.py │ │ ├── cell_dino/ │ │ │ └── backbones.py │ │ ├── classifiers.py │ │ ├── depth/ │ │ │ ├── __init__.py │ │ │ ├── decode_heads.py │ │ │ ├── encoder_decoder.py │ │ │ └── ops.py │ │ ├── depthers.py │ │ ├── dinotxt.py │ │ ├── text/ │ │ │ ├── dinotxt_model.py │ │ │ ├── dinov2_wrapper.py │ │ │ ├── text_tower.py │ │ │ ├── text_transformer.py │ │ │ ├── tokenizer.py │ │ │ └── vision_tower.py │ │ ├── utils.py │ │ └── xray_dino/ │ │ └── backbones.py │ ├── layers/ │ │ ├── __init__.py │ │ ├── attention.py │ │ ├── block.py │ │ ├── dino_head.py │ │ ├── drop_path.py │ │ ├── layer_scale.py │ │ ├── mlp.py │ │ ├── patch_embed.py │ │ └── swiglu_ffn.py │ ├── logging/ │ │ ├── __init__.py │ │ └── helpers.py │ ├── loss/ │ │ ├── __init__.py │ │ ├── dino_clstoken_loss.py │ │ ├── ibot_patch_loss.py │ │ └── koleo_loss.py │ ├── models/ │ │ ├── __init__.py │ │ └── vision_transformer.py │ ├── run/ │ │ ├── __init__.py │ │ ├── eval/ │ │ │ ├── cell_dino/ │ │ │ │ ├── knn.py │ │ │ │ └── linear.py │ │ │ ├── knn.py │ │ │ ├── linear.py │ │ │ └── log_regression.py │ │ ├── submit.py │ │ └── train/ │ │ └── train.py │ ├── thirdparty/ │ │ └── CLIP/ │ │ ├── LICENSE │ │ └── clip/ │ │ └── simple_tokenizer.py │ ├── train/ │ │ ├── __init__.py │ │ ├── ssl_meta_arch.py │ │ └── train.py │ └── utils/ │ ├── __init__.py │ ├── checkpoint.py │ ├── cluster.py │ ├── config.py │ ├── dtype.py │ ├── param_groups.py │ └── utils.py ├── docs/ │ ├── README_CELL_DINO.md │ └── README_CHANNEL_ADAPTIVE_DINO.md ├── hubconf.py ├── notebooks/ │ ├── cell_dino/ │ │ └── inference.ipynb │ ├── depth_estimation.ipynb │ ├── dinotxt.ipynb │ └── semantic_segmentation.ipynb ├── pyproject.toml ├── requirements-dev.txt ├── requirements-extras.txt ├── requirements.txt ├── scripts/ │ ├── cell_dino/ │ │ ├── launcher_knn_eval_on_chammi.sh │ │ └── launcher_linear_eval_on_chammi.sh │ └── lint.sh ├── setup.cfg └── setup.py