gitextract_jijj82e1/ ├── .gitignore ├── LICENSE ├── README.md ├── configs/ │ ├── c2i/ │ │ ├── nit_b_pack_merge_radio_65536.yaml │ │ ├── nit_l_pack_merge_radio_16384.yaml │ │ ├── nit_s_pack_merge_radio_65536.yaml │ │ ├── nit_xl_pack_merge_radio_16384.yaml │ │ └── nit_xxl_pack_merge_radio_8192.yaml │ └── preprocess/ │ ├── imagenet1k_256x256.yaml │ ├── imagenet1k_512x512.yaml │ └── imagenet1k_native_resolution.yaml ├── nit/ │ ├── data/ │ │ ├── pack/ │ │ │ ├── __init__.py │ │ │ ├── ennlshp.py │ │ │ ├── lpfhp.py │ │ │ ├── nnlshp.py │ │ │ └── spfhp.py │ │ ├── packed_c2i_data.py │ │ └── sampler_util.py │ ├── models/ │ │ ├── c2i/ │ │ │ └── nit_model.py │ │ ├── nvidia_radio/ │ │ │ ├── hubconf.py │ │ │ └── radio/ │ │ │ ├── __init__.py │ │ │ ├── adaptor_base.py │ │ │ ├── adaptor_generic.py │ │ │ ├── adaptor_mlp.py │ │ │ ├── adaptor_registry.py │ │ │ ├── block.py │ │ │ ├── cls_token.py │ │ │ ├── common.py │ │ │ ├── conv.py │ │ │ ├── dinov2_arch.py │ │ │ ├── dual_hybrid_vit.py │ │ │ ├── enable_cpe_support.py │ │ │ ├── enable_damp.py │ │ │ ├── enable_spectral_reparam.py │ │ │ ├── eradio_model.py │ │ │ ├── extra_models.py │ │ │ ├── extra_timm_models.py │ │ │ ├── feature_normalizer.py │ │ │ ├── forward_intermediates.py │ │ │ ├── hf_model.py │ │ │ ├── input_conditioner.py │ │ │ ├── open_clip_adaptor.py │ │ │ ├── radio_model.py │ │ │ ├── vision_transformer_xpos.py │ │ │ ├── vit_patch_generator.py │ │ │ └── vitdet.py │ │ └── utils/ │ │ ├── convs.py │ │ ├── funcs.py │ │ ├── norms.py │ │ └── pos_embeds/ │ │ ├── flash_attn_rotary.py │ │ ├── rope.py │ │ └── sincos.py │ ├── schedulers/ │ │ └── flow_matching/ │ │ ├── loss.py │ │ └── samplers_c2i.py │ └── utils/ │ ├── __init__.py │ ├── deepspeed_zero_to_fp32.py │ ├── ema.py │ ├── eval_utils.py │ ├── freeze.py │ ├── gpu_memory_monitor.py │ ├── lr_scheduler.py │ ├── misc_utils.py │ ├── model_utils.py │ ├── train_utils.py │ ├── util.py │ ├── video_utils.py │ └── warp_pos_idx.py ├── projects/ │ ├── evaluate/ │ │ └── adm_evaluator.py │ ├── preprocess/ │ │ ├── image_latent_c2i.py │ │ └── image_nr_latent_c2i.py │ ├── sample/ │ │ └── sample_c2i_ddp.py │ └── train/ │ └── packed_trainer_c2i.py ├── requirements.txt ├── scripts/ │ ├── preprocess/ │ │ ├── preorocess_in1k_256x256.sh │ │ ├── preorocess_in1k_512x512.sh │ │ └── preorocess_in1k_native_resolution.sh │ ├── sample/ │ │ ├── sample_256x256.sh │ │ ├── sample_512x512.sh │ │ └── sample_768x768.sh │ └── train/ │ ├── train_b_model.sh │ ├── train_l_model.sh │ ├── train_s_model.sh │ ├── train_xl_model.sh │ └── train_xxl_model.sh ├── setup.py └── tools/ ├── download_dataset_256x256.sh ├── download_dataset_512x512.sh ├── download_dataset_data_meta.sh ├── download_dataset_native_resolution.sh ├── download_dataset_sampler_meta.sh └── pack_dataset.py