gitextract_3mk8n7n3/ ├── .github/ │ └── workflows/ │ ├── black.yml │ ├── test-build.yaml │ └── test-inference.yml ├── .gitignore ├── CODEOWNERS ├── LICENSE-CODE ├── README.md ├── configs/ │ ├── example_training/ │ │ ├── autoencoder/ │ │ │ └── kl-f4/ │ │ │ ├── imagenet-attnfree-logvar.yaml │ │ │ └── imagenet-kl_f8_8chn.yaml │ │ ├── imagenet-f8_cond.yaml │ │ ├── toy/ │ │ │ ├── cifar10_cond.yaml │ │ │ ├── mnist.yaml │ │ │ ├── mnist_cond.yaml │ │ │ ├── mnist_cond_discrete_eps.yaml │ │ │ ├── mnist_cond_l1_loss.yaml │ │ │ └── mnist_cond_with_ema.yaml │ │ ├── txt2img-clipl-legacy-ucg-training.yaml │ │ └── txt2img-clipl.yaml │ └── inference/ │ ├── sd_xl_base.yaml │ ├── sd_xl_refiner.yaml │ ├── sv3d_p.yaml │ ├── sv3d_u.yaml │ ├── svd.yaml │ └── svd_image_decoder.yaml ├── main.py ├── model_licenses/ │ ├── LICENSE-SDXL-Turbo │ ├── LICENSE-SDXL0.9 │ ├── LICENSE-SDXL1.0 │ ├── LICENSE-SV3D │ └── LICENSE-SVD ├── pyproject.toml ├── pytest.ini ├── requirements/ │ └── pt2.txt ├── scripts/ │ ├── __init__.py │ ├── demo/ │ │ ├── __init__.py │ │ ├── detect.py │ │ ├── discretization.py │ │ ├── gradio_app.py │ │ ├── gradio_app_sv4d.py │ │ ├── sampling.py │ │ ├── streamlit_helpers.py │ │ ├── sv3d_helpers.py │ │ ├── sv4d_helpers.py │ │ ├── turbo.py │ │ └── video_sampling.py │ ├── sampling/ │ │ ├── configs/ │ │ │ ├── sv3d_p.yaml │ │ │ ├── sv3d_u.yaml │ │ │ ├── sv4d.yaml │ │ │ ├── sv4d2.yaml │ │ │ ├── sv4d2_8views.yaml │ │ │ ├── svd.yaml │ │ │ ├── svd_image_decoder.yaml │ │ │ ├── svd_xt.yaml │ │ │ ├── svd_xt_1_1.yaml │ │ │ └── svd_xt_image_decoder.yaml │ │ ├── simple_video_sample.py │ │ ├── simple_video_sample_4d.py │ │ └── simple_video_sample_4d2.py │ ├── tests/ │ │ └── attention.py │ └── util/ │ ├── __init__.py │ └── detection/ │ ├── __init__.py │ ├── nsfw_and_watermark_dectection.py │ ├── p_head_v1.npz │ └── w_head_v1.npz ├── sgm/ │ ├── __init__.py │ ├── data/ │ │ ├── __init__.py │ │ ├── cifar10.py │ │ ├── dataset.py │ │ └── mnist.py │ ├── inference/ │ │ ├── api.py │ │ └── helpers.py │ ├── lr_scheduler.py │ ├── models/ │ │ ├── __init__.py │ │ ├── autoencoder.py │ │ └── diffusion.py │ ├── modules/ │ │ ├── __init__.py │ │ ├── attention.py │ │ ├── autoencoding/ │ │ │ ├── __init__.py │ │ │ ├── losses/ │ │ │ │ ├── __init__.py │ │ │ │ ├── discriminator_loss.py │ │ │ │ └── lpips.py │ │ │ ├── lpips/ │ │ │ │ ├── __init__.py │ │ │ │ ├── loss/ │ │ │ │ │ ├── .gitignore │ │ │ │ │ ├── LICENSE │ │ │ │ │ ├── __init__.py │ │ │ │ │ └── lpips.py │ │ │ │ ├── model/ │ │ │ │ │ ├── LICENSE │ │ │ │ │ ├── __init__.py │ │ │ │ │ └── model.py │ │ │ │ ├── util.py │ │ │ │ └── vqperceptual.py │ │ │ ├── regularizers/ │ │ │ │ ├── __init__.py │ │ │ │ ├── base.py │ │ │ │ └── quantize.py │ │ │ └── temporal_ae.py │ │ ├── diffusionmodules/ │ │ │ ├── __init__.py │ │ │ ├── denoiser.py │ │ │ ├── denoiser_scaling.py │ │ │ ├── denoiser_weighting.py │ │ │ ├── discretizer.py │ │ │ ├── guiders.py │ │ │ ├── loss.py │ │ │ ├── loss_weighting.py │ │ │ ├── model.py │ │ │ ├── openaimodel.py │ │ │ ├── sampling.py │ │ │ ├── sampling_utils.py │ │ │ ├── sigma_sampling.py │ │ │ ├── util.py │ │ │ ├── video_model.py │ │ │ └── wrappers.py │ │ ├── distributions/ │ │ │ ├── __init__.py │ │ │ └── distributions.py │ │ ├── ema.py │ │ ├── encoders/ │ │ │ ├── __init__.py │ │ │ └── modules.py │ │ ├── spacetime_attention.py │ │ └── video_attention.py │ └── util.py └── tests/ └── inference/ └── test_inference.py