gitextract_ma67qwgl/ ├── .gitignore ├── LICENSE ├── README.md ├── semanticodec/ │ ├── __init__.py │ ├── config.py │ ├── main.py │ ├── modules/ │ │ ├── __init__.py │ │ ├── audiomae/ │ │ │ ├── AudioMAE.py │ │ │ ├── __init__.py │ │ │ ├── models_mae.py │ │ │ ├── patch_embed.py │ │ │ └── pos_embed.py │ │ ├── decoder/ │ │ │ ├── __init__.py │ │ │ ├── hifigan/ │ │ │ │ ├── LICENSE │ │ │ │ ├── __init__.py │ │ │ │ ├── models.py │ │ │ │ └── models_v2.py │ │ │ ├── latent_diffusion/ │ │ │ │ ├── __init__.py │ │ │ │ ├── models/ │ │ │ │ │ ├── __init__.py │ │ │ │ │ ├── ddim.py │ │ │ │ │ ├── ddpm.py │ │ │ │ │ └── dpm_solver/ │ │ │ │ │ ├── __init__.py │ │ │ │ │ └── dpm_solver.py │ │ │ │ ├── modules/ │ │ │ │ │ ├── __init__.py │ │ │ │ │ ├── attention.py │ │ │ │ │ ├── diffusionmodules/ │ │ │ │ │ │ ├── __init__.py │ │ │ │ │ │ ├── model.py │ │ │ │ │ │ ├── openaimodel.py │ │ │ │ │ │ └── util.py │ │ │ │ │ ├── distributions/ │ │ │ │ │ │ ├── __init__.py │ │ │ │ │ │ └── distributions.py │ │ │ │ │ ├── ema.py │ │ │ │ │ ├── mamba.py │ │ │ │ │ ├── nn.py │ │ │ │ │ └── x_transformer.py │ │ │ │ └── util.py │ │ │ ├── latent_encoder/ │ │ │ │ ├── __init__.py │ │ │ │ └── autoencoder.py │ │ │ └── utilities/ │ │ │ ├── __init__.py │ │ │ ├── audio/ │ │ │ │ ├── __init__.py │ │ │ │ ├── audio_processing.py │ │ │ │ ├── stft.py │ │ │ │ └── tools.py │ │ │ ├── model.py │ │ │ └── tools.py │ │ └── encoder/ │ │ ├── __init__.py │ │ └── encoder.py │ └── utils.py ├── setup.py └── test/ ├── encoding.py └── test_all_settings.py