gitextract_7_a5iyu7/ ├── .github/ │ └── actions/ │ └── audiocraft_build/ │ └── action.yml ├── .gitignore ├── CHANGELOG.md ├── CODE_OF_CONDUCT.md ├── CONTRIBUTING.md ├── Dockerfile ├── LICENSE ├── LICENSE_weights ├── MANIFEST.in ├── Makefile ├── README.md ├── app.py ├── audiocraft/ │ ├── __init__.py │ ├── adversarial/ │ │ ├── __init__.py │ │ ├── discriminators/ │ │ │ ├── __init__.py │ │ │ ├── base.py │ │ │ ├── mpd.py │ │ │ ├── msd.py │ │ │ └── msstftd.py │ │ └── losses.py │ ├── data/ │ │ ├── __init__.py │ │ ├── audio.py │ │ ├── audio_dataset.py │ │ ├── audio_utils.py │ │ ├── info_audio_dataset.py │ │ ├── music_dataset.py │ │ ├── sound_dataset.py │ │ └── zip.py │ ├── environment.py │ ├── grids/ │ │ ├── __init__.py │ │ ├── _base_explorers.py │ │ ├── audiogen/ │ │ │ ├── __init__.py │ │ │ ├── audiogen_base_16khz.py │ │ │ └── audiogen_pretrained_16khz_eval.py │ │ ├── compression/ │ │ │ ├── __init__.py │ │ │ ├── _explorers.py │ │ │ ├── debug.py │ │ │ ├── encodec_audiogen_16khz.py │ │ │ ├── encodec_base_24khz.py │ │ │ └── encodec_musicgen_32khz.py │ │ ├── diffusion/ │ │ │ ├── 4_bands_base_32khz.py │ │ │ ├── __init__.py │ │ │ └── _explorers.py │ │ └── musicgen/ │ │ ├── __init__.py │ │ ├── _explorers.py │ │ ├── musicgen_base_32khz.py │ │ ├── musicgen_base_cached_32khz.py │ │ ├── musicgen_clapemb_32khz.py │ │ ├── musicgen_melody_32khz.py │ │ └── musicgen_pretrained_32khz_eval.py │ ├── losses/ │ │ ├── __init__.py │ │ ├── balancer.py │ │ ├── sisnr.py │ │ ├── specloss.py │ │ └── stftloss.py │ ├── metrics/ │ │ ├── __init__.py │ │ ├── chroma_cosinesim.py │ │ ├── clap_consistency.py │ │ ├── fad.py │ │ ├── kld.py │ │ ├── rvm.py │ │ └── visqol.py │ ├── models/ │ │ ├── __init__.py │ │ ├── audiogen.py │ │ ├── builders.py │ │ ├── encodec.py │ │ ├── lm.py │ │ ├── loaders.py │ │ ├── multibanddiffusion.py │ │ ├── musicgen.py │ │ └── unet.py │ ├── modules/ │ │ ├── __init__.py │ │ ├── activations.py │ │ ├── chroma.py │ │ ├── codebooks_patterns.py │ │ ├── conditioners.py │ │ ├── conv.py │ │ ├── diffusion_schedule.py │ │ ├── lstm.py │ │ ├── rope.py │ │ ├── seanet.py │ │ ├── streaming.py │ │ └── transformer.py │ ├── optim/ │ │ ├── __init__.py │ │ ├── cosine_lr_scheduler.py │ │ ├── dadam.py │ │ ├── ema.py │ │ ├── fsdp.py │ │ ├── inverse_sqrt_lr_scheduler.py │ │ ├── linear_warmup_lr_scheduler.py │ │ └── polynomial_decay_lr_scheduler.py │ ├── py.typed │ ├── quantization/ │ │ ├── __init__.py │ │ ├── base.py │ │ ├── core_vq.py │ │ └── vq.py │ ├── solvers/ │ │ ├── __init__.py │ │ ├── audiogen.py │ │ ├── base.py │ │ ├── builders.py │ │ ├── compression.py │ │ ├── diffusion.py │ │ └── musicgen.py │ ├── train.py │ └── utils/ │ ├── __init__.py │ ├── autocast.py │ ├── best_state.py │ ├── cache.py │ ├── checkpoint.py │ ├── cluster.py │ ├── deadlock.py │ ├── export.py │ ├── export_legacy.py │ ├── notebook.py │ ├── profiler.py │ ├── samples/ │ │ ├── __init__.py │ │ └── manager.py │ ├── ui.py │ └── utils.py ├── config/ │ ├── conditioner/ │ │ ├── chroma2music.yaml │ │ ├── clapemb2music.yaml │ │ ├── none.yaml │ │ ├── text2music.yaml │ │ └── text2sound.yaml │ ├── config.yaml │ ├── dset/ │ │ ├── audio/ │ │ │ ├── audiocaps_16khz.yaml │ │ │ ├── default.yaml │ │ │ ├── example.yaml │ │ │ └── musiccaps_32khz.yaml │ │ ├── default.yaml │ │ └── internal/ │ │ ├── music_10k_32khz.yaml │ │ ├── music_400k_32khz.yaml │ │ └── sounds_16khz.yaml │ ├── model/ │ │ ├── encodec/ │ │ │ ├── default.yaml │ │ │ ├── encodec_base_causal.yaml │ │ │ ├── encodec_large_nq4_s320.yaml │ │ │ └── encodec_large_nq4_s640.yaml │ │ ├── lm/ │ │ │ ├── audiogen_lm.yaml │ │ │ ├── default.yaml │ │ │ ├── model_scale/ │ │ │ │ ├── base.yaml │ │ │ │ ├── large.yaml │ │ │ │ ├── medium.yaml │ │ │ │ ├── small.yaml │ │ │ │ └── xsmall.yaml │ │ │ └── musicgen_lm.yaml │ │ ├── none.yaml │ │ └── score/ │ │ └── basic.yaml │ ├── solver/ │ │ ├── audiogen/ │ │ │ ├── audiogen_base_16khz.yaml │ │ │ ├── debug.yaml │ │ │ ├── default.yaml │ │ │ └── evaluation/ │ │ │ ├── none.yaml │ │ │ └── objective_eval.yaml │ │ ├── compression/ │ │ │ ├── debug.yaml │ │ │ ├── default.yaml │ │ │ ├── encodec_audiogen_16khz.yaml │ │ │ ├── encodec_base_24khz.yaml │ │ │ └── encodec_musicgen_32khz.yaml │ │ ├── default.yaml │ │ ├── diffusion/ │ │ │ ├── debug.yaml │ │ │ ├── default.yaml │ │ │ └── encodec_24khz.yaml │ │ └── musicgen/ │ │ ├── debug.yaml │ │ ├── default.yaml │ │ ├── evaluation/ │ │ │ ├── none.yaml │ │ │ └── objective_eval.yaml │ │ ├── musicgen_base_32khz.yaml │ │ └── musicgen_melody_32khz.yaml │ └── teams/ │ ├── default.yaml │ └── labs.yaml ├── dataset/ │ └── example/ │ ├── electro_1.json │ └── electro_2.json ├── demos/ │ ├── audiogen_demo.ipynb │ ├── musicgen_app.py │ └── musicgen_demo.ipynb ├── dockerignore ├── docs/ │ ├── AUDIOGEN.md │ ├── CONDITIONING.md │ ├── DATASETS.md │ ├── ENCODEC.md │ ├── MBD.md │ ├── METRICS.md │ ├── MUSICGEN.md │ └── TRAINING.md ├── egs/ │ └── example/ │ └── data.jsonl ├── model_cards/ │ ├── AUDIOGEN_MODEL_CARD.md │ └── MUSICGEN_MODEL_CARD.md ├── models/ │ └── Put your models here.txt ├── mypy.ini ├── requirements.txt ├── scripts/ │ ├── __init__.py │ ├── mos.py │ ├── resample_dataset.py │ ├── static/ │ │ └── style.css │ └── templates/ │ ├── base.html │ ├── index.html │ ├── login.html │ ├── results.html │ └── survey.html ├── setup.cfg ├── setup.py └── tests/ ├── __init__.py ├── adversarial/ │ ├── __init__.py │ ├── test_discriminators.py │ └── test_losses.py ├── common_utils/ │ ├── __init__.py │ ├── temp_utils.py │ └── wav_utils.py ├── data/ │ ├── __init__.py │ ├── test_audio.py │ ├── test_audio_dataset.py │ └── test_audio_utils.py ├── losses/ │ ├── __init__.py │ └── test_losses.py ├── models/ │ ├── test_audiogen.py │ ├── test_encodec_model.py │ ├── test_multibanddiffusion.py │ └── test_musicgen.py ├── modules/ │ ├── __init__.py │ ├── test_activations.py │ ├── test_codebooks_patterns.py │ ├── test_conv.py │ ├── test_lstm.py │ ├── test_rope.py │ ├── test_seanet.py │ └── test_transformer.py ├── quantization/ │ └── test_vq.py └── utils/ └── __init__.py