gitextract_1bqvithb/ ├── .github/ │ ├── actions/ │ │ └── audiocraft_build/ │ │ └── action.yml │ └── workflows/ │ ├── audiocraft_docs.yml │ ├── audiocraft_linter.yml │ └── audiocraft_tests.yml ├── .gitignore ├── CHANGELOG.md ├── CODE_OF_CONDUCT.md ├── CONTRIBUTING.md ├── LICENSE ├── LICENSE_weights ├── MANIFEST.in ├── Makefile ├── README.md ├── assets/ │ ├── chord_to_index_mapping.pkl │ ├── salience_1.th │ └── salience_2.th ├── audiocraft/ │ ├── __init__.py │ ├── adversarial/ │ │ ├── __init__.py │ │ ├── discriminators/ │ │ │ ├── __init__.py │ │ │ ├── base.py │ │ │ ├── mpd.py │ │ │ ├── msd.py │ │ │ └── msstftd.py │ │ └── losses.py │ ├── data/ │ │ ├── __init__.py │ │ ├── audio.py │ │ ├── audio_dataset.py │ │ ├── audio_utils.py │ │ ├── info_audio_dataset.py │ │ ├── jasco_dataset.py │ │ ├── music_dataset.py │ │ ├── sound_dataset.py │ │ └── zip.py │ ├── environment.py │ ├── grids/ │ │ ├── __init__.py │ │ ├── _base_explorers.py │ │ ├── audiogen/ │ │ │ ├── __init__.py │ │ │ ├── audiogen_base_16khz.py │ │ │ └── audiogen_pretrained_16khz_eval.py │ │ ├── compression/ │ │ │ ├── __init__.py │ │ │ ├── _explorers.py │ │ │ ├── debug.py │ │ │ ├── encodec_audiogen_16khz.py │ │ │ ├── encodec_base_24khz.py │ │ │ └── encodec_musicgen_32khz.py │ │ ├── diffusion/ │ │ │ ├── 4_bands_base_32khz.py │ │ │ ├── __init__.py │ │ │ └── _explorers.py │ │ ├── magnet/ │ │ │ ├── __init__.py │ │ │ ├── audio_magnet_16khz.py │ │ │ ├── audio_magnet_pretrained_16khz_eval.py │ │ │ ├── magnet_32khz.py │ │ │ └── magnet_pretrained_32khz_eval.py │ │ ├── musicgen/ │ │ │ ├── __init__.py │ │ │ ├── _explorers.py │ │ │ ├── musicgen_base_32khz.py │ │ │ ├── musicgen_base_cached_32khz.py │ │ │ ├── musicgen_clapemb_32khz.py │ │ │ ├── musicgen_melody_32khz.py │ │ │ ├── musicgen_pretrained_32khz_eval.py │ │ │ ├── musicgen_stereo_finetune_32khz.py │ │ │ └── musicgen_style_32khz.py │ │ └── watermarking/ │ │ ├── __init__.py │ │ ├── _explorers.py │ │ ├── audioseal.py │ │ └── kbits.py │ ├── losses/ │ │ ├── __init__.py │ │ ├── balancer.py │ │ ├── loudnessloss.py │ │ ├── sisnr.py │ │ ├── specloss.py │ │ ├── stftloss.py │ │ └── wmloss.py │ ├── metrics/ │ │ ├── __init__.py │ │ ├── chroma_cosinesim.py │ │ ├── clap_consistency.py │ │ ├── fad.py │ │ ├── kld.py │ │ ├── miou.py │ │ ├── pesq.py │ │ ├── rvm.py │ │ └── visqol.py │ ├── models/ │ │ ├── __init__.py │ │ ├── audiogen.py │ │ ├── builders.py │ │ ├── encodec.py │ │ ├── flow_matching.py │ │ ├── genmodel.py │ │ ├── jasco.py │ │ ├── lm.py │ │ ├── lm_magnet.py │ │ ├── loaders.py │ │ ├── magnet.py │ │ ├── multibanddiffusion.py │ │ ├── musicgen.py │ │ ├── unet.py │ │ └── watermark.py │ ├── modules/ │ │ ├── __init__.py │ │ ├── activations.py │ │ ├── chroma.py │ │ ├── codebooks_patterns.py │ │ ├── conditioners.py │ │ ├── conv.py │ │ ├── diffusion_schedule.py │ │ ├── jasco_conditioners.py │ │ ├── lstm.py │ │ ├── rope.py │ │ ├── seanet.py │ │ ├── streaming.py │ │ ├── transformer.py │ │ ├── unet_transformer.py │ │ └── watermark.py │ ├── optim/ │ │ ├── __init__.py │ │ ├── cosine_lr_scheduler.py │ │ ├── dadam.py │ │ ├── ema.py │ │ ├── fsdp.py │ │ ├── inverse_sqrt_lr_scheduler.py │ │ ├── linear_warmup_lr_scheduler.py │ │ └── polynomial_decay_lr_scheduler.py │ ├── py.typed │ ├── quantization/ │ │ ├── __init__.py │ │ ├── base.py │ │ ├── core_vq.py │ │ └── vq.py │ ├── solvers/ │ │ ├── __init__.py │ │ ├── audiogen.py │ │ ├── base.py │ │ ├── builders.py │ │ ├── compression.py │ │ ├── diffusion.py │ │ ├── jasco.py │ │ ├── magnet.py │ │ ├── musicgen.py │ │ └── watermark.py │ ├── train.py │ └── utils/ │ ├── __init__.py │ ├── audio_effects.py │ ├── autocast.py │ ├── best_state.py │ ├── cache.py │ ├── checkpoint.py │ ├── cluster.py │ ├── deadlock.py │ ├── export.py │ ├── export_legacy.py │ ├── notebook.py │ ├── profiler.py │ ├── samples/ │ │ ├── __init__.py │ │ └── manager.py │ └── utils.py ├── config/ │ ├── augmentations/ │ │ └── default.yaml │ ├── conditioner/ │ │ ├── chords2music.yaml │ │ ├── chroma2music.yaml │ │ ├── clapemb2music.yaml │ │ ├── drums2music.yaml │ │ ├── jasco_chords_drums.yaml │ │ ├── jasco_chords_drums_melody.yaml │ │ ├── none.yaml │ │ ├── style2music.yaml │ │ ├── text2music.yaml │ │ └── text2sound.yaml │ ├── config.yaml │ ├── dset/ │ │ ├── audio/ │ │ │ ├── audiocaps_16khz.yaml │ │ │ ├── default.yaml │ │ │ ├── example.yaml │ │ │ └── musiccaps_32khz.yaml │ │ ├── default.yaml │ │ └── internal/ │ │ ├── music_10k_32khz.yaml │ │ ├── music_400k_32khz.yaml │ │ └── sounds_16khz.yaml │ ├── model/ │ │ ├── encodec/ │ │ │ ├── default.yaml │ │ │ ├── encodec_base_causal.yaml │ │ │ ├── encodec_large_nq4_s320.yaml │ │ │ └── encodec_large_nq4_s640.yaml │ │ ├── lm/ │ │ │ ├── audiogen_lm.yaml │ │ │ ├── default.yaml │ │ │ ├── model_scale/ │ │ │ │ ├── base.yaml │ │ │ │ ├── large.yaml │ │ │ │ ├── medium.yaml │ │ │ │ ├── small.yaml │ │ │ │ └── xsmall.yaml │ │ │ └── musicgen_lm.yaml │ │ ├── none.yaml │ │ ├── score/ │ │ │ └── basic.yaml │ │ └── watermark/ │ │ └── default.yaml │ ├── solver/ │ │ ├── audiogen/ │ │ │ ├── audiogen_base_16khz.yaml │ │ │ ├── debug.yaml │ │ │ ├── default.yaml │ │ │ └── evaluation/ │ │ │ ├── none.yaml │ │ │ └── objective_eval.yaml │ │ ├── compression/ │ │ │ ├── debug.yaml │ │ │ ├── default.yaml │ │ │ ├── encodec_audiogen_16khz.yaml │ │ │ ├── encodec_base_24khz.yaml │ │ │ └── encodec_musicgen_32khz.yaml │ │ ├── default.yaml │ │ ├── diffusion/ │ │ │ ├── debug.yaml │ │ │ ├── default.yaml │ │ │ └── encodec_24khz.yaml │ │ ├── jasco/ │ │ │ ├── chords.yaml │ │ │ ├── chords_drums.yaml │ │ │ ├── chords_drums_melody.yaml │ │ │ ├── drums.yaml │ │ │ └── jasco_32khz_base.yaml │ │ ├── magnet/ │ │ │ ├── audio_magnet_16khz.yaml │ │ │ └── magnet_32khz.yaml │ │ ├── musicgen/ │ │ │ ├── debug.yaml │ │ │ ├── default.yaml │ │ │ ├── evaluation/ │ │ │ │ ├── none.yaml │ │ │ │ └── objective_eval.yaml │ │ │ ├── musicgen_base_32khz.yaml │ │ │ ├── musicgen_melody_32khz.yaml │ │ │ └── musicgen_style_32khz.yaml │ │ └── watermark/ │ │ ├── debug.yaml │ │ ├── default.yaml │ │ └── robustness.yaml │ └── teams/ │ ├── default.yaml │ └── labs.yaml ├── dataset/ │ └── example/ │ ├── electro_1.json │ └── electro_2.json ├── demos/ │ ├── audiogen_demo.ipynb │ ├── jasco_app.py │ ├── jasco_demo.ipynb │ ├── magnet_app.py │ ├── magnet_demo.ipynb │ ├── musicgen_app.py │ ├── musicgen_demo.ipynb │ ├── musicgen_style_app.py │ └── musicgen_style_demo.ipynb ├── docs/ │ ├── AUDIOGEN.md │ ├── CONDITIONING.md │ ├── DATASETS.md │ ├── ENCODEC.md │ ├── JASCO.md │ ├── MAGNET.md │ ├── MBD.md │ ├── METRICS.md │ ├── MUSICGEN.md │ ├── MUSICGEN_STYLE.md │ ├── TRAINING.md │ └── WATERMARKING.md ├── egs/ │ └── example/ │ └── data.jsonl ├── jasco_demo.ipynb ├── model_cards/ │ ├── AUDIOGEN_MODEL_CARD.md │ ├── JASCO_MODEL_CARD.md │ ├── MAGNET_MODEL_CARD.md │ ├── MUSICGEN_MODEL_CARD.md │ └── MUSICGEN_STYLE_MODEL_CARD.md ├── mypy.ini ├── requirements.txt ├── scripts/ │ ├── __init__.py │ ├── chords/ │ │ ├── build_chord_maps.py │ │ ├── extract_chords.py │ │ └── job_array_example.sh │ ├── mos.py │ ├── resample_dataset.py │ ├── static/ │ │ └── style.css │ └── templates/ │ ├── base.html │ ├── index.html │ ├── login.html │ ├── results.html │ └── survey.html ├── setup.cfg ├── setup.py └── tests/ ├── __init__.py ├── adversarial/ │ ├── __init__.py │ ├── test_discriminators.py │ └── test_losses.py ├── common_utils/ │ ├── __init__.py │ ├── temp_utils.py │ └── wav_utils.py ├── data/ │ ├── __init__.py │ ├── test_audio.py │ ├── test_audio_dataset.py │ └── test_audio_utils.py ├── losses/ │ ├── __init__.py │ └── test_losses.py ├── metrics/ │ ├── __init__.py │ └── test_pesq.py ├── models/ │ ├── test_audiogen.py │ ├── test_encodec_model.py │ ├── test_multibanddiffusion.py │ ├── test_musicgen.py │ └── test_watermark.py ├── modules/ │ ├── __init__.py │ ├── test_activations.py │ ├── test_codebooks_patterns.py │ ├── test_conv.py │ ├── test_lstm.py │ ├── test_rope.py │ ├── test_seanet.py │ └── test_transformer.py ├── quantization/ │ └── test_vq.py └── utils/ ├── __init__.py └── test_audio_effects.py