gitextract_wldclo_i/ ├── .dockerignore ├── Dockerfile ├── LICENSE ├── README.md ├── api.py ├── batch_inference.py ├── compose.yaml ├── cosyvoice/ │ ├── __init__.py │ ├── bin/ │ │ ├── inference.py │ │ └── train.py │ ├── cli/ │ │ ├── __init__.py │ │ ├── cosyvoice.py │ │ ├── frontend.py │ │ └── model.py │ ├── dataset/ │ │ ├── __init__.py │ │ ├── dataset.py │ │ └── processor.py │ ├── flow/ │ │ ├── decoder.py │ │ ├── flow.py │ │ ├── flow_matching.py │ │ └── length_regulator.py │ ├── hifigan/ │ │ ├── f0_predictor.py │ │ └── generator.py │ ├── llm/ │ │ └── llm.py │ ├── transformer/ │ │ ├── __init__.py │ │ ├── activation.py │ │ ├── attention.py │ │ ├── convolution.py │ │ ├── decoder.py │ │ ├── decoder_layer.py │ │ ├── embedding.py │ │ ├── encoder.py │ │ ├── encoder_layer.py │ │ ├── label_smoothing_loss.py │ │ ├── positionwise_feed_forward.py │ │ └── subsampling.py │ └── utils/ │ ├── __init__.py │ ├── class_utils.py │ ├── common.py │ ├── executor.py │ ├── file_utils.py │ ├── frontend_utils.py │ ├── mask.py │ ├── scheduler.py │ └── train_utils.py ├── data/ │ └── batch_files.csv ├── openai_api_inference.py ├── requirements.txt ├── results/ │ └── .gitkeep ├── run_batch_inference.sh ├── run_single_inference.sh ├── single_inference.py ├── third_party/ │ └── Matcha-TTS/ │ ├── LICENSE │ ├── MANIFEST.in │ ├── Makefile │ ├── README.md │ ├── configs/ │ │ ├── __init__.py │ │ ├── callbacks/ │ │ │ ├── default.yaml │ │ │ ├── model_checkpoint.yaml │ │ │ ├── model_summary.yaml │ │ │ ├── none.yaml │ │ │ └── rich_progress_bar.yaml │ │ ├── data/ │ │ │ ├── hi-fi_en-US_female.yaml │ │ │ ├── ljspeech.yaml │ │ │ └── vctk.yaml │ │ ├── debug/ │ │ │ ├── default.yaml │ │ │ ├── fdr.yaml │ │ │ ├── limit.yaml │ │ │ ├── overfit.yaml │ │ │ └── profiler.yaml │ │ ├── eval.yaml │ │ ├── experiment/ │ │ │ ├── hifi_dataset_piper_phonemizer.yaml │ │ │ ├── ljspeech.yaml │ │ │ ├── ljspeech_min_memory.yaml │ │ │ └── multispeaker.yaml │ │ ├── extras/ │ │ │ └── default.yaml │ │ ├── hparams_search/ │ │ │ └── mnist_optuna.yaml │ │ ├── hydra/ │ │ │ └── default.yaml │ │ ├── local/ │ │ │ └── .gitkeep │ │ ├── logger/ │ │ │ ├── aim.yaml │ │ │ ├── comet.yaml │ │ │ ├── csv.yaml │ │ │ ├── many_loggers.yaml │ │ │ ├── mlflow.yaml │ │ │ ├── neptune.yaml │ │ │ ├── tensorboard.yaml │ │ │ └── wandb.yaml │ │ ├── model/ │ │ │ ├── cfm/ │ │ │ │ └── default.yaml │ │ │ ├── decoder/ │ │ │ │ └── default.yaml │ │ │ ├── encoder/ │ │ │ │ └── default.yaml │ │ │ ├── matcha.yaml │ │ │ └── optimizer/ │ │ │ └── adam.yaml │ │ ├── paths/ │ │ │ └── default.yaml │ │ ├── train.yaml │ │ └── trainer/ │ │ ├── cpu.yaml │ │ ├── ddp.yaml │ │ ├── ddp_sim.yaml │ │ ├── default.yaml │ │ ├── gpu.yaml │ │ └── mps.yaml │ ├── matcha/ │ │ ├── VERSION │ │ ├── __init__.py │ │ ├── app.py │ │ ├── cli.py │ │ ├── data/ │ │ │ ├── __init__.py │ │ │ ├── components/ │ │ │ │ └── __init__.py │ │ │ └── text_mel_datamodule.py │ │ ├── hifigan/ │ │ │ ├── LICENSE │ │ │ ├── README.md │ │ │ ├── __init__.py │ │ │ ├── config.py │ │ │ ├── denoiser.py │ │ │ ├── env.py │ │ │ ├── meldataset.py │ │ │ ├── models.py │ │ │ └── xutils.py │ │ ├── models/ │ │ │ ├── __init__.py │ │ │ ├── baselightningmodule.py │ │ │ ├── components/ │ │ │ │ ├── __init__.py │ │ │ │ ├── decoder.py │ │ │ │ ├── flow_matching.py │ │ │ │ ├── text_encoder.py │ │ │ │ └── transformer.py │ │ │ └── matcha_tts.py │ │ ├── onnx/ │ │ │ ├── __init__.py │ │ │ ├── export.py │ │ │ └── infer.py │ │ ├── text/ │ │ │ ├── __init__.py │ │ │ ├── cleaners.py │ │ │ ├── numbers.py │ │ │ └── symbols.py │ │ ├── train.py │ │ └── utils/ │ │ ├── __init__.py │ │ ├── audio.py │ │ ├── generate_data_statistics.py │ │ ├── instantiators.py │ │ ├── logging_utils.py │ │ ├── model.py │ │ ├── monotonic_align/ │ │ │ ├── __init__.py │ │ │ ├── core.c │ │ │ ├── core.pyx │ │ │ └── setup.py │ │ ├── pylogger.py │ │ ├── rich_utils.py │ │ └── utils.py │ ├── matcha_tts.egg-info/ │ │ ├── PKG-INFO │ │ ├── SOURCES.txt │ │ ├── dependency_links.txt │ │ ├── entry_points.txt │ │ ├── requires.txt │ │ └── top_level.txt │ ├── notebooks/ │ │ └── .gitkeep │ ├── pyproject.toml │ ├── requirements.txt │ ├── scripts/ │ │ └── schedule.sh │ ├── setup.py │ └── synthesis.ipynb └── utils/ └── word_utils.py