gitextract_whvdqko7/ ├── .dockerignore ├── .github/ │ ├── build_windows_packages.ps1 │ └── workflows/ │ ├── build_windows_packages.yaml │ └── docker-publish.yaml ├── .gitignore ├── .pre-commit-config.yaml ├── Colab-Inference.ipynb ├── Colab-WebUI.ipynb ├── Docker/ │ ├── install_wrapper.sh │ └── miniforge_install.sh ├── Dockerfile ├── GPT_SoVITS/ │ ├── AR/ │ │ ├── __init__.py │ │ ├── data/ │ │ │ ├── __init__.py │ │ │ ├── bucket_sampler.py │ │ │ ├── data_module.py │ │ │ └── dataset.py │ │ ├── models/ │ │ │ ├── __init__.py │ │ │ ├── t2s_lightning_module.py │ │ │ ├── t2s_lightning_module_onnx.py │ │ │ ├── t2s_model.py │ │ │ ├── t2s_model_onnx.py │ │ │ └── utils.py │ │ ├── modules/ │ │ │ ├── __init__.py │ │ │ ├── activation.py │ │ │ ├── activation_onnx.py │ │ │ ├── embedding.py │ │ │ ├── embedding_onnx.py │ │ │ ├── lr_schedulers.py │ │ │ ├── optim.py │ │ │ ├── patched_mha_with_cache.py │ │ │ ├── patched_mha_with_cache_onnx.py │ │ │ ├── scaling.py │ │ │ ├── transformer.py │ │ │ └── transformer_onnx.py │ │ ├── text_processing/ │ │ │ ├── __init__.py │ │ │ ├── phonemizer.py │ │ │ └── symbols.py │ │ └── utils/ │ │ ├── __init__.py │ │ ├── initialize.py │ │ └── io.py │ ├── BigVGAN/ │ │ ├── LICENSE │ │ ├── README.md │ │ ├── activations.py │ │ ├── alias_free_activation/ │ │ │ ├── cuda/ │ │ │ │ ├── __init__.py │ │ │ │ ├── activation1d.py │ │ │ │ ├── anti_alias_activation.cpp │ │ │ │ ├── anti_alias_activation_cuda.cu │ │ │ │ ├── compat.h │ │ │ │ ├── load.py │ │ │ │ └── type_shim.h │ │ │ └── torch/ │ │ │ ├── __init__.py │ │ │ ├── act.py │ │ │ ├── filter.py │ │ │ └── resample.py │ │ ├── bigvgan.py │ │ ├── configs/ │ │ │ ├── bigvgan_22khz_80band.json │ │ │ ├── bigvgan_24khz_100band.json │ │ │ ├── bigvgan_base_22khz_80band.json │ │ │ ├── bigvgan_base_24khz_100band.json │ │ │ ├── bigvgan_v2_22khz_80band_256x.json │ │ │ ├── bigvgan_v2_22khz_80band_fmax8k_256x.json │ │ │ ├── bigvgan_v2_24khz_100band_256x.json │ │ │ ├── bigvgan_v2_44khz_128band_256x.json │ │ │ └── bigvgan_v2_44khz_128band_512x.json │ │ ├── discriminators.py │ │ ├── env.py │ │ ├── incl_licenses/ │ │ │ ├── LICENSE_1 │ │ │ ├── LICENSE_2 │ │ │ ├── LICENSE_3 │ │ │ ├── LICENSE_4 │ │ │ ├── LICENSE_5 │ │ │ ├── LICENSE_6 │ │ │ ├── LICENSE_7 │ │ │ └── LICENSE_8 │ │ ├── inference.py │ │ ├── inference_e2e.py │ │ ├── loss.py │ │ ├── meldataset.py │ │ ├── nv-modelcard++/ │ │ │ ├── .gitkeep │ │ │ ├── bias.md │ │ │ ├── explainability.md │ │ │ ├── overview.md │ │ │ ├── privacy.md │ │ │ └── safety.md │ │ ├── requirements.txt │ │ ├── tests/ │ │ │ ├── test_activation.py │ │ │ ├── test_activation_snake_beta.py │ │ │ └── test_cuda_vs_torch_model.py │ │ ├── train.py │ │ └── utils0.py │ ├── TTS_infer_pack/ │ │ ├── TTS.py │ │ ├── TextPreprocessor.py │ │ ├── __init__.py │ │ └── text_segmentation_method.py │ ├── configs/ │ │ ├── .gitignore │ │ ├── s2.json │ │ ├── s2v2Pro.json │ │ └── s2v2ProPlus.json │ ├── download.py │ ├── eres2net/ │ │ ├── ERes2Net.py │ │ ├── ERes2NetV2.py │ │ ├── ERes2Net_huge.py │ │ ├── fusion.py │ │ ├── kaldi.py │ │ └── pooling_layers.py │ ├── export_torch_script.py │ ├── export_torch_script_v3v4.py │ ├── f5_tts/ │ │ └── model/ │ │ ├── __init__.py │ │ ├── backbones/ │ │ │ ├── README.md │ │ │ ├── dit.py │ │ │ ├── mmdit.py │ │ │ └── unett.py │ │ └── modules.py │ ├── feature_extractor/ │ │ ├── __init__.py │ │ ├── cnhubert.py │ │ └── whisper_enc.py │ ├── inference_cli.py │ ├── inference_gui.py │ ├── inference_webui.py │ ├── inference_webui_fast.py │ ├── module/ │ │ ├── __init__.py │ │ ├── attentions.py │ │ ├── attentions_onnx.py │ │ ├── commons.py │ │ ├── core_vq.py │ │ ├── data_utils.py │ │ ├── ddp_utils.py │ │ ├── distrib.py │ │ ├── losses.py │ │ ├── mel_processing.py │ │ ├── models.py │ │ ├── models_onnx.py │ │ ├── modules.py │ │ ├── mrte_model.py │ │ ├── quantize.py │ │ └── transforms.py │ ├── onnx_export.py │ ├── prepare_datasets/ │ │ ├── 1-get-text.py │ │ ├── 2-get-hubert-wav32k.py │ │ ├── 2-get-sv.py │ │ └── 3-get-semantic.py │ ├── pretrained_models/ │ │ └── .gitignore │ ├── process_ckpt.py │ ├── s1_train.py │ ├── s2_train.py │ ├── s2_train_v3.py │ ├── s2_train_v3_lora.py │ ├── stream_v2pro.py │ ├── sv.py │ ├── text/ │ │ ├── .gitignore │ │ ├── LangSegmenter/ │ │ │ ├── __init__.py │ │ │ └── langsegmenter.py │ │ ├── __init__.py │ │ ├── cantonese.py │ │ ├── chinese.py │ │ ├── chinese2.py │ │ ├── cleaner.py │ │ ├── cmudict-fast.rep │ │ ├── cmudict.rep │ │ ├── en_normalization/ │ │ │ └── expend.py │ │ ├── engdict-hot.rep │ │ ├── engdict_cache.pickle │ │ ├── english.py │ │ ├── g2pw/ │ │ │ ├── __init__.py │ │ │ ├── dataset.py │ │ │ ├── g2pw.py │ │ │ ├── onnx_api.py │ │ │ ├── polyphonic-fix.rep │ │ │ ├── polyphonic.pickle │ │ │ ├── polyphonic.rep │ │ │ └── utils.py │ │ ├── ja_userdic/ │ │ │ └── userdict.csv │ │ ├── japanese.py │ │ ├── korean.py │ │ ├── namedict_cache.pickle │ │ ├── opencpop-strict.txt │ │ ├── symbols.py │ │ ├── symbols2.py │ │ ├── tone_sandhi.py │ │ └── zh_normalization/ │ │ ├── README.md │ │ ├── __init__.py │ │ ├── char_convert.py │ │ ├── chronology.py │ │ ├── constants.py │ │ ├── num.py │ │ ├── phonecode.py │ │ ├── quantifier.py │ │ └── text_normlization.py │ └── utils.py ├── LICENSE ├── README.md ├── api.py ├── api_v2.py ├── config.py ├── docker-compose.yaml ├── docker_build.sh ├── docs/ │ ├── cn/ │ │ ├── Changelog_CN.md │ │ └── README.md │ ├── en/ │ │ └── Changelog_EN.md │ ├── ja/ │ │ ├── Changelog_JA.md │ │ └── README.md │ ├── ko/ │ │ ├── Changelog_KO.md │ │ └── README.md │ └── tr/ │ ├── Changelog_TR.md │ └── README.md ├── extra-req.txt ├── go-webui.bat ├── go-webui.ps1 ├── install.ps1 ├── install.sh ├── requirements.txt ├── tools/ │ ├── AP_BWE_main/ │ │ ├── 24kto48k/ │ │ │ └── readme.txt │ │ ├── LICENSE │ │ ├── README.md │ │ ├── datasets1/ │ │ │ ├── __init__.py │ │ │ └── dataset.py │ │ └── models/ │ │ ├── __init__.py │ │ └── model.py │ ├── __init__.py │ ├── asr/ │ │ ├── config.py │ │ ├── fasterwhisper_asr.py │ │ ├── funasr_asr.py │ │ └── models/ │ │ └── .gitignore │ ├── assets.py │ ├── audio_sr.py │ ├── cmd-denoise.py │ ├── denoise-model/ │ │ └── .gitignore │ ├── i18n/ │ │ ├── i18n.py │ │ ├── locale/ │ │ │ ├── en_US.json │ │ │ ├── es_ES.json │ │ │ ├── fr_FR.json │ │ │ ├── it_IT.json │ │ │ ├── ja_JP.json │ │ │ ├── ko_KR.json │ │ │ ├── pt_BR.json │ │ │ ├── ru_RU.json │ │ │ ├── tr_TR.json │ │ │ ├── zh_CN.json │ │ │ ├── zh_HK.json │ │ │ ├── zh_SG.json │ │ │ └── zh_TW.json │ │ └── scan_i18n.py │ ├── my_utils.py │ ├── slice_audio.py │ ├── slicer2.py │ ├── subfix_webui.py │ └── uvr5/ │ ├── bs_roformer/ │ │ ├── __init__.py │ │ ├── attend.py │ │ ├── bs_roformer.py │ │ └── mel_band_roformer.py │ ├── bsroformer.py │ ├── mdxnet.py │ ├── uvr5_weights/ │ │ └── .gitignore │ ├── vr.py │ └── webui.py └── webui.py