gitextract_whvdqko7/

├── .dockerignore
├── .github/
│   ├── build_windows_packages.ps1
│   └── workflows/
│       ├── build_windows_packages.yaml
│       └── docker-publish.yaml
├── .gitignore
├── .pre-commit-config.yaml
├── Colab-Inference.ipynb
├── Colab-WebUI.ipynb
├── Docker/
│   ├── install_wrapper.sh
│   └── miniforge_install.sh
├── Dockerfile
├── GPT_SoVITS/
│   ├── AR/
│   │   ├── __init__.py
│   │   ├── data/
│   │   │   ├── __init__.py
│   │   │   ├── bucket_sampler.py
│   │   │   ├── data_module.py
│   │   │   └── dataset.py
│   │   ├── models/
│   │   │   ├── __init__.py
│   │   │   ├── t2s_lightning_module.py
│   │   │   ├── t2s_lightning_module_onnx.py
│   │   │   ├── t2s_model.py
│   │   │   ├── t2s_model_onnx.py
│   │   │   └── utils.py
│   │   ├── modules/
│   │   │   ├── __init__.py
│   │   │   ├── activation.py
│   │   │   ├── activation_onnx.py
│   │   │   ├── embedding.py
│   │   │   ├── embedding_onnx.py
│   │   │   ├── lr_schedulers.py
│   │   │   ├── optim.py
│   │   │   ├── patched_mha_with_cache.py
│   │   │   ├── patched_mha_with_cache_onnx.py
│   │   │   ├── scaling.py
│   │   │   ├── transformer.py
│   │   │   └── transformer_onnx.py
│   │   ├── text_processing/
│   │   │   ├── __init__.py
│   │   │   ├── phonemizer.py
│   │   │   └── symbols.py
│   │   └── utils/
│   │       ├── __init__.py
│   │       ├── initialize.py
│   │       └── io.py
│   ├── BigVGAN/
│   │   ├── LICENSE
│   │   ├── README.md
│   │   ├── activations.py
│   │   ├── alias_free_activation/
│   │   │   ├── cuda/
│   │   │   │   ├── __init__.py
│   │   │   │   ├── activation1d.py
│   │   │   │   ├── anti_alias_activation.cpp
│   │   │   │   ├── anti_alias_activation_cuda.cu
│   │   │   │   ├── compat.h
│   │   │   │   ├── load.py
│   │   │   │   └── type_shim.h
│   │   │   └── torch/
│   │   │       ├── __init__.py
│   │   │       ├── act.py
│   │   │       ├── filter.py
│   │   │       └── resample.py
│   │   ├── bigvgan.py
│   │   ├── configs/
│   │   │   ├── bigvgan_22khz_80band.json
│   │   │   ├── bigvgan_24khz_100band.json
│   │   │   ├── bigvgan_base_22khz_80band.json
│   │   │   ├── bigvgan_base_24khz_100band.json
│   │   │   ├── bigvgan_v2_22khz_80band_256x.json
│   │   │   ├── bigvgan_v2_22khz_80band_fmax8k_256x.json
│   │   │   ├── bigvgan_v2_24khz_100band_256x.json
│   │   │   ├── bigvgan_v2_44khz_128band_256x.json
│   │   │   └── bigvgan_v2_44khz_128band_512x.json
│   │   ├── discriminators.py
│   │   ├── env.py
│   │   ├── incl_licenses/
│   │   │   ├── LICENSE_1
│   │   │   ├── LICENSE_2
│   │   │   ├── LICENSE_3
│   │   │   ├── LICENSE_4
│   │   │   ├── LICENSE_5
│   │   │   ├── LICENSE_6
│   │   │   ├── LICENSE_7
│   │   │   └── LICENSE_8
│   │   ├── inference.py
│   │   ├── inference_e2e.py
│   │   ├── loss.py
│   │   ├── meldataset.py
│   │   ├── nv-modelcard++/
│   │   │   ├── .gitkeep
│   │   │   ├── bias.md
│   │   │   ├── explainability.md
│   │   │   ├── overview.md
│   │   │   ├── privacy.md
│   │   │   └── safety.md
│   │   ├── requirements.txt
│   │   ├── tests/
│   │   │   ├── test_activation.py
│   │   │   ├── test_activation_snake_beta.py
│   │   │   └── test_cuda_vs_torch_model.py
│   │   ├── train.py
│   │   └── utils0.py
│   ├── TTS_infer_pack/
│   │   ├── TTS.py
│   │   ├── TextPreprocessor.py
│   │   ├── __init__.py
│   │   └── text_segmentation_method.py
│   ├── configs/
│   │   ├── .gitignore
│   │   ├── s2.json
│   │   ├── s2v2Pro.json
│   │   └── s2v2ProPlus.json
│   ├── download.py
│   ├── eres2net/
│   │   ├── ERes2Net.py
│   │   ├── ERes2NetV2.py
│   │   ├── ERes2Net_huge.py
│   │   ├── fusion.py
│   │   ├── kaldi.py
│   │   └── pooling_layers.py
│   ├── export_torch_script.py
│   ├── export_torch_script_v3v4.py
│   ├── f5_tts/
│   │   └── model/
│   │       ├── __init__.py
│   │       ├── backbones/
│   │       │   ├── README.md
│   │       │   ├── dit.py
│   │       │   ├── mmdit.py
│   │       │   └── unett.py
│   │       └── modules.py
│   ├── feature_extractor/
│   │   ├── __init__.py
│   │   ├── cnhubert.py
│   │   └── whisper_enc.py
│   ├── inference_cli.py
│   ├── inference_gui.py
│   ├── inference_webui.py
│   ├── inference_webui_fast.py
│   ├── module/
│   │   ├── __init__.py
│   │   ├── attentions.py
│   │   ├── attentions_onnx.py
│   │   ├── commons.py
│   │   ├── core_vq.py
│   │   ├── data_utils.py
│   │   ├── ddp_utils.py
│   │   ├── distrib.py
│   │   ├── losses.py
│   │   ├── mel_processing.py
│   │   ├── models.py
│   │   ├── models_onnx.py
│   │   ├── modules.py
│   │   ├── mrte_model.py
│   │   ├── quantize.py
│   │   └── transforms.py
│   ├── onnx_export.py
│   ├── prepare_datasets/
│   │   ├── 1-get-text.py
│   │   ├── 2-get-hubert-wav32k.py
│   │   ├── 2-get-sv.py
│   │   └── 3-get-semantic.py
│   ├── pretrained_models/
│   │   └── .gitignore
│   ├── process_ckpt.py
│   ├── s1_train.py
│   ├── s2_train.py
│   ├── s2_train_v3.py
│   ├── s2_train_v3_lora.py
│   ├── stream_v2pro.py
│   ├── sv.py
│   ├── text/
│   │   ├── .gitignore
│   │   ├── LangSegmenter/
│   │   │   ├── __init__.py
│   │   │   └── langsegmenter.py
│   │   ├── __init__.py
│   │   ├── cantonese.py
│   │   ├── chinese.py
│   │   ├── chinese2.py
│   │   ├── cleaner.py
│   │   ├── cmudict-fast.rep
│   │   ├── cmudict.rep
│   │   ├── en_normalization/
│   │   │   └── expend.py
│   │   ├── engdict-hot.rep
│   │   ├── engdict_cache.pickle
│   │   ├── english.py
│   │   ├── g2pw/
│   │   │   ├── __init__.py
│   │   │   ├── dataset.py
│   │   │   ├── g2pw.py
│   │   │   ├── onnx_api.py
│   │   │   ├── polyphonic-fix.rep
│   │   │   ├── polyphonic.pickle
│   │   │   ├── polyphonic.rep
│   │   │   └── utils.py
│   │   ├── ja_userdic/
│   │   │   └── userdict.csv
│   │   ├── japanese.py
│   │   ├── korean.py
│   │   ├── namedict_cache.pickle
│   │   ├── opencpop-strict.txt
│   │   ├── symbols.py
│   │   ├── symbols2.py
│   │   ├── tone_sandhi.py
│   │   └── zh_normalization/
│   │       ├── README.md
│   │       ├── __init__.py
│   │       ├── char_convert.py
│   │       ├── chronology.py
│   │       ├── constants.py
│   │       ├── num.py
│   │       ├── phonecode.py
│   │       ├── quantifier.py
│   │       └── text_normlization.py
│   └── utils.py
├── LICENSE
├── README.md
├── api.py
├── api_v2.py
├── config.py
├── docker-compose.yaml
├── docker_build.sh
├── docs/
│   ├── cn/
│   │   ├── Changelog_CN.md
│   │   └── README.md
│   ├── en/
│   │   └── Changelog_EN.md
│   ├── ja/
│   │   ├── Changelog_JA.md
│   │   └── README.md
│   ├── ko/
│   │   ├── Changelog_KO.md
│   │   └── README.md
│   └── tr/
│       ├── Changelog_TR.md
│       └── README.md
├── extra-req.txt
├── go-webui.bat
├── go-webui.ps1
├── install.ps1
├── install.sh
├── requirements.txt
├── tools/
│   ├── AP_BWE_main/
│   │   ├── 24kto48k/
│   │   │   └── readme.txt
│   │   ├── LICENSE
│   │   ├── README.md
│   │   ├── datasets1/
│   │   │   ├── __init__.py
│   │   │   └── dataset.py
│   │   └── models/
│   │       ├── __init__.py
│   │       └── model.py
│   ├── __init__.py
│   ├── asr/
│   │   ├── config.py
│   │   ├── fasterwhisper_asr.py
│   │   ├── funasr_asr.py
│   │   └── models/
│   │       └── .gitignore
│   ├── assets.py
│   ├── audio_sr.py
│   ├── cmd-denoise.py
│   ├── denoise-model/
│   │   └── .gitignore
│   ├── i18n/
│   │   ├── i18n.py
│   │   ├── locale/
│   │   │   ├── en_US.json
│   │   │   ├── es_ES.json
│   │   │   ├── fr_FR.json
│   │   │   ├── it_IT.json
│   │   │   ├── ja_JP.json
│   │   │   ├── ko_KR.json
│   │   │   ├── pt_BR.json
│   │   │   ├── ru_RU.json
│   │   │   ├── tr_TR.json
│   │   │   ├── zh_CN.json
│   │   │   ├── zh_HK.json
│   │   │   ├── zh_SG.json
│   │   │   └── zh_TW.json
│   │   └── scan_i18n.py
│   ├── my_utils.py
│   ├── slice_audio.py
│   ├── slicer2.py
│   ├── subfix_webui.py
│   └── uvr5/
│       ├── bs_roformer/
│       │   ├── __init__.py
│       │   ├── attend.py
│       │   ├── bs_roformer.py
│       │   └── mel_band_roformer.py
│       ├── bsroformer.py
│       ├── mdxnet.py
│       ├── uvr5_weights/
│       │   └── .gitignore
│       ├── vr.py
│       └── webui.py
└── webui.py