gitextract_lols3utf/ ├── .github/ │ └── workflows/ │ └── install_check.yml ├── .gitignore ├── LICENSE ├── README.md ├── example_for_mac.py ├── example_tts.py ├── example_tts_turbo.py ├── example_vc.py ├── gradio_tts_app.py ├── gradio_tts_turbo_app.py ├── gradio_vc_app.py ├── multilingual_app.py ├── pyproject.toml └── src/ └── chatterbox/ ├── __init__.py ├── models/ │ ├── __init__.py │ ├── s3gen/ │ │ ├── __init__.py │ │ ├── configs.py │ │ ├── const.py │ │ ├── decoder.py │ │ ├── f0_predictor.py │ │ ├── flow.py │ │ ├── flow_matching.py │ │ ├── hifigan.py │ │ ├── matcha/ │ │ │ ├── decoder.py │ │ │ ├── flow_matching.py │ │ │ ├── text_encoder.py │ │ │ └── transformer.py │ │ ├── s3gen.py │ │ ├── transformer/ │ │ │ ├── __init__.py │ │ │ ├── activation.py │ │ │ ├── attention.py │ │ │ ├── convolution.py │ │ │ ├── embedding.py │ │ │ ├── encoder_layer.py │ │ │ ├── positionwise_feed_forward.py │ │ │ ├── subsampling.py │ │ │ └── upsample_encoder.py │ │ ├── utils/ │ │ │ ├── class_utils.py │ │ │ ├── intmeanflow.py │ │ │ ├── mask.py │ │ │ └── mel.py │ │ └── xvector.py │ ├── s3tokenizer/ │ │ ├── __init__.py │ │ └── s3tokenizer.py │ ├── t3/ │ │ ├── __init__.py │ │ ├── inference/ │ │ │ ├── alignment_stream_analyzer.py │ │ │ └── t3_hf_backend.py │ │ ├── llama_configs.py │ │ ├── modules/ │ │ │ ├── cond_enc.py │ │ │ ├── learned_pos_emb.py │ │ │ ├── perceiver.py │ │ │ └── t3_config.py │ │ └── t3.py │ ├── tokenizers/ │ │ ├── __init__.py │ │ └── tokenizer.py │ ├── utils.py │ └── voice_encoder/ │ ├── __init__.py │ ├── config.py │ ├── melspec.py │ └── voice_encoder.py ├── mtl_tts.py ├── tts.py ├── tts_turbo.py └── vc.py