gitextract_kozm2q6w/ ├── .gitignore ├── LICENSE ├── README.md ├── cli/ │ ├── SparkTTS.py │ └── inference.py ├── example/ │ └── infer.sh ├── requirements.txt ├── runtime/ │ └── triton_trtllm/ │ ├── Dockerfile.server │ ├── README.md │ ├── client_grpc.py │ ├── client_http.py │ ├── docker-compose.yml │ ├── model_repo/ │ │ ├── audio_tokenizer/ │ │ │ ├── 1/ │ │ │ │ └── model.py │ │ │ └── config.pbtxt │ │ ├── spark_tts/ │ │ │ ├── 1/ │ │ │ │ └── model.py │ │ │ └── config.pbtxt │ │ ├── tensorrt_llm/ │ │ │ ├── 1/ │ │ │ │ └── .gitkeep │ │ │ └── config.pbtxt │ │ └── vocoder/ │ │ ├── 1/ │ │ │ └── model.py │ │ └── config.pbtxt │ ├── run.sh │ └── scripts/ │ ├── convert_checkpoint.py │ └── fill_template.py ├── sparktts/ │ ├── models/ │ │ ├── audio_tokenizer.py │ │ └── bicodec.py │ ├── modules/ │ │ ├── blocks/ │ │ │ ├── layers.py │ │ │ ├── samper.py │ │ │ └── vocos.py │ │ ├── encoder_decoder/ │ │ │ ├── feat_decoder.py │ │ │ ├── feat_encoder.py │ │ │ └── wave_generator.py │ │ ├── fsq/ │ │ │ ├── finite_scalar_quantization.py │ │ │ └── residual_fsq.py │ │ ├── speaker/ │ │ │ ├── ecapa_tdnn.py │ │ │ ├── perceiver_encoder.py │ │ │ ├── pooling_layers.py │ │ │ └── speaker_encoder.py │ │ └── vq/ │ │ └── factorized_vector_quantize.py │ └── utils/ │ ├── __init__.py │ ├── audio.py │ ├── file.py │ ├── parse_options.sh │ └── token_parser.py └── webui.py