gitextract_z12pzj5x/ ├── .dockerignore ├── .github/ │ └── workflows/ │ └── docker-image.yml ├── .gitignore ├── .python-version ├── Dockerfile ├── Dockerfile.copy ├── LICENSE ├── MANIFEST.in ├── README.md ├── docker-compose-bash.yaml ├── docker-compose.yml ├── gpt_server/ │ ├── __init__.py │ ├── cli.py │ ├── database/ │ │ └── models/ │ │ └── process_manager.py │ ├── model_backend/ │ │ ├── __init__.py │ │ ├── base.py │ │ ├── hf_backend.py │ │ ├── lmdeploy_backend.py │ │ ├── sglang_backend.py │ │ ├── utils.py │ │ └── vllm_backend.py │ ├── model_handler/ │ │ ├── __init__.py │ │ ├── chat_template/ │ │ │ ├── get_chat_template.py │ │ │ ├── qwen3.jinja │ │ │ ├── qwen3_zh.jinja │ │ │ └── qwen3vl.jinja │ │ ├── pitch.py │ │ ├── reasoning_parser.py │ │ ├── tool_parser.py │ │ └── utils.py │ ├── model_worker/ │ │ ├── __init__.py │ │ ├── auto.py │ │ ├── base/ │ │ │ ├── __init__.py │ │ │ ├── base_model_worker.py │ │ │ └── model_worker_base.py │ │ ├── embedding_infinity.py │ │ ├── embedding_sentence_transformers.py │ │ ├── embedding_v2.py │ │ ├── embedding_vllm.py │ │ ├── flux.py │ │ ├── funasr.py │ │ ├── qwen_image.py │ │ ├── qwen_image_edit.py │ │ ├── spark_tts.py │ │ ├── utils.py │ │ ├── voxcpm_tts.py │ │ ├── wan.py │ │ └── z_image.py │ ├── openai_api_protocol/ │ │ ├── __init__.py │ │ └── custom_api_protocol.py │ ├── script/ │ │ ├── __init__.py │ │ ├── config_example.yaml │ │ ├── start.sh │ │ └── stop.sh │ ├── serving/ │ │ ├── __init__.py │ │ ├── chat_ui.py │ │ ├── controller.py │ │ ├── controller_v2.py │ │ ├── main.py │ │ ├── openai_api_server.py │ │ └── server_ui.py │ ├── settings.py │ ├── utils.py │ └── version.py ├── pyproject.toml ├── setup.py └── tests/ ├── download_model.py ├── responses_api/ │ ├── test_openai_responses.py │ ├── test_openai_responses_response_format.py │ ├── test_openai_responses_tool_calling.py │ └── test_response_vl_chat.py ├── sglang/ │ └── models.py ├── test_chat_template.py ├── test_embedding_dynamic_batch.py ├── test_image_edit.py ├── test_image_gen.py ├── test_mteb.py ├── test_needle_haystack.py ├── test_openai_chat.py ├── test_openai_completion.py ├── test_openai_completion_response_format.py ├── test_openai_completion_tool_calling.py ├── test_openai_embedding.py ├── test_openai_embedding_vl.py ├── test_openai_moderation.py ├── test_openai_rerank.py ├── test_openai_transcriptions.py ├── test_openai_tts_stream.py ├── test_openai_vl_chat.py ├── test_perf.py ├── test_rerank.py └── vllm/ ├── embedding.py └── models.py