gitextract_qr2pzmmc/ ├── .github/ │ ├── PULL_REQUEST_TEMPLATE.md │ └── workflows/ │ └── python-package.yml ├── .gitignore ├── .pylintrc ├── LICENSE ├── README.md ├── docker/ │ ├── Dockerfile │ └── docker-compose.yml ├── docs/ │ ├── arena.md │ ├── awq.md │ ├── commands/ │ │ ├── conv_release.md │ │ ├── data_cleaning.md │ │ ├── leaderboard.md │ │ ├── local_cluster.md │ │ ├── pypi.md │ │ └── webserver.md │ ├── dashinfer_integration.md │ ├── dataset_release.md │ ├── exllama_v2.md │ ├── gptq.md │ ├── langchain_integration.md │ ├── lightllm_integration.md │ ├── mlx_integration.md │ ├── model_support.md │ ├── openai_api.md │ ├── server_arch.md │ ├── third_party_ui.md │ ├── training.md │ ├── vicuna_weights_version.md │ ├── vllm_integration.md │ └── xFasterTransformer.md ├── fastchat/ │ ├── __init__.py │ ├── constants.py │ ├── conversation.py │ ├── data/ │ │ ├── __init__.py │ │ ├── clean_sharegpt.py │ │ ├── convert_alpaca.py │ │ ├── extract_gpt4_only.py │ │ ├── extract_single_round.py │ │ ├── filter_wrong_format.py │ │ ├── get_stats.py │ │ ├── hardcoded_questions.py │ │ ├── inspect_data.py │ │ ├── merge.py │ │ ├── optional_clean.py │ │ ├── optional_replace.py │ │ ├── prepare_all.py │ │ ├── pretty_json.py │ │ ├── sample.py │ │ ├── split_long_conversation.py │ │ └── split_train_test.py │ ├── llm_judge/ │ │ ├── README.md │ │ ├── clean_judgment.py │ │ ├── common.py │ │ ├── compute_agreement.py │ │ ├── data/ │ │ │ ├── judge_prompts.jsonl │ │ │ ├── mt_bench/ │ │ │ │ ├── question.jsonl │ │ │ │ └── reference_answer/ │ │ │ │ └── gpt-4.jsonl │ │ │ └── vicuna_bench/ │ │ │ ├── question.jsonl │ │ │ └── reference_answer/ │ │ │ └── gpt-4.jsonl │ │ ├── download_mt_bench_pregenerated.py │ │ ├── gen_api_answer.py │ │ ├── gen_judgment.py │ │ ├── gen_model_answer.py │ │ ├── qa_browser.py │ │ └── show_result.py │ ├── model/ │ │ ├── __init__.py │ │ ├── apply_delta.py │ │ ├── apply_lora.py │ │ ├── compression.py │ │ ├── convert_fp16.py │ │ ├── llama_condense_monkey_patch.py │ │ ├── make_delta.py │ │ ├── model_adapter.py │ │ ├── model_chatglm.py │ │ ├── model_cllm.py │ │ ├── model_codet5p.py │ │ ├── model_exllama.py │ │ ├── model_falcon.py │ │ ├── model_registry.py │ │ ├── model_xfastertransformer.py │ │ ├── model_yuan2.py │ │ ├── monkey_patch_non_inplace.py │ │ ├── rwkv_model.py │ │ └── upload_hub.py │ ├── modules/ │ │ ├── __init__.py │ │ ├── awq.py │ │ ├── exllama.py │ │ ├── gptq.py │ │ └── xfastertransformer.py │ ├── protocol/ │ │ ├── api_protocol.py │ │ └── openai_api_protocol.py │ ├── serve/ │ │ ├── __init__.py │ │ ├── api_provider.py │ │ ├── base_model_worker.py │ │ ├── call_monitor.py │ │ ├── cli.py │ │ ├── controller.py │ │ ├── dashinfer_worker.py │ │ ├── gateway/ │ │ │ ├── README.md │ │ │ └── nginx.conf │ │ ├── gradio_block_arena_anony.py │ │ ├── gradio_block_arena_named.py │ │ ├── gradio_block_arena_vision.py │ │ ├── gradio_block_arena_vision_anony.py │ │ ├── gradio_block_arena_vision_named.py │ │ ├── gradio_global_state.py │ │ ├── gradio_web_server.py │ │ ├── gradio_web_server_multi.py │ │ ├── huggingface_api.py │ │ ├── huggingface_api_worker.py │ │ ├── inference.py │ │ ├── launch_all_serve.py │ │ ├── lightllm_worker.py │ │ ├── mlx_worker.py │ │ ├── model_worker.py │ │ ├── monitor/ │ │ │ ├── add_markdown_info.py │ │ │ ├── basic_stats.py │ │ │ ├── classify/ │ │ │ │ ├── README.md │ │ │ │ ├── category.py │ │ │ │ ├── config.yaml │ │ │ │ ├── display_score.py │ │ │ │ ├── label.py │ │ │ │ └── vision_config.yaml │ │ │ ├── clean_battle_data.py │ │ │ ├── clean_chat_data.py │ │ │ ├── copilot_arena.py │ │ │ ├── criteria_labeling.py │ │ │ ├── dataset_release_scripts/ │ │ │ │ ├── arena_33k/ │ │ │ │ │ ├── count_unique_users.py │ │ │ │ │ ├── filter_bad_conv.py │ │ │ │ │ ├── merge_field.py │ │ │ │ │ ├── sample.py │ │ │ │ │ └── upload_hf_dataset.py │ │ │ │ └── lmsys_chat_1m/ │ │ │ │ ├── approve_all.py │ │ │ │ ├── compute_stats.py │ │ │ │ ├── filter_bad_conv.py │ │ │ │ ├── final_post_processing.py │ │ │ │ ├── instructions.md │ │ │ │ ├── merge_oai_tag.py │ │ │ │ ├── process_all.sh │ │ │ │ ├── sample.py │ │ │ │ └── upload_hf_dataset.py │ │ │ ├── deduplication.py │ │ │ ├── elo_analysis.py │ │ │ ├── inspect_conv.py │ │ │ ├── intersect_conv_file.py │ │ │ ├── leaderboard_csv_to_html.py │ │ │ ├── monitor.py │ │ │ ├── monitor_md.py │ │ │ ├── rating_systems.py │ │ │ ├── summarize_cluster.py │ │ │ ├── tag_openai_moderation.py │ │ │ ├── topic_clustering.py │ │ │ └── vote_time_stats/ │ │ │ ├── README.md │ │ │ ├── analyze_data.py │ │ │ └── plot.py │ │ ├── multi_model_worker.py │ │ ├── openai_api_server.py │ │ ├── register_worker.py │ │ ├── remote_logger.py │ │ ├── sglang_worker.py │ │ ├── shutdown_serve.py │ │ ├── test_message.py │ │ ├── test_throughput.py │ │ ├── vision/ │ │ │ ├── create_vqa_examples_dir.py │ │ │ ├── create_vqa_examples_json.py │ │ │ └── image.py │ │ └── vllm_worker.py │ ├── train/ │ │ ├── llama2_flash_attn_monkey_patch.py │ │ ├── llama_flash_attn_monkey_patch.py │ │ ├── llama_xformers_attn_monkey_patch.py │ │ ├── train.py │ │ ├── train_baichuan.py │ │ ├── train_flant5.py │ │ ├── train_lora.py │ │ ├── train_lora_t5.py │ │ ├── train_mem.py │ │ ├── train_with_template.py │ │ ├── train_xformers.py │ │ └── train_yuan2.py │ └── utils.py ├── format.sh ├── playground/ │ ├── FastChat_API_GoogleColab.ipynb │ ├── __init__.py │ ├── benchmark/ │ │ └── benchmark_api_provider.py │ ├── deepspeed_config_s2.json │ ├── deepspeed_config_s3.json │ └── test_embedding/ │ ├── README.md │ ├── test_classification.py │ ├── test_semantic_search.py │ └── test_sentence_similarity.py ├── pyproject.toml ├── scripts/ │ ├── build-api.sh │ ├── test_readme_train.sh │ ├── train_lora.sh │ ├── train_vicuna_13b.sh │ ├── train_vicuna_7b.sh │ └── upload_pypi.sh └── tests/ ├── README.md ├── killall_python.sh ├── launch_openai_api_test_server.py ├── load_test.py ├── test_cli.py ├── test_cli_inputs.txt ├── test_image_utils.py ├── test_openai_api.py ├── test_openai_langchain.py └── test_openai_vision_api.py