gitextract_zv37hsfa/ ├── .dockerignore ├── .github/ │ ├── ISSUE_TEMPLATE/ │ │ ├── bug_report.yaml │ │ ├── config.yaml │ │ └── feature_request.yaml │ └── workflows/ │ └── stale.yml ├── .gitignore ├── FAQ.md ├── FAQ_ja.md ├── FAQ_zh.md ├── LICENSE ├── NOTICE ├── README.md ├── README_CN.md ├── README_ES.md ├── README_FR.md ├── README_JA.md ├── Tongyi Qianwen LICENSE AGREEMENT ├── Tongyi Qianwen RESEARCH LICENSE AGREEMENT ├── ascend-support/ │ ├── README.md │ └── docker_qwen.sh ├── cli_demo.py ├── dcu-support/ │ ├── README.md │ ├── cli_demo.py │ ├── cli_demo_batch.py │ ├── model.properties │ ├── package/ │ │ ├── fastllm_pytools/ │ │ │ ├── __init__.py │ │ │ ├── hf_model.py │ │ │ ├── llm.py │ │ │ └── torch2flm.py │ │ └── setup.py │ ├── qwen2flm.py │ ├── requirements.txt │ └── web_demo.py ├── docker/ │ ├── Dockerfile │ ├── Dockerfile-cu114 │ ├── Dockerfile-cu121 │ ├── docker_cli_demo.sh │ ├── docker_openai_api.sh │ └── docker_web_demo.sh ├── eval/ │ ├── EVALUATION.md │ ├── evaluate_ceval.py │ ├── evaluate_chat_ceval.py │ ├── evaluate_chat_gsm8k.py │ ├── evaluate_chat_humaneval.py │ ├── evaluate_chat_mmlu.py │ ├── evaluate_cmmlu.py │ ├── evaluate_gsm8k.py │ ├── evaluate_humaneval.py │ ├── evaluate_mmlu.py │ ├── evaluate_plugin.py │ └── gsm8k_prompt.txt ├── examples/ │ ├── add_merges.py │ ├── auto_comments.md │ ├── auto_comments.py │ ├── function_call_examples.py │ ├── function_call_finetune_examples.py │ ├── langchain_tooluse.ipynb │ ├── qwen_extra.tiktoken │ ├── qwen_extra_vocab.txt │ ├── react_demo.py │ ├── react_prompt.md │ ├── system_prompt.md │ ├── tokenizer_showcase.ipynb │ ├── transformers_agent.md │ └── vllm_wrapper.py ├── finetune/ │ ├── ds_config_zero2.json │ ├── ds_config_zero3.json │ ├── finetune_ds.sh │ ├── finetune_lora_ds.sh │ ├── finetune_lora_single_gpu.sh │ ├── finetune_qlora_ds.sh │ └── finetune_qlora_single_gpu.sh ├── finetune.py ├── openai_api.py ├── recipes/ │ ├── applications/ │ │ ├── chatbot/ │ │ │ └── qwen_chatbot.ipynb │ │ ├── domain_finetune/ │ │ │ └── qwen_domain_finetune.ipynb │ │ └── retrieval/ │ │ └── retrieval.ipynb │ ├── finetune/ │ │ ├── ascend/ │ │ │ └── README.md │ │ ├── deepspeed/ │ │ │ ├── finetune_fullparameter_multi_gpu.ipynb │ │ │ ├── finetune_fullparameter_single_gpu.ipynb │ │ │ ├── finetune_lora_multi_gpu.ipynb │ │ │ ├── finetune_lora_single_gpu.ipynb │ │ │ ├── finetune_qlora_multi_gpu.ipynb │ │ │ ├── finetune_qlora_single_gpu.ipynb │ │ │ ├── readme.md │ │ │ └── requirements.txt │ │ └── swift/ │ │ ├── README.md │ │ └── README_CN.md │ ├── inference/ │ │ ├── dashscope/ │ │ │ └── README.md │ │ ├── hf_modelscope/ │ │ │ └── README.md │ │ ├── quantization/ │ │ │ └── README.md │ │ ├── tensorrt/ │ │ │ ├── README.md │ │ │ └── docker/ │ │ │ └── Dockerfile │ │ └── vllm/ │ │ ├── README.md │ │ ├── template_chatml.jinja │ │ └── vllm_wrapper.py │ ├── quickstart/ │ │ └── qwen.ipynb │ └── tests/ │ ├── README.md │ ├── __init__.py │ ├── assets/ │ │ └── test_sampled_qwen.json │ ├── test_finetune/ │ │ └── test_finetune_ds.py │ ├── test_inference/ │ │ ├── test_inference_api.py │ │ └── test_inference_vllm_fschat.py │ ├── ut_config.py │ └── utils.py ├── requirements.txt ├── requirements_web_demo.txt ├── run_gptq.py ├── tech_memo.md ├── tokenization_note.md ├── tokenization_note_ja.md ├── tokenization_note_zh.md ├── utils.py └── web_demo.py