gitextract_zv37hsfa/

├── .dockerignore
├── .github/
│   ├── ISSUE_TEMPLATE/
│   │   ├── bug_report.yaml
│   │   ├── config.yaml
│   │   └── feature_request.yaml
│   └── workflows/
│       └── stale.yml
├── .gitignore
├── FAQ.md
├── FAQ_ja.md
├── FAQ_zh.md
├── LICENSE
├── NOTICE
├── README.md
├── README_CN.md
├── README_ES.md
├── README_FR.md
├── README_JA.md
├── Tongyi Qianwen LICENSE AGREEMENT
├── Tongyi Qianwen RESEARCH LICENSE AGREEMENT
├── ascend-support/
│   ├── README.md
│   └── docker_qwen.sh
├── cli_demo.py
├── dcu-support/
│   ├── README.md
│   ├── cli_demo.py
│   ├── cli_demo_batch.py
│   ├── model.properties
│   ├── package/
│   │   ├── fastllm_pytools/
│   │   │   ├── __init__.py
│   │   │   ├── hf_model.py
│   │   │   ├── llm.py
│   │   │   └── torch2flm.py
│   │   └── setup.py
│   ├── qwen2flm.py
│   ├── requirements.txt
│   └── web_demo.py
├── docker/
│   ├── Dockerfile
│   ├── Dockerfile-cu114
│   ├── Dockerfile-cu121
│   ├── docker_cli_demo.sh
│   ├── docker_openai_api.sh
│   └── docker_web_demo.sh
├── eval/
│   ├── EVALUATION.md
│   ├── evaluate_ceval.py
│   ├── evaluate_chat_ceval.py
│   ├── evaluate_chat_gsm8k.py
│   ├── evaluate_chat_humaneval.py
│   ├── evaluate_chat_mmlu.py
│   ├── evaluate_cmmlu.py
│   ├── evaluate_gsm8k.py
│   ├── evaluate_humaneval.py
│   ├── evaluate_mmlu.py
│   ├── evaluate_plugin.py
│   └── gsm8k_prompt.txt
├── examples/
│   ├── add_merges.py
│   ├── auto_comments.md
│   ├── auto_comments.py
│   ├── function_call_examples.py
│   ├── function_call_finetune_examples.py
│   ├── langchain_tooluse.ipynb
│   ├── qwen_extra.tiktoken
│   ├── qwen_extra_vocab.txt
│   ├── react_demo.py
│   ├── react_prompt.md
│   ├── system_prompt.md
│   ├── tokenizer_showcase.ipynb
│   ├── transformers_agent.md
│   └── vllm_wrapper.py
├── finetune/
│   ├── ds_config_zero2.json
│   ├── ds_config_zero3.json
│   ├── finetune_ds.sh
│   ├── finetune_lora_ds.sh
│   ├── finetune_lora_single_gpu.sh
│   ├── finetune_qlora_ds.sh
│   └── finetune_qlora_single_gpu.sh
├── finetune.py
├── openai_api.py
├── recipes/
│   ├── applications/
│   │   ├── chatbot/
│   │   │   └── qwen_chatbot.ipynb
│   │   ├── domain_finetune/
│   │   │   └── qwen_domain_finetune.ipynb
│   │   └── retrieval/
│   │       └── retrieval.ipynb
│   ├── finetune/
│   │   ├── ascend/
│   │   │   └── README.md
│   │   ├── deepspeed/
│   │   │   ├── finetune_fullparameter_multi_gpu.ipynb
│   │   │   ├── finetune_fullparameter_single_gpu.ipynb
│   │   │   ├── finetune_lora_multi_gpu.ipynb
│   │   │   ├── finetune_lora_single_gpu.ipynb
│   │   │   ├── finetune_qlora_multi_gpu.ipynb
│   │   │   ├── finetune_qlora_single_gpu.ipynb
│   │   │   ├── readme.md
│   │   │   └── requirements.txt
│   │   └── swift/
│   │       ├── README.md
│   │       └── README_CN.md
│   ├── inference/
│   │   ├── dashscope/
│   │   │   └── README.md
│   │   ├── hf_modelscope/
│   │   │   └── README.md
│   │   ├── quantization/
│   │   │   └── README.md
│   │   ├── tensorrt/
│   │   │   ├── README.md
│   │   │   └── docker/
│   │   │       └── Dockerfile
│   │   └── vllm/
│   │       ├── README.md
│   │       ├── template_chatml.jinja
│   │       └── vllm_wrapper.py
│   ├── quickstart/
│   │   └── qwen.ipynb
│   └── tests/
│       ├── README.md
│       ├── __init__.py
│       ├── assets/
│       │   └── test_sampled_qwen.json
│       ├── test_finetune/
│       │   └── test_finetune_ds.py
│       ├── test_inference/
│       │   ├── test_inference_api.py
│       │   └── test_inference_vllm_fschat.py
│       ├── ut_config.py
│       └── utils.py
├── requirements.txt
├── requirements_web_demo.txt
├── run_gptq.py
├── tech_memo.md
├── tokenization_note.md
├── tokenization_note_ja.md
├── tokenization_note_zh.md
├── utils.py
└── web_demo.py