gitextract_diif25g8/ ├── .dockerignore ├── .github/ │ ├── ISSUE_TEMPLATE/ │ │ ├── 1_bug-report.yml │ │ ├── 2_feature-request.yml │ │ ├── 3_documentation.yml │ │ └── config.yml │ └── workflows/ │ ├── basic_check.yml │ ├── build_docker_image.yml │ └── sync_files.yml ├── .gitignore ├── .pre-commit-config.yaml ├── Cookbook/ │ ├── CHANGELOG.md │ ├── CONTRIBUTING.md │ ├── CONTRIBUTING_cn.md │ ├── README.md │ ├── README_cn.md │ ├── cn/ │ │ ├── api/ │ │ │ ├── function_calling/ │ │ │ │ └── function_calling_llamaindex.ipynb │ │ │ └── rag/ │ │ │ ├── yi_rag_langchain.ipynb │ │ │ └── yi_rag_llamaindex.ipynb │ │ ├── ecosystem/ │ │ │ ├── yi-vl最佳实践.md │ │ │ ├── 使用Yi大模型玩转街霸三.md │ │ │ ├── 基于LlamaIndex和Yi-large构建智能问答系统.md │ │ │ ├── 基于yi-large构建思维导图生成器.md │ │ │ └── 强化Yi-1.5-6B-Chat的数学和逻辑能力.md │ │ └── opensource/ │ │ ├── Inference/ │ │ │ ├── Inference_using_lmdeploy.ipynb │ │ │ ├── Inference_using_swift.ipynb │ │ │ ├── Inference_using_transformers.ipynb │ │ │ └── vLLM_Inference_tutorial.ipynb │ │ ├── fine_tune/ │ │ │ ├── finetune-yi-with-llamafactory.md │ │ │ └── finetune-yi-with-swift.md │ │ ├── function_calling/ │ │ │ ├── function_calling.ipynb │ │ │ └── function_calling_llamaindex.ipynb │ │ ├── local/ │ │ │ ├── local-llama.cpp.md │ │ │ ├── local-lm-studio.md │ │ │ ├── local-mlx.md │ │ │ └── local-ollama.md │ │ ├── quantization/ │ │ │ ├── autoawq-yi-quantization.md │ │ │ ├── autogptq-yi-quantization.md │ │ │ └── swift-yi-quantization.md │ │ └── rag/ │ │ ├── yi_rag_langchain.ipynb │ │ └── yi_rag_llamaindex.ipynb │ └── en/ │ ├── api/ │ │ ├── function_calling/ │ │ │ └── function_calling_llamaindex.ipynb │ │ └── rag/ │ │ ├── yi_rag_langchain.ipynb │ │ └── yi_rag_llamaindex.ipynb │ ├── ecosystem/ │ │ ├── Building_a_Mind_Map_Generator_Powered_by_Yi-Large.md │ │ ├── Building_an_Intelligent_Q&A_System_Based_on_LlamaIndex_and_Yi-large.md │ │ ├── Enhancing_the_Mathematical_and_Logical_Reasoning_Abilities_of_Yi-1.5-6B-Chat.md │ │ ├── Mastering_Street_Fighter_III_with_the_Yi_Language_Model.md │ │ └── yi-vl-best-practice.md │ └── opensource/ │ ├── Inference/ │ │ ├── Inference_using_lmdeploy.ipynb │ │ ├── Inference_using_swift.ipynb │ │ ├── Inference_using_transformers.ipynb │ │ └── vLLM_Inference_tutorial.ipynb │ ├── fine_tune/ │ │ ├── finetune-yi-with-llamafactory.md │ │ └── finetune-yi-with-swift.md │ ├── function_calling/ │ │ ├── function_calling.ipynb │ │ └── function_calling_llamaindex.ipynb │ ├── local/ │ │ ├── local-llama.cpp.md │ │ ├── local-lm-studio.md │ │ ├── local-mlx.md │ │ └── local-ollama.md │ ├── quantization/ │ │ ├── autoawq-yi-quantization.md │ │ ├── autogptq-yi-quantization.md │ │ └── swift-yi-quantization.md │ └── rag/ │ ├── yi_rag_langchain.ipynb │ └── yi_rag_llamaindex.ipynb ├── Dockerfile ├── Events/ │ └── readme.md ├── HUGGINGFACE_README.md ├── LICENSE ├── MODEL_LICENSE_AGREEMENT.txt ├── NOTICE ├── README/ │ ├── huggingface_header.md │ ├── modelscope_header.md │ └── wisemodel_header.md ├── README.md ├── README_CN.md ├── VL/ │ ├── README.md │ ├── cli.py │ ├── llava/ │ │ ├── __init__.py │ │ ├── conversation.py │ │ ├── mm_utils.py │ │ └── model/ │ │ ├── __init__.py │ │ ├── clip_encoder/ │ │ │ ├── builder.py │ │ │ └── clip_encoder.py │ │ ├── constants.py │ │ ├── llava_arch.py │ │ ├── llava_llama.py │ │ └── multimodal_projector/ │ │ └── builder.py │ ├── openai_api.py │ ├── requirements.txt │ ├── single_inference.py │ └── web_demo.py ├── assets/ │ └── img/ │ ├── coder/ │ │ └── test │ └── events/ │ └── 1 ├── conda-lock.yml ├── demo/ │ ├── README.md │ ├── text_generation.py │ ├── text_generation_tp.py │ └── web_demo.py ├── docs/ │ └── README_llama.cpp.md ├── finetune/ │ ├── README.md │ ├── README_CN.md │ ├── constant.py │ ├── scripts/ │ │ ├── run_eval.sh │ │ ├── run_sft_Yi_34b.sh │ │ ├── run_sft_Yi_6b.sh │ │ └── run_sft_lora_Yi_6b.sh │ ├── sft/ │ │ ├── main.py │ │ └── prompt_eval.py │ ├── utils/ │ │ ├── data/ │ │ │ ├── data_utils.py │ │ │ └── raw_datasets.py │ │ ├── ds_utils.py │ │ ├── model/ │ │ │ └── model_utils.py │ │ ├── module/ │ │ │ └── lora.py │ │ ├── perf.py │ │ └── utils.py │ └── yi_example_dataset/ │ └── data/ │ ├── eval.jsonl │ └── train.jsonl ├── pyproject.toml ├── quantization/ │ ├── awq/ │ │ ├── README.md │ │ ├── eval_quantized_model.py │ │ └── quant_autoawq.py │ └── gptq/ │ ├── README.md │ ├── eval_quantized_model.py │ └── quant_autogptq.py └── requirements.txt