gitextract_yevbd9zu/ ├── README.md ├── README_EN.md ├── assets/ │ ├── meta_eval_13B.md │ └── meta_eval_7B.md ├── data/ │ ├── dev_sft.csv │ ├── dev_sft_sharegpt.csv │ └── train_sft.csv ├── docker/ │ ├── Dockerfile │ ├── Dockerfile_train │ └── docker-compose.yml ├── docs/ │ ├── chat_gradio_guide.md │ └── inference_speed_guide.md ├── examples/ │ ├── chat_gradio.py │ ├── chat_gradio_no_merge.py │ └── llama2_for_langchain.py ├── inference-speed/ │ ├── CPU/ │ │ └── ggml/ │ │ └── README.md │ └── GPU/ │ ├── FasterTransformer_example/ │ │ └── README.md │ ├── JittorLLMs_example/ │ │ └── README.md │ ├── TensorRT-LLM_example/ │ │ ├── README.md │ │ ├── atom_inference.py │ │ └── utils.py │ ├── lmdeploy_example/ │ │ ├── README.md │ │ └── test_api_server.py │ └── vllm_example/ │ ├── README.md │ ├── api_server.py │ ├── client_test.py │ ├── multi_gpus_api_server.sh │ └── single_gpu_api_server.sh ├── requirements.txt ├── scripts/ │ ├── api/ │ │ ├── README.md │ │ ├── accelerate_client.py │ │ └── accelerate_server.py │ ├── convert2hf/ │ │ ├── README.md │ │ └── convert_llama_weights_to_hf.py │ └── test_model/ │ └── test_pretrain_model.ipynb └── train/ ├── merge_peft_model/ │ ├── merge.sh │ ├── merge_muilt.sh │ ├── merge_muilt_peft_adapter.py │ └── merge_peft_adapter.py ├── pretrain/ │ ├── accuracy.py │ ├── ds_config_zero2.json │ ├── ds_config_zero3.json │ ├── pretrain.sh │ └── pretrain_clm.py └── sft/ ├── accuracy.py ├── ds_config_zero2.json ├── finetune.sh ├── finetune_clm.py ├── finetune_clm_lora.py └── finetune_lora.sh