gitextract_yevbd9zu/

├── README.md
├── README_EN.md
├── assets/
│   ├── meta_eval_13B.md
│   └── meta_eval_7B.md
├── data/
│   ├── dev_sft.csv
│   ├── dev_sft_sharegpt.csv
│   └── train_sft.csv
├── docker/
│   ├── Dockerfile
│   ├── Dockerfile_train
│   └── docker-compose.yml
├── docs/
│   ├── chat_gradio_guide.md
│   └── inference_speed_guide.md
├── examples/
│   ├── chat_gradio.py
│   ├── chat_gradio_no_merge.py
│   └── llama2_for_langchain.py
├── inference-speed/
│   ├── CPU/
│   │   └── ggml/
│   │       └── README.md
│   └── GPU/
│       ├── FasterTransformer_example/
│       │   └── README.md
│       ├── JittorLLMs_example/
│       │   └── README.md
│       ├── TensorRT-LLM_example/
│       │   ├── README.md
│       │   ├── atom_inference.py
│       │   └── utils.py
│       ├── lmdeploy_example/
│       │   ├── README.md
│       │   └── test_api_server.py
│       └── vllm_example/
│           ├── README.md
│           ├── api_server.py
│           ├── client_test.py
│           ├── multi_gpus_api_server.sh
│           └── single_gpu_api_server.sh
├── requirements.txt
├── scripts/
│   ├── api/
│   │   ├── README.md
│   │   ├── accelerate_client.py
│   │   └── accelerate_server.py
│   ├── convert2hf/
│   │   ├── README.md
│   │   └── convert_llama_weights_to_hf.py
│   └── test_model/
│       └── test_pretrain_model.ipynb
└── train/
    ├── merge_peft_model/
    │   ├── merge.sh
    │   ├── merge_muilt.sh
    │   ├── merge_muilt_peft_adapter.py
    │   └── merge_peft_adapter.py
    ├── pretrain/
    │   ├── accuracy.py
    │   ├── ds_config_zero2.json
    │   ├── ds_config_zero3.json
    │   ├── pretrain.sh
    │   └── pretrain_clm.py
    └── sft/
        ├── accuracy.py
        ├── ds_config_zero2.json
        ├── finetune.sh
        ├── finetune_clm.py
        ├── finetune_clm_lora.py
        └── finetune_lora.sh