gitextract_n7cjws43/ ├── README.md ├── component/ │ ├── argument.py │ ├── collator.py │ ├── dataset.py │ ├── loss.py │ ├── model.py │ ├── template.py │ ├── trainer.py │ └── utils.py ├── data/ │ ├── dummy_data.jsonl │ ├── dummy_dpo.jsonl │ └── pretrain/ │ └── dummy_pretrain.jsonl ├── requirements.txt ├── script/ │ ├── chat/ │ │ └── chat.py │ ├── evaluate/ │ │ └── evaluate.py │ ├── http/ │ │ ├── post.py │ │ └── start_service.py │ └── merge_lora.py ├── train.py └── train_args/ ├── dpo/ │ ├── full/ │ │ ├── minicpm-2b-dpo-full.json │ │ ├── minicpm3-4b-dpo-full.json │ │ └── qwen1.5-7b-dpo-full.json │ ├── lora/ │ │ ├── minicpm-2b-dpo-lora.json │ │ ├── minicpm3-4b-dpo-lora.json │ │ └── qwen1.5-7b-dpo-lora.json │ └── qlora/ │ ├── minicpm-2b-dpo-qlora.json │ ├── minicpm3-4b-dpo-qlora.json │ └── qwen1.5-7b-dpo-qlora.json ├── ds_z3_config.json ├── pretrain/ │ ├── full/ │ │ ├── bloom-1b1-pretrain-full.json │ │ ├── bloom-3b-pretrain-full.json │ │ ├── minicpm3-4b-pretrain-full.json │ │ └── qwen-7b-pretrain-full.json │ └── qlora/ │ ├── bloom-3b-pretrain-qlora.json │ ├── minicpm3-4b-pretrain-qlora.json │ ├── qwen-7b-pretrain-qlora.json │ └── yi-6b-pretrain-qlora.json └── sft/ ├── full/ │ ├── bloom-1b1-sft-full.json │ ├── bloom-3b-sft-full.json │ ├── minicpm-2b-sft-full.json │ ├── minicpm3-4b-sft-full.json │ ├── qwen-7b-sft-full.json │ └── yi-6b-sft-full.json ├── lora/ │ ├── bloom-7b1-sft-lora.json │ ├── minicpm3-4b-sft-lora.json │ └── qwen1.5-7b-sft-lora.json └── qlora/ ├── baichuan-13b-sft-qlora.json ├── baichuan-7b-sft-qlora.json ├── baichuan2-13b-sft-qlora.json ├── baichuan2-7b-sft-qlora.json ├── bloom-7b1-sft-qlora.json ├── chatglm2-6b-sft-qlora.json ├── chatglm3-6b-sft-qlora.json ├── deepseek-7b-sft-qlora.json ├── deepseek-moe-16b-sft-qlora.json ├── gemma-2b-sft-qlora.json ├── gemma-7b-sft-qlora.json ├── internlm-20b-sft-qlora.json ├── internlm-7b-sft-qlora.json ├── internlm2-20b-sft-qlora.json ├── internlm2-7b-sft-qlora.json ├── llama2-13b-sft-qlora.json ├── llama2-7b-sft-qlora.json ├── llama3-8b-sft-qlora.json ├── minicpm-2b-sft-qlora.json ├── minicpm3-4b-sft-qlora.json ├── mistral-7b-sft-qlora.json ├── mixtral-8x7b-sft-qlora.json ├── orion-14b-sft-qlora.json ├── phi3-3.8b-sft-qlora.json ├── qwen-14b-sft-qlora.json ├── qwen-7b-sft-qlora.json ├── qwen1.5-7b-sft-qlora.json ├── qwen1.5-moe-2.7b-sft-qlora.json ├── qwen2-7b-sft-qlora.json ├── qwen2.5-7b-sft-qlora.json ├── vicuna-13b-sft-qlora.json ├── vicuna-7b-sft-qlora.json ├── xverse-13b-sft-qlora.json ├── xverse-7b-sft-qlora.json ├── yi-34b-sft-qlora.json ├── yi-6b-sft-qlora.json ├── yi1.5-6b-sft-qlora.json ├── zephyr-7b-sft-qlora.json └── ziya2-13b-sft-qlora.json