gitextract_35w5f4e3/ ├── .gitattributes ├── .github/ │ ├── ISSUE_TEMPLATE/ │ │ ├── api-feedback.md │ │ ├── blank-template.md │ │ ├── bug-report.md │ │ └── feature-request.md │ └── workflows/ │ └── documentation.yaml ├── .gitignore ├── .pre-commit-config.yaml ├── CODE_OF_CONDUCT.md ├── CONTRIBUTING.md ├── LICENSE ├── README.md ├── configs/ │ ├── accelerate_dsz0_config.yaml │ ├── accelerate_dsz2_config.yaml │ ├── accelerate_dsz3_config.yaml │ ├── accelerate_fsdp_config.yaml │ ├── accelerate_singlegpu_config.yaml │ ├── archive/ │ │ ├── accelerate_multigpu_config.yaml │ │ ├── accelerate_singlegpu_config.yaml │ │ ├── ds_config_chatbot.json │ │ ├── ds_config_eval.json │ │ ├── ds_config_multimodal.json │ │ └── ds_config_vis_chatbot.json │ ├── deepspeed/ │ │ ├── zero0_no_offload.json │ │ ├── zero2.json │ │ ├── zero2_no_offload.json │ │ ├── zero3.json │ │ ├── zero3_for_eval.json │ │ └── zero3_no_offload.json │ └── iterative_dpo.yaml ├── contrib/ │ ├── README.md │ ├── langchain/ │ │ ├── README.md │ │ └── retrieval_chatbot.py │ ├── long-context/ │ │ ├── hf_sft_full_finetune.sh │ │ ├── hf_sft_lora_flashattn.sh │ │ └── sft_summarizer.py │ ├── rlhflow/ │ │ ├── reward_modeling.py │ │ └── run_reward_modeling.sh │ ├── text2image/ │ │ ├── README.md │ │ ├── accelerate_t2i_config.yaml │ │ ├── diffuser_args.py │ │ ├── diffuser_finetuner.py │ │ ├── finetune_t2i.py │ │ ├── finetune_t2i.sh │ │ ├── requirements.txt │ │ └── t2i_dataset.py │ └── tool-finetune/ │ ├── README.md │ ├── function_call_finetune.py │ └── run_function_call_finetune.sh ├── docs/ │ ├── dev_notes/ │ │ └── finetuning.mmd │ ├── readme/ │ │ ├── Position_Interpolation.md │ │ ├── README_es.md │ │ ├── README_hindi.md │ │ ├── README_jp.md │ │ ├── README_ko.md │ │ ├── README_zh-hans.md │ │ ├── flash_attn2.md │ │ └── multi_node.md │ ├── requirements.txt │ └── source/ │ ├── _static/ │ │ └── check_before_after_lora_tuning.jsonl │ ├── about/ │ │ ├── authors.md │ │ ├── changelog.md │ │ └── index.md │ ├── blogs/ │ │ ├── benchmark.md │ │ └── index.md │ ├── conf.py │ ├── examples/ │ │ ├── DATASETS.md │ │ ├── TASK_GUIDE.md │ │ ├── checkpoints.md │ │ ├── customize_conversation_template.md │ │ ├── finetuning.md │ │ ├── index.md │ │ ├── medical_finetune.md │ │ ├── raft.md │ │ ├── reward_modeling.md │ │ └── supported_conversation_template.md │ └── index.md ├── examples/ │ ├── benchmarking.py │ ├── chatbot.py │ ├── chatbot_gradio.py │ ├── detail_memory.py │ ├── dpo_train.py │ ├── dpov2_train.py │ ├── evaluation.py │ ├── finetune.py │ ├── finetune_multi_modal.py │ ├── inference.py │ ├── iterative_dpo_train.py │ ├── merge_lora.py │ ├── multistage_finetune.py │ ├── raft_align.py │ ├── reward_modeling.py │ ├── rm_inference.py │ ├── sglang_inference.py │ ├── speculative_inference.py │ ├── tool_inference.py │ ├── vis_chatbot.py │ ├── vis_chatbot_gradio.py │ └── vllm_inference.py ├── experimental/ │ ├── Hymba/ │ │ ├── README.md │ │ └── run_finetune_hymba.sh │ ├── LISA-diffusion/ │ │ ├── README.md │ │ ├── diffusion_dpo/ │ │ │ ├── train_diffusion_dpo.py │ │ │ └── train_diffusion_dpo_lisa.py │ │ ├── instruct_pix2pix/ │ │ │ ├── test_instruct_pix2pix.py │ │ │ └── train_instruct_pix2pix_lisa.py │ │ ├── latent_consistency_model/ │ │ │ ├── train_lcm_distill_sd_wds_lisa.py │ │ │ └── train_lcm_distill_sd_wds_lora.py │ │ ├── requirement.txt │ │ └── single_lisa.py │ └── RAFT-diffusion/ │ ├── README.md │ ├── SD256-RAFT.ipynb │ ├── requirements.txt │ └── train_text_to_image_lora.py ├── pyproject.toml ├── requirements.txt ├── scripts/ │ ├── archive/ │ │ ├── bash.sh │ │ ├── convert_llama_weights_to_hf.py │ │ ├── download_model.sh │ │ ├── export_llama_state_dict_checkpoint.py │ │ ├── run_all_benchmark.sh │ │ ├── run_app.sh │ │ ├── run_benchmark.sh │ │ ├── run_chatbot.sh │ │ ├── run_chatbot_chatglm.sh │ │ ├── run_chatbot_cpu.sh │ │ ├── run_detail_gpu_memory.sh │ │ ├── run_dpo_align.sh │ │ ├── run_dpov2_align.sh │ │ ├── run_evaluation.sh │ │ ├── run_evaluation_accelerator.sh │ │ ├── run_evaluation_with_lora.sh │ │ ├── run_finetune.sh │ │ ├── run_finetune_with_custom_optim.sh │ │ ├── run_finetune_with_lisa.sh │ │ ├── run_finetune_with_lora.sh │ │ ├── run_finetune_with_qlora.sh │ │ ├── run_inference.sh │ │ ├── run_inference_multimodal_model.sh │ │ ├── run_iterative_dpo.sh │ │ ├── run_multistage_finetune.sh │ │ ├── run_raft_align.sh │ │ ├── run_reward_modeling.sh │ │ ├── run_reward_modeling_with_lisa.sh │ │ ├── run_reward_modeling_with_lora.sh │ │ ├── run_rm_inference.sh │ │ ├── run_tool.sh │ │ └── run_vllm_inference.sh │ ├── multimodal/ │ │ ├── README.md │ │ ├── run_finetune_multi_modal_stage1.sh │ │ ├── run_finetune_multi_modal_stage2.sh │ │ ├── run_vis_chatbot_blip2.sh │ │ ├── run_vis_chatbot_gradio_minigpt4.sh │ │ ├── run_vis_chatbot_llava.sh │ │ └── run_vis_chatbot_minigpt4.sh │ ├── run_finetune.sh │ ├── run_finetune_with_custom_optim.sh │ ├── run_finetune_with_lisa.sh │ ├── run_finetune_with_lora.sh │ ├── run_finetune_with_qlora.sh │ ├── run_merge_lora.sh │ ├── run_sglang_inference.sh │ └── run_unittest.sh ├── setup.py ├── src/ │ └── lmflow/ │ ├── __init__.py │ ├── args.py │ ├── datasets/ │ │ ├── __init__.py │ │ ├── dataset.py │ │ └── multi_modal_dataset.py │ ├── models/ │ │ ├── __init__.py │ │ ├── auto_model.py │ │ ├── base_model.py │ │ ├── decoder_model.py │ │ ├── encoder_decoder_model.py │ │ ├── hf_decoder_model.py │ │ ├── hf_model_mixin.py │ │ ├── hf_text_regression_model.py │ │ ├── interfaces/ │ │ │ ├── __init__.py │ │ │ └── tunable.py │ │ ├── regression_model.py │ │ ├── text_regression_model.py │ │ ├── vision2seq_model.py │ │ └── vision_encoder/ │ │ ├── __init__.py │ │ └── clip_encoder.py │ ├── optim/ │ │ ├── __init__.py │ │ ├── adabelief.py │ │ ├── adabound.py │ │ ├── adadelta.py │ │ ├── adagrad.py │ │ ├── adam.py │ │ ├── adamax.py │ │ ├── adamp.py │ │ ├── adamw_schedule_free.py │ │ ├── adan.py │ │ ├── dummy.py │ │ ├── lamb.py │ │ ├── lars.py │ │ ├── muon.py │ │ ├── nadam.py │ │ ├── novograd.py │ │ ├── optimizers.py │ │ ├── radam.py │ │ ├── sgd_schedule_free.py │ │ ├── sgdp.py │ │ ├── sophia.py │ │ ├── utils.py │ │ └── yogi.py │ ├── pipeline/ │ │ ├── __init__.py │ │ ├── auto_pipeline.py │ │ ├── base_aligner.py │ │ ├── base_pipeline.py │ │ ├── base_tuner.py │ │ ├── dpo_aligner.py │ │ ├── dpov2_aligner.py │ │ ├── evaluator.py │ │ ├── finetuner.py │ │ ├── inferencer.py │ │ ├── iterative_dpo_aligner.py │ │ ├── raft_aligner.py │ │ ├── rm_inferencer.py │ │ ├── rm_tuner.py │ │ ├── sglang_inferencer.py │ │ ├── utils/ │ │ │ ├── __init__.py │ │ │ ├── dpov2_dataprocessor.py │ │ │ ├── dpov2_trainer.py │ │ │ ├── lisa_trainer.py │ │ │ ├── memory_safe_dpov2_align.py │ │ │ ├── memory_safe_vllm_inference.py │ │ │ ├── raft_trainer.py │ │ │ ├── rm_dataprocessor.py │ │ │ └── rm_trainer.py │ │ └── vllm_inferencer.py │ ├── tokenization/ │ │ ├── __init__.py │ │ ├── hf_decoder_model.py │ │ └── hf_text_regression_model.py │ ├── utils/ │ │ ├── __init__.py │ │ ├── common.py │ │ ├── constants.py │ │ ├── conversation_template/ │ │ │ ├── __init__.py │ │ │ ├── base.py │ │ │ ├── chatglm.py │ │ │ ├── chatml.py │ │ │ ├── deepseek.py │ │ │ ├── gemma.py │ │ │ ├── hymba.py │ │ │ ├── internlm.py │ │ │ ├── llama.py │ │ │ ├── phi.py │ │ │ ├── qwen.py │ │ │ ├── yi.py │ │ │ └── zephyr.py │ │ ├── data_utils.py │ │ ├── debug/ │ │ │ └── profiler.py │ │ ├── deprecated.py │ │ ├── envs.py │ │ ├── llava_conversation_lib.py │ │ ├── model.py │ │ ├── multimodal.py │ │ ├── position_interpolation/ │ │ │ ├── __init__.py │ │ │ └── llama_rope_scaled_monkey_patch.py │ │ ├── protocol.py │ │ ├── test_utils.py │ │ └── versioning.py │ └── version.py └── tests/ ├── __init__.py ├── conftest.py ├── datasets/ │ ├── __init__.py │ ├── conftest.py │ └── test_dataset.py ├── models/ │ ├── __init__.py │ ├── test_auto_model.py │ ├── test_hf_decoder_model.py │ └── test_tool_inferencer.py ├── pipeline/ │ ├── test_auto_pipeline.py │ ├── test_finetuner_distributed_loss.py │ ├── test_memory_safe_vllm_inferencer.py │ └── test_sglang_infernecer.py └── utils/ ├── __init__.py ├── test_conversation_formatter.py ├── test_conversation_template.py └── test_data_utils.py