gitextract__f25tgfg/ ├── .github/ │ └── FUNDING.yml ├── .gitignore ├── LICENSE ├── README.md ├── README_ja.md ├── air_llm/ │ ├── LICENSE │ ├── README.md │ ├── __init__.py │ ├── airllm/ │ │ ├── __init__.py │ │ ├── airllm.py │ │ ├── airllm_baichuan.py │ │ ├── airllm_base.py │ │ ├── airllm_chatglm.py │ │ ├── airllm_internlm.py │ │ ├── airllm_llama_mlx.py │ │ ├── airllm_mistral.py │ │ ├── airllm_mixtral.py │ │ ├── airllm_qwen.py │ │ ├── airllm_qwen2.py │ │ ├── auto_model.py │ │ ├── persist/ │ │ │ ├── __init__.py │ │ │ ├── mlx_model_persister.py │ │ │ ├── model_persister.py │ │ │ └── safetensor_model_persister.py │ │ ├── profiler.py │ │ ├── tokenization_baichuan.py │ │ └── utils.py │ ├── examples/ │ │ ├── run_all_types_of_models.ipynb │ │ ├── run_llama3.1_405B.ipynb │ │ └── run_on_macos.ipynb │ ├── inference_example.py │ ├── setup.py │ └── tests/ │ ├── __init__.py │ ├── test_automodel.py │ ├── test_compression.py │ └── test_notebooks/ │ ├── test_compression.ipynb │ ├── test_mixtral.ipynb │ ├── test_mlx.ipynb │ ├── test_models_transformer_4_35_2.ipynb │ ├── test_models_transformer_4_36_2_torch_2_1_2.ipynb │ └── test_sealllm.ipynb ├── anima_100k/ │ ├── 120_topics_en.jsonl │ ├── README.md │ ├── extened_longchat_topiced_conversations.json │ ├── gen_longchat_lines_retrieval_eval_dataset.ipynb │ ├── gen_longchat_topics_retrieval_eval_dataset_extended.ipynb │ ├── longer_training.py │ ├── modeling_flash_llama.py │ └── run_longer_training.sh ├── data/ │ ├── gpt4_translate_vicuna_eval_set.ipynb │ └── translated_vicuna_eval_set.json ├── eval/ │ └── elo_tournanment_all_models_on_translated_vicuna.ipynb ├── examples/ │ └── inferrence.ipynb ├── funding.json ├── requirements.txt ├── rlhf/ │ ├── README.md │ ├── pre_post_dpo_model_output_belle_eval_1k.csv │ ├── qlora_dpo.py │ └── run_dpo_training.sh ├── scripts/ │ └── test_cn_dataset_lenghts.py └── training/ ├── README.md ├── README_en.md ├── qlora.py ├── run_Amina_training.sh └── run_finetune_raining_based_on_Anima.sh