gitextract_v70jytjc/ ├── .gitignore ├── LICENSE ├── README.md ├── README_zh.md ├── config/ │ ├── deepspeed/ │ │ ├── deepspeed_zero0.yaml │ │ ├── deepspeed_zero1.yaml │ │ ├── deepspeed_zero2.yaml │ │ └── deepspeed_zero3.yaml │ ├── default_fsdp.yaml │ └── xlmroberta_default_config.yaml ├── example_data/ │ ├── grouped_reranker_eval_data.jsonl │ ├── grouped_reranker_train_data_listwise_label.jsonl │ ├── grouped_reranker_train_data_pointwise_label.jsonl │ ├── lmsft.jsonl │ ├── pointwise_reranker_eval_data.jsonl │ ├── pointwise_reranker_train_data.jsonl │ └── t2rank_100.jsonl ├── examples/ │ ├── MyopicTrap/ │ │ ├── README.md │ │ ├── appendix_exp_cosine_sim.py │ │ ├── commercial_embedding_api.py │ │ ├── exp_FineWeb-PosQ.py │ │ ├── exp_SQuAD-PosQ.py │ │ ├── run_exp_FineWeb-PosQ.sh │ │ ├── run_exp_SQuAD-PosQ.sh │ │ └── utils.py │ ├── Reranker_Tutorial.md │ ├── distill_llm_to_bert_reranker/ │ │ ├── README.md │ │ ├── create_distill_data.py │ │ └── model_llm_generate.py │ ├── stella_embedding_distill/ │ │ ├── README.md │ │ ├── concate_two_teacher_embedding.py │ │ ├── concate_two_teacher_embedding.sh │ │ ├── create_distill_data.py │ │ └── create_distill_data.sh │ └── synthetic_data_embedding/ │ ├── README.md │ ├── flashrag_config.yaml │ └── get_lm_probs_dataset.py ├── pyproject.toml ├── rag_retrieval/ │ ├── __init__.py │ ├── infer/ │ │ ├── __init__.py │ │ └── reranker_models/ │ │ ├── __init__.py │ │ ├── colbert_ranker.py │ │ ├── cross_encoder_ranker.py │ │ ├── llm_rankers.py │ │ ├── ranker.py │ │ ├── result.py │ │ └── utils.py │ ├── reranker.py │ └── train/ │ ├── colbert/ │ │ ├── README.md │ │ ├── data.py │ │ ├── model.py │ │ ├── train_colbert.py │ │ ├── train_colbert.sh │ │ └── trainer.py │ ├── embedding/ │ │ ├── README.md │ │ ├── README_zh.md │ │ ├── config/ │ │ │ ├── distill_embedding.yaml │ │ │ └── training_embedding.yaml │ │ ├── data.py │ │ ├── model.py │ │ ├── model_distill.py │ │ ├── train_embedding.py │ │ ├── train_embedding.sh │ │ └── trainer.py │ └── reranker/ │ ├── README.md │ ├── README_zh.md │ ├── config/ │ │ ├── training_bert.yaml │ │ └── training_llm.yaml │ ├── data.py │ ├── model_bert.py │ ├── model_llm.py │ ├── ranking_loss.py │ ├── train_reranker.py │ ├── train_reranker.sh │ ├── trainer.py │ └── utils.py ├── requirements.txt └── tests/ ├── test_cross_encoder_reranker_bce.py ├── test_cross_encoder_reranker_bge.py ├── test_cross_encoder_reranker_bge_m3.py ├── test_llm_reranker_bge_cpm.py └── test_llm_reranker_bge_gemma.py