gitextract_v70jytjc/

├── .gitignore
├── LICENSE
├── README.md
├── README_zh.md
├── config/
│   ├── deepspeed/
│   │   ├── deepspeed_zero0.yaml
│   │   ├── deepspeed_zero1.yaml
│   │   ├── deepspeed_zero2.yaml
│   │   └── deepspeed_zero3.yaml
│   ├── default_fsdp.yaml
│   └── xlmroberta_default_config.yaml
├── example_data/
│   ├── grouped_reranker_eval_data.jsonl
│   ├── grouped_reranker_train_data_listwise_label.jsonl
│   ├── grouped_reranker_train_data_pointwise_label.jsonl
│   ├── lmsft.jsonl
│   ├── pointwise_reranker_eval_data.jsonl
│   ├── pointwise_reranker_train_data.jsonl
│   └── t2rank_100.jsonl
├── examples/
│   ├── MyopicTrap/
│   │   ├── README.md
│   │   ├── appendix_exp_cosine_sim.py
│   │   ├── commercial_embedding_api.py
│   │   ├── exp_FineWeb-PosQ.py
│   │   ├── exp_SQuAD-PosQ.py
│   │   ├── run_exp_FineWeb-PosQ.sh
│   │   ├── run_exp_SQuAD-PosQ.sh
│   │   └── utils.py
│   ├── Reranker_Tutorial.md
│   ├── distill_llm_to_bert_reranker/
│   │   ├── README.md
│   │   ├── create_distill_data.py
│   │   └── model_llm_generate.py
│   ├── stella_embedding_distill/
│   │   ├── README.md
│   │   ├── concate_two_teacher_embedding.py
│   │   ├── concate_two_teacher_embedding.sh
│   │   ├── create_distill_data.py
│   │   └── create_distill_data.sh
│   └── synthetic_data_embedding/
│       ├── README.md
│       ├── flashrag_config.yaml
│       └── get_lm_probs_dataset.py
├── pyproject.toml
├── rag_retrieval/
│   ├── __init__.py
│   ├── infer/
│   │   ├── __init__.py
│   │   └── reranker_models/
│   │       ├── __init__.py
│   │       ├── colbert_ranker.py
│   │       ├── cross_encoder_ranker.py
│   │       ├── llm_rankers.py
│   │       ├── ranker.py
│   │       ├── result.py
│   │       └── utils.py
│   ├── reranker.py
│   └── train/
│       ├── colbert/
│       │   ├── README.md
│       │   ├── data.py
│       │   ├── model.py
│       │   ├── train_colbert.py
│       │   ├── train_colbert.sh
│       │   └── trainer.py
│       ├── embedding/
│       │   ├── README.md
│       │   ├── README_zh.md
│       │   ├── config/
│       │   │   ├── distill_embedding.yaml
│       │   │   └── training_embedding.yaml
│       │   ├── data.py
│       │   ├── model.py
│       │   ├── model_distill.py
│       │   ├── train_embedding.py
│       │   ├── train_embedding.sh
│       │   └── trainer.py
│       └── reranker/
│           ├── README.md
│           ├── README_zh.md
│           ├── config/
│           │   ├── training_bert.yaml
│           │   └── training_llm.yaml
│           ├── data.py
│           ├── model_bert.py
│           ├── model_llm.py
│           ├── ranking_loss.py
│           ├── train_reranker.py
│           ├── train_reranker.sh
│           ├── trainer.py
│           └── utils.py
├── requirements.txt
└── tests/
    ├── test_cross_encoder_reranker_bce.py
    ├── test_cross_encoder_reranker_bge.py
    ├── test_cross_encoder_reranker_bge_m3.py
    ├── test_llm_reranker_bge_cpm.py
    └── test_llm_reranker_bge_gemma.py