gitextract_i4mtabdf/ ├── CODEOWNERS ├── CODE_OF_CONDUCT.md ├── LICENSE.txt ├── README.md ├── SECURITY.md ├── alignments/ │ ├── book-level-summary-alignments/ │ │ ├── book_summaries_aligned_test.jsonl │ │ ├── book_summaries_aligned_train.jsonl │ │ └── book_summaries_aligned_val.jsonl │ ├── chapter-level-summary-alignments/ │ │ ├── chapter_summary_aligned_test_split.jsonl │ │ ├── chapter_summary_aligned_train_split.jsonl │ │ └── chapter_summary_aligned_val_split.jsonl │ ├── chapter_summary_aligned.jsonl.aggregate_splits │ └── paragraph-level-summary-alignments/ │ ├── align_data_bi_encoder_paraphrase.py │ └── gather_data.py ├── requirements.txt └── scripts/ ├── data_cleaning/ │ ├── basic_clean.py │ ├── clean_summaries.py │ └── split_aggregate_chaps_all_sources.py └── data_collection/ ├── bookwolf/ │ ├── get_summaries.py │ ├── get_works.py │ └── literature_links.tsv.pruned ├── cliffnotes/ │ ├── get_summaries.py │ ├── get_works.py │ └── literature_links.tsv.pruned ├── gradesaver/ │ ├── get_summaries.py │ ├── get_works.py │ └── literature_links.tsv.pruned ├── novelguide/ │ ├── get_summaries.py │ ├── get_works.py │ └── literature_links.tsv.pruned ├── pinkmonkey/ │ ├── get_summaries.py │ ├── get_works.py │ └── literature_links.tsv.pruned ├── shmoop/ │ ├── get_summaries.py │ ├── get_works.py │ └── literature_links.tsv.pruned ├── sparknotes/ │ ├── get_summaries.py │ ├── get_works.py │ └── literature_links.tsv.pruned └── thebestnotes/ ├── get_summaries.py ├── get_works.py └── literature_links.tsv.pruned