gitextract_xl1gyk4u/ ├── .gitignore ├── LICENSE ├── README.md ├── clasp/ │ ├── __init__.py │ ├── clasp.py │ ├── data/ │ │ └── bpe_simple_vocab_16e6.txt │ ├── positional.py │ ├── reversible.py │ ├── simple_tokenizer.py │ ├── transformer.py │ └── utils.py ├── data/ │ ├── progen_ood_families.csv │ ├── progen_ood_families_uniprot_acc.csv │ ├── uniprot_100.csv │ └── uniprot_100_reduced.csv ├── install_deepspeed.sh ├── notebooks/ │ ├── RankSplitDataset.ipynb │ ├── Utils_CLASPDataset.ipynb │ ├── inference.ipynb │ └── inference_introduction.ipynb ├── preproc/ │ ├── create_offset_dict.py │ ├── ood_id_split.md │ ├── preprocess_data.py │ └── preprocess_data_reduced.py ├── resources.md ├── setup.py ├── tokenizers/ │ ├── byte_level_BPE.py │ ├── char_level_bpe.py │ ├── sentencepiece.py │ └── wordpiece.py └── train/ ├── example_inference_multigpu.py ├── inference_multigpu_ecpred_test.py ├── inference_multigpu_loss_test.py ├── inference_multigpu_simple_query_test.py ├── train.py ├── train_multigpusim.py └── train_multigpusim_wandb.py