gitextract_xxctnvov/ ├── LICENSE.md ├── README.md ├── code/ │ ├── .gitignore │ ├── Makefile │ ├── README.md │ ├── dataloader.py │ ├── eval_discriminative_models.py │ ├── eval_ensemble.py │ ├── eval_generative_models.py │ ├── eval_sentiment_models.py │ ├── evaluation.py │ ├── intersentence_loader.py │ ├── models/ │ │ ├── __init__.py │ │ ├── download_models.sh │ │ └── models.py │ ├── nsp_prediction/ │ │ ├── README.md │ │ ├── average_token_length.py │ │ ├── dataset.py │ │ ├── main.py │ │ └── process_wikipedia/ │ │ ├── WikiExtractor.py │ │ ├── categories.filter │ │ ├── cirrus-extract.py │ │ ├── extract.sh │ │ └── wikiextractor/ │ │ ├── README.md │ │ ├── WikiExtractor.py │ │ ├── categories.filter │ │ ├── cirrus-extract.py │ │ └── extract.sh │ ├── predictions/ │ │ ├── predictions_EnsembleModel_.json │ │ ├── predictions_SentimentModel.json │ │ ├── predictions_bert-base-cased_BertNextSentence_BertLM.json │ │ ├── predictions_bert-large-cased_BertNextSentence_BertLM.json │ │ ├── predictions_gpt2-large_ModelNSP_GPT2LM.json │ │ ├── predictions_gpt2-medium_ModelNSP_GPT2LM.json │ │ ├── predictions_gpt2_ModelNSP_GPT2LM.json │ │ ├── predictions_roberta-base_ModelNSP_RoBERTaLM.json │ │ ├── predictions_roberta-large_ModelNSP_RoBERTaLM.json │ │ ├── predictions_xlnet-base-cased_ModelNSP_XLNetLM.json │ │ └── predictions_xlnet-large-cased_ModelNSP_XLNetLM.json │ ├── predictions.json │ ├── predictions.txt │ ├── tables/ │ │ ├── README.md │ │ ├── analysis.py │ │ ├── compute_domain_stats.py │ │ ├── compute_terms_domains.py │ │ └── find_universal_examples.py │ └── utils.py ├── data/ │ ├── dev.json │ └── test_terms.txt └── requirements.txt