gitextract_zstwuz6r/ ├── .amlignore ├── .bumpversion.cfg ├── .flake8 ├── .github/ │ ├── ISSUE_TEMPLATE/ │ │ ├── bug_report.md │ │ ├── feature_request.md │ │ └── general-ask.md │ ├── ISSUE_TEMPLATE.md │ └── PULL_REQUEST_TEMPLATE.md ├── .gitignore ├── .pre-commit-config.yaml ├── CONTRIBUTING.md ├── DatasetReferences.md ├── LICENSE ├── MANIFEST.in ├── NOTICE.txt ├── README.md ├── SETUP.md ├── VERSIONING.md ├── _config.yml ├── cgmanifest.json ├── docker/ │ └── Dockerfile ├── docs/ │ ├── Makefile │ ├── README.md │ ├── _config.yml │ └── source/ │ ├── azureml.rst │ ├── conf.py │ └── index.rst ├── examples/ │ ├── README.md │ ├── annotation/ │ │ ├── Doccano.md │ │ └── README.md │ ├── embeddings/ │ │ ├── README.md │ │ └── embedding_trainer.ipynb │ ├── entailment/ │ │ ├── README.md │ │ ├── entailment_multinli_transformers.ipynb │ │ └── entailment_xnli_bert_azureml.ipynb │ ├── model_explainability/ │ │ ├── README.md │ │ └── interpret_dnn_layers.ipynb │ ├── named_entity_recognition/ │ │ ├── README.md │ │ └── ner_wikigold_transformer.ipynb │ ├── question_answering/ │ │ ├── README.md │ │ ├── bert_run_squad_azureml.py │ │ ├── bidaf_aml_deep_dive.ipynb │ │ ├── bidaf_config.json │ │ ├── pretrained-BERT-SQuAD-deep-dive-aml.ipynb │ │ ├── question_answering_squad_transformers.ipynb │ │ └── question_answering_system_bidaf_quickstart.ipynb │ ├── sentence_similarity/ │ │ ├── README.md │ │ ├── automl_local_deployment_aci.ipynb │ │ ├── automl_with_pipelines_deployment_aks.ipynb │ │ ├── baseline_deep_dive.ipynb │ │ ├── bert_encoder.ipynb │ │ ├── bert_senteval.ipynb │ │ ├── gensen_aml_deep_dive.ipynb │ │ ├── gensen_config.json │ │ ├── gensen_local.ipynb │ │ ├── gensen_train.py │ │ └── gensen_wrapper.py │ ├── sentiment_analysis/ │ │ └── absa/ │ │ ├── README.md │ │ ├── absa.ipynb │ │ ├── absa_azureml.ipynb │ │ └── dataset/ │ │ └── data.md │ ├── text_classification/ │ │ ├── README.md │ │ ├── tc_bert_azureml.ipynb │ │ ├── tc_mnli_mtdnn.ipynb │ │ ├── tc_mnli_transformers.ipynb │ │ └── tc_multi_languages_transformers.ipynb │ └── text_summarization/ │ ├── abstractive_summarization_bertsum_cnndm_distributed_train.py │ ├── abstractive_summarization_bertsumabs_cnndm.ipynb │ ├── abstractive_summarization_minilm_cnndm.ipynb │ ├── abstractive_summarization_unilm_cnndm.ipynb │ ├── abstractive_summarization_unilm_cnndm.py │ ├── extractive_summarization_cnndm_aml_distributed.ipynb │ ├── extractive_summarization_cnndm_distributed_train.py │ ├── extractive_summarization_cnndm_transformer.ipynb │ └── summarization_evaluation.ipynb ├── pyproject.toml ├── setup.py ├── tests/ │ ├── README.md │ ├── __init__.py │ ├── ci/ │ │ ├── azureml_integration_tests.yml │ │ ├── component_governance.yml │ │ ├── cpu_integration_tests_linux.yml │ │ ├── cpu_unit_tests_linux.yml │ │ ├── gpu_integration_tests_linux.yml │ │ ├── gpu_unit_tests_linux.yml │ │ ├── notebooks_cpu_unit_tests_linux.yml │ │ └── notebooks_gpu_unit_tests_linux.yml │ ├── conftest.py │ ├── integration/ │ │ ├── test_ddp_summarization.py │ │ ├── test_gpu_utils.py │ │ ├── test_notebooks_abstractive_summarization_bertsumabs.py │ │ ├── test_notebooks_embeddings.py │ │ ├── test_notebooks_entailment.py │ │ ├── test_notebooks_extractive_summarization.py │ │ ├── test_notebooks_interpretability.py │ │ ├── test_notebooks_minilm_abstractive_summarization.py │ │ ├── test_notebooks_named_entity_recognition.py │ │ ├── test_notebooks_question_answering.py │ │ ├── test_notebooks_sentence_similarity.py │ │ ├── test_notebooks_text_classification.py │ │ └── test_notebooks_unilm_abstractive_summarization.py │ ├── notebooks_common.py │ ├── smoke/ │ │ ├── test_dataset.py │ │ ├── test_gpu_utils.py │ │ └── test_word_embeddings.py │ └── unit/ │ ├── test_abstractive_summarization_bertsum.py │ ├── test_abstractive_summarization_seq2seq.py │ ├── test_bert_common.py │ ├── test_bert_encoder.py │ ├── test_bert_sentence_encoding.py │ ├── test_common_pytorch_utils.py │ ├── test_data_loaders.py │ ├── test_dataset.py │ ├── test_dataset_pytorch.py │ ├── test_distributed_sampler.py │ ├── test_eval_classification.py │ ├── test_eval_compute_rouge.py │ ├── test_extractive_summarization.py │ ├── test_gensen_utils.py │ ├── test_interpreter.py │ ├── test_models_transformers_question_answering.py │ ├── test_notebooks_cpu.py │ ├── test_notebooks_gpu.py │ ├── test_preprocess.py │ ├── test_timer.py │ ├── test_transformers_sequence_classification.py │ └── test_transformers_token_classification.py ├── tools/ │ ├── README.md │ ├── __init__.py │ ├── generate_conda_file.py │ ├── generate_requirements_txt.py │ └── remove_pixelserver.py └── utils_nlp/ ├── README.md ├── __init__.py ├── azureml/ │ ├── README.md │ ├── __init__.py │ ├── azureml_bert_util.py │ └── azureml_utils.py ├── common/ │ ├── README.md │ ├── __init__.py │ ├── pytorch_utils.py │ └── timer.py ├── dataset/ │ ├── README.md │ ├── __init__.py │ ├── bbc_hindi.py │ ├── cnndm.py │ ├── dac.py │ ├── data_loaders.py │ ├── msrpc.py │ ├── multinli.py │ ├── ner_utils.py │ ├── preprocess.py │ ├── sentence_selection.py │ ├── snli.py │ ├── squad.py │ ├── stsbenchmark.py │ ├── url_utils.py │ ├── wikigold.py │ ├── xnli.py │ └── xnli_torch_dataset.py ├── eval/ │ ├── README.md │ ├── SentEval/ │ │ ├── .gitignore │ │ ├── LICENSE │ │ ├── README.md │ │ ├── senteval/ │ │ │ ├── __init__.py │ │ │ ├── binary.py │ │ │ ├── engine.py │ │ │ ├── mrpc.py │ │ │ ├── probing.py │ │ │ ├── rank.py │ │ │ ├── sick.py │ │ │ ├── snli.py │ │ │ ├── sst.py │ │ │ ├── sts.py │ │ │ ├── tools/ │ │ │ │ ├── __init__.py │ │ │ │ ├── classifier.py │ │ │ │ ├── ranking.py │ │ │ │ ├── relatedness.py │ │ │ │ └── validation.py │ │ │ ├── trec.py │ │ │ └── utils.py │ │ └── setup.py │ ├── __init__.py │ ├── classification.py │ ├── evaluate_squad.py │ ├── evaluate_summarization.py │ ├── question_answering.py │ ├── rouge/ │ │ ├── compute_rouge.py │ │ └── rouge_ext.py │ └── senteval.py ├── interpreter/ │ ├── Interpreter.py │ ├── README.md │ └── __init__.py ├── language_utils/ │ └── hi/ │ └── hindi_stemmer.py └── models/ ├── README.md ├── bert/ │ ├── README.md │ ├── __init__.py │ ├── common.py │ ├── sequence_classification.py │ ├── sequence_classification_distributed.py │ ├── sequence_encoding.py │ └── token_classification.py ├── gensen/ │ ├── README.md │ ├── __init__.py │ ├── create_gensen_model.py │ ├── gensen.py │ ├── multi_task_model.py │ ├── preprocess_utils.py │ └── utils.py ├── glove/ │ ├── Makefile │ ├── README.md │ ├── demo.sh │ └── src/ │ ├── README.md │ ├── cooccur.c │ ├── glove.c │ ├── shuffle.c │ └── vocab_count.c ├── pretrained_embeddings/ │ ├── README.md │ ├── __init__.py │ ├── fasttext.py │ ├── glove.py │ └── word2vec.py ├── pytorch_modules/ │ ├── README.md │ ├── __init__.py │ └── conditional_gru.py ├── transformers/ │ ├── abstractive_summarization_bertsum.py │ ├── abstractive_summarization_seq2seq.py │ ├── bertsum/ │ │ ├── __init__.py │ │ ├── adam.py │ │ ├── beam.py │ │ ├── data_loader.py │ │ ├── dataset.py │ │ ├── decoder.py │ │ ├── encoder.py │ │ ├── loss.py │ │ ├── model_builder.py │ │ ├── neural.py │ │ ├── optimizers.py │ │ ├── penalties.py │ │ └── predictor.py │ ├── common.py │ ├── datasets.py │ ├── extractive_summarization.py │ ├── named_entity_recognition.py │ ├── question_answering.py │ └── sequence_classification.py └── xlnet/ ├── README.md ├── common.py └── sequence_classification.py