gitextract_11835njk/ ├── .gitignore ├── .travis.yml ├── MANIFEST.in ├── README.md ├── development/ │ ├── README.md │ └── time_parsers.py ├── fabfile.py ├── long_example.md ├── nlpre/ │ ├── Grammars/ │ │ ├── __init__.py │ │ ├── parenthesis_nester.py │ │ └── reference_patterns.py │ ├── __init__.py │ ├── _version.py │ ├── decaps_text.py │ ├── dedash.py │ ├── dictionary/ │ │ ├── MeSH_two_word_lexicon.csv │ │ ├── __init__.py │ │ └── english_wordlist.txt │ ├── identify_parenthetical_phrases.py │ ├── pos_tokenizer.py │ ├── presets/ │ │ └── __init__.py │ ├── replace_acronyms.py │ ├── replace_from_dictionary.py │ ├── separate_reference.py │ ├── separated_parenthesis.py │ ├── spacy_init.py │ ├── spacy_models/ │ │ └── en_core_web_sm-2.1.0/ │ │ ├── accuracy.json │ │ ├── meta.json │ │ ├── ner/ │ │ │ ├── cfg │ │ │ ├── model │ │ │ └── moves │ │ ├── parser/ │ │ │ ├── cfg │ │ │ ├── model │ │ │ └── moves │ │ ├── tagger/ │ │ │ ├── cfg │ │ │ ├── model │ │ │ └── tag_map │ │ ├── tokenizer │ │ └── vocab/ │ │ ├── key2row │ │ ├── strings.json │ │ └── vectors │ ├── titlecaps.py │ ├── token_replacement.py │ ├── unidecoder.py │ └── url_replacement.py ├── requirements.txt ├── setup.py ├── tests/ │ ├── custom_dict.csv │ ├── decaps_text_tests.py │ ├── dedash_tests.py │ ├── doc1 │ ├── doc1_right │ ├── doc2 │ ├── doc2_right │ ├── full_test.py │ ├── identify_parenthetical_phrases_tests.py │ ├── pos_tokenizer_tests.py │ ├── replace_acronyms_test.py │ ├── replace_from_dictionary_tests.py │ ├── separate_reference_test.py │ ├── separated_parenthesis_tests.py │ ├── titlecaps_tests.py │ ├── token_replacement_tests.py │ ├── unidecoder_tests.py │ └── url_replacement_tests.py └── tox.ini