gitextract_oae3wt1e/ ├── .gitattributes ├── .gitignore ├── LICENSE.txt ├── README.txt ├── ark-tweet-nlp/ │ ├── pom.xml │ └── src/ │ └── main/ │ └── resources/ │ └── cmu/ │ └── arktweetnlp/ │ ├── 50mpaths2 │ ├── 6mpaths │ ├── celebs │ ├── family │ ├── female │ ├── male │ ├── mobyplaces │ ├── proper_names │ ├── tagdict.txt │ └── videogame ├── data/ │ ├── ritter/ │ │ ├── AccuracyEvaluation.txt │ │ ├── IssuesWithRitter2011Data.txt │ │ ├── Makefile │ │ ├── cleanup_tags.sh │ │ ├── orig/ │ │ │ ├── ner.txt │ │ │ └── pos.txt │ │ ├── pos_fixed.tsv │ │ ├── pos_fixed.txt │ │ └── pos_fixed_attempt_to_fix_startquotes.txt │ ├── twpos-annotator-v0.1/ │ │ ├── MIT-LICENSE │ │ ├── README │ │ ├── annotator-instructions.txt │ │ ├── json.php │ │ ├── lib/ │ │ │ └── MIT-LICENSE.txt │ │ ├── pos.php │ │ └── sample.automatic_tags │ ├── twpos-data-v0.3/ │ │ ├── README.txt │ │ ├── anno_changes/ │ │ │ └── oct27_reanno_changes_to_supertsv.diff │ │ ├── daily547.conll │ │ ├── full_data/ │ │ │ ├── daily547.supertsv │ │ │ └── oct27.supertsv │ │ ├── oct27.conll │ │ ├── oct27.splits/ │ │ │ ├── oct27.dev │ │ │ ├── oct27.test │ │ │ ├── oct27.train │ │ │ ├── oct27.traindev │ │ │ └── splits.txt │ │ └── scripts/ │ │ └── toconll.sh │ └── twpos-data-v0.3-original-tweets/ │ ├── README.txt │ ├── daily547.tweets.json.tsv │ └── oct27.tweets.json.tsv ├── docs/ │ ├── annot_guidelines.tex │ ├── changelog.txt │ ├── hacking.txt │ ├── nathan_notes.md │ ├── replicate_naacl2013_evaluation.sh │ ├── training.txt │ └── word_cluster_notes.md ├── examples/ │ ├── README.txt │ ├── bill_nye_tho.txt │ ├── casual.txt │ ├── example_tweets.txt │ ├── tagged_tweets_expected.txt │ └── tweets.jsonline ├── lib/ │ ├── metaphone-map2.txt │ ├── posBerkeley/ │ │ └── posBerkeley.jar │ ├── ptb_ordered_metaphone.txt │ ├── stanford-postagger-2010-05-26.jar │ └── trove-3.0.0a5.jar ├── pom.xml ├── runTagger.sh ├── scripts/ │ ├── java.sh │ ├── paired_stats.r │ ├── prepare_release.sh │ ├── show.py │ ├── simple_tests.sh │ └── toconll.py ├── src/ │ └── cmu/ │ └── arktweetnlp/ │ ├── RunTagger.java │ ├── Tagger.java │ ├── Train.java │ ├── Twokenize.java │ ├── impl/ │ │ ├── Model.java │ │ ├── ModelSentence.java │ │ ├── OWLQN.java │ │ ├── Sentence.java │ │ ├── Vocabulary.java │ │ ├── features/ │ │ │ ├── FeatureExtractor.java │ │ │ ├── FeatureUtil.java │ │ │ ├── MetaphoneFeatures.java │ │ │ ├── MiscFeatures.java │ │ │ ├── TagDictionary.java │ │ │ ├── WordClusterPaths.java │ │ │ └── WordListFeatures.java │ │ └── package.html │ ├── io/ │ │ ├── CoNLLReader.java │ │ └── JsonTweetReader.java │ ├── package.html │ └── util/ │ ├── BasicFileIO.java │ └── Util.java └── twokenize.sh