gitextract_huu181ly/ ├── .gitignore ├── Makefile ├── README.md ├── crowdflower/ │ ├── __init__.py │ ├── combine_chunks.py │ ├── compute_fleiss_kappa.py │ ├── create_crowdflower_input.py │ ├── crowdflower_results_into_training_data.py │ ├── generate_crowdflower_interface_template.py │ ├── process_crowdflower_full_results.py │ ├── resources/ │ │ ├── crowdflower-aggregated-results.sample │ │ ├── crowdflower-input.sample │ │ ├── crowdflower-instructions.html │ │ ├── crowdflower-interface-template.html │ │ ├── crowdflower-results.sample │ │ └── soccer-lu2frame-dbptypes-notimex.json │ └── utils.py ├── date_normalizer/ │ ├── __init__.py │ ├── date_normalizer.py │ ├── regexes.yml │ ├── rpc.py │ └── tests.yml ├── extraction/ │ ├── __init__.py │ ├── bag_of_words.py │ ├── extract_sentences.py │ ├── extract_verbs.sh │ ├── get_soccer_ids.py │ ├── get_soccer_players_articles.py │ ├── process_articles.py │ └── resources/ │ └── soccer_ids ├── lib/ │ ├── .gitignore │ ├── WikiExtractor.py │ ├── __init__.py │ ├── confidence_filter.py │ ├── entity_linking.py │ ├── orderedset.py │ ├── scoring.py │ ├── stopwords.py │ └── to_assertions.py ├── requirements.txt ├── resources/ │ ├── __init__.py │ ├── chunks.json │ ├── crowdflower-results.sample │ ├── frame2dbpo.py │ ├── frame_it2en.py │ ├── gold-standard │ ├── gold-standard.classifiable.final │ ├── gold-standard.final │ ├── gold-standard.final.sentences │ ├── italian-splitter.pickle │ ├── labeled_data.sample │ ├── lexicalizations.sample │ ├── lu-frame-map.json │ ├── soccer_lu2frame_dbtypes.py │ ├── stdevs-by-lemma.json │ ├── stop-words/ │ │ └── README │ ├── test-make-iob │ ├── textpro-chunks/ │ │ ├── 00 │ │ ├── 01 │ │ ├── 02 │ │ ├── 03 │ │ ├── 04 │ │ ├── 05 │ │ ├── 06 │ │ ├── 07 │ │ ├── 08 │ │ ├── 09 │ │ ├── 10 │ │ ├── 11 │ │ ├── 12 │ │ ├── 13 │ │ ├── 14 │ │ ├── 15 │ │ ├── 16 │ │ ├── 17 │ │ ├── 18 │ │ ├── 19 │ │ ├── 20 │ │ ├── 21 │ │ ├── 22 │ │ ├── 23 │ │ ├── 24 │ │ ├── 25 │ │ ├── 26 │ │ ├── 27 │ │ ├── 28 │ │ ├── 29 │ │ ├── 30 │ │ ├── 31 │ │ ├── 32 │ │ ├── 33 │ │ ├── 34 │ │ ├── 35 │ │ ├── 36 │ │ ├── 37 │ │ ├── 38 │ │ ├── 39 │ │ ├── 40 │ │ ├── 41 │ │ ├── 42 │ │ ├── 43 │ │ ├── 44 │ │ ├── 45 │ │ ├── 46 │ │ ├── 47 │ │ ├── 48 │ │ ├── 49 │ │ ├── 50 │ │ ├── 51 │ │ ├── 52 │ │ ├── 53 │ │ ├── 54 │ │ ├── 55 │ │ ├── 56 │ │ ├── 57 │ │ ├── 58 │ │ ├── 59 │ │ ├── 60 │ │ ├── 61 │ │ ├── 62 │ │ ├── 63 │ │ ├── 64 │ │ ├── 65 │ │ ├── 66 │ │ ├── 67 │ │ ├── 68 │ │ ├── 69 │ │ ├── 70 │ │ ├── 71 │ │ ├── 72 │ │ ├── 73 │ │ ├── 74 │ │ ├── 75 │ │ └── 76 │ ├── tokens.list │ ├── top-50-token2lemma.sorted │ ├── training-data.sample │ ├── treetagger-output-sample/ │ │ ├── 0 │ │ ├── 1 │ │ ├── 10 │ │ ├── 11 │ │ ├── 12 │ │ ├── 13 │ │ ├── 14 │ │ ├── 15 │ │ ├── 16 │ │ ├── 17 │ │ ├── 18 │ │ ├── 19 │ │ ├── 2 │ │ ├── 20 │ │ ├── 21 │ │ ├── 22 │ │ ├── 23 │ │ ├── 24 │ │ ├── 25 │ │ ├── 26 │ │ ├── 27 │ │ ├── 28 │ │ ├── 29 │ │ ├── 3 │ │ ├── 30 │ │ ├── 31 │ │ ├── 32 │ │ ├── 33 │ │ ├── 34 │ │ ├── 35 │ │ ├── 36 │ │ ├── 37 │ │ ├── 38 │ │ ├── 39 │ │ ├── 4 │ │ ├── 40 │ │ ├── 41 │ │ ├── 42 │ │ ├── 43 │ │ ├── 44 │ │ ├── 45 │ │ ├── 46 │ │ ├── 47 │ │ ├── 48 │ │ ├── 49 │ │ ├── 5 │ │ ├── 50 │ │ ├── 51 │ │ ├── 52 │ │ ├── 53 │ │ ├── 54 │ │ ├── 55 │ │ ├── 56 │ │ ├── 57 │ │ ├── 58 │ │ ├── 59 │ │ ├── 6 │ │ ├── 60 │ │ ├── 61 │ │ ├── 62 │ │ ├── 63 │ │ ├── 64 │ │ ├── 65 │ │ ├── 66 │ │ ├── 67 │ │ ├── 68 │ │ ├── 69 │ │ ├── 7 │ │ ├── 70 │ │ ├── 71 │ │ ├── 72 │ │ ├── 73 │ │ ├── 74 │ │ ├── 75 │ │ ├── 76 │ │ ├── 8 │ │ └── 9 │ ├── twm-links/ │ │ ├── 0.json │ │ ├── 1.json │ │ ├── 10.json │ │ ├── 11.json │ │ ├── 12.json │ │ ├── 13.json │ │ ├── 14.json │ │ ├── 15.json │ │ ├── 16.json │ │ ├── 17.json │ │ ├── 18.json │ │ ├── 19.json │ │ ├── 2.json │ │ ├── 20.json │ │ ├── 21.json │ │ ├── 22.json │ │ ├── 2278.json │ │ ├── 23.json │ │ ├── 24.json │ │ ├── 25.json │ │ ├── 26.json │ │ ├── 27.json │ │ ├── 28.json │ │ ├── 29.json │ │ ├── 3.json │ │ ├── 30.json │ │ ├── 31.json │ │ ├── 32.json │ │ ├── 33.json │ │ ├── 34.json │ │ ├── 35.json │ │ ├── 36.json │ │ ├── 37.json │ │ ├── 38.json │ │ ├── 39.json │ │ ├── 4.json │ │ ├── 40.json │ │ ├── 41.json │ │ ├── 42.json │ │ ├── 43.json │ │ ├── 44.json │ │ ├── 45.json │ │ ├── 46.json │ │ ├── 47.json │ │ ├── 48.json │ │ ├── 49.json │ │ ├── 5.json │ │ ├── 50.json │ │ ├── 51.json │ │ ├── 52.json │ │ ├── 53.json │ │ ├── 54.json │ │ ├── 55.json │ │ ├── 56.json │ │ ├── 57.json │ │ ├── 58.json │ │ ├── 59.json │ │ ├── 6.json │ │ ├── 60.json │ │ ├── 61.json │ │ ├── 62.json │ │ ├── 63.json │ │ ├── 64.json │ │ ├── 65.json │ │ ├── 66.json │ │ ├── 67.json │ │ ├── 68.json │ │ ├── 69.json │ │ ├── 7.json │ │ ├── 70.json │ │ ├── 71.json │ │ ├── 72.json │ │ ├── 73.json │ │ ├── 74.json │ │ ├── 75.json │ │ ├── 76.json │ │ ├── 8.json │ │ └── 9.json │ └── twm-ngrams/ │ ├── 0.json │ ├── 1.json │ ├── 10.json │ ├── 11.json │ ├── 12.json │ ├── 13.json │ ├── 14.json │ ├── 15.json │ ├── 16.json │ ├── 17.json │ ├── 18.json │ ├── 19.json │ ├── 2.json │ ├── 20.json │ ├── 21.json │ ├── 22.json │ ├── 23.json │ ├── 24.json │ ├── 25.json │ ├── 26.json │ ├── 27.json │ ├── 28.json │ ├── 29.json │ ├── 3.json │ ├── 30.json │ ├── 31.json │ ├── 32.json │ ├── 33.json │ ├── 34.json │ ├── 35.json │ ├── 36.json │ ├── 37.json │ ├── 38.json │ ├── 39.json │ ├── 4.json │ ├── 40.json │ ├── 41.json │ ├── 42.json │ ├── 43.json │ ├── 44.json │ ├── 45.json │ ├── 46.json │ ├── 47.json │ ├── 48.json │ ├── 49.json │ ├── 5.json │ ├── 50.json │ ├── 51.json │ ├── 52.json │ ├── 53.json │ ├── 54.json │ ├── 55.json │ ├── 56.json │ ├── 57.json │ ├── 58.json │ ├── 59.json │ ├── 6.json │ ├── 60.json │ ├── 61.json │ ├── 62.json │ ├── 63.json │ ├── 64.json │ ├── 65.json │ ├── 66.json │ ├── 67.json │ ├── 68.json │ ├── 69.json │ ├── 7.json │ ├── 70.json │ ├── 71.json │ ├── 72.json │ ├── 73.json │ ├── 74.json │ ├── 75.json │ ├── 76.json │ ├── 8.json │ └── 9.json ├── seed_selection/ │ ├── __init__.py │ ├── generate_lexicalization_patterns.py │ ├── get_meaningful_sentences.py │ └── split_sentences.py ├── supervised/ │ ├── __init__.py │ ├── build_label_based_gaz.py │ ├── build_uri_based_gaz.sh │ ├── classifier/ │ │ ├── .gitignore │ │ ├── README.md │ │ ├── lib/ │ │ │ └── jcore-alone.jar │ │ ├── log-config.properties │ │ ├── pom.xml │ │ └── src/ │ │ └── main/ │ │ ├── java/ │ │ │ └── org/ │ │ │ └── fbk/ │ │ │ └── cit/ │ │ │ └── hlt/ │ │ │ └── dirha/ │ │ │ ├── Annotator.java │ │ │ ├── Answer.java │ │ │ ├── ChunkCombinator.java │ │ │ ├── ClassifierResults.java │ │ │ ├── ConfusionMatrix.java │ │ │ ├── DateNormalizer.java │ │ │ ├── Evaluator.java │ │ │ ├── FeatureExtraction.java │ │ │ ├── FeatureIndex.java │ │ │ ├── FrameFeatureExtractor.java │ │ │ ├── FrameTrainingSetToLibSvm.java │ │ │ ├── GenericToken.java │ │ │ ├── InputReader.java │ │ │ ├── NormalizerResult.java │ │ │ ├── Role.java │ │ │ ├── RoleFeatureExtractor.java │ │ │ ├── RoleTrainingSetToLibSvm.java │ │ │ ├── Sentence.java │ │ │ ├── TextProRunner.java │ │ │ ├── TheWikiMachineClient.java │ │ │ ├── Token.java │ │ │ └── kernel/ │ │ │ ├── CharKernel.java │ │ │ ├── Frame.java │ │ │ ├── GoldReader.java │ │ │ ├── Main.java │ │ │ ├── Role.java │ │ │ ├── Sentence.java │ │ │ ├── StringKernel.java │ │ │ ├── SysGoldAligner.java │ │ │ ├── SystemReader.java │ │ │ └── Token.java │ │ └── resources/ │ │ └── .gitignore │ ├── italian_train_and_run.sh │ ├── plot.py │ ├── produce_triples.py │ ├── resources/ │ │ ├── classification_output.sample │ │ ├── it/ │ │ │ ├── club-gaz.tsv │ │ │ ├── dbpedia-gaz.tsv │ │ │ └── soccer-gaz.tsv │ │ └── training.sample │ └── train.sh ├── unsupervised/ │ ├── __init__.py │ ├── evaluate.py │ ├── labeled_to_assertions.py │ └── produce_labeled_data.py └── verb_ranking/ ├── __init__.py ├── compute_stdev_by_lemma.py ├── make_lemma_freq.py ├── tf_idfize.py └── tfidf.py