gitextract_s42zntzb/ ├── .gitattributes ├── .gitignore ├── Changelog ├── LICENSE ├── MANIFEST.in ├── README.md ├── extra_dict/ │ ├── dict.txt.big │ ├── dict.txt.small │ ├── idf.txt.big │ └── stop_words.txt ├── jieba/ │ ├── __init__.py │ ├── __main__.py │ ├── _compat.py │ ├── analyse/ │ │ ├── __init__.py │ │ ├── analyzer.py │ │ ├── idf.txt │ │ ├── textrank.py │ │ └── tfidf.py │ ├── dict.txt │ ├── finalseg/ │ │ ├── __init__.py │ │ ├── prob_emit.p │ │ ├── prob_emit.py │ │ ├── prob_start.p │ │ ├── prob_start.py │ │ ├── prob_trans.p │ │ └── prob_trans.py │ ├── lac_small/ │ │ ├── __init__.py │ │ ├── creator.py │ │ ├── model_baseline/ │ │ │ ├── crfw │ │ │ ├── fc_0.b_0 │ │ │ ├── fc_0.w_0 │ │ │ ├── fc_1.b_0 │ │ │ ├── fc_1.w_0 │ │ │ ├── fc_2.b_0 │ │ │ ├── fc_2.w_0 │ │ │ ├── fc_3.b_0 │ │ │ ├── fc_3.w_0 │ │ │ ├── fc_4.b_0 │ │ │ ├── fc_4.w_0 │ │ │ ├── gru_0.b_0 │ │ │ ├── gru_0.w_0 │ │ │ ├── gru_1.b_0 │ │ │ ├── gru_1.w_0 │ │ │ ├── gru_2.b_0 │ │ │ ├── gru_2.w_0 │ │ │ ├── gru_3.b_0 │ │ │ ├── gru_3.w_0 │ │ │ └── word_emb │ │ ├── nets.py │ │ ├── predict.py │ │ ├── reader_small.py │ │ ├── tag.dic │ │ ├── utils.py │ │ └── word.dic │ └── posseg/ │ ├── __init__.py │ ├── char_state_tab.p │ ├── char_state_tab.py │ ├── prob_emit.p │ ├── prob_emit.py │ ├── prob_start.p │ ├── prob_start.py │ ├── prob_trans.p │ ├── prob_trans.py │ └── viterbi.py ├── setup.py └── test/ ├── demo.py ├── extract_tags.py ├── extract_tags_idfpath.py ├── extract_tags_stop_words.py ├── extract_tags_with_weight.py ├── extract_topic.py ├── foobar.txt ├── jieba_test.py ├── jiebacmd.py ├── lyric.txt ├── parallel/ │ ├── extract_tags.py │ ├── test.py │ ├── test2.py │ ├── test_cut_for_search.py │ ├── test_disable_hmm.py │ ├── test_file.py │ ├── test_pos.py │ └── test_pos_file.py ├── test.py ├── test.txt ├── test_bug.py ├── test_change_dictpath.py ├── test_cut_for_search.py ├── test_cutall.py ├── test_file.py ├── test_lock.py ├── test_multithread.py ├── test_no_hmm.py ├── test_paddle.py ├── test_paddle_postag.py ├── test_pos.py ├── test_pos_file.py ├── test_pos_no_hmm.py ├── test_tokenize.py ├── test_tokenize_no_hmm.py ├── test_userdict.py ├── test_whoosh.py ├── test_whoosh_file.py ├── test_whoosh_file_read.py └── userdict.txt