gitextract_8gohnn84/ ├── .github/ │ └── workflows/ │ ├── runtests.yml │ └── stale.yml ├── .gitignore ├── .readthedocs.yaml ├── AUTHORS.md ├── LICENSE ├── MANIFEST.in ├── Makefile ├── README.rst ├── conftest.py ├── doc/ │ ├── Makefile │ └── source/ │ ├── api.rst │ ├── bow.ipynb │ ├── conf.py │ ├── data/ │ │ ├── corpus_example/ │ │ │ ├── sample1.txt │ │ │ ├── sample2.txt │ │ │ └── sample3.txt │ │ ├── news_articles_100.pickle │ │ ├── news_articles_100.xlsx │ │ └── tm_wordclouds/ │ │ └── .gitignore │ ├── development.rst │ ├── getting_started.ipynb │ ├── index.rst │ ├── install.rst │ ├── intro.rst │ ├── license_note.rst │ ├── preprocessing.ipynb │ ├── text_corpora.ipynb │ ├── topic_modeling.ipynb │ └── version_history.rst ├── examples/ │ ├── README.md │ ├── __init__.py │ ├── _benchmarktools.py │ ├── benchmark_en_newsarticles.py │ ├── bundestag18_tfidf.py │ ├── data/ │ │ ├── ap.pickle │ │ ├── bt18_sample_1000.pickle │ │ └── nips.pickle │ ├── gensim_evaluation.py │ ├── minimal_tfidf.py │ ├── topicmod_ap_nips_eval.py │ └── topicmod_lda.py ├── requirements.txt ├── requirements_doc.txt ├── scripts/ │ ├── fulldata/ │ │ ├── .gitignore │ │ └── README.md │ ├── nips_data.py │ ├── prepare_corpora.R │ └── tmp/ │ └── .gitignore ├── setup.py ├── tests/ │ ├── __init__.py │ ├── _testtextdata.py │ ├── _testtools.py │ ├── data/ │ │ ├── .gitignore │ │ ├── 100NewsArticles.csv │ │ ├── 100NewsArticles.xlsx │ │ ├── 3ExampleDocs.xlsx │ │ ├── bt18_speeches_sample.csv │ │ ├── gutenberg/ │ │ │ ├── kafka_verwandlung.txt │ │ │ └── werther/ │ │ │ ├── goethe_werther1.txt │ │ │ └── goethe_werther2.txt │ │ └── tiny_model_reuters_5_topics.pickle │ ├── test_bow.py │ ├── test_corpus.py │ ├── test_corpusimport.py │ ├── test_tokenseq.py │ ├── test_topicmod__eval_tools.py │ ├── test_topicmod_evaluate.py │ ├── test_topicmod_model_io.py │ ├── test_topicmod_model_stats.py │ ├── test_topicmod_visualize.py │ └── test_utils.py ├── tmtoolkit/ │ ├── __init__.py │ ├── __main__.py │ ├── bow/ │ │ ├── __init__.py │ │ ├── bow_stats.py │ │ └── dtm.py │ ├── corpus/ │ │ ├── __init__.py │ │ ├── _common.py │ │ ├── _corpus.py │ │ ├── _corpusfuncs.py │ │ ├── _document.py │ │ ├── _nltk_extras.py │ │ └── visualize.py │ ├── tokenseq.py │ ├── topicmod/ │ │ ├── __init__.py │ │ ├── _common.py │ │ ├── _eval_tools.py │ │ ├── evaluate.py │ │ ├── model_io.py │ │ ├── model_stats.py │ │ ├── parallel.py │ │ ├── tm_gensim.py │ │ ├── tm_lda.py │ │ ├── tm_sklearn.py │ │ └── visualize.py │ ├── types.py │ └── utils.py └── tox.ini