gitextract_s6becou6/ ├── .git-blame-ignore-revs ├── .gitattributes ├── .github/ │ ├── ISSUE_TEMPLATE/ │ │ ├── bug_report.yml │ │ ├── config.yml │ │ └── feature_request.yml │ ├── PULL_REQUEST_TEMPLATE.md │ └── workflows/ │ └── testing.yml ├── .gitignore ├── .pre-commit-config.yaml ├── CONTRIBUTING.md ├── LICENSE ├── Makefile ├── README.md ├── bertopic/ │ ├── __init__.py │ ├── _bertopic.py │ ├── _save_utils.py │ ├── _utils.py │ ├── backend/ │ │ ├── __init__.py │ │ ├── _base.py │ │ ├── _cohere.py │ │ ├── _fastembed.py │ │ ├── _flair.py │ │ ├── _gensim.py │ │ ├── _hftransformers.py │ │ ├── _langchain.py │ │ ├── _model2vec.py │ │ ├── _multimodal.py │ │ ├── _openai.py │ │ ├── _sentencetransformers.py │ │ ├── _sklearn.py │ │ ├── _spacy.py │ │ ├── _use.py │ │ ├── _utils.py │ │ └── _word_doc.py │ ├── cluster/ │ │ ├── __init__.py │ │ ├── _base.py │ │ └── _utils.py │ ├── dimensionality/ │ │ ├── __init__.py │ │ └── _base.py │ ├── plotting/ │ │ ├── __init__.py │ │ ├── _approximate_distribution.py │ │ ├── _barchart.py │ │ ├── _datamap.py │ │ ├── _distribution.py │ │ ├── _documents.py │ │ ├── _heatmap.py │ │ ├── _hierarchical_documents.py │ │ ├── _hierarchy.py │ │ ├── _term_rank.py │ │ ├── _topics.py │ │ ├── _topics_over_time.py │ │ └── _topics_per_class.py │ ├── representation/ │ │ ├── __init__.py │ │ ├── _base.py │ │ ├── _cohere.py │ │ ├── _keybert.py │ │ ├── _langchain.py │ │ ├── _litellm.py │ │ ├── _llamacpp.py │ │ ├── _mmr.py │ │ ├── _openai.py │ │ ├── _pos.py │ │ ├── _textgeneration.py │ │ ├── _utils.py │ │ ├── _visual.py │ │ └── _zeroshot.py │ └── vectorizers/ │ ├── __init__.py │ ├── _ctfidf.py │ └── _online_cv.py ├── docs/ │ ├── algorithm/ │ │ └── algorithm.md │ ├── api/ │ │ ├── backends.md │ │ ├── bertopic.md │ │ ├── cluster copy.md │ │ ├── cluster.md │ │ ├── ctfidf.md │ │ ├── dimensionality.md │ │ ├── plotting/ │ │ │ ├── barchart.md │ │ │ ├── distribution.md │ │ │ ├── document_datamap.md │ │ │ ├── documents.md │ │ │ ├── dtm.md │ │ │ ├── heatmap.md │ │ │ ├── hierarchical_documents.md │ │ │ ├── hierarchy.md │ │ │ ├── term.md │ │ │ ├── topics.md │ │ │ └── topics_per_class.md │ │ ├── plotting.md │ │ ├── representations.md │ │ └── vectorizers.md │ ├── changelog.md │ ├── faq.md │ ├── getting_started/ │ │ ├── best_practices/ │ │ │ └── best_practices.md │ │ ├── clustering/ │ │ │ └── clustering.md │ │ ├── ctfidf/ │ │ │ └── ctfidf.md │ │ ├── dim_reduction/ │ │ │ └── dim_reduction.md │ │ ├── distribution/ │ │ │ ├── distribution.md │ │ │ └── distribution_viz.html │ │ ├── embeddings/ │ │ │ └── embeddings.md │ │ ├── guided/ │ │ │ └── guided.md │ │ ├── hierarchicaltopics/ │ │ │ ├── hierarchical_topics.html │ │ │ └── hierarchicaltopics.md │ │ ├── manual/ │ │ │ └── manual.md │ │ ├── merge/ │ │ │ └── merge.md │ │ ├── multiaspect/ │ │ │ └── multiaspect.md │ │ ├── multimodal/ │ │ │ └── multimodal.md │ │ ├── online/ │ │ │ └── online.md │ │ ├── outlier_reduction/ │ │ │ ├── fig_base.html │ │ │ ├── fig_reduced.html │ │ │ └── outlier_reduction.md │ │ ├── parameter tuning/ │ │ │ └── parametertuning.md │ │ ├── quickstart/ │ │ │ ├── quickstart.md │ │ │ └── viz.html │ │ ├── representation/ │ │ │ ├── llm.md │ │ │ └── representation.md │ │ ├── search/ │ │ │ └── search.md │ │ ├── seed_words/ │ │ │ └── seed_words.md │ │ ├── semisupervised/ │ │ │ └── semisupervised.md │ │ ├── serialization/ │ │ │ └── serialization.md │ │ ├── supervised/ │ │ │ └── supervised.md │ │ ├── tips_and_tricks/ │ │ │ └── tips_and_tricks.md │ │ ├── topicreduction/ │ │ │ └── topicreduction.md │ │ ├── topicrepresentation/ │ │ │ └── topicrepresentation.md │ │ ├── topicsovertime/ │ │ │ ├── topicsovertime.md │ │ │ └── trump.html │ │ ├── topicsperclass/ │ │ │ ├── topics_per_class.html │ │ │ └── topicsperclass.md │ │ ├── vectorizers/ │ │ │ └── vectorizers.md │ │ ├── visualization/ │ │ │ ├── bar_chart.html │ │ │ ├── datamapplot.html │ │ │ ├── documents.html │ │ │ ├── heatmap.html │ │ │ ├── hierarchical_documents.html │ │ │ ├── hierarchical_topics.html │ │ │ ├── hierarchy.html │ │ │ ├── probabilities.html │ │ │ ├── term_rank.html │ │ │ ├── term_rank_log.html │ │ │ ├── topics_per_class.html │ │ │ ├── trump.html │ │ │ ├── visualization.md │ │ │ ├── visualize_documents.md │ │ │ ├── visualize_hierarchy.md │ │ │ ├── visualize_terms.md │ │ │ ├── visualize_topics.md │ │ │ └── viz.html │ │ └── zeroshot/ │ │ └── zeroshot.md │ ├── img/ │ │ └── probabilities.html │ ├── index.md │ ├── stylesheets/ │ │ └── extra.css │ └── usecases.md ├── mkdocs.yml ├── pyproject.toml └── tests/ ├── __init__.py ├── conftest.py ├── test_bertopic.py ├── test_other.py ├── test_plotting/ │ ├── __init__.py │ ├── test_approximate.py │ ├── test_bar.py │ ├── test_documents.py │ ├── test_dynamic.py │ ├── test_heatmap.py │ ├── test_term_rank.py │ └── test_topics.py ├── test_reduction/ │ ├── __init__.py │ ├── test_delete.py │ └── test_merge.py ├── test_representation/ │ ├── __init__.py │ ├── test_get.py │ ├── test_labels.py │ └── test_representations.py ├── test_sub_models/ │ ├── __init__.py │ ├── test_cluster.py │ ├── test_dim_reduction.py │ └── test_embeddings.py ├── test_utils.py ├── test_variations/ │ ├── __init__.py │ ├── test_class.py │ ├── test_dynamic.py │ └── test_hierarchy.py └── test_vectorizers/ ├── __init__.py ├── test_ctfidf.py └── test_online_cv.py