gitextract_i1k0jy7m/ ├── .dockerignore ├── .editorconfig ├── .github/ │ ├── .stale.yml │ ├── CODEOWNERS │ ├── ISSUE_TEMPLATE/ │ │ ├── bug_report.md │ │ ├── config.yml │ │ ├── feature_request.md │ │ └── question.md │ ├── PULL_REQUEST_TEMPLATE.md │ ├── dependabot.yml │ ├── release-drafter.yml │ └── workflows/ │ ├── cd.yml │ ├── ci.yml │ ├── greetings.yml │ └── release-drafter.yml ├── .gitignore ├── .pre-commit-config.yaml ├── CODE_OF_CONDUCT.md ├── CONTRIBUTING.md ├── LICENSE ├── Makefile ├── README.md ├── SECURITY.md ├── datasets/ │ └── external/ │ ├── get_language_dataset.sh │ └── get_stanfordtweets.sh ├── docker/ │ ├── Dockerfile │ └── README.md ├── docs/ │ ├── Makefile │ ├── make.bat │ ├── scripts/ │ │ └── buildsite.sh │ └── source/ │ ├── _templates/ │ │ ├── module.rst_t │ │ ├── package.rst_t │ │ └── versions.html │ ├── conf.py │ ├── index.rst │ └── tutorials/ │ ├── basic_notebook.ipynb │ └── index.rst ├── nlpretext/ │ ├── __init__.py │ ├── _config/ │ │ ├── __init__.py │ │ ├── config.py │ │ ├── constants.py │ │ └── stopwords.py │ ├── _utils/ │ │ ├── __init__.py │ │ ├── daskloader.py │ │ ├── file_loader.py │ │ ├── pandasloader.py │ │ ├── phone_number.py │ │ └── stopwords.py │ ├── augmentation/ │ │ ├── __init__.py │ │ └── text_augmentation.py │ ├── basic/ │ │ ├── __init__.py │ │ └── preprocess.py │ ├── cli/ │ │ ├── __init__.py │ │ ├── __main__.py │ │ └── preprocess.py │ ├── preprocessor.py │ ├── py.typed │ ├── social/ │ │ ├── __init__.py │ │ └── preprocess.py │ ├── textloader.py │ └── token/ │ ├── __init__.py │ ├── preprocess.py │ └── tokenizer.py ├── pyproject.toml ├── references/ │ └── .gitkeep └── tests/ ├── __init__.py ├── test_data_augmentation.py ├── test_file_loader.py ├── test_phone_number.py ├── test_preprocessor.py ├── test_textloader.py └── test_tokenizer.py