[
  {
    "path": ".dockerignore",
    "content": "tests/*\ntarget/*\ndata/*\n"
  },
  {
    "path": ".github/FUNDING.yml",
    "content": "# These are supported funding model platforms\n\ngithub: valeriansaliou\n"
  },
  {
    "path": ".github/workflows/build.yml",
    "content": "on:\n  push:\n    tags:\n      - \"v*.*.*\"\n\nname: Build and Release\n\njobs:\n  build-releases:\n    runs-on: ubuntu-22.04\n\n    steps:\n      - name: Checkout code\n        uses: actions/checkout@v2\n\n      - name: Cache build artifacts\n        id: cache-cargo\n        uses: actions/cache@v4\n        with:\n          path: |\n            ~/.cargo/bin\n            ~/.cargo/registry\n            ~/.cargo/git\n            target\n          key: build-${{ runner.os }}-cargo-any\n\n      - name: Install Rust toolchain\n        uses: actions-rs/toolchain@v1\n        with:\n          toolchain: stable\n          components: rustfmt\n          override: true\n\n      - name: Verify versions\n        run: rustc --version && rustup --version && cargo --version\n\n      - name: Get current tag\n        id: current_tag\n        uses: WyriHaximus/github-action-get-previous-tag@v1\n\n      - name: Release package\n        run: cargo publish --no-verify --token ${CRATES_TOKEN}\n        env:\n          CRATES_TOKEN: ${{ secrets.CRATES_TOKEN }}\n\n      - name: Release binaries\n        run: ./scripts/release_binaries.sh --version=${{ steps.current_tag.outputs.tag }}\n\n      - name: Release new version\n        uses: softprops/action-gh-release@v1\n        with:\n          tag_name: ${{ steps.current_tag.outputs.tag }}\n          name: Sonic ${{ steps.current_tag.outputs.tag }}\n          body: \"⚠️ Changelog not yet provided.\"\n          files: ./${{ steps.current_tag.outputs.tag }}-*.tar.gz\n        env:\n          GITHUB_TOKEN: ${{ secrets.GITHUB_TOKEN }}\n\n  build-packages:\n    needs: build-releases\n    runs-on: ubuntu-latest\n\n    steps:\n      - name: Checkout code\n        uses: actions/checkout@v2\n\n      - name: Build packages\n        run: ./scripts/build_packages.sh\n\n      - name: Push packages to Packagecloud\n        uses: faucetsdn/action-packagecloud-upload-debian-packages@v1\n        with:\n          path: ./packages\n          repo: ${{ secrets.PACKAGECLOUD_REPO }}\n          token: ${{ secrets.PACKAGECLOUD_TOKEN }}\n\n  build-docker:\n    runs-on: ubuntu-latest\n\n    steps:\n      - name: Checkout code\n        uses: actions/checkout@v4\n\n      - name: Acquire Docker image metadata\n        id: metadata\n        uses: docker/metadata-action@v4\n        with:\n          images: valeriansaliou/sonic\n\n      - name: Login to Docker Hub\n        uses: docker/login-action@v3\n        with:\n          username: ${{ secrets.DOCKERHUB_USERNAME }}\n          password: ${{ secrets.DOCKERHUB_TOKEN }}\n\n      - name: Build and push Docker image\n        uses: docker/build-push-action@v4\n        id: build\n        with:\n          context: .\n          tags: ${{ steps.metadata.outputs.tags }}\n          labels: ${{ steps.metadata.outputs.labels }}\n          push: true\n"
  },
  {
    "path": ".github/workflows/test.yml",
    "content": "on: [push, pull_request]\n\nname: Test and Build\n\njobs:\n  test:\n    strategy:\n      matrix:\n        os: [ubuntu-latest]\n        rust-toolchain: [stable]\n      fail-fast: false\n\n    runs-on: ${{ matrix.os }}\n\n    steps:\n      - name: Checkout code\n        uses: actions/checkout@v2\n\n      - name: Cache build artifacts\n        id: cache-cargo\n        uses: actions/cache@v4\n        with:\n          path: |\n            ~/.cargo/registry\n            ~/.cargo/git\n            target\n          key: test-${{ runner.os }}-cargo-${{ matrix.rust-toolchain }}\n\n      - name: Cache integration artifacts\n        id: cache-integration\n        uses: actions/cache@v4\n        with:\n          path: |\n            tests/integration/runner/node_modules\n          key: test-${{ runner.os }}-integration-${{ matrix.rust-toolchain }}\n\n      - name: Install Rust toolchain\n        uses: actions-rs/toolchain@v1\n        with:\n          toolchain: ${{ matrix.rust-toolchain }}\n          components: rustfmt\n          override: true\n\n      - name: Install NodeJS\n        uses: actions/setup-node@v1\n\n      - name: Verify versions\n        run: rustc --version && rustup --version && cargo --version && node --version && npm --version\n\n      - name: Build code\n        run: cargo build\n\n      - name: Test code\n        run: cargo test\n\n      - name: Check code style\n        run: cargo fmt -- --check\n\n      - name: Run integration tests\n        run: tests/integration/scripts/run.sh\n"
  },
  {
    "path": ".gitignore",
    "content": "target/*\n.DS_Store\n*~\n*#\n.cargo\n\ndata/store/fst/*\ndata/store/kv/*\n"
  },
  {
    "path": "CHANGELOG.md",
    "content": "Sonic Changelog\n===============\n\n## 1.4.9 (2024-06-16)\n\n### Changes\n\n* Update Rust code style to conform to new `rustc` requirements (preventing builds on `rustc 1.79.0` and further) [[@jaseemabid](https://github.com/jaseemabid), [#321](https://github.com/valeriansaliou/sonic/pull/321)].\n\n## 1.4.8 (2023-12-14)\n\n### Changes\n\n* Pull out the `arm64` platform from the Docker image, since it does not build in acceptable time via GitHub Actions due to using QEMU emulation (will wait that GitHub Actions provides a native `arm64` runner) [[@valeriansaliou](https://github.com/valeriansaliou)].\n\n## 1.4.7 (2023-12-14)\n\n### Bug Fixes\n\n* Fixed non-working `arm64` builds due to hardcoded `x86_64-unknown-linux-gnu` Rust target in the `Dockerfile` [[@valeriansaliou](https://github.com/valeriansaliou)].\n\n## 1.4.6 (2023-12-14)\n\n### New Features\n\n* The Docker image is now also available for the `arm64` platform, in addition to `amd64` [[@PovilasID](https://github.com/PovilasID), [#310](https://github.com/valeriansaliou/sonic/pull/310)].\n\n## 1.4.5 (2023-12-11)\n\n### Bug Fixes\n\n* Fixed an issue where system clock can move back to the past on a virtualized system, resulting in client threads entering a crash loop due to mutex poisoning [[@valeriansaliou](https://github.com/valeriansaliou)].\n\n## 1.4.4 (2023-12-08)\n\n### Bug Fixes\n\n* Fixed `rocksdb` not building due to a `rust-bindgen` version which was not compatible with `clang` version 16 [[@anthonyroussel](https://github.com/anthonyroussel), [#316](https://github.com/valeriansaliou/sonic/pull/316)].\n\n### Changes\n\n* Dependencies have been bumped to latest versions (namely: `rocksdb`, `toml`, `regex-syntax`, `hashbrown`, `lindera-core`, `lindera-dictionary`, `lindera-tokenizer`) [[@valeriansaliou](https://github.com/valeriansaliou)].\n\n## 1.4.3 (2023-09-04)\n\n### Changes\n\n* Publish `.deb` packages for Debian 12 on `x86_64` architecture [[@valeriansaliou](https://github.com/valeriansaliou)].\n\n## 1.4.2 (2023-09-04)\n\n### Changes\n\n* Produce `glibc` builds from GitHub Actions whenever a new Sonic version gets released [[@valeriansaliou](https://github.com/valeriansaliou)].\n* Pull out `tokenizer-japanese` from the default features, as it x10 the final binary size [[@valeriansaliou](https://github.com/valeriansaliou)].\n\n## 1.4.1 (2023-08-12)\n\n### New Features\n\n* Added support for Japanese word segmentation in tokenizer (note that as this adds quite some size overhead to the final binary size, the feature `tokenizer-japanese` can be disabled when building Sonic) [[@nmkj-io](https://github.com/nmkj-io), [#311](https://github.com/valeriansaliou/sonic/pull/311)].\n\n## 1.4.0 (2022-10-20)\n\n### Bug Fixes\n\n* Fixed typo in README abstract [[@remram44](https://github.com/remram44), [#295](https://github.com/valeriansaliou/sonic/pull/295)].\n* Fixed typos in code and documentation [[@kianmeng](https://github.com/kianmeng), [#294](https://github.com/valeriansaliou/sonic/pull/294)].\n\n### Changes\n\n* Replaced Docker source image from Debian Slim to lighter Google distroless image [[@0x0x1](https://github.com/0x0x1), [#282](https://github.com/valeriansaliou/sonic/pull/282)].\n\n### New Features\n\n* Added an index enumeration `LIST` command to Sonic Channel [[@trkohler](https://github.com/trkohler), [#293](https://github.com/valeriansaliou/sonic/pull/293)].\n\n## 1.3.5 (2022-07-10)\n\n### Bug Fixes\n\n* Rolled back `rocksdb` version, as the latest version does not link properly in `--release` mode [[@valeriansaliou](https://github.com/valeriansaliou)].\n\n## 1.3.4 (2022-07-10)\n\n### Changes\n\n* Dependencies have been bumped to latest versions (namely: `rocksdb`, `clap`, `regex`) [[@valeriansaliou](https://github.com/valeriansaliou)].\n\n## 1.3.3 (2022-07-07)\n\n### Changes\n\n* Dependencies have been bumped to latest versions (namely: `hashbrown`, `whatlang`, `regex`) [[@valeriansaliou](https://github.com/valeriansaliou)].\n* Moved the release pipeline to GitHub Actions [[@valeriansaliou](https://github.com/valeriansaliou)].\n\n### New Features\n\n* The language detection system is now about 2x faster (due to the upgrade of `whatlang` past `v0.14.0`) [[@valeriansaliou](https://github.com/valeriansaliou)].\n* Added Armenian stopwords [[@valeriansaliou](https://github.com/valeriansaliou)].\n* Added Georgian stopwords [[@valeriansaliou](https://github.com/valeriansaliou)].\n* Added Gujarati stopwords [[@valeriansaliou](https://github.com/valeriansaliou)].\n* Added Tagalog stopwords [[@valeriansaliou](https://github.com/valeriansaliou)].\n\n## 1.3.2 (2021-11-09)\n\n### Bug Fixes\n\n* Fixed Norwegian stopwords [[@valeriansaliou](https://github.com/valeriansaliou), [#239](https://github.com/valeriansaliou/sonic/issues/239)].\n\n### Changes\n\n* Code has been formatted according to `clippy` recommendations. This does not change the way Sonic behaves [[@pleshevskiy](https://github.com/pleshevskiy), [#233](https://github.com/valeriansaliou/sonic/pull/233)].\n\n### New Features\n\n* Added support for Chinese word segmentation in tokenizer (note that as this adds quite some size overhead to the final binary size, the feature `tokenizer-chinese` can be disabled when building Sonic) [[@vincascm](https://github.com/vincascm), [#209](https://github.com/valeriansaliou/sonic/pull/209)].\n\n## 1.3.1 (2021-11-02)\n\n### Changes\n\n* Apple Silicon is now supported [[@valeriansaliou](https://github.com/valeriansaliou)].\n* Added Norwegian stopwords [[@mikalv](https://github.com/mikalv), [#236](https://github.com/valeriansaliou/sonic/pull/236)].\n* Added Catalan stopwords [[@coopanio](https://github.com/coopanio), [#227](https://github.com/valeriansaliou/sonic/pull/227)].\n* Dependencies have been bumped to latest versions (namely: `rocksdb`, `fst-levenshtein`, `fst-regex`, `hashbrown`, `whatlang`, `byteorder`, `rand`) [[@valeriansaliou](https://github.com/valeriansaliou)].\n\n### Deprecations\n\n* A few rarely-used languages have been removed, following `whatlang` `v0.12.0` release, [see the notes here](https://github.com/greyblake/whatlang-rs/blob/master/CHANGELOG.md#v0120---2021-04-18) [[@valeriansaliou](https://github.com/valeriansaliou), [940d3c3](https://github.com/valeriansaliou/sonic/commit/940d3c3070e144a10f041fcfdf77d15548598eee)].\n\n## 1.3.0 (2020-06-27)\n\n### Changes\n\n* Added support for Slovak, which is now auto-detected from terms [[@valeriansaliou](https://github.com/valeriansaliou), [19412ce](https://github.com/valeriansaliou/sonic/commit/19412ce05a802ef1e6054b751faaef50cab5d36b)].\n* Added Slovak stopwords [[@valeriansaliou](https://github.com/valeriansaliou), [19412ce](https://github.com/valeriansaliou/sonic/commit/19412ce05a802ef1e6054b751faaef50cab5d36b)].\n* Dependencies have been bumped to latest versions (namely: `whatlang`) [[@valeriansaliou](https://github.com/valeriansaliou), [19412ce](https://github.com/valeriansaliou/sonic/commit/19412ce05a802ef1e6054b751faaef50cab5d36b)].\n\n## 1.2.4 (2020-06-25)\n\n### Bug Fixes\n\n* Fixed multiple deadlocks, which where not noticed in practice by running Sonic at scale, but that are still theoretically possible [[@BurtonQin](https://github.com/BurtonQin), [#213](https://github.com/valeriansaliou/sonic/pull/213), [#211](https://github.com/valeriansaliou/sonic/pull/211)].\n\n### Changes\n\n* Added support for Latin, which is now auto-detected from terms [[@valeriansaliou](https://github.com/valeriansaliou), [e6c5621](https://github.com/valeriansaliou/sonic/commit/e6c5621ba0fabe83b8bc060824951006b373dc3f)].\n* Added Latin stopwords [[@valeriansaliou](https://github.com/valeriansaliou), [e6c5621](https://github.com/valeriansaliou/sonic/commit/e6c5621ba0fabe83b8bc060824951006b373dc3f)].\n* Dependencies have been bumped to latest versions (namely: `rocksdb`, `radix`, `hashbrown`, `whatlang`) [[@valeriansaliou](https://github.com/valeriansaliou)].\n\n### New Features\n\n* Added a release script, with cross-compilation capabilities (currently for the `x86_64` architecture, dynamically linked against GNU libraries) [[@valeriansaliou](https://github.com/valeriansaliou), [961bab9](https://github.com/valeriansaliou/sonic/commit/961bab92211295e99f1f6052577fa1aeff459d0c)].\n\n## 1.2.3 (2019-10-14)\n\n### Changes\n\n* RocksDB compression algorithm has been changed from LZ4 to Zstandard, for a slightly better compression ratio, and much better read/write performance; this will be used for new SST files only [[@valeriansaliou](https://github.com/valeriansaliou), [cd4cdfb](https://github.com/valeriansaliou/sonic/commit/cd4cdfb756ae9eccd43dc7e73d2c115b33297714)].\n* Dependencies have been bumped to latest versions (namely: `rocksdb`) [[@valeriansaliou](https://github.com/valeriansaliou), [cd4cdfb](https://github.com/valeriansaliou/sonic/commit/cd4cdfb756ae9eccd43dc7e73d2c115b33297714)].\n\n## 1.2.2 (2019-07-12)\n\n### Bug Fixes\n\n* Fixed a regression on optional configuration values not working anymore, due to an issue in the environment variable reading system introduced in `v1.2.1` [[@valeriansaliou](https://github.com/valeriansaliou), [#155](https://github.com/valeriansaliou/sonic/issues/155)].\n\n### Changes\n\n* Optimized some aspects of FST consolidation and pending operations management [[@valeriansaliou](https://github.com/valeriansaliou), [#156](https://github.com/valeriansaliou/sonic/issues/156)].\n\n## 1.2.1 (2019-07-08)\n\n### Changes\n\n* FST graph consolidation is now able to ignore new words when the graph is over configured limits, which are set with the new `store.fst.graph.max_size` and `store.fst.graph.max_words` configuration variables [[@valeriansaliou](https://github.com/valeriansaliou), [53db9c1](https://github.com/valeriansaliou/sonic/commit/53db9c186630a6751c0a85e610cebabace1aee2b)].\n* An integration testing infrastructure has been added to the Sonic automated test suite [[@vilunov](https://github.com/vilunov), [#154](https://github.com/valeriansaliou/sonic/pull/154)].\n* Configuration values can now be sourced from environment variables, using the `${env.VARIABLE}` syntax in `config.cfg` [[@perzanko](https://github.com/perzanko), [#148](https://github.com/valeriansaliou/sonic/pull/148)].\n* Dependencies have been bumped to latest versions (namely: `rand`, `radix` and `hashbrown`) [[@valeriansaliou](https://github.com/valeriansaliou), [c1b1f54](https://github.com/valeriansaliou/sonic/commit/c1b1f54ad836df553bec0cd14f041bb34058307c)].\n\n## 1.2.0 (2019-05-03)\n\n### Bug Fixes\n\n* Fixed a rare deadlock occurring when 3 concurrent operations get executed on different threads for the same collection, in the following timely order: `PUSH` then `FLUSHB` then `PUSH` [[@valeriansaliou](https://github.com/valeriansaliou), [d96546b](https://github.com/valeriansaliou/sonic/commit/d96546bd9d8b79332df1106766377e4a4acebd50)].\n\n### Changes\n\n* Reworked the KV store manager to perform periodic memory flushes to disk, thus reducing startup time [[@valeriansaliou](https://github.com/valeriansaliou), [6713488](https://github.com/valeriansaliou/sonic/commit/6713488af3543bca33be6e772936f9668430ba86)].\n* Stop accepting Sonic Channel commands when shutting down Sonic [[@valeriansaliou](https://github.com/valeriansaliou), [#131](https://github.com/valeriansaliou/sonic/issues/131)].\n\n### New Features\n\n* Introduced a server statistics `INFO` command to Sonic Channel [[@valeriansaliou](https://github.com/valeriansaliou), [#70](https://github.com/valeriansaliou/sonic/issues/70)].\n* Added the ability to disable the lexer for a command with the command modifier `LANG(none)` [[@valeriansaliou](https://github.com/valeriansaliou), [#108](https://github.com/valeriansaliou/sonic/issues/108)].\n* Added a backup and restore system for both KV and FST stores, which can be triggered over Sonic Channel with `TRIGGER backup` and `TRIGGER restore` [[@valeriansaliou](https://github.com/valeriansaliou), [#5](https://github.com/valeriansaliou/sonic/issues/5)].\n* Added the ability to disable KV store WAL (Write-Ahead Log) with the `write_ahead_log` option, which helps limit write wear on heavily loaded SSD-backed servers [[@valeriansaliou](https://github.com/valeriansaliou), [#130](https://github.com/valeriansaliou/sonic/issues/130)].\n\n## 1.1.9 (2019-03-29)\n\n### Bug Fixes\n\n* RocksDB has been bumped to `v5.18.3`, which fixes a dead-lock occurring in RocksDB at scale when a compaction task is ran under heavy disk writes (ie. disk flushes). This dead-lock was causing Sonic to stop responding to any command issued for the frozen collection. This dead-lock was due to a bug in RocksDB internals (not originating from Sonic itself) [[@baptistejamin](https://github.com/baptistejamin), [19c4a10](https://github.com/baptistejamin/sonic/commit/19c4a104a6d6aaed1dd9beb2e51d2639627825cd)].\n\n### Changes\n\n* Reworked the `FLUSHB` command internals, which now use the atomic `delete_range()` operation provided by RocksDB `v5.18` [[@valeriansaliou](https://github.com/valeriansaliou), [660f8b7](https://github.com/valeriansaliou/sonic/commit/660f8b714d968400fb9f88a245752dca02249bf7)].\n\n### New Features\n\n* Added the `LANG(<locale>)` command modifier for `QUERY` and `PUSH`, that lets a Sonic Channel client force a text locale (instead of letting the lexer system guess the text language) [[@valeriansaliou](https://github.com/valeriansaliou), [#75](https://github.com/valeriansaliou/sonic/issues/75)].\n* The FST word lookup system, used by the `SUGGEST` command, now support all scripts via a restricted Unicode range forward scan [[@valeriansaliou](https://github.com/valeriansaliou), [#64](https://github.com/valeriansaliou/sonic/issues/64)].\n\n## 1.1.8 (2019-03-27)\n\n### Bug Fixes\n\n* A store acquire lock has been added to prevent 2 concurrent threads from opening the same collection at the same time [[@valeriansaliou](https://github.com/valeriansaliou), [2628077](https://github.com/valeriansaliou/sonic/commit/2628077ebe7e24155975962471e7653745a0add7)].\n\n## 1.1.7 (2019-03-27)\n\n### Bug Fixes\n\n* A superfluous mutex was removed from KV and FST store managers, in an attempt to solve a rare dead-lock occurring on high-traffic Sonic setups in the KV store [[@valeriansaliou](https://github.com/valeriansaliou), [60566d2](https://github.com/valeriansaliou/sonic/commit/60566d2f087fd6725dba4a60c3c5a3fef7e8399b)].\n\n## 1.1.6 (2019-03-27)\n\n### Changes\n\n* Reverted changes made in `v1.1.5` regarding the open files `rlimit`, as this can be set from outside Sonic [[@valeriansaliou](https://github.com/valeriansaliou), [f6400c6](https://github.com/valeriansaliou/sonic/commit/f6400c61a9a956130ae0bdaa9a164f4955cd2a18)].\n* Added Chinese Traditional stopwords [[@dsewnr](https://github.com/dsewnr), [#87](https://github.com/valeriansaliou/sonic/issues/87)].\n\n### Bug Fixes\n\n* Improved the way database locking is handled when calling a pool janitor; this prevents potential dead-locks under high load [[@valeriansaliou](https://github.com/valeriansaliou), [fa78372](https://github.com/valeriansaliou/sonic/commit/fa783728fd27a116b8dcf9a7180740d204b69aa4)].\n\n## 1.1.5 (2019-03-27)\n\n### New Features\n\n* Added the `server.limit_open_files` configuration variable to allow configuring `rlimit` [[@valeriansaliou](https://github.com/valeriansaliou)].\n\n## 1.1.4 (2019-03-27)\n\n### Changes\n\n* Added Kannada stopwords [[@dileepbapat](https://github.com/dileepbapat)].\n* The Docker image is now much lighter [[@codeflows](https://github.com/codeflows)].\n\n### New Features\n\n* Automatically adjust `rlimit` for the process to the hard limit allowed by the system (allows opening more FSTs in parallel) [[@valeriansaliou](https://github.com/valeriansaliou)].\n\n## 1.1.3 (2019-03-25)\n\n### Changes\n\n* Limit the size of words that can hit against the FST graph, as the FST gets slower for long words [[@valeriansaliou](https://github.com/valeriansaliou), [#81](https://github.com/valeriansaliou/sonic/issues/81)].\n\n### Bug Fixes\n\n* Rework Sonic Channel buffer management using a VecDeque (Sonic should now work better in harsh network environments) [[@valeriansaliou](https://github.com/valeriansaliou), [1c2b9c8](https://github.com/valeriansaliou/sonic/commit/1c2b9c8fcd28b033a7cb80d678c388ce78ab989d)].\n\n## 1.1.2 (2019-03-24)\n\n### Changes\n\n* FST graph consolidation locking strategy has been improved even further, based on issues with the previous rework we have noticed at scale in production (now, consolidation locking is done at a lower-priority relative to actual queries and pushes to the index) [[@valeriansaliou](https://github.com/valeriansaliou), [#68](https://github.com/valeriansaliou/sonic/issues/68)].\n\n## 1.1.1 (2019-03-24)\n\n### Changes\n\n* FST graph consolidation locking strategy has been reworked as to allow queries to be executed lock-free when the FST consolidate task takes a lot of time (previously, queries were being deferred due to an ongoing FST consolidate task) [[@valeriansaliou](https://github.com/valeriansaliou), [#68](https://github.com/valeriansaliou/sonic/issues/68)].\n* Removed special license clause introduced in `v1.0.2`, Sonic is full `MPL 2.0` now. [[@valeriansaliou](https://github.com/valeriansaliou)]\n\n## 1.1.0 (2019-03-21)\n\n### Breaking Changes\n\n* Change how buckets are stored in a KV-based collection (nest them in the same RocksDB database; this is much more efficient on setups with a large number of buckets - **`v1.1.0` is incompatible with the `v1.0.0` KV database format**) [[@valeriansaliou](https://github.com/valeriansaliou)].\n\n### Changes\n\n* Bump `jemallocator` to version `0.3` [[@valeriansaliou](https://github.com/valeriansaliou)].\n\n## 1.0.2 (2019-03-20)\n\n### Changes\n\n* Re-license from `MPL 2.0` to `SOSSL 1.0` (Sonic has a special license clause) [[@valeriansaliou](https://github.com/valeriansaliou)].\n\n## 1.0.1 (2019-03-19)\n\n### Changes\n\n* Added automated benchmarks (can be ran via `cargo bench --features benchmark`) [[@valeriansaliou](https://github.com/valeriansaliou)].\n* Reduced the time to query the search index by 50% via optimizations (in multiple methods, eg. the lexer) [[@valeriansaliou](https://github.com/valeriansaliou)].\n\n## 1.0.0 (2019-03-18)\n\n### New Features\n\n* Initial Sonic release [[@valeriansaliou](https://github.com/valeriansaliou)].\n"
  },
  {
    "path": "CODE_OF_CONDUCT.md",
    "content": "# Contributor Covenant Code of Conduct\n\n## Our Pledge\n\nIn the interest of fostering an open and welcoming environment, we as\ncontributors and maintainers pledge to making participation in our project and\nour community a harassment-free experience for everyone, regardless of age, body\nsize, disability, ethnicity, sex characteristics, gender identity and expression,\nlevel of experience, education, socio-economic status, nationality, personal\nappearance, race, religion, or sexual identity and orientation.\n\n## Our Standards\n\nExamples of behavior that contributes to creating a positive environment\ninclude:\n\n* Using welcoming and inclusive language\n* Being respectful of differing viewpoints and experiences\n* Gracefully accepting constructive criticism\n* Focusing on what is best for the community\n* Showing empathy towards other community members\n\nExamples of unacceptable behavior by participants include:\n\n* The use of sexualized language or imagery and unwelcome sexual attention or\n advances\n* Trolling, insulting/derogatory comments, and personal or political attacks\n* Public or private harassment\n* Publishing others' private information, such as a physical or electronic\n address, without explicit permission\n* Other conduct which could reasonably be considered inappropriate in a\n professional setting\n\n## Our Responsibilities\n\nProject maintainers are responsible for clarifying the standards of acceptable\nbehavior and are expected to take appropriate and fair corrective action in\nresponse to any instances of unacceptable behavior.\n\nProject maintainers have the right and responsibility to remove, edit, or\nreject comments, commits, code, wiki edits, issues, and other contributions\nthat are not aligned to this Code of Conduct, or to ban temporarily or\npermanently any contributor for other behaviors that they deem inappropriate,\nthreatening, offensive, or harmful.\n\n## Scope\n\nThis Code of Conduct applies both within project spaces and in public spaces\nwhen an individual is representing the project or its community. Examples of\nrepresenting a project or community include using an official project e-mail\naddress, posting via an official social media account, or acting as an appointed\nrepresentative at an online or offline event. Representation of a project may be\nfurther defined and clarified by project maintainers.\n\n## Enforcement\n\nInstances of abusive, harassing, or otherwise unacceptable behavior may be\nreported by contacting the project team at valerian@valeriansaliou.name. All\ncomplaints will be reviewed and investigated and will result in a response that\nis deemed necessary and appropriate to the circumstances. The project team is\nobligated to maintain confidentiality with regard to the reporter of an incident.\nFurther details of specific enforcement policies may be posted separately.\n\nProject maintainers who do not follow or enforce the Code of Conduct in good\nfaith may face temporary or permanent repercussions as determined by other\nmembers of the project's leadership.\n\n## Attribution\n\nThis Code of Conduct is adapted from the [Contributor Covenant][homepage], version 1.4,\navailable at https://www.contributor-covenant.org/version/1/4/code-of-conduct.html\n\n[homepage]: https://www.contributor-covenant.org\n\nFor answers to common questions about this code of conduct, see\nhttps://www.contributor-covenant.org/faq\n"
  },
  {
    "path": "CONFIGURATION.md",
    "content": "Sonic Configuration\n===================\n\n# File: config.cfg\n\n**All available configuration options are commented below, with allowed values:**\n\n**[server]**\n\n* `log_level` (type: _string_, allowed: `debug`, `info`, `warn`, `error`, default: `error`) — Verbosity of logging, set it to `error` in production\n\n**[channel]**\n\n* `inet` (type: _string_, allowed: IPv4 / IPv6 + port, default: `[::1]:1491`) — Host and TCP port Sonic Channel should listen on\n* `tcp_timeout` (type: _integer_, allowed: seconds, default: `300`) — Timeout of idle/dead client connections to Sonic Channel\n* `auth_password` (type: _string_, allowed: password values, default: none) — Authentication password required to connect to the channel (optional but recommended)\n\n**[channel.search]**\n\n* `query_limit_default` (type: _integer_, allowed: numbers, default: `10`) — Default search results limit for a query command (if the LIMIT command modifier is not used when issuing a QUERY command)\n* `query_limit_maximum` (type: _integer_, allowed: numbers, default: `100`) — Maximum search results limit for a query command (if the LIMIT command modifier is being used when issuing a QUERY command)\n* `query_alternates_try` (type: _integer_, allowed: numbers, default: `4`) — Number of alternate words that look like query word to try if there are not enough query results (if zero, no alternate will be tried; if too high there may be a noticeable performance penalty)\n* `suggest_limit_default` (type: _integer_, allowed: numbers, default: `5`) — Default suggested words limit for a suggest command (if the LIMIT command modifier is not used when issuing a SUGGEST command)\n* `suggest_limit_maximum` (type: _integer_, allowed: numbers, default: `20`) — Maximum suggested words limit for a suggest command (if the LIMIT command modifier is being used when issuing a SUGGEST command)\n* `list_limit_default` (type: _integer_, allowed: numbers, default: `100`) — Default listed words limit for a list command (if the LIMIT command modifier is not used when issuing a LIST command)\n* `list_limit_maximum` (type: _integer_, allowed: numbers, default: `500`) — Maximum listed words limit for a list command (if the LIMIT command modifier is being used when issuing a LIST command)\n\n**[store]**\n\n**[store.kv]**\n\n* `path` (type: _string_, allowed: UNIX path, default: `./data/store/kv/`) — Path to the Key-Value database store\n* `retain_word_objects` (type: _integer_, allowed: numbers, default: `1000`) — Maximum number of objects a given word in the index can be linked to (older objects are cleared using a sliding window)\n\n**[store.kv.pool]**\n\n* `inactive_after` (type: _integer_, allowed: seconds, default: `1800`) — Time after which a cached database is considered inactive and can be closed (if it is not used, ie. re-activated)\n\n**[store.kv.database]**\n\n* `flush_after` (type: _integer_, allowed: seconds, default: `900`) — Time after which pending database updates should be flushed from memory to disk (increase this delay if you encounter high-CPU usage issues when a flush task kicks-in; this value should be lower than `store.kv.pool.inactive_after`)\n* `compress` (type: _boolean_, allowed: `true`, `false`, default: `true`) — Whether to compress database or not (uses Zstandard)\n* `parallelism` (type: _integer_, allowed: numbers, default: `2`) — Limit on the number of compaction and flush threads that can run at the same time\n* `max_files` (type: _integer_, allowed: numbers, no default) — Maximum number of database files kept open at the same time per-database (if any; otherwise there are no limits)\n* `max_compactions` (type: _integer_, allowed: numbers, default: `1`) — Limit on the number of concurrent database compaction jobs\n* `max_flushes` (type: _integer_, allowed: numbers, default: `1`) — Limit on the number of concurrent database flush jobs\n* `write_buffer` (type: _integer_, allowed: numbers, default: `16384`) — Maximum size in KB of the database write buffer, after which data gets flushed to disk (ie. `16384` is `16MB`; the size should be a multiple of `1024`, eg. `128 * 1024 = 131072` for `128MB`)\n* `write_ahead_log` (type: _boolean_, allowed: `true`, `false`, default: `true`) — Whether to enable Write-Ahead Log or not (it avoids losing non-flushed data in case of server crash)\n\n**[store.fst]**\n\n* `path` (type: _string_, allowed: UNIX path, default: `./data/store/fst/`) — Path to the Finite-State Transducer database store\n\n**[store.fst.pool]**\n\n* `inactive_after` (type: _integer_, allowed: seconds, default: `300`) — Time after which a cached graph is considered inactive and can be closed (if it is not used, ie. re-activated)\n\n**[store.fst.graph]**\n\n* `consolidate_after` (type: _integer_, allowed: seconds, default: `180`) — Time after which a graph that has pending updates should be consolidated (increase this delay if you encounter high-CPU usage issues when a consolidation task kicks-in; this value should be lower than `store.fst.pool.inactive_after`)\n* `max_size` (type: _integer_, allowed: numbers, default: `2048`) — Maximum size in KB of the graph file on disk, after which further words are not inserted anymore (ie. `2048` is `2MB`; the size should be a multiple of `1024`, eg. `8 * 1024 = 8192` for `8MB`; use this limit to prevent heavy graphs to be consolidating forever; this limit is enforced in pair with `store.fst.graph.max_words`, whichever is reached first)\n* `max_words` (type: _integer_, allowed: numbers, default: `250000`) — Maximum number of words that can be held at the same time in the graph, after which further words are not inserted anymore (use this limit to prevent heavy graphs to be consolidating forever; this limit is enforced in pair with `store.fst.graph.max_size`, whichever is reached first)\n\n# Command-Line: Environment variables\n\nYou are allowed to use environment variables in the configuration file.\n\n**You can provide them as follows:**\n\n```toml\n[channel]\n\nauth_password = \"${env.SECRET}\"\n```\n\n**Then, you can run Sonic providing a defined environment variable:**\n\n```bash\nSECRET=secretphrase ./sonic -c /path/to/config.cfg\n```\n\n_Note that this can only be used with string-like values._\n"
  },
  {
    "path": "CONTRIBUTING.md",
    "content": "Sonic Contributing Guide\n========================\n\n# Get Started\n\n- First of all, fork and clone this repo;\n- Install Rust and Cargo (to build and test Sonic);\n- Install NPM (for integration tests);\n\n## Build Sonic\n\nFrom the repository root, run:\n\n```sh\ncargo build\n```\n\n## Start Sonic\n\nFrom the repository root, run:\n\n```sh\ncargo run\n```\n\n## Run unit tests\n\nFrom the repository root, run:\n\n```sh\ncargo test\n```\n\n## Run integration tests\n\nFrom the directory: `<repository root>/tests/integration/scripts/`, run:\n\n```sh\n./run.sh\n```\n\n# Report Issues & Request Features\n\n**If you encounter an issue with Sonic, or would like to request a feature to be implemented, please do [open an issue](https://github.com/valeriansaliou/sonic/issues/new).**\n\nNote that before opening an issue, you should always search for other similar issues as to avoid opening a duplicate issue. This makes the life of the project maintainer much easier.\n\nWhen writing your issue title and command, make sure to be as precise as possible, giving away the maximum amount of details (even if you have a feeling some details are useless, they might make debugging or understanding easier for us).\n\n# Submit Your Code\n\n**If you would like to contribute directly by writing code, you should fork this repository and edit it right away from your GitHub namespace.**\n\nOnce you are done with your work, always ensure to format your Rust code according to guidelines, via the [rustfmt](https://github.com/rust-lang/rustfmt) utility: `rustfmt src/*.rs`\n\nWhen this is done, you may open a Pull Request (PR), then explain your changes and their purpose precisely. We will finally accept or comment on your Pull Request, if we need more changes done on your code.\n"
  },
  {
    "path": "Cargo.toml",
    "content": "[package]\nname = \"sonic-server\"\nversion = \"1.4.9\"\ndescription = \"Fast, lightweight and schema-less search backend.\"\nreadme = \"README.md\"\nlicense = \"MPL-2.0\"\nedition = \"2018\"\nhomepage = \"https://github.com/valeriansaliou/sonic\"\nrepository = \"https://github.com/valeriansaliou/sonic.git\"\nkeywords = [\"search\", \"query\", \"server\", \"index\"]\ncategories = [\"database-implementations\", \"web-programming\"]\nauthors = [\"Valerian Saliou <valerian@valeriansaliou.name>\", \"Baptiste Jamin <baptistejamin@gmail.com>\"]\n\n[[bin]]\nname = \"sonic\"\npath = \"src/main.rs\"\ndoc = false\n\n[dependencies]\nlog = \"0.4\"\ntoml = \"0.8\"\nclap = { version = \"3.2\", features = [\"std\", \"cargo\"] }\nlazy_static = \"1.4\"\nserde = \"1.0\"\nserde_derive = \"1.0\"\nrand = \"0.8\"\nunicode-segmentation = \"1.6\"\nradix = \"0.6\"\nrocksdb = { version = \"0.24\", features = [\"zstd\"] }\nfst = \"0.3\"\nfst-levenshtein = \"0.3\"\nfst-regex = \"0.3\"\nregex-syntax = \"0.8\"\ntwox-hash = \"1.5\"\nbyteorder = \"1.4\"\nhashbrown = \"0.14\"\nlinked_hash_set = \"0.1\"\nwhatlang = \"0.16\"\nregex = \"1.6\"\njieba-rs = { version = \"0.7\", optional = true }\nlindera-core = { version = \"0.31\", optional = true }\nlindera-dictionary = { version = \"0.31\", features = [\"unidic\"], optional = true }\nlindera-tokenizer = { version = \"0.31\", features = [\"unidic\"], optional = true }\n\n[target.'cfg(unix)'.dependencies]\nnix = { version = \"0.31.1\", features = [\"signal\"] }\ntikv-jemallocator = { version = \"0.4\", optional = true }\n\n[target.'cfg(windows)'.dependencies]\nwinapi = { version = \"0.3\", features = [\"minwindef\", \"consoleapi\"] }\n\n[features]\ndefault = [\"allocator-jemalloc\", \"tokenizer-chinese\"]\nallocator-jemalloc = [\"tikv-jemallocator\"]\ntokenizer-chinese = [\"jieba-rs\"]\ntokenizer-japanese = [\"lindera-core\", \"lindera-dictionary\", \"lindera-tokenizer\"]\nbenchmark = []\n\n[profile.dev]\nopt-level = 0\ndebug = true\ndebug-assertions = true\n\n[profile.release]\nopt-level = 3\nlto = true\ndebug = false\ndebug-assertions = false\nstrip = true\n\n[profile.bench]\nopt-level = 3\ndebug = false\ndebug-assertions = false\n"
  },
  {
    "path": "Dockerfile",
    "content": "FROM rust:slim-bullseye AS build\n\nRUN apt-get update\nRUN apt-get install -y build-essential clang\n\nRUN rustup --version\nRUN rustup component add rustfmt\n\nRUN rustc --version && \\\n    rustup --version && \\\n    cargo --version\n\nWORKDIR /app\nCOPY . /app\n\nRUN cargo clean && cargo build --release\nRUN strip ./target/release/sonic\n\nFROM gcr.io/distroless/cc\n\nWORKDIR /usr/src/sonic\n\nCOPY --from=build /app/target/release/sonic /usr/local/bin/sonic\n\nCMD [ \"sonic\", \"-c\", \"/etc/sonic.cfg\" ]\n\nEXPOSE 1491\n"
  },
  {
    "path": "INNER_WORKINGS.md",
    "content": "Sonic Inner Workings\n====================\n\nThis document was written with the goal of explaining the inner workings of Sonic, as well as the whys of the design choices that were made while building Sonic.\n\nAnyone reading this documentation should quickly get more familiar in how such a search index can be built from scratch, to the point that they should be able to start building their own Sonic from scratch.\n\n_If you feel something is missing from this document, or if it did not help you understand a concept Sonic implements, please [open an issue](https://github.com/valeriansaliou/sonic/issues/new) and explain precisely which part you did not get and why you think you did not get it._\n\n# The Building Blocks of a Search Index\n\n## Basics of a search index\n\nA search index is nothing more than a specialized database. It should expose primitives such as: query the index, push text in the index, pop text from the index, flush parts of the index.\n\nThe search index server is responsible for organizing the index data in a way that makes writes and reads efficient. It makes uses of specialized data structures for some very specific operations like typos corrections. The overall goal of such a search index system is: speed, lightweightness and data compactness (ie. it should minimize the resulting output database size given a text input size).\n\nAs to provide flexibility to organized indexed data, the search index is organized into collections that contain buckets. Buckets contain indexed objects. This means that you can organize your search index within a depth of 2 layers. Objects are actual search results; you could push an object `result_1` to collection `messages` within bucket `user_1`. This would index `messages` for `user_1` with result `result_1`. Later on, one could search for `messages` matching a given query for `user_1`. If the Sonic user use case does not require using buckets, the bucket value can still be set to a generic value, eg. `default`.\n\nSonic, unlike many other search index systems, does not serve actual documents as search results. A strategic choice was made to store only identifiers referring to primary keys in an external database, which makes the data stored on-disk as compact as it can be. Users can still refer to their external database to fetch actual search result documents, using identifiers provided by Sonic.\n\nIt is worth nothing that any project initiated as of 2019 should make use of modern server hardware, which is mostly all about multi-core CPUs and SSDs. Also, Sonic should be very wary of minimizing its resource requirements — _from a cold start to running under high load_ — as a lot of developers nowadays expect to run software on cheap VPS servers with limited CPU time, small disk space and little RAM. Those modern VPS are nonetheless powered by modern SSDs with fast random I/O. Last but not least, it would definitely be a plus if we could make software a bit greener.\n\nIn order to address the above, Sonic is capable to run queries over multiple CPUs in parallel. It leverages SSDs fast random I/O by using RocksDB as its main key-value store. It also avoids eating all available RAM by storing most data on-disk (via memory mapping), which is not an issue anymore as of 2019, as SSDs have low I/O latency and can sustain an unlimited number of reads over their lifetimes. Though, as writes are Achilles' heel of SSD disks, Sonic aims at minimizing writes and buffers a lot of those writes in RAM, which are committed to disk at periodic intervals. This should maximize the lifespan of the SSD disk under heavy index write load. Unfortunately, the side-effect of doing this is that in case of server power loss, non-committed writes will vanish.\n\n## How do result objects get indexed?\n\nSonic stores result objects in a key-value database (abbreviated KV), powered by RocksDB.\n\nWhen a text is pushed to Sonic, this text gets normalized, cleaned up and split in separate words. Each word is then associated to the pushed object result, and committed to the KV database as `word <-> object`.\n\nUpon cleaning the text, overhead is eluded. For instance, in the text `the lazy dog` there would be no point in indexing the word `the`, which is what is called a _stopword_. Sonic does not push stopwords to the index ([read more on stopwords](https://en.wikipedia.org/wiki/Stop_words)).\n\nWhen objects are pushed to the search index for a given bucket in a given collection, for instance object `session_77f2e05e-5a81-49f0-89e3-177e9e1d1f32`, Sonic converts this object to a compact 32 bits format, for instance `10292198`. We call the user-provided object identifier the OID, while the compact internal identifier is named the IID. The IID is mapped internally to indexed words, and is much more compact in terms of storage than the OID. You can think of OIDs and IIDs as basically the same thing, except that the IID is the compact version of an OID. OIDs are only used for user-facing input and output objects, while IIDs are only used for internal storage of those objects. On very long indexed texts, this helps save **_a lot_** of disk space.\n\nThe KV store has a simple schema, where we associate a binary key to binary data. The following types of keys exist:\n\n1. **Meta-To-Value**: state data for the bucket, eg. stores the count increment of indexed objects (data is in arbitrary format) (_code: [StoreKeyerIdx::MetaToValue](https://github.com/valeriansaliou/sonic/blob/5320b81afc1598ac1cd2af938df0b2ef6cb96dc4/src/store/keyer.rs#L24)_);\n2. **Term-To-IIDs**: maps a word (ie. term) to an internal identifier (ie. IID), which is essentially a word-to-result mapping (data is an array of 32 bits numbers encoded to binary as little-endian) (_code: [StoreKeyerIdx::TermToIIDs](https://github.com/valeriansaliou/sonic/blob/5320b81afc1598ac1cd2af938df0b2ef6cb96dc4/src/store/keyer.rs#L25)_);\n3. **OID-To-IID**: maps an object identifier (ie. OID) to an internal identifier (ie. IID), which converts an user-provided object to a compact internal object (data is a 32 bits number encoded to binary as little-endian) (_code: [StoreKeyerIdx::OIDToIID](https://github.com/valeriansaliou/sonic/blob/5320b81afc1598ac1cd2af938df0b2ef6cb96dc4/src/store/keyer.rs#L26)_);\n4. **IID-To-OID**: this is the reverse mapping of OID-To-IID, which lets convert an IID back to an OID (data is a variable-length UTF-8 string encoded in binary) (_code: [StoreKeyerIdx::IIDToOID](https://github.com/valeriansaliou/sonic/blob/5320b81afc1598ac1cd2af938df0b2ef6cb96dc4/src/store/keyer.rs#L27)_);\n5. **IID-To-Terms**: this lists all words (ie. terms) associated to an internal identifier (ie. IID) (data is an array of 32 bits numbers encoded to binary as little-endian) (_code: [StoreKeyerIdx::IIDToTerms](https://github.com/valeriansaliou/sonic/blob/5320b81afc1598ac1cd2af938df0b2ef6cb96dc4/src/store/keyer.rs#L28)_);\n\nA key is formatted as such, in binary: `[idx<1B> | bucket<4B> | route<4B>]` (_code: [StoreKeyerBuilder::build_key](https://github.com/valeriansaliou/sonic/blob/5320b81afc1598ac1cd2af938df0b2ef6cb96dc4/src/store/keyer.rs#L73)_), which makes it 9-bytes long. The index stands for the type of key, eg. Term-To-IIDs. The bucket and what we call the route are hashed as 32 bits numbers, and appended in little-endian binary format to the key.\n\nBoth IIDs and terms are stored as 32 bits numbers in binary format. 64 bits numbers could have been used instead, increasing the total number of objects that can be indexed per-bucket. Though, storing such 64 bits numbers instead of 32 bits numbers would double required storage space. As they make up most of stored space, it was important to keep them as small as possible. Those 32 bits numbers are generated using a fast and low-collision hash family called [XxHash](http://www.xxhash.com), from the OID in the case of the IID, and from the word in the case of the term hash (_code: [StoreTermHash](https://github.com/valeriansaliou/sonic/blob/5320b81afc1598ac1cd2af938df0b2ef6cb96dc4/src/store/identifiers.rs#L32)_).\n\n## How do word suggestion and user typo auto-correction work?\n\nWhen most users input text to a computer system using an actual keyboard, they make typos and mistakes. A nice property of a good search system should be that those typos can be forgiven and accurate search results still come up for the bogus user query. Sonic implements a data structure that lets it correct typos or autocomplete incomplete words.\n\nFor instance, if our index has the word `english` but the user, for some reason, inputs `englich`, Sonic would still return results for `english`. Similarly, if the user inputs an incomplete word eg. `eng`, Sonic would expand this word to `english`, if there were no or not enough exact matches for `eng`.\n\nThe store system responsible for such a feat is the FST ([Finite-State Transducer](https://en.wikipedia.org/wiki/Finite-state_transducer)). It can be grossly compared to a graph of characters, where nodes are characters and edges connect those characters to produce words.\n\nSonic stores a single FST file per bucket. This FST file is memory-mapped, and read directly from the disk when Sonic needs to read it. The [fst](https://crates.io/crates/fst) crate is used to implement the FST data structure.\n\nOne downside of the FST implementation that Sonic uses, is that once built, an FST is immutable. It means that in order to add a new word to the search index (for a given bucket), Sonic needs to re-build the entire FST (ie. iterate word-by-word on the existing FST and stream those words plus the added word to a new on-disk FST file). In order to do that in an efficient manner, Sonic implements an FST consolidation tasker, which stores FST changes in-memory and consolidates them to disk at periodic intervals (this interval can be configured) (_code: [StoreFSTPool::consolidate](https://github.com/valeriansaliou/sonic/blob/5320b81afc1598ac1cd2af938df0b2ef6cb96dc4/src/store/fst.rs#L173)_).\n\n## How do texts get cleaned up? (via the lexer)\n\nAny text that gets pushed to Sonic needs to be normalized (eg. lower-cased) and cleaned up (eg. remove stopwords) before it can be added to the index. This task is handled by the lexer system, also called [tokenizer](https://en.wikipedia.org/wiki/Lexical_analysis#Tokenization).\n\nSonic's tokenizer is built around an iterator pattern (_code: [Iterator->TokenLexer](https://github.com/valeriansaliou/sonic/blob/5320b81afc1598ac1cd2af938df0b2ef6cb96dc4/src/lexer/token.rs#L244)_), and yields lexed words one-by-one. Iteration can be stopped before the end of the text is reached, for instance if we did not get enough search results for the first words of the query. This ensures no extraneous lexing work is done.\n\nGiven that stopwords depend on the text language, Sonic first needs to detect the language of the text that is being cleaned up. This is done using an hybrid method of either counting the number of stopwords that appear in the text for long-enough texts (which is faster) (_code: [TokenLexerBuilder::detect_lang_fast](https://github.com/valeriansaliou/sonic/blob/5320b81afc1598ac1cd2af938df0b2ef6cb96dc4/src/lexer/token.rs#L177)_), or performing an [n-gram](https://en.wikipedia.org/wiki/N-gram) pass on the text for smaller texts (which is **_an order of magnitude_** slower) (_code: [TokenLexerBuilder::detect_lang_slow](https://github.com/valeriansaliou/sonic/blob/5320b81afc1598ac1cd2af938df0b2ef6cb96dc4/src/lexer/token.rs#L126)_).\n\nAs the n-gram method is better at guessing the language for small texts than the stopwords method is, we prefer it, although it is crazy slow in comparison to the stopwords method. For long-enough texts, the stopwords method becomes reliable enough, so we can use it. In either cases, if the first chosen guessing method result is judged as non-reliable, Sonic fallbacks on the other method (_code: [!detector.is_reliable()](https://github.com/valeriansaliou/sonic/blob/5320b81afc1598ac1cd2af938df0b2ef6cb96dc4/src/lexer/token.rs#L148)_).\n\nBy the way, Sonic builds up its own list of stopwords for all supported languages, [which can be found here](https://github.com/valeriansaliou/sonic/tree/master/src/stopwords) (languages are referred to via their ISO 639-3 codes). People are welcome to improve those lists of stopwords by [submitting a Pull Request](https://github.com/valeriansaliou/sonic/pulls).\n\n## What is the purpose of the tasker system?\n\nLooking at the source code of Sonic, you will find a module named `tasker` ([see here](https://github.com/valeriansaliou/sonic/tree/master/src/tasker)). This module performs background tasks, and is triggered periodically.\n\n**The tasker performs the following actions:**\n\n1. **Janitor**: it closes cached collection and bucket stores that were not used recently, freeing up memory (_code: [Tasker::tick](https://github.com/valeriansaliou/sonic/blob/5320b81afc1598ac1cd2af938df0b2ef6cb96dc4/src/tasker/runtime.rs#L48)_);\n2. **Consolidate**: it writes in-memory FST changes to the on-disk FST data structure (_code: [Tasker::tick](https://github.com/valeriansaliou/sonic/blob/5320b81afc1598ac1cd2af938df0b2ef6cb96dc4/src/tasker/runtime.rs#L48)_);\n\nAs in all databases, a lot of locking is involved while the tasker is performing heavy-duty work on a KV or FST store. Thus, when the tasker system kicks-in, stores may experience higher than expected latency for all consumers attempting to read or write to them. The tasker system has been optimized to minimize thread contention caused by locks, so the impact of those locks on Sonic consumers should be minimum.\n\n# On the Sonic Channel Protocol\n\nIn order for a client to communicate with the search index system, one needs a protocol. Sonic uses the Sonic Channel protocol, which defines a way for clients to send commands (ie. requests) to a Sonic server over the network (via a raw TCP socket); and get responses from the Sonic server. For instance, a client may send a search query command such as `QUERY collection bucket \"search query\"` and get a response with search results such as `EVENT QUERY isgsHQYu result_1 result_2`.\n\n**On that Sonic Channel protocol, technical choices that may seem to go against common sense were made:**\n\n1. **Sonic does not expose any HTTP API interface**, as it adds a network and processing overhead cost we do not want to bear;\n2. **Sonic only exposes a raw TCP socket** with which clients interact via the Sonic Channel protocol, which was designed to be simple, lightweight and extensible;\n3. **Most Sonic Channel commands are synchronous**, for simplicity's sake (Redis does the same). You can still run multiple Sonic Channel connections in parallel, and enjoy increased parallelism, but on a given Sonic Channel connection, you must wait for the previous command to return before issuing the next one;\n4. **Some Sonic Channel commands are asynchronous**, when a lot of commands may be issued in a short period of time, in a burst pattern. This is typical of read operations such as search queries, which should be submitted as jobs to a dedicated thread pool, which can be upsized and downsized at will. To handle this, a special eventing protocol format should be used;\n\n_The Sonic Channel protocol is specified in a separate document, which [you can read here](https://github.com/valeriansaliou/sonic/blob/master/PROTOCOL.md)._\n\n# The Journey of a Search Query\n\nAs always, examples are the way to go to explain any complex system. This section drafts the journey of a search query in Sonic, from receiving the search query command over Sonic Channel, to serving results to the Sonic Channel consumer.\n\nGiven a collection `messages` and a bucket `acme_corp` (ie. indexed messages for Acme Corp), John Doe wants to find messages that match the query text `\"The robber has stolen our corporate car\"`.\n\nFirst off, John Doe would connect to Sonic over a Sonic Channel client, for instance [node-sonic-channel](https://github.com/valeriansaliou/node-sonic-channel). Using this client, he would issue the following query: `QUERY messages acme_corp \"The robber has stolen our corporate car\"` to find conversations that contain messages about a recent robbery at Acme Corp.\n\n**After receiving the raw command above, the Sonic server would, in order:**\n\n1. Read the raw command from the Sonic Channel TCP stream buffer (_code: [Self::on_message](https://github.com/valeriansaliou/sonic/blob/5320b81afc1598ac1cd2af938df0b2ef6cb96dc4/src/channel/handle.rs#L163)_);\n2. Route the unpacked command message to the proper command handler, which would be `ChannelCommandSearch::dispatch_query` (_code: [ChannelMessage::on](https://github.com/valeriansaliou/sonic/blob/5320b81afc1598ac1cd2af938df0b2ef6cb96dc4/src/channel/message.rs#L39)_);\n3. Commit the search query for processing (_code: [ChannelCommandBase::commit_pending_operation](https://github.com/valeriansaliou/sonic/blob/5320b81afc1598ac1cd2af938df0b2ef6cb96dc4/src/channel/command.rs#L428)_);\n4. Dispatch the search query to its executor (_code: [StoreOperationDispatch::dispatch](https://github.com/valeriansaliou/sonic/blob/5320b81afc1598ac1cd2af938df0b2ef6cb96dc4/src/channel/command.rs#L351)_);\n5. Run the search executor (_code: [ExecutorSearch::search](https://github.com/valeriansaliou/sonic/blob/5320b81afc1598ac1cd2af938df0b2ef6cb96dc4/src/executor/search.rs#L21)_);\n6. Open both the KV and FST stores for the collection `messages` and bucket `acme_corp` (_code: [StoreKVPool::acquire + StoreFSTPool::acquire](https://github.com/valeriansaliou/sonic/blob/5320b81afc1598ac1cd2af938df0b2ef6cb96dc4/src/executor/search.rs#L34)_);\n7. Perform search query text lexing, and search word-by-word, which would yield in order: `robber`, `stolen`, `corporate`, `car` (_code: [lexer.next](https://github.com/valeriansaliou/sonic/blob/5320b81afc1598ac1cd2af938df0b2ef6cb96dc4/src/executor/search.rs#L50)_);\n8. If not enough search results are found, tries to suggest other words eg. typos corrections (_code: [fst_action.suggest_words](https://github.com/valeriansaliou/sonic/blob/5320b81afc1598ac1cd2af938df0b2ef6cb96dc4/src/executor/search.rs#L81)_);\n9. Perform paging on found OIDs from KV store to limit results (_code: [found_iids.iter](https://github.com/valeriansaliou/sonic/blob/5320b81afc1598ac1cd2af938df0b2ef6cb96dc4/src/executor/search.rs#L163)_);\n10. Return found OIDs from the executor (_code: [result_oids](https://github.com/valeriansaliou/sonic/blob/5320b81afc1598ac1cd2af938df0b2ef6cb96dc4/src/executor/search.rs#L180)_);\n11. Write back the final results to the TCP stream (_code: [response_args_groups](https://github.com/valeriansaliou/sonic/blob/5320b81afc1598ac1cd2af938df0b2ef6cb96dc4/src/channel/message.rs#L81)_);\n\n_This is it!_ John Doe would receive the following response from Sonic Channel: `EVENT QUERY isgsHQYu conversation_3459 conversation_29398`, which indicates that there are 2 conversations that contain messages matching the search text `\"The robber has stolen our corporate car\"`.\n"
  },
  {
    "path": "LICENSE.md",
    "content": "Mozilla Public License Version 2.0\n==================================\n\n1. Definitions\n--------------\n\n1.1. \"Contributor\"\n    means each individual or legal entity that creates, contributes to\n    the creation of, or owns Covered Software.\n\n1.2. \"Contributor Version\"\n    means the combination of the Contributions of others (if any) used\n    by a Contributor and that particular Contributor's Contribution.\n\n1.3. \"Contribution\"\n    means Covered Software of a particular Contributor.\n\n1.4. \"Covered Software\"\n    means Source Code Form to which the initial Contributor has attached\n    the notice in Exhibit A, the Executable Form of such Source Code\n    Form, and Modifications of such Source Code Form, in each case\n    including portions thereof.\n\n1.5. \"Incompatible With Secondary Licenses\"\n    means\n\n    (a) that the initial Contributor has attached the notice described\n        in Exhibit B to the Covered Software; or\n\n    (b) that the Covered Software was made available under the terms of\n        version 1.1 or earlier of the License, but not also under the\n        terms of a Secondary License.\n\n1.6. \"Executable Form\"\n    means any form of the work other than Source Code Form.\n\n1.7. \"Larger Work\"\n    means a work that combines Covered Software with other material, in\n    a separate file or files, that is not Covered Software.\n\n1.8. \"License\"\n    means this document.\n\n1.9. \"Licensable\"\n    means having the right to grant, to the maximum extent possible,\n    whether at the time of the initial grant or subsequently, any and\n    all of the rights conveyed by this License.\n\n1.10. \"Modifications\"\n    means any of the following:\n\n    (a) any file in Source Code Form that results from an addition to,\n        deletion from, or modification of the contents of Covered\n        Software; or\n\n    (b) any new file in Source Code Form that contains any Covered\n        Software.\n\n1.11. \"Patent Claims\" of a Contributor\n    means any patent claim(s), including without limitation, method,\n    process, and apparatus claims, in any patent Licensable by such\n    Contributor that would be infringed, but for the grant of the\n    License, by the making, using, selling, offering for sale, having\n    made, import, or transfer of either its Contributions or its\n    Contributor Version.\n\n1.12. \"Secondary License\"\n    means either the GNU General Public License, Version 2.0, the GNU\n    Lesser General Public License, Version 2.1, the GNU Affero General\n    Public License, Version 3.0, or any later versions of those\n    licenses.\n\n1.13. \"Source Code Form\"\n    means the form of the work preferred for making modifications.\n\n1.14. \"You\" (or \"Your\")\n    means an individual or a legal entity exercising rights under this\n    License. For legal entities, \"You\" includes any entity that\n    controls, is controlled by, or is under common control with You. For\n    purposes of this definition, \"control\" means (a) the power, direct\n    or indirect, to cause the direction or management of such entity,\n    whether by contract or otherwise, or (b) ownership of more than\n    fifty percent (50%) of the outstanding shares or beneficial\n    ownership of such entity.\n\n2. License Grants and Conditions\n--------------------------------\n\n2.1. Grants\n\nEach Contributor hereby grants You a world-wide, royalty-free,\nnon-exclusive license:\n\n(a) under intellectual property rights (other than patent or trademark)\n    Licensable by such Contributor to use, reproduce, make available,\n    modify, display, perform, distribute, and otherwise exploit its\n    Contributions, either on an unmodified basis, with Modifications, or\n    as part of a Larger Work; and\n\n(b) under Patent Claims of such Contributor to make, use, sell, offer\n    for sale, have made, import, and otherwise transfer either its\n    Contributions or its Contributor Version.\n\n2.2. Effective Date\n\nThe licenses granted in Section 2.1 with respect to any Contribution\nbecome effective for each Contribution on the date the Contributor first\ndistributes such Contribution.\n\n2.3. Limitations on Grant Scope\n\nThe licenses granted in this Section 2 are the only rights granted under\nthis License. No additional rights or licenses will be implied from the\ndistribution or licensing of Covered Software under this License.\nNotwithstanding Section 2.1(b) above, no patent license is granted by a\nContributor:\n\n(a) for any code that a Contributor has removed from Covered Software;\n    or\n\n(b) for infringements caused by: (i) Your and any other third party's\n    modifications of Covered Software, or (ii) the combination of its\n    Contributions with other software (except as part of its Contributor\n    Version); or\n\n(c) under Patent Claims infringed by Covered Software in the absence of\n    its Contributions.\n\nThis License does not grant any rights in the trademarks, service marks,\nor logos of any Contributor (except as may be necessary to comply with\nthe notice requirements in Section 3.4).\n\n2.4. Subsequent Licenses\n\nNo Contributor makes additional grants as a result of Your choice to\ndistribute the Covered Software under a subsequent version of this\nLicense (see Section 10.2) or under the terms of a Secondary License (if\npermitted under the terms of Section 3.3).\n\n2.5. Representation\n\nEach Contributor represents that the Contributor believes its\nContributions are its original creation(s) or it has sufficient rights\nto grant the rights to its Contributions conveyed by this License.\n\n2.6. Fair Use\n\nThis License is not intended to limit any rights You have under\napplicable copyright doctrines of fair use, fair dealing, or other\nequivalents.\n\n2.7. Conditions\n\nSections 3.1, 3.2, 3.3, and 3.4 are conditions of the licenses granted\nin Section 2.1.\n\n3. Responsibilities\n-------------------\n\n3.1. Distribution of Source Form\n\nAll distribution of Covered Software in Source Code Form, including any\nModifications that You create or to which You contribute, must be under\nthe terms of this License. You must inform recipients that the Source\nCode Form of the Covered Software is governed by the terms of this\nLicense, and how they can obtain a copy of this License. You may not\nattempt to alter or restrict the recipients' rights in the Source Code\nForm.\n\n3.2. Distribution of Executable Form\n\nIf You distribute Covered Software in Executable Form then:\n\n(a) such Covered Software must also be made available in Source Code\n    Form, as described in Section 3.1, and You must inform recipients of\n    the Executable Form how they can obtain a copy of such Source Code\n    Form by reasonable means in a timely manner, at a charge no more\n    than the cost of distribution to the recipient; and\n\n(b) You may distribute such Executable Form under the terms of this\n    License, or sublicense it under different terms, provided that the\n    license for the Executable Form does not attempt to limit or alter\n    the recipients' rights in the Source Code Form under this License.\n\n3.3. Distribution of a Larger Work\n\nYou may create and distribute a Larger Work under terms of Your choice,\nprovided that You also comply with the requirements of this License for\nthe Covered Software. If the Larger Work is a combination of Covered\nSoftware with a work governed by one or more Secondary Licenses, and the\nCovered Software is not Incompatible With Secondary Licenses, this\nLicense permits You to additionally distribute such Covered Software\nunder the terms of such Secondary License(s), so that the recipient of\nthe Larger Work may, at their option, further distribute the Covered\nSoftware under the terms of either this License or such Secondary\nLicense(s).\n\n3.4. Notices\n\nYou may not remove or alter the substance of any license notices\n(including copyright notices, patent notices, disclaimers of warranty,\nor limitations of liability) contained within the Source Code Form of\nthe Covered Software, except that You may alter any license notices to\nthe extent required to remedy known factual inaccuracies.\n\n3.5. Application of Additional Terms\n\nYou may choose to offer, and to charge a fee for, warranty, support,\nindemnity or liability obligations to one or more recipients of Covered\nSoftware. However, You may do so only on Your own behalf, and not on\nbehalf of any Contributor. You must make it absolutely clear that any\nsuch warranty, support, indemnity, or liability obligation is offered by\nYou alone, and You hereby agree to indemnify every Contributor for any\nliability incurred by such Contributor as a result of warranty, support,\nindemnity or liability terms You offer. You may include additional\ndisclaimers of warranty and limitations of liability specific to any\njurisdiction.\n\n4. Inability to Comply Due to Statute or Regulation\n---------------------------------------------------\n\nIf it is impossible for You to comply with any of the terms of this\nLicense with respect to some or all of the Covered Software due to\nstatute, judicial order, or regulation then You must: (a) comply with\nthe terms of this License to the maximum extent possible; and (b)\ndescribe the limitations and the code they affect. Such description must\nbe placed in a text file included with all distributions of the Covered\nSoftware under this License. Except to the extent prohibited by statute\nor regulation, such description must be sufficiently detailed for a\nrecipient of ordinary skill to be able to understand it.\n\n5. Termination\n--------------\n\n5.1. The rights granted under this License will terminate automatically\nif You fail to comply with any of its terms. However, if You become\ncompliant, then the rights granted under this License from a particular\nContributor are reinstated (a) provisionally, unless and until such\nContributor explicitly and finally terminates Your grants, and (b) on an\nongoing basis, if such Contributor fails to notify You of the\nnon-compliance by some reasonable means prior to 60 days after You have\ncome back into compliance. Moreover, Your grants from a particular\nContributor are reinstated on an ongoing basis if such Contributor\nnotifies You of the non-compliance by some reasonable means, this is the\nfirst time You have received notice of non-compliance with this License\nfrom such Contributor, and You become compliant prior to 30 days after\nYour receipt of the notice.\n\n5.2. If You initiate litigation against any entity by asserting a patent\ninfringement claim (excluding declaratory judgment actions,\ncounter-claims, and cross-claims) alleging that a Contributor Version\ndirectly or indirectly infringes any patent, then the rights granted to\nYou by any and all Contributors for the Covered Software under Section\n2.1 of this License shall terminate.\n\n5.3. In the event of termination under Sections 5.1 or 5.2 above, all\nend user license agreements (excluding distributors and resellers) which\nhave been validly granted by You or Your distributors under this License\nprior to termination shall survive termination.\n\n6. Disclaimer of Warranty\n-------------------------\n\n>  Covered Software is provided under this License on an \"as is\"\n>  basis, without warranty of any kind, either expressed, implied, or\n>  statutory, including, without limitation, warranties that the\n>  Covered Software is free of defects, merchantable, fit for a\n>  particular purpose or non-infringing. The entire risk as to the\n>  quality and performance of the Covered Software is with You.\n>  Should any Covered Software prove defective in any respect, You\n>  (not any Contributor) assume the cost of any necessary servicing,\n>  repair, or correction. This disclaimer of warranty constitutes an\n>  essential part of this License. No use of any Covered Software is\n>  authorized under this License except under this disclaimer.\n\n\n7. Limitation of Liability\n--------------------------\n\n>  Under no circumstances and under no legal theory, whether tort\n>  (including negligence), contract, or otherwise, shall any\n>  Contributor, or anyone who distributes Covered Software as\n>  permitted above, be liable to You for any direct, indirect,\n>  special, incidental, or consequential damages of any character\n>  including, without limitation, damages for lost profits, loss of\n>  goodwill, work stoppage, computer failure or malfunction, or any\n>  and all other commercial damages or losses, even if such party\n>  shall have been informed of the possibility of such damages. This\n>  limitation of liability shall not apply to liability for death or\n>  personal injury resulting from such party's negligence to the\n>  extent applicable law prohibits such limitation. Some\n>  jurisdictions do not allow the exclusion or limitation of\n>  incidental or consequential damages, so this exclusion and\n>  limitation may not apply to You.\n\n8. Litigation\n-------------\n\nAny litigation relating to this License may be brought only in the\ncourts of a jurisdiction where the defendant maintains its principal\nplace of business and such litigation shall be governed by laws of that\njurisdiction, without reference to its conflict-of-law provisions.\nNothing in this Section shall prevent a party's ability to bring\ncross-claims or counter-claims.\n\n9. Miscellaneous\n----------------\n\nThis License represents the complete agreement concerning the subject\nmatter hereof. If any provision of this License is held to be\nunenforceable, such provision shall be reformed only to the extent\nnecessary to make it enforceable. Any law or regulation which provides\nthat the language of a contract shall be construed against the drafter\nshall not be used to construe this License against a Contributor.\n\n10. Versions of the License\n---------------------------\n\n10.1. New Versions\n\nMozilla Foundation is the license steward. Except as provided in Section\n10.3, no one other than the license steward has the right to modify or\npublish new versions of this License. Each version will be given a\ndistinguishing version number.\n\n10.2. Effect of New Versions\n\nYou may distribute the Covered Software under the terms of the version\nof the License under which You originally received the Covered Software,\nor under the terms of any subsequent version published by the license\nsteward.\n\n10.3. Modified Versions\n\nIf you create software not governed by this License, and you want to\ncreate a new license for such software, you may create and use a\nmodified version of this License if you rename the license and remove\nany references to the name of the license steward (except to note that\nsuch modified license differs from this License).\n\n10.4. Distributing Source Code Form that is Incompatible With Secondary\nLicenses\n\nIf You choose to distribute Source Code Form that is Incompatible With\nSecondary Licenses under the terms of this version of the License, the\nnotice described in Exhibit B of this License must be attached.\n\nExhibit A - Source Code Form License Notice\n-------------------------------------------\n\n  This Source Code Form is subject to the terms of the Mozilla Public\n  License, v. 2.0. If a copy of the MPL was not distributed with this\n  file, You can obtain one at http://mozilla.org/MPL/2.0/.\n\nIf it is not possible or desirable to put the notice in a particular\nfile, then You may include the notice in a location (such as a LICENSE\nfile in a relevant directory) where a recipient would be likely to look\nfor such a notice.\n\nYou may add additional accurate notices of copyright ownership.\n\nExhibit B - \"Incompatible With Secondary Licenses\" Notice\n---------------------------------------------------------\n\n  This Source Code Form is \"Incompatible With Secondary Licenses\", as\n  defined by the Mozilla Public License, v. 2.0.\n"
  },
  {
    "path": "PACKAGING.md",
    "content": "Packaging\n=========\n\nThis file contains quick reminders and notes on how to package Sonic.\n\nWe consider here the packaging flow of Sonic version `1.0.0` for Linux.\n\n1. **How to bump Sonic version before a release:**\n    1. Bump version in `Cargo.toml` to `1.0.0`\n    2. Execute `cargo update` to bump `Cargo.lock`\n    3. Bump Debian package version in `debian/rules` to `1.0.0`\n\n2. **How to build Sonic, package it and release it on Crates, GitHub, Docker Hub and Packagecloud (multiple architectures):**\n    1. Tag the latest Git commit corresponding to the release with tag `v1.0.0`, and push the tag\n    2. Wait for all release jobs to complete on the [actions](https://github.com/valeriansaliou/sonic/actions) page on GitHub\n    3. Download all release archives, and sign them locally using: `./scripts/sign_binaries.sh --version=1.0.0`\n    4. Publish a changelog and upload all the built archives, as well as their signatures on the [releases](https://github.com/valeriansaliou/sonic/releases) page on GitHub\n"
  },
  {
    "path": "PROTOCOL.md",
    "content": "Sonic Protocol\n==============\n\n# ⚡️ Sonic Channel\n\n**Sonic Channel is the protocol used to perform searches and ingest index data. You can also use it for Sonic administration operations. Sonic listens on TCP port 1491 by default.**\n\nThis document specifies the Sonic Channel protocol. Use it if you are looking to build your own Sonic Channel library, or if you are looking to debug Sonic using eg. `telnet` in command-line.\n\nTo start a `telnet` session with your local Sonic instance, execute: `telnet ::1 1491`\n\n_Refer to sections below to interact with Sonic._\n\n---\n\n### 1️⃣ Before you start\n\n**Please consider the following upon integrating the Sonic Channel protocol:**\n\n1. Each command sent must be terminated with a new line character (`\\n`) as to commit the command to the server;\n2. Upon starting a Sonic Channel session, your library should read the `buffer(20000)` parameter in the `STARTED` response, and use this value (in bytes) as to know when a command data should be truncated and split in multiple sub-commands (to avoid buffer overflows, ie. sending too much data in a single command);\n\n---\n\n### 2️⃣ Sonic Channel (uninitialized)\n\n* `START <mode> <password>`: select mode to use for connection (either: `search` or `ingest`). The password is found in the `config.cfg` file at `channel.auth_password`.\n\n_Issuing any other command — eg. `QUIT` — in this mode will abort the TCP connection, effectively resulting in a `QUIT` with the `ENDED not_recognized` response._\n\n---\n\n### 3️⃣ Sonic Channel (Search mode)\n\n_The Sonic Channel Search mode is used for querying the search index. Once in this mode, you cannot switch to other modes or gain access to commands from other modes._\n\n**➡️ Available commands:**\n\n* `QUERY`: query database (syntax: `QUERY <collection> <bucket> \"<terms>\" [LIMIT(<count>)]? [OFFSET(<count>)]? [LANG(<locale>)]?`; time complexity: `O(1)` if enough exact word matches or `O(N)` if not enough exact matches where `N` is the number of alternate words tried, in practice it approaches `O(1)`)\n* `SUGGEST`: auto-completes word (syntax: `SUGGEST <collection> <bucket> \"<word>\" [LIMIT(<count>)]?`; time complexity: `O(1)`)\n* `LIST`: enumerates all words in an index (syntax: `LIST <collection> <bucket> [LIMIT(<count>)]? [OFFSET(<count>)]?`; time complexity: `O(N)` where `N` is the number of words enumerated, within provided limits)\n* `PING`: ping server (syntax: `PING`; time complexity: `O(1)`)\n* `HELP`: show help (syntax: `HELP [<manual>]?`; time complexity: `O(1)`)\n* `QUIT`: stop connection (syntax: `QUIT`; time complexity: `O(1)`)\n\n**⏩ Syntax terminology:**\n\n* `<collection>`: index collection (ie. what you search in, eg. `messages`, `products`, etc.);\n* `<bucket>`: index bucket name (ie. user-specific search classifier in the collection if you have any eg. `user-1, user-2, ..`, otherwise use a common bucket name eg. `generic, default, common, ..`);\n* `<terms>`: text for search terms (between quotes);\n* `<count>`: a positive integer number; set within allowed maximum & minimum limits;\n* `<locale>`: an ISO 639-3 locale code eg. `eng` for English (if set, the locale must be a valid ISO 639-3 code; if set to `none`, lexing will be disabled; if not set, the locale will be guessed from text);\n* `<manual>`: help manual to be shown (available manuals: `commands`);\n\n_Notice: the `bucket` terminology may confuse some Sonic users. As we are well-aware Sonic may be used in an environment where end-users may each hold their own search index in a given `collection`, we made it possible to manage per-end-user search indexes with `bucket`. If you only have a single index per `collection` (most Sonic users will), we advise you use a static generic name for your `bucket`, for instance: `default`._\n\n**⬇️ Search flow example (via `telnet`):**\n\n```bash\nT1: telnet sonic.local 1491\nT2: Trying ::1...\nT3: Connected to sonic.local.\nT4: Escape character is '^]'.\nT5: CONNECTED <sonic-server v1.0.0>\nT6: START search SecretPassword\nT7: STARTED search protocol(1) buffer(20000)\nT8: QUERY messages user:0dcde3a6 \"valerian saliou\" LIMIT(10)\nT9: PENDING Bt2m2gYa\nT10: EVENT QUERY Bt2m2gYa conversation:71f3d63b conversation:6501e83a\nT11: QUERY helpdesk user:0dcde3a6 \"gdpr\" LIMIT(50)\nT12: PENDING y57KaB2d\nT13: QUERY helpdesk user:0dcde3a6 \"law\" LIMIT(50) OFFSET(200)\nT14: PENDING CjPvE5t9\nT15: PING\nT16: PONG\nT17: EVENT QUERY CjPvE5t9\nT18: EVENT QUERY y57KaB2d article:28d79959\nT19: SUGGEST messages user:0dcde3a6 \"val\"\nT20: PENDING z98uDE0f\nT21: EVENT SUGGEST z98uDE0f valerian valala\nT22: QUIT\nT23: ENDED quit\nT24: Connection closed by foreign host.\n```\n\n_Notes on what happens:_\n\n* **T6:** we enter `search` mode (this is required to enable `search` commands);\n* **T8:** we query collection `messages`, in bucket for platform user `user:0dcde3a6` with search terms `valerian saliou` and a limit of `10` on returned results;\n* **T9:** Sonic received the query and stacked it for processing with marker `Bt2m2gYa` (the marker is used to track the asynchronous response);\n* **T10:** Sonic processed search query of T8 with marker `Bt2m2gYa` and sends 2 search results (those are conversation identifiers, that refer to a primary key in an external database);\n* **T11 + T13:** we query collection `helpdesk` twice (in the example, this one is heavy, so processing of results takes more time);\n* **T17 + T18:** we receive search results for search queries of T11 + T13 (this took a while!);\n\n---\n\n### 4️⃣ Sonic Channel (Ingest mode)\n\n_The Sonic Channel Ingest mode is used for altering the search index (push, pop and flush). Once in this mode, you cannot switch to other modes or gain access to commands from other modes._\n\n**➡️ Available commands:**\n\n* `PUSH`: Push search data in the index (syntax: `PUSH <collection> <bucket> <object> \"<text>\" [LANG(<locale>)]?`; time complexity: `O(1)`)\n* `POP`: Pop search data from the index (syntax: `POP <collection> <bucket> <object> \"<text>\"`; time complexity: `O(1)`)\n* `COUNT`: Count indexed search data (syntax: `COUNT <collection> [<bucket> [<object>]?]?`; time complexity: `O(1)`)\n* `FLUSHC`: Flush all indexed data from a collection (syntax: `FLUSHC <collection>`; time complexity: `O(1)`)\n* `FLUSHB`: Flush all indexed data from a bucket in a collection (syntax: `FLUSHB <collection> <bucket>`; time complexity: `O(N)` where `N` is the number of bucket objects)\n* `FLUSHO`: Flush all indexed data from an object in a bucket in collection (syntax: `FLUSHO <collection> <bucket> <object>`; time complexity: `O(1)`)\n* `PING`: ping server (syntax: `PING`; time complexity: `O(1)`)\n* `HELP`: show help (syntax: `HELP [<manual>]?`; time complexity: `O(1)`)\n* `QUIT`: stop connection (syntax: `QUIT`; time complexity: `O(1)`)\n\n**⏩ Syntax terminology:**\n\n* `<collection>`: index collection (ie. what you search in, eg. `messages`, `products`, etc.);\n* `<bucket>`: index bucket name (ie. user-specific search classifier in the collection if you have any eg. `user-1, user-2, ..`, otherwise use a common bucket name eg. `generic, default, common, ..`);\n* `<object>`: object identifier that refers to an entity in an external database, where the searched object is stored (eg. you use Sonic to index CRM contacts by name; full CRM contact data is stored in a MySQL database; in this case the object identifier in Sonic will be the MySQL primary key for the CRM contact);\n* `<text>`: search text to be indexed (can be a single word, or a longer text; within maximum length safety limits; should be quoted using `\"` quotes; internal quotes should be escaped using `\\\"`);\n* `<locale>`: an ISO 639-3 locale code eg. `eng` for English (if set, the locale must be a valid ISO 639-3 code; if set to `none`, lexing will be disabled; if not set, the locale will be guessed from text);\n* `<manual>`: help manual to be shown (available manuals: `commands`);\n\n_Notice: the `bucket` terminology may confuse some Sonic users. As we are well-aware Sonic may be used in an environment where end-users may each hold their own search index in a given `collection`, we made it possible to manage per-end-user search indexes with `bucket`. If you only have a single index per `collection` (most Sonic users will), we advise you use a static generic name for your `bucket`, for instance: `default`._\n\n**⬇️ Ingest flow example (via `telnet`):**\n\n```bash\nT1: telnet sonic.local 1491\nT2: Trying ::1...\nT3: Connected to sonic.local.\nT4: Escape character is '^]'.\nT5: CONNECTED <sonic-server v1.0.0>\nT6: START ingest SecretPassword\nT7: STARTED ingest protocol(1) buffer(20000)\nT8: PUSH messages user:0dcde3a6 conversation:71f3d63b Hey Valerian\nT9: ERR invalid_format(PUSH <collection> <bucket> <object> \"<text>\")\nT10: PUSH messages user:0dcde3a6 conversation:71f3d63b \"Hello Valerian Saliou, how are you today?\"\nT11: OK\nT12: COUNT messages user:0dcde3a6\nT13: RESULT 43\nT14: COUNT messages user:0dcde3a6 conversation:71f3d63b\nT15: RESULT 1\nT16: FLUSHO messages user:0dcde3a6 conversation:71f3d63b\nT17: RESULT 1\nT18: FLUSHB messages user:0dcde3a6\nT19: RESULT 42\nT20: PING\nT21: PONG\nT22: QUIT\nT23: ENDED quit\nT24: Connection closed by foreign host.\n```\n\n_Notes on what happens:_\n\n* **T6:** we enter `ingest` mode (this is required to enable `ingest` commands);\n* **T8:** we try to push text `Hey Valerian` to the index, in collection `messages`, bucket `user:0dcde3a6` and object `conversation:71f3d63b` (the syntax that was used is invalid);\n* **T9:** Sonic refuses the command we issued in T8, and provides us with the correct command format (notice that `<text>` should be quoted);\n* **T10:** we attempt to push another text in the same collection, bucket and object as in T8;\n* **T11:** this time, our push command in T10 was valid (Sonic acknowledges the push commit to the search index);\n* **T12:** we count the number of indexed terms in collection `messages` and bucket `user:0dcde3a6`;\n* **T13:** there are 43 terms (ie. words) in index for query in T12;\n* **T18:** we flush all index data from collection `messages` and bucket `user:0dcde3a6`;\n* **T19:** 42 terms have been flushed from index for command in T18;\n\n---\n\n### 5️⃣ Sonic Channel (Control mode)\n\n_The Sonic Channel Control mode is used for administration purposes. Once in this mode, you cannot switch to other modes or gain access to commands from other modes._\n\n**➡️ Available commands:**\n\n* `TRIGGER`: trigger an action (syntax: `TRIGGER [<action>]? [<data>]?`; time complexity: `O(1)`)\n* `INFO`: get server information (syntax: `INFO`; time complexity: `O(1)`)\n* `PING`: ping server (syntax: `PING`; time complexity: `O(1)`)\n* `HELP`: show help (syntax: `HELP [<manual>]?`; time complexity: `O(1)`)\n* `QUIT`: stop connection (syntax: `QUIT`; time complexity: `O(1)`)\n\n**⏩ Syntax terminology:**\n\n* `<action>`: action to be triggered (available actions: `consolidate`, `backup`, `restore`);\n* `<data>`: additional data to provide to the action (required for: `backup`, `restore`);\n* `<manual>`: help manual to be shown (available manuals: `commands`);\n\n**⬇️ Control flow example (via `telnet`):**\n\n```bash\nT1: telnet sonic.local 1491\nT2: Trying ::1...\nT3: Connected to sonic.local.\nT4: Escape character is '^]'.\nT5: CONNECTED <sonic-server v1.0.0>\nT6: START control SecretPassword\nT7: STARTED control protocol(1) buffer(20000)\nT8: TRIGGER consolidate\nT9: OK\nT10: PING\nT11: PONG\nT12: QUIT\nT13: ENDED quit\nT14: Connection closed by foreign host.\n```\n\n_Notes on what happens:_\n\n* **T6:** we enter `control` mode (this is required to enable `control` commands);\n* **T8:** we trigger a database consolidation (instead of waiting for the next automated consolidation tick);\n"
  },
  {
    "path": "README.md",
    "content": "Sonic\n=====\n\n[![Test and Build](https://github.com/valeriansaliou/sonic/workflows/Test%20and%20Build/badge.svg?branch=master)](https://github.com/valeriansaliou/sonic/actions?query=workflow%3A%22Test+and+Build%22) [![Build and Release](https://github.com/valeriansaliou/sonic/workflows/Build%20and%20Release/badge.svg)](https://github.com/valeriansaliou/sonic/actions?query=workflow%3A%22Build+and+Release%22) [![dependency status](https://deps.rs/repo/github/valeriansaliou/sonic/status.svg)](https://deps.rs/repo/github/valeriansaliou/sonic) [![Buy Me A Coffee](https://img.shields.io/badge/buy%20me%20a%20coffee-donate-yellow.svg)](https://www.buymeacoffee.com/valeriansaliou)\n\n**Sonic is a fast, lightweight and schema-less search backend. It ingests search texts and identifier tuples that can then be queried against in a microsecond's time.**\n\nSonic can be used as a simple alternative to super-heavy and full-featured search backends such as Elasticsearch in some use-cases. It is capable of normalizing natural language search queries, auto-completing a search query and providing the most relevant results for a query. Sonic is an identifier index, rather than a document index; when queried, it returns IDs that can then be used to refer to the matched documents in an external database.\n\nA strong attention to performance and code cleanliness has been given when designing Sonic. It aims at being crash-free, super-fast and puts minimum strain on server resources (our measurements have shown that Sonic - when under load - responds to search queries in the μs range, eats ~30MB RAM and has a low CPU footprint; [see our benchmarks](https://github.com/valeriansaliou/sonic#how-fast--lightweight-is-it)).\n\n_Tested at Rust version: `rustc 1.74.1 (a28077b28 2023-12-04)`_\n\n**🇫🇷 Crafted in Nantes, France.**\n\n**:newspaper: The Sonic project was initially announced in [a post on my personal journal](https://journal.valeriansaliou.name/announcing-sonic-a-super-light-alternative-to-elasticsearch/).**\n\n![Sonic](https://valeriansaliou.github.io/sonic/images/banner.jpg)\n\n> _« Sonic » is the mascot of the Sonic project. I drew it to look like a psychedelic hipster hedgehog._\n\n## Who uses it?\n\n<table>\n<tr>\n<td align=\"center\"><a href=\"https://crisp.chat/\"><img src=\"https://valeriansaliou.github.io/sonic/images/logo-crisp.png\" width=\"64\" /></a></td>\n<td align=\"center\"><a href=\"https://scrumpy.io/\"><img src=\"https://valeriansaliou.github.io/sonic/images/logo-scrumpy.png\" width=\"64\" /></a></td>\n</tr>\n<tr>\n<td align=\"center\">Crisp</td>\n<td align=\"center\">Scrumpy</td>\n</tr>\n</table>\n\n_👋 You use Sonic and you want to be listed there? [Contact me](https://valeriansaliou.name/)._\n\n## Demo\n\nSonic is integrated in all Crisp search products on the [Crisp](https://crisp.chat/) platform. It is used to index half a billion objects on a $5/mth 1-vCPU SSD cloud server (as of 2019). Crisp users use it to search in their messages, conversations, contacts, helpdesk articles and more.\n\n**You can test Sonic live on: [Crisp Helpdesk](https://help.crisp.chat/), and get an idea of the speed and relevance of Sonic search results. You can also test search suggestions from there: start typing at least 2 characters for a word, and get suggested a full word (press the tab key to expand suggestion). _Both search and suggestions are powered by Sonic._**\n\n![Demo on Crisp Helpdesk search](https://valeriansaliou.github.io/sonic/images/crisp-search-demo.gif)\n\n> _Sonic fuzzy search in helpdesk articles at its best. Lookup for any word or group of terms, get results instantly._\n\n## Features\n\n* **Search terms are stored in collections, organized in buckets**; you may use a single bucket, or a bucket per user on your platform if you need to search in separate indexes.\n* **Search results return object identifiers**, that can be resolved from an external database if you need to enrich the search results. This makes Sonic a simple word index, that points to identifier results. Sonic doesn't store any direct textual data in its index, but it still holds a word graph for auto-completion and typo corrections.\n* **Search query typos are corrected** if there are not enough exact-match results for a given word in a search query, Sonic tries to correct the word and tries against alternate words. You're allowed to make mistakes when searching.\n* **Insert and remove items in the index**; index-altering operations are light and can be committed to the server while it is running. A background tasker handles the job of consolidating the index so that the entries you have pushed or popped are quickly made available for search.\n* **Auto-complete any word** in real-time via the suggest operation. This helps build a snappy word suggestion feature in your end-user search interface.\n* **Full Unicode compatibility** on 80+ most spoken languages in the world. Sonic removes useless stop words from any text (eg. 'the' in English), after guessing the text language. This ensures any searched or ingested text is clean before it hits the index; [see languages](https://github.com/valeriansaliou/sonic#which-text-languages-are-supported).\n* **Simple protocol (Sonic Channel)**, that let you search your index, manage data ingestion (push in the index, pop from the index, flush a collection, flush a bucket, etc.) and perform administrative actions. Sonic Channel was designed to be lightweight on resources and simple to integrate with; [read protocol specification](https://github.com/valeriansaliou/sonic/blob/master/PROTOCOL.md).\n* **Easy-to-use libraries**, that let you connect to Sonic from your apps; [see libraries](https://github.com/valeriansaliou/sonic#-sonic-channel-libraries).\n\n## How to use it?\n\n### Installation\n\nSonic is built in Rust. To install it, either download a version from the [Sonic releases](https://github.com/valeriansaliou/sonic/releases) page, use `cargo install` or pull the source code from `master`.\n\n👉 _Each release binary comes with an `.asc` signature file, which can be verified using [@valeriansaliou](https://github.com/valeriansaliou) GPG public key: [:key:valeriansaliou.gpg.pub.asc](https://valeriansaliou.name/files/keys/valeriansaliou.gpg.pub.asc)._\n\n**👉 Install from packages:**\n\nSonic provides [pre-built packages](https://packagecloud.io/valeriansaliou/sonic) for Debian-based systems (Debian, Ubuntu, etc.).\n\n**Important: Sonic only provides 64 bits packages targeting Debian 12 for now (codename: `bookworm`). You might still be able to use them on other Debian versions, as well as Ubuntu (although they rely on a specific `glibc` version that might not be available on older or newer systems).**\n\nFirst, add the Sonic APT repository (eg. for Debian `bookworm`):\n\n```bash\necho \"deb [signed-by=/usr/share/keyrings/valeriansaliou_sonic.gpg] https://packagecloud.io/valeriansaliou/sonic/debian/ bookworm main\" > /etc/apt/sources.list.d/valeriansaliou_sonic.list\n```\n\n```bash\ncurl -fsSL https://packagecloud.io/valeriansaliou/sonic/gpgkey | gpg --dearmor -o /usr/share/keyrings/valeriansaliou_sonic.gpg\n```\n\n```bash\napt-get update\n```\n\nThen, install the Sonic package:\n\n```bash\napt-get install sonic\n```\n\nThen, edit the pre-filled Sonic configuration file:\n\n```bash\nnano /etc/sonic.cfg\n```\n\nFinally, restart Sonic:\n\n```\nservice sonic restart\n```\n\n**👉 Install from source:**\n\nIf you pulled the source code from Git, you can build it using `cargo`:\n\n```bash\ncargo build --release\n```\n\nYou can find the built binaries in the `./target/release` directory.\n\n_Install `build-essential`, `clang`, `libclang-dev`, `libc6-dev`, `g++` and `llvm-dev` to be able to compile the required RocksDB dependency._\n\nNote that the following optional features can be enabled upon building Sonic: `allocator-jemalloc`, `tokenizer-chinese` and `tokenizer-japanese` (some might be already enabled by default).\n\n**👉 Install from Cargo:**\n\nYou can install Sonic directly with `cargo install`:\n\n```bash\ncargo install sonic-server\n```\n\nEnsure that your `$PATH` is properly configured to source the Crates binaries, and then run Sonic using the `sonic` command.\n\n_Install `build-essential`, `clang`, `libclang-dev`, `libc6-dev`, `g++` and `llvm-dev` to be able to compile the required RocksDB dependency._\n\n**👉 Install from Docker Hub:**\n\nYou might find it convenient to run Sonic via Docker. You can find the pre-built Sonic image on Docker Hub as [valeriansaliou/sonic](https://hub.docker.com/r/valeriansaliou/sonic/).\n\nFirst, pull the `valeriansaliou/sonic` image:\n\n```bash\ndocker pull valeriansaliou/sonic:v1.4.9\n```\n\nThen, seed it a configuration file and run it (replace `/path/to/your/sonic/config.cfg` with the path to your configuration file):\n\n```bash\ndocker run -p 1491:1491 -v /path/to/your/sonic/config.cfg:/etc/sonic.cfg -v /path/to/your/sonic/store/:/var/lib/sonic/store/ valeriansaliou/sonic:v1.4.9\n```\n\nIn the configuration file, ensure that:\n\n* `channel.inet` is set to `0.0.0.0:1491` (this lets Sonic be reached from outside the container)\n* `store.kv.path` is set to `/var/lib/sonic/store/kv/` (this lets the external KV store directory be reached by Sonic)\n* `store.fst.path` is set to `/var/lib/sonic/store/fst/` (this lets the external FST store directory be reached by Sonic)\n\nSonic will be reachable from `tcp://localhost:1491`.\n\n**👉 Install from another source (non-official):**\n\nOther installation sources are available:\n\n* **Homebrew (macOS)**: `brew install sonic` ([see formula](https://formulae.brew.sh/formula/sonic))\n\n_Note that those sources are non-official, meaning that they are not owned nor maintained by the Sonic project owners. The latest Sonic version available on those sources might be outdated, in comparison to the latest version available through the Sonic project._\n\n### Configuration\n\nUse the sample [config.cfg](https://github.com/valeriansaliou/sonic/blob/master/config.cfg) configuration file and adjust it to your own environment.\n\n_If you are looking to fine-tune your configuration, you may read our [detailed configuration documentation](https://github.com/valeriansaliou/sonic/blob/master/CONFIGURATION.md)._\n\n### Run Sonic\n\nSonic can be run as such:\n\n`./sonic -c /path/to/config.cfg`\n\n## Perform searches and manage objects\n\nBoth searches and object management (i.e. data ingestion) is handled via the Sonic Channel protocol only. As we want to keep things simple with Sonic (similarly to how Redis does it), Sonic does not offer a HTTP endpoint or similar; connecting via Sonic Channel is the way to go when you need to interact with the Sonic search database.\n\nSonic distributes official libraries, that let you integrate Sonic to your apps easily. Click on a library below to see library integration documentation and code.\n\n_If you are looking for details on the raw Sonic Channel TCP-based protocol, you can read our [detailed protocol documentation](https://github.com/valeriansaliou/sonic/blob/master/PROTOCOL.md). It can prove handy if you are looking to code your own Sonic Channel library._\n\n### 📦 Sonic Channel Libraries\n\n#### 1️⃣ Official Libraries\n\nSonic distributes official Sonic integration libraries for your programming language (official means that those libraries have been reviewed and validated by a core maintainer):\n\n* **NodeJS**:\n  * **[node-sonic-channel](https://www.npmjs.com/package/sonic-channel)** by [@valeriansaliou](https://github.com/valeriansaliou)\n* **PHP**:\n  * **[psonic](https://github.com/ppshobi/psonic)** by [@ppshobi](https://github.com/ppshobi)\n* **Rust**:\n  * **[sonic-channel](https://github.com/pleshevskiy/sonic-channel)** by [@pleshevskiy](https://github.com/pleshevskiy)\n\n#### 2️⃣ Community Libraries\n\nYou can find below a list of Sonic integrations provided by the community (many thanks to them!):\n\n* **Rust**:\n  * **[sonic_client](https://github.com/FrontMage/sonic_client)** by [@FrontMage](https://github.com/FrontMage)\n* **Python**:\n  * **[asonic](https://github.com/moshe/asonic)** by [@moshe](https://github.com/moshe)\n  * **[python-sonic-client](https://github.com/xmonader/python-sonic-client)** by [@xmonader](https://github.com/xmonader)\n  * **[pysonic-channel](https://github.com/AlongWY/pysonic)** by [@AlongWY](https://github.com/AlongWY)\n* **Ruby**:\n  * **[sonic-ruby](https://github.com/atipugin/sonic-ruby)** by [@atipugin](https://github.com/atipugin)\n* **Go**:\n  * **[go-sonic](https://github.com/expectedsh/go-sonic)** by [@alexisvisco](https://github.com/alexisvisco)\n  * **[go-sonic](https://github.com/OGKevin/go-sonic)** by [@OGKevin](https://github.com/OGKevin)\n* **PHP**:\n  * **[php-sonic](https://github.com/php-sonic/php-sonic)** by [@touhonoob](https://github.com/touhonoob)\n  * **[laravel-scout-sonic](https://github.com/james2doyle/laravel-scout-sonic)** by [@james2doyle](https://github.com/james2doyle)\n* **Java**:\n  * **[java-sonic](https://github.com/twohou/java-sonic)** by [@touhonoob](https://github.com/touhonoob)\n  * **[jsonic](https://github.com/alohaking/jsonic)** by [@alohaking](https://github.com/alohaking)\n* **Deno**:\n  * **[deno-sonic](https://github.com/erfanium/deno_sonic)** by [@erfanium](https://github.com/erfanium)\n* **Bun**:\n  * **[sonic-bun](https://github.com/emilianscheel/sonic-bun)** by [@emilianscheel](https://github.com/emilianscheel)\n* **Elixir**:\n  * **[sonix](https://github.com/imerkle/sonix)** by [@imerkle](https://github.com/imerkle)\n* **Crystal**:\n  * **[sonic-crystal](https://github.com/babelian/sonic-crystal)** by [@babelian](https://github.com/babelian)\n* **Nim**:\n  * **[nim-sonic-client](https://github.com/xmonader/nim-sonic-client)** by [@xmonader](https://github.com/xmonader)\n* **.NET**:\n  * **[nsonic](https://github.com/spikensbror-dotnet/nsonic)** by [@spikensbror](https://github.com/spikensbror)\n\n_ℹ️ Cannot find the library for your programming language? Build your own and be referenced here! ([contact me](https://valeriansaliou.name/))_\n\n## Which text languages are supported?\n\nSonic supports a wide range of languages in its lexing system. If a language is not in this list, you will still be able to push this language to the search index, but stop-words will not be eluded, which could lead to lower-quality search results.\n\n**The languages supported by the lexing system are:**\n\n* 🇿🇦 Afrikaans\n* 🇸🇦 Arabic\n* 🇦🇲 Armenian\n* 🇦🇿 Azerbaijani\n* 🇧🇩 Bengali\n* 🇧🇬 Bulgarian\n* 🇲🇲 Burmese\n* 🏳 Catalan\n* 🇨🇳 Chinese (Simplified)\n* 🇹🇼 Chinese (Traditional)\n* 🇭🇷 Croatian\n* 🇨🇿 Czech\n* 🇩🇰 Danish\n* 🇳🇱 Dutch\n* 🇬🇧 English\n* 🏳 Esperanto\n* 🇪🇪 Estonian\n* 🇫🇮 Finnish\n* 🇫🇷 French\n* 🇬🇪 Georgian\n* 🇩🇪 German\n* 🇬🇷 Greek\n* 🇮🇳 Gujarati\n* 🇮🇱 Hebrew\n* 🇮🇳 Hindi\n* 🇭🇺 Hungarian\n* 🇮🇩 Indonesian\n* 🇮🇹 Italian\n* 🇯🇵 Japanese\n* 🇮🇳 Kannada\n* 🇰🇭 Khmer\n* 🇰🇷 Korean\n* 🏳 Latin\n* 🇱🇻 Latvian\n* 🇱🇹 Lithuanian\n* 🇮🇳 Malayalam\n* 🇮🇳 Marathi\n* 🇳🇵 Nepali\n* 🇮🇷 Persian\n* 🇵🇱 Polish\n* 🇵🇹 Portuguese\n* 🇮🇳 Punjabi\n* 🇷🇺 Russian\n* 🇷🇸 Serbian\n* 🇸🇰 Slovak\n* 🇸🇮 Slovene\n* 🇪🇸 Spanish\n* 🇸🇪 Swedish\n* 🇵🇭 Tagalog\n* 🇮🇳 Tamil\n* 🇹🇭 Thai\n* 🇹🇷 Turkish\n* 🇺🇦 Ukrainian\n* 🇵🇰 Urdu\n* 🇻🇳 Vietnamese\n* 🇮🇱 Yiddish\n* 🇿🇦 Zulu\n\n## How fast & lightweight is it?\n\nSonic was built for [Crisp](https://crisp.chat/) from the start. As Crisp was growing and indexing more and more search data into a full-text search SQL database, we decided it was time to switch to a proper search backend system. When reviewing Elasticsearch (ELS) and others, we found those were full-featured heavyweight systems that did not scale well with Crisp's freemium-based cost structure.\n\nAt the end, we decided to build our own search backend, designed to be simple and lightweight on resources.\n\nYou can run function-level benchmarks with the command: `cargo bench --features benchmark`\n\n### 👩‍🔬 Benchmark #1\n\n#### ➡️ Scenario\n\nWe performed an extract of all messages from the Crisp team used for [Crisp](https://crisp.chat/) own customer support.\n\nWe want to import all those messages into a clean Sonic instance, and then perform searches on the index we built. We will measure the time that Sonic spent executing each operation (ie. each `PUSH` and `QUERY` commands over Sonic Channel), and group results per 1,000 operations (this outputs a mean time per 1,000 operations).\n\n#### ➡️ Context\n\n**Our benchmark is ran on the following computer:**\n\n* **Device**: MacBook Pro (Retina, 15-inch, Mid 2014)\n* **OS**: MacOS 10.14.3\n* **Disk**: 512GB SSD (formatted under the AFS file system)\n* **CPU**: 2.5 GHz Intel Core i7\n* **RAM**: 16 GB 1600 MHz DDR3\n\n**Sonic is compiled as following:**\n\n* **Sonic version**: 1.0.1\n* **Rustc version**: `rustc 1.35.0-nightly (719b0d984 2019-03-13)`\n* **Compiler flags**: `release` profile (`-03` with `lto`)\n\n**Our dataset is as such:**\n\n* **Number of objects**: ~1,000,000 messages\n* **Total size**: ~100MB of raw message text (this does not account for identifiers and other metas)\n\n#### ➡️ Scripts\n\n**The scripts we used to perform the benchmark are:**\n\n1. **PUSH script**: [sonic-benchmark_batch-push.js](https://gist.github.com/valeriansaliou/e5ab737b28601ebd70483f904d21aa09)\n2. **QUERY script**: [sonic-benchmark_batch-query.js](https://gist.github.com/valeriansaliou/3ef8315d7282bd173c2cb9eba64fa739)\n\n#### ⏬ Results\n\n**Our findings:**\n\n* We imported ~1,000,000 messages of dynamic length (some very long, eg. emails);\n* Once imported, the search index weights 20MB (KV) + 1.4MB (FST) on disk;\n* CPU usage during import averaged 75% of a single CPU core;\n* RAM usage for the Sonic process peaked at 28MB during our benchmark;\n* We used a single Sonic Channel TCP connection, which limits the import to a single thread (we could have load-balanced this across as many Sonic Channel connections as there are CPUs);\n* We get an import RPS approaching 4,000 operations per second (per thread);\n* We get a search query RPS approaching 1,000 operations per second (per thread);\n* On the hyper-threaded 4-cores CPU used, we could have parallelized operations to 8 virtual cores, thus theoretically increasing the import RPS to 32,000 operations / second, while the search query RPS would be increased to 8,000 operations / second (we may be SSD-bound at some point though);\n\n**Compared results per operation (on a single object):**\n\nWe took a sample of 8 results from our batched operations, which produced a total of 1,000 results (1,000,000 items, with 1,000 items batched per measurement report).\n\n_This is not very scientific, but it should give you a clear idea of Sonic performances._\n\n**Time spent per operation:**\n\nOperation | Average | Best  | Worst\n--------- | ------- | ----- | -----\nPUSH      | 275μs   | 190μs | 363μs\nQUERY     | 880μs   | 852μs | 1ms\n\n**Batch PUSH results as seen from our terminal (from initial index of: 0 objects):**\n\n![Batch PUSH benchmark](https://valeriansaliou.github.io/sonic/images/benchmark-batch-push.png)\n\n**Batch QUERY results as seen from our terminal (on index of: 1,000,000 objects):**\n\n![Batch QUERY benchmark](https://valeriansaliou.github.io/sonic/images/benchmark-batch-query.png)\n\n## Limitations\n\n* **Indexed data limits**: Sonic is designed for large search indexes split over thousands of search buckets per collection. An IID (ie. Internal-ID) is stored in the index as a 32 bits number, which theoretically allow up to ~4.2 billion objects to be indexed (ie. OID) per bucket. We've observed storage savings of 30% to 40%, which justifies the trade-off on large databases (versus Sonic using 64 bits IIDs). Also, Sonic only keeps the N most recently pushed results for a given word, in a sliding window way (the sliding window width can be configured).\n* **Search query limits**: Sonic Natural Language Processing system (NLP) does not work at the sentence-level, for storage compactness reasons (we keep the FST graph shallow as to reduce time and space complexity). It works at the word-level, and is thus able to search per-word and can predict a word based on user input, though it is unable to predict the next word in a sentence.\n* **Real-time limits**: the FST needs to be rebuilt every time a word is pushed or popped from the bucket graph. As this is quite heavy, Sonic batches rebuild cycles. If you have just pushed a new word to the index and you are not seeing it in the `SUGGEST` command yet, wait for the next rebuild cycle to kick-in, or force it with `TRIGGER consolidate` in a `control` channel.\n* **Interoperability limits**: The Sonic Channel protocol is the only way to read and write search entries to the Sonic search index. Sonic does not expose any HTTP API. Sonic Channel has been designed with performance and minimal network footprint in mind. If you need to access Sonic from an unsupported programming language, you can either [open an issue](https://github.com/valeriansaliou/sonic/issues/new) or look at the reference [node-sonic-channel](https://github.com/valeriansaliou/node-sonic-channel) implementation and build it in your target programming language.\n* **Hardware limits**: Sonic performs the search on the file-system directly; ie. it does not fit the index in RAM. A search query results in a lot of random accesses on the disk, which means that it will be quite slow on old-school HDDs and super-fast on newer SSDs. Do store the Sonic database on SSD-backed file systems only.\n\n## :fire: Report A Vulnerability\n\nIf you find a vulnerability in Sonic, you are more than welcome to report it directly to [@valeriansaliou](https://github.com/valeriansaliou) by sending an encrypted email to [valerian@valeriansaliou.name](mailto:valerian@valeriansaliou.name). Do not report vulnerabilities in public GitHub issues, as they may be exploited by malicious people to target production servers running an unpatched Sonic instance.\n\n**:warning: You must encrypt your email using [@valeriansaliou](https://github.com/valeriansaliou) GPG public key: [:key:valeriansaliou.gpg.pub.asc](https://valeriansaliou.name/files/keys/valeriansaliou.gpg.pub.asc).**\n"
  },
  {
    "path": "config.cfg",
    "content": "# Sonic\n# Fast, lightweight and schema-less search backend\n# Configuration file\n# Example: https://github.com/valeriansaliou/sonic/blob/master/config.cfg\n\n\n[server]\n\nlog_level = \"debug\"\n\n\n[channel]\n\ninet = \"[::1]:1491\"\ntcp_timeout = 300\n\nauth_password = \"SecretPassword\"\n\n[channel.search]\n\nquery_limit_default = 10\nquery_limit_maximum = 100\nquery_alternates_try = 4\n\nsuggest_limit_default = 5\nsuggest_limit_maximum = 20\n\nlist_limit_default = 100\nlist_limit_maximum = 500\n\n\n[store]\n\n[store.kv]\n\npath = \"./data/store/kv/\"\n\nretain_word_objects = 1000\n\n[store.kv.pool]\n\ninactive_after = 1800\n\n[store.kv.database]\n\nflush_after = 900\n\ncompress = true\nparallelism = 2\nmax_files = 100\nmax_compactions = 1\nmax_flushes = 1\nwrite_buffer = 16384\nwrite_ahead_log = true\n\n[store.fst]\n\npath = \"./data/store/fst/\"\n\n[store.fst.pool]\n\ninactive_after = 300\n\n[store.fst.graph]\n\nconsolidate_after = 180\n\nmax_size = 2048\nmax_words = 250000\n"
  },
  {
    "path": "debian/changelog",
    "content": "sonic (0.0.0-1) UNRELEASED; urgency=medium\n\n  * Initial release.\n\n -- Valerian Saliou <valerian@valeriansaliou.name>  Tue, 31 Aug 2023 12:00:00 +0000\n"
  },
  {
    "path": "debian/compat",
    "content": "10\n"
  },
  {
    "path": "debian/control",
    "content": "Source: sonic\nSection: net\nPriority: ext\nMaintainer: Valerian Saliou <valerian@valeriansaliou.name>\nStandards-Version: 3.9.4\nBuild-Depends: wget, ca-certificates\nHomepage: https://github.com/valeriansaliou/sonic\n\nPackage: sonic\nArchitecture: any\nDepends: adduser\nProvides: sonic\nDescription: Fast, lightweight & schema-less search backend. An alternative to Elasticsearch that runs on a few MBs of RAM.\n"
  },
  {
    "path": "debian/copyright",
    "content": "Format: http://www.debian.org/doc/packaging-manuals/copyright-format/1.0/\nUpstream-Name: sonic\nUpstream-Contact: Valerian Saliou <valerian@valeriansaliou.name>\nSource: https://github.com/valeriansaliou/sonic\n\nFiles: *\nCopyright: 2023 Valerian Saliou\nLicense: MPL-2\n\nLicense: MPL-2\n This Source Code Form is subject to the terms of the Mozilla Public License,\n v. 2.0. If a copy of the MPL was not distributed with this file,\n You can obtain one at http://mozilla.org/MPL/2.0/.\n"
  },
  {
    "path": "debian/rules",
    "content": "#!/usr/bin/make -f\n\nDISTRIBUTION = $(shell lsb_release -sr)\nVERSION = 1.4.9\nPACKAGEVERSION = $(VERSION)-0~$(DISTRIBUTION)0\nURL = https://github.com/valeriansaliou/sonic/releases/download/v$(VERSION)/\n\n%:\n\t\tdh $@ --with systemd\n\noverride_dh_auto_clean:\noverride_dh_auto_test:\noverride_dh_auto_build:\noverride_dh_auto_install:\n\t\t$(eval ENV_ARCH := $(shell dpkg --print-architecture))\n\t\t$(eval ENV_ISA := $(shell if [ \"$(ENV_ARCH)\" = \"amd64\" ]; then echo \"x86_64\"; else echo \"$(ENV_ARCH)\"; fi))\n\t\t$(eval ENV_TARBALL := v$(VERSION)-$(ENV_ISA)-gnu.tar.gz)\n\n\t\techo \"Architecture: $(ENV_ARCH)\"\n\t\techo \"Instruction Set: $(ENV_ISA)\"\n\t\techo \"Target: $(URL)$(ENV_TARBALL)\"\n\n\t\twget -N --progress=dot:mega $(URL)$(ENV_TARBALL)\n\t\ttar -xf $(ENV_TARBALL)\n\t\tstrip sonic/sonic\n\t\tmv sonic/config.cfg sonic/sonic.cfg\n\t\tmkdir sonic/store/\n\t\tsed -i 's/path = \".\\/data\\/store\\//path = \"\\/var\\/lib\\/sonic\\/store\\//g' sonic/sonic.cfg\n\noverride_dh_gencontrol:\n\t\tdh_gencontrol -- -v$(PACKAGEVERSION)\n"
  },
  {
    "path": "debian/sonic.install",
    "content": "sonic/sonic usr/bin/\nsonic/sonic.cfg etc/\nsonic/store/ var/lib/sonic/\n"
  },
  {
    "path": "debian/sonic.postinst",
    "content": "#!/bin/sh\n\nset -e\n\ncase \"$1\" in\n    configure)\n        adduser --system --disabled-password --disabled-login --home /var/empty \\\n                --no-create-home --quiet --group sonic && \\\n        chown sonic:sonic -R /var/lib/sonic/\n        ;;\nesac\n\n#DEBHELPER#\n\nexit 0\n"
  },
  {
    "path": "debian/sonic.service",
    "content": "[Unit]\nDescription=Sonic Search Index\nAfter=network.target\n\n[Service]\nType=simple\nUser=sonic\nGroup=sonic\nExecStart=/usr/bin/sonic -c /etc/sonic.cfg\nRestart=on-failure\nLimitNOFILE=infinity\n\n[Install]\nWantedBy=multi-user.target\n"
  },
  {
    "path": "debian/source/format",
    "content": "3.0 (quilt)\n"
  },
  {
    "path": "scripts/build_packages.sh",
    "content": "#!/bin/bash\n\n##\n#  Sonic\n#\n#  Fast, lightweight and schema-less search backend\n#  Copyright: 2023, Valerian Saliou <valerian@valeriansaliou.name>\n#  License: Mozilla Public License v2.0 (MPL v2.0)\n##\n\n# Define build pipeline\nfunction build_for_target {\n    OS=\"$2\" DIST=\"$3\" ARCH=\"$1\" ./packpack/packpack\n    release_result=$?\n\n    if [ $release_result -eq 0 ]; then\n        mkdir -p \"./packages/$2_$3/\"\n        mv ./build/*$4 \"./packages/$2_$3/\"\n\n        echo \"Result: Packaged architecture: $1 for OS: $2:$3 (*$4)\"\n    fi\n\n    return $release_result\n}\n\n# Run release tasks\nABSPATH=$(cd \"$(dirname \"$0\")\"; pwd)\nBASE_DIR=\"$ABSPATH/../\"\n\nrc=0\n\npushd \"$BASE_DIR\" > /dev/null\n    echo \"Executing packages build steps for Sonic...\"\n\n    # Initialize `packpack`\n    rm -rf ./packpack && \\\n        git clone https://github.com/packpack/packpack.git packpack\n    rc=$?\n\n    # Proceed build for each target?\n    if [ $rc -eq 0 ]; then\n        build_for_target \"x86_64\" \"debian\" \"bookworm\" \".deb\"\n        rc=$?\n    fi\n\n    # Cleanup environment\n    rm -rf ./build ./packpack\n\n    if [ $rc -eq 0 ]; then\n        echo \"Success: Done executing packages build steps for Sonic\"\n    else\n        echo \"Error: Failed executing packages build steps for Sonic\"\n    fi\npopd > /dev/null\n\nexit $rc\n"
  },
  {
    "path": "scripts/release_binaries.sh",
    "content": "#!/bin/bash\n\n##\n#  Sonic\n#\n#  Fast, lightweight and schema-less search backend\n#  Copyright: 2023, Valerian Saliou <valerian@valeriansaliou.name>\n#  License: Mozilla Public License v2.0 (MPL v2.0)\n##\n\n# Read arguments\nwhile [ \"$1\" != \"\" ]; do\n    argument_key=`echo $1 | awk -F= '{print $1}'`\n    argument_value=`echo $1 | awk -F= '{print $2}'`\n\n    case $argument_key in\n        -v | --version)\n            # Notice: strip any leading 'v' to the version number\n            SONIC_VERSION=\"${argument_value/v}\"\n            ;;\n        *)\n            echo \"Unknown argument received: '$argument_key'\"\n            exit 1\n            ;;\n    esac\n\n    shift\ndone\n\n# Ensure release version is provided\nif [ -z \"$SONIC_VERSION\" ]; then\n  echo \"No Sonic release version was provided, please provide it using '--version'\"\n\n  exit 1\nfi\n\n# Define release pipeline\nfunction release_for_architecture {\n    final_tar=\"v$SONIC_VERSION-$1-$2.tar.gz\"\n\n    rm -rf ./sonic/ && \\\n        cargo build --target \"$3\" --release && \\\n        mkdir ./sonic && \\\n        cp -p \"target/$3/release/sonic\" ./sonic/ && \\\n        cp -r ./config.cfg sonic/ && \\\n        tar --owner=0 --group=0 -czvf \"$final_tar\" ./sonic && \\\n        rm -r ./sonic/\n    release_result=$?\n\n    if [ $release_result -eq 0 ]; then\n        echo \"Result: Packed architecture: $1 ($2) to file: $final_tar\"\n    fi\n\n    return $release_result\n}\n\n# Run release tasks\nABSPATH=$(cd \"$(dirname \"$0\")\"; pwd)\nBASE_DIR=\"$ABSPATH/../\"\n\nrc=0\n\npushd \"$BASE_DIR\" > /dev/null\n    echo \"Executing release steps for Sonic v$SONIC_VERSION...\"\n\n    release_for_architecture \"x86_64\" \"gnu\" \"x86_64-unknown-linux-gnu\"\n    rc=$?\n\n    if [ $rc -eq 0 ]; then\n        echo \"Success: Done executing release steps for Sonic v$SONIC_VERSION\"\n    else\n        echo \"Error: Failed executing release steps for Sonic v$SONIC_VERSION\"\n    fi\npopd > /dev/null\n\nexit $rc\n"
  },
  {
    "path": "scripts/sign_binaries.sh",
    "content": "#!/bin/bash\n\n##\n#  Sonic\n#\n#  Fast, lightweight and schema-less search backend\n#  Copyright: 2023, Valerian Saliou <valerian@valeriansaliou.name>\n#  License: Mozilla Public License v2.0 (MPL v2.0)\n##\n\n# Read arguments\nwhile [ \"$1\" != \"\" ]; do\n    argument_key=`echo $1 | awk -F= '{print $1}'`\n    argument_value=`echo $1 | awk -F= '{print $2}'`\n\n    case $argument_key in\n        -v | --version)\n            # Notice: strip any leading 'v' to the version number\n            SONIC_VERSION=\"${argument_value/v}\"\n            ;;\n        *)\n            echo \"Unknown argument received: '$argument_key'\"\n            exit 1\n            ;;\n    esac\n\n    shift\ndone\n\n# Ensure release version is provided\nif [ -z \"$SONIC_VERSION\" ]; then\n  echo \"No Sonic release version was provided, please provide it using '--version'\"\n\n  exit 1\nfi\n\n# Define sign pipeline\nfunction sign_for_architecture {\n    final_tar=\"v$SONIC_VERSION-$1-$2.tar.gz\"\n    gpg_signer=\"valerian@valeriansaliou.name\"\n\n    gpg -u \"$gpg_signer\" --armor --detach-sign \"$final_tar\"\n    sign_result=$?\n\n    if [ $sign_result -eq 0 ]; then\n        echo \"Result: Signed architecture: $1 ($2) for file: $final_tar\"\n    fi\n\n    return $sign_result\n}\n\n# Run sign tasks\nABSPATH=$(cd \"$(dirname \"$0\")\"; pwd)\nBASE_DIR=\"$ABSPATH/../\"\n\nrc=0\n\npushd \"$BASE_DIR\" > /dev/null\n    echo \"Executing sign steps for Sonic v$SONIC_VERSION...\"\n\n    sign_for_architecture \"x86_64\" \"gnu\"\n    rc=$?\n\n    if [ $rc -eq 0 ]; then\n        echo \"Success: Done executing sign steps for Sonic v$SONIC_VERSION\"\n    else\n        echo \"Error: Failed executing sign steps for Sonic v$SONIC_VERSION\"\n    fi\npopd > /dev/null\n\nexit $rc\n"
  },
  {
    "path": "src/channel/command.rs",
    "content": "// Sonic\n//\n// Fast, lightweight and schema-less search backend\n// Copyright: 2019, Valerian Saliou <valerian@valeriansaliou.name>\n// License: Mozilla Public License v2.0 (MPL v2.0)\n\nuse hashbrown::HashMap;\nuse rand::distributions::Alphanumeric;\nuse rand::{thread_rng, Rng};\nuse std::fmt;\nuse std::path::Path;\nuse std::str::{self, SplitWhitespace};\nuse std::vec::Vec;\n\nuse super::format::unescape;\nuse super::statistics::ChannelStatistics;\nuse crate::query::builder::{QueryBuilder, QueryBuilderResult};\nuse crate::query::types::{\n    ListMetaData, QueryGenericLang, QueryMetaData, QuerySearchLimit, QuerySearchOffset,\n};\nuse crate::store::fst::StoreFSTPool;\nuse crate::store::kv::StoreKVPool;\nuse crate::store::operation::StoreOperationDispatch;\nuse crate::APP_CONF;\n\n#[derive(PartialEq)]\npub enum ChannelCommandError {\n    UnknownCommand,\n    NotFound,\n    QueryError,\n    InternalError,\n    ShuttingDown,\n    PolicyReject(&'static str),\n    InvalidFormat(&'static str),\n    InvalidMetaKey((String, String)),\n    InvalidMetaValue((String, String)),\n}\n\n#[derive(PartialEq)]\npub enum ChannelCommandResponse {\n    Void,\n    Ok,\n    Pong,\n    Pending(String),\n    Result(String),\n    Event(&'static str, String, String),\n    Ended(&'static str),\n    Err(ChannelCommandError),\n}\n\npub struct ChannelCommandBase;\npub struct ChannelCommandSearch;\npub struct ChannelCommandIngest;\npub struct ChannelCommandControl;\n\npub type ChannelCommandResponseArgs = (&'static str, Option<Vec<String>>);\n\ntype ChannelResult = Result<Vec<ChannelCommandResponse>, ChannelCommandError>;\ntype MetaPartsResult<'a> = Result<(&'a str, &'a str), (&'a str, &'a str)>;\n\npub const EVENT_ID_SIZE: usize = 8;\n\nconst TEXT_PART_BOUNDARY: char = '\"';\nconst TEXT_PART_ESCAPE: char = '\\\\';\nconst META_PART_GROUP_OPEN: char = '(';\nconst META_PART_GROUP_CLOSE: char = ')';\n\nstatic BACKUP_KV_PATH: &str = \"kv\";\nstatic BACKUP_FST_PATH: &str = \"fst\";\n\nlazy_static! {\n    pub static ref COMMANDS_MODE_SEARCH: Vec<&'static str> =\n        vec![\"QUERY\", \"SUGGEST\", \"LIST\", \"PING\", \"HELP\", \"QUIT\"];\n    pub static ref COMMANDS_MODE_INGEST: Vec<&'static str> =\n        vec![\"PUSH\", \"POP\", \"COUNT\", \"FLUSHC\", \"FLUSHB\", \"FLUSHO\", \"PING\", \"HELP\", \"QUIT\"];\n    pub static ref COMMANDS_MODE_CONTROL: Vec<&'static str> =\n        vec![\"TRIGGER\", \"INFO\", \"PING\", \"HELP\", \"QUIT\"];\n    pub static ref CONTROL_TRIGGER_ACTIONS: Vec<&'static str> =\n        vec![\"consolidate\", \"backup\", \"restore\"];\n    static ref MANUAL_MODE_SEARCH: HashMap<&'static str, &'static Vec<&'static str>> =\n        [(\"commands\", &*COMMANDS_MODE_SEARCH)]\n            .iter()\n            .cloned()\n            .collect();\n    static ref MANUAL_MODE_INGEST: HashMap<&'static str, &'static Vec<&'static str>> =\n        [(\"commands\", &*COMMANDS_MODE_INGEST)]\n            .iter()\n            .cloned()\n            .collect();\n    static ref MANUAL_MODE_CONTROL: HashMap<&'static str, &'static Vec<&'static str>> =\n        [(\"commands\", &*COMMANDS_MODE_CONTROL)]\n            .iter()\n            .cloned()\n            .collect();\n}\n\nimpl ChannelCommandResponse {\n    pub fn to_args(&self) -> ChannelCommandResponseArgs {\n        // Convert internal response to channel response arguments; this either gives 'RESPONSE' \\\n        //   or 'RESPONSE <value:1> <value:2> <..>' whether there are values or not.\n        match *self {\n            ChannelCommandResponse::Void => (\"\", None),\n            ChannelCommandResponse::Ok => (\"OK\", None),\n            ChannelCommandResponse::Pong => (\"PONG\", None),\n            ChannelCommandResponse::Pending(ref id) => (\"PENDING\", Some(vec![id.to_owned()])),\n            ChannelCommandResponse::Result(ref id) => (\"RESULT\", Some(vec![id.to_owned()])),\n            ChannelCommandResponse::Event(ref query, ref id, ref payload) => (\n                \"EVENT\",\n                Some(vec![query.to_string(), id.to_owned(), payload.to_owned()]),\n            ),\n            ChannelCommandResponse::Ended(reason) => (\"ENDED\", Some(vec![reason.to_owned()])),\n            ChannelCommandResponse::Err(ref reason) => (\"ERR\", Some(vec![reason.to_string()])),\n        }\n    }\n}\n\nimpl ChannelCommandBase {\n    pub fn dispatch_ping(mut parts: SplitWhitespace) -> ChannelResult {\n        match parts.next() {\n            None => Ok(vec![ChannelCommandResponse::Pong]),\n            _ => Err(ChannelCommandError::InvalidFormat(\"PING\")),\n        }\n    }\n\n    pub fn dispatch_quit(mut parts: SplitWhitespace) -> ChannelResult {\n        match parts.next() {\n            None => Ok(vec![ChannelCommandResponse::Ended(\"quit\")]),\n            _ => Err(ChannelCommandError::InvalidFormat(\"QUIT\")),\n        }\n    }\n\n    pub fn generic_dispatch_help(\n        mut parts: SplitWhitespace,\n        manuals: &HashMap<&str, &Vec<&str>>,\n    ) -> ChannelResult {\n        match (parts.next(), parts.next()) {\n            (None, _) => {\n                let manual_list = manuals.keys().map(|k| k.to_owned()).collect::<Vec<&str>>();\n\n                Ok(vec![ChannelCommandResponse::Result(format!(\n                    \"manuals({})\",\n                    manual_list.join(\", \")\n                ))])\n            }\n            (Some(manual_key), next_part) => {\n                if next_part.is_none() {\n                    if let Some(manual_data) = manuals.get(manual_key) {\n                        Ok(vec![ChannelCommandResponse::Result(format!(\n                            \"{}({})\",\n                            manual_key,\n                            manual_data.join(\", \")\n                        ))])\n                    } else {\n                        Err(ChannelCommandError::NotFound)\n                    }\n                } else {\n                    Err(ChannelCommandError::InvalidFormat(\"HELP [<manual>]?\"))\n                }\n            }\n        }\n    }\n\n    pub fn parse_text_parts(parts: &mut SplitWhitespace) -> Option<String> {\n        // Parse text parts and nest them together\n        let mut text_raw = String::new();\n\n        for text_part in parts {\n            if !text_raw.is_empty() {\n                text_raw.push(' ');\n            }\n\n            text_raw.push_str(text_part);\n\n            // End reached? (ie. got boundary character)\n            let text_part_bytes = text_part.as_bytes();\n            let text_part_bound = text_part_bytes.len();\n\n            if text_raw.len() > 1\n                && text_part_bytes[text_part_bound - 1] as char == TEXT_PART_BOUNDARY\n            {\n                // Count the total amount of escape characters before escape (check if escape \\\n                //   characters are also being escaped, or not)\n                let mut count_escapes = 0;\n\n                if text_part_bound > 1 {\n                    for index in (0..text_part_bound - 1).rev() {\n                        if text_part_bytes[index] as char != TEXT_PART_ESCAPE {\n                            break;\n                        }\n\n                        count_escapes += 1\n                    }\n                }\n\n                // Boundary is not escaped, we can stop there.\n                if count_escapes == 0 || (count_escapes % 2 == 0) {\n                    break;\n                }\n            }\n        }\n\n        // Ensure parsed text parts are valid\n        let text_bytes = text_raw.as_bytes();\n        let text_bytes_len = text_bytes.len();\n\n        if text_raw.is_empty()\n            || text_bytes_len < 2\n            || text_bytes[0] as char != TEXT_PART_BOUNDARY\n            || text_bytes[text_bytes_len - 1] as char != TEXT_PART_BOUNDARY\n        {\n            info!(\"could not properly parse text parts: {}\", text_raw);\n\n            None\n        } else {\n            debug!(\n                \"parsed text parts (still needs post-processing): {}\",\n                text_raw\n            );\n\n            // Return inner text (without boundary characters)\n            match str::from_utf8(&text_bytes[1..text_bytes_len - 1]) {\n                Ok(text_inner) => {\n                    let text_inner_string = unescape(text_inner.trim());\n\n                    debug!(\"parsed text parts (post-processed): {}\", text_inner_string);\n\n                    // Text must not be empty\n                    if !text_inner_string.is_empty() {\n                        Some(text_inner_string)\n                    } else {\n                        None\n                    }\n                }\n                Err(err) => {\n                    info!(\n                        \"could not type-cast post-processed text parts: {} because: {}\",\n                        text_raw, err\n                    );\n\n                    None\n                }\n            }\n        }\n    }\n\n    pub fn parse_next_meta_parts<'a>(\n        parts: &'a mut SplitWhitespace,\n    ) -> Option<MetaPartsResult<'a>> {\n        if let Some(part) = parts.next() {\n            // Parse meta (with format: 'KEY(VALUE)'; no '(' or ')' is allowed in KEY and VALUE)\n            if !part.is_empty() {\n                if let Some(index_open) = part.find(META_PART_GROUP_OPEN) {\n                    let (key_bound_start, key_bound_end) = (0, index_open);\n                    let (value_bound_start, value_bound_end) = (index_open + 1, part.len() - 1);\n\n                    if part.as_bytes()[value_bound_end] as char == META_PART_GROUP_CLOSE {\n                        let (key, value) = (\n                            &part[key_bound_start..key_bound_end],\n                            &part[value_bound_start..value_bound_end],\n                        );\n\n                        // Ensure final key and value do not contain reserved syntax characters\n                        return if !key.contains(META_PART_GROUP_OPEN)\n                            && !key.contains(META_PART_GROUP_CLOSE)\n                            && !value.contains(META_PART_GROUP_OPEN)\n                            && !value.contains(META_PART_GROUP_CLOSE)\n                        {\n                            debug!(\"parsed meta part as: {} = {}\", key, value);\n\n                            Some(Ok((key, value)))\n                        } else {\n                            info!(\n                                \"parsed meta part, but it contains reserved characters: {} = {}\",\n                                key, value\n                            );\n\n                            Some(Err((key, value)))\n                        };\n                    }\n                }\n            }\n\n            info!(\"could not parse meta part: {}\", part);\n\n            Some(Err((\"?\", part)))\n        } else {\n            None\n        }\n    }\n\n    pub fn make_error_invalid_meta_key(meta_key: &str, meta_value: &str) -> ChannelCommandError {\n        ChannelCommandError::InvalidMetaKey((meta_key.to_owned(), meta_value.to_owned()))\n    }\n\n    pub fn make_error_invalid_meta_value(meta_key: &str, meta_value: &str) -> ChannelCommandError {\n        ChannelCommandError::InvalidMetaValue((meta_key.to_owned(), meta_value.to_owned()))\n    }\n\n    pub fn commit_ok_operation(query_builder: QueryBuilderResult) -> ChannelResult {\n        query_builder\n            .and_then(StoreOperationDispatch::dispatch)\n            .map(|_| vec![ChannelCommandResponse::Ok])\n            .or(Err(ChannelCommandError::QueryError))\n    }\n\n    pub fn commit_result_operation(query_builder: QueryBuilderResult) -> ChannelResult {\n        query_builder\n            .and_then(StoreOperationDispatch::dispatch)\n            .or(Err(ChannelCommandError::QueryError))\n            .and_then(|result| {\n                if let Some(result_inner) = result {\n                    Ok(vec![ChannelCommandResponse::Result(result_inner)])\n                } else {\n                    Err(ChannelCommandError::InternalError)\n                }\n            })\n    }\n\n    pub fn commit_pending_operation(\n        query_type: &'static str,\n        query_id: &str,\n        query_builder: QueryBuilderResult,\n    ) -> ChannelResult {\n        // Idea: this could be made asynchronous in the future, if there are some latency issues \\\n        //   on large Sonic deployments. The idea would be to have a number of worker threads for \\\n        //   the whole running daemon, and channel threads dispatching work to those threads. This \\\n        //   way Sonic can be up-scaled to N CPUs instead of 1 CPU per channel connection. Now on, \\\n        //   the only way to scale Sonic executors to multiple CPUs is opening multiple parallel \\\n        //   Sonic Channel connections and dispatching work evenly to each connection. It does not \\\n        //   prevent scaling Sonic vertically, but could be made simpler for the Sonic Channel \\\n        //   consumer via a worker thread pool.\n\n        query_builder\n            .and_then(StoreOperationDispatch::dispatch)\n            .map(|results| {\n                vec![\n                    ChannelCommandResponse::Pending(query_id.to_string()),\n                    ChannelCommandResponse::Event(\n                        query_type,\n                        query_id.to_string(),\n                        results.unwrap_or_default(),\n                    ),\n                ]\n            })\n            .or(Err(ChannelCommandError::QueryError))\n    }\n\n    pub fn generate_event_id() -> String {\n        thread_rng()\n            .sample_iter(&Alphanumeric)\n            .take(EVENT_ID_SIZE)\n            .map(|value| value as char)\n            .collect()\n    }\n}\n\nimpl ChannelCommandSearch {\n    pub fn dispatch_query(mut parts: SplitWhitespace) -> ChannelResult {\n        match (\n            parts.next(),\n            parts.next(),\n            ChannelCommandBase::parse_text_parts(&mut parts),\n        ) {\n            (Some(collection), Some(bucket), Some(text)) => {\n                // Generate command identifier\n                let event_id = ChannelCommandBase::generate_event_id();\n\n                debug!(\n                    \"dispatching search query #{} on collection: {} and bucket: {}\",\n                    event_id, collection, bucket\n                );\n\n                // Define query parameters\n                let (mut query_limit, mut query_offset, mut query_lang) =\n                    (APP_CONF.channel.search.query_limit_default, 0, None);\n\n                // Parse meta parts (meta comes after text; extract meta parts second)\n                let mut last_meta_err = None;\n\n                while let Some(meta_result) = ChannelCommandBase::parse_next_meta_parts(&mut parts)\n                {\n                    match Self::handle_query_meta(meta_result) {\n                        Ok((Some(query_limit_parsed), None, None)) => {\n                            query_limit = query_limit_parsed\n                        }\n                        Ok((None, Some(query_offset_parsed), None)) => {\n                            query_offset = query_offset_parsed\n                        }\n                        Ok((None, None, Some(query_lang_parsed))) => {\n                            query_lang = Some(query_lang_parsed)\n                        }\n                        Err(parse_err) => last_meta_err = Some(parse_err),\n                        _ => {}\n                    }\n                }\n\n                if let Some(err) = last_meta_err {\n                    Err(err)\n                } else if query_limit < 1\n                    || query_limit > APP_CONF.channel.search.query_limit_maximum\n                {\n                    Err(ChannelCommandError::PolicyReject(\n                        \"LIMIT out of minimum/maximum bounds\",\n                    ))\n                } else {\n                    debug!(\n                        \"will search for #{} with text: {}, limit: {}, offset: {}, locale: <{:?}>\",\n                        event_id, text, query_limit, query_offset, query_lang\n                    );\n\n                    // Commit 'search' query\n                    ChannelCommandBase::commit_pending_operation(\n                        \"QUERY\",\n                        &event_id,\n                        QueryBuilder::search(\n                            &event_id,\n                            collection,\n                            bucket,\n                            &text,\n                            query_limit,\n                            query_offset,\n                            query_lang,\n                        ),\n                    )\n                }\n            }\n            _ => Err(ChannelCommandError::InvalidFormat(\n                \"QUERY <collection> <bucket> \\\"<terms>\\\" [LIMIT(<count>)]? [OFFSET(<count>)]? \\\n                 [LANG(<locale>)]?\",\n            )),\n        }\n    }\n\n    pub fn dispatch_suggest(mut parts: SplitWhitespace) -> ChannelResult {\n        match (\n            parts.next(),\n            parts.next(),\n            ChannelCommandBase::parse_text_parts(&mut parts),\n        ) {\n            (Some(collection), Some(bucket), Some(text)) => {\n                // Generate command identifier\n                let event_id = ChannelCommandBase::generate_event_id();\n\n                debug!(\n                    \"dispatching search suggest #{} on collection: {} and bucket: {}\",\n                    event_id, collection, bucket\n                );\n\n                // Define suggest parameters\n                let mut suggest_limit = APP_CONF.channel.search.suggest_limit_default;\n\n                // Parse meta parts (meta comes after text; extract meta parts second)\n                let mut last_meta_err = None;\n\n                while let Some(meta_result) = ChannelCommandBase::parse_next_meta_parts(&mut parts)\n                {\n                    match Self::handle_suggest_meta(meta_result) {\n                        Ok(Some(suggest_limit_parsed)) => suggest_limit = suggest_limit_parsed,\n                        Err(parse_err) => last_meta_err = Some(parse_err),\n                        _ => {}\n                    }\n                }\n\n                if let Some(err) = last_meta_err {\n                    Err(err)\n                } else if suggest_limit < 1\n                    || suggest_limit > APP_CONF.channel.search.suggest_limit_maximum\n                {\n                    Err(ChannelCommandError::PolicyReject(\n                        \"LIMIT out of minimum/maximum bounds\",\n                    ))\n                } else {\n                    debug!(\n                        \"will suggest for #{} with text: {}, limit: {}\",\n                        event_id, text, suggest_limit\n                    );\n\n                    // Commit 'suggest' query\n                    ChannelCommandBase::commit_pending_operation(\n                        \"SUGGEST\",\n                        &event_id,\n                        QueryBuilder::suggest(&event_id, collection, bucket, &text, suggest_limit),\n                    )\n                }\n            }\n            _ => Err(ChannelCommandError::InvalidFormat(\n                \"SUGGEST <collection> <bucket> \\\"<word>\\\" [LIMIT(<count>)]?\",\n            )),\n        }\n    }\n\n    pub fn dispatch_list(mut parts: SplitWhitespace) -> ChannelResult {\n        match (parts.next(), parts.next()) {\n            (Some(collection), Some(bucket)) => {\n                // Generate command identifier\n                let event_id = ChannelCommandBase::generate_event_id();\n\n                debug!(\n                    \"dispatching search list #{} on collection: {} and bucket: {}\",\n                    event_id, collection, bucket\n                );\n\n                // Define list parameters\n                let (mut list_limit, mut list_offset) =\n                    (APP_CONF.channel.search.list_limit_default, 0);\n\n                // Parse meta parts (meta comes last; extract meta parts second)\n                let mut last_meta_err = None;\n\n                while let Some(meta_result) = ChannelCommandBase::parse_next_meta_parts(&mut parts)\n                {\n                    match Self::handle_list_meta(meta_result) {\n                        Ok(metadata) => match metadata {\n                            (Some(list_limit_parsed), None) => list_limit = list_limit_parsed,\n                            (None, Some(list_offset_parsed)) => list_offset = list_offset_parsed,\n                            _ => {}\n                        },\n                        Err(parse_err) => last_meta_err = Some(parse_err),\n                    }\n                }\n\n                if let Some(err) = last_meta_err {\n                    Err(err)\n                } else if list_limit < 1 || list_limit > APP_CONF.channel.search.list_limit_maximum\n                {\n                    Err(ChannelCommandError::PolicyReject(\n                        \"LIMIT out of minimum/maximum bounds\",\n                    ))\n                } else {\n                    // Commit 'list' query\n                    ChannelCommandBase::commit_pending_operation(\n                        \"LIST\",\n                        &event_id,\n                        QueryBuilder::list(&event_id, collection, bucket, list_limit, list_offset),\n                    )\n                }\n            }\n            _ => Err(ChannelCommandError::InvalidFormat(\n                \"LIST <collection> <bucket> [LIMIT(<count>)]? [OFFSET(<count>)]?\",\n            )),\n        }\n    }\n\n    pub fn dispatch_help(parts: SplitWhitespace) -> ChannelResult {\n        ChannelCommandBase::generic_dispatch_help(parts, &*MANUAL_MODE_SEARCH)\n    }\n\n    fn handle_query_meta(\n        meta_result: MetaPartsResult,\n    ) -> Result<QueryMetaData, ChannelCommandError> {\n        match meta_result {\n            Ok((meta_key, meta_value)) => {\n                debug!(\"handle query meta: {} = {}\", meta_key, meta_value);\n\n                match meta_key {\n                    \"LIMIT\" => {\n                        // 'LIMIT(<count>)' where 0 <= <count> < 2^16\n                        if let Ok(query_limit_parsed) = meta_value.parse::<QuerySearchLimit>() {\n                            Ok((Some(query_limit_parsed), None, None))\n                        } else {\n                            Err(ChannelCommandBase::make_error_invalid_meta_value(\n                                meta_key, meta_value,\n                            ))\n                        }\n                    }\n                    \"OFFSET\" => {\n                        // 'OFFSET(<count>)' where 0 <= <count> < 2^32\n                        if let Ok(query_offset_parsed) = meta_value.parse::<QuerySearchOffset>() {\n                            Ok((None, Some(query_offset_parsed), None))\n                        } else {\n                            Err(ChannelCommandBase::make_error_invalid_meta_value(\n                                meta_key, meta_value,\n                            ))\n                        }\n                    }\n                    \"LANG\" => {\n                        // 'LANG(<locale>)' where <locale> ∈ ISO 639-3\n                        if let Some(query_lang_parsed) = QueryGenericLang::from_value(meta_value) {\n                            Ok((None, None, Some(query_lang_parsed)))\n                        } else {\n                            Err(ChannelCommandBase::make_error_invalid_meta_value(\n                                meta_key, meta_value,\n                            ))\n                        }\n                    }\n                    _ => Err(ChannelCommandBase::make_error_invalid_meta_key(\n                        meta_key, meta_value,\n                    )),\n                }\n            }\n            Err(err) => Err(ChannelCommandBase::make_error_invalid_meta_key(\n                err.0, err.1,\n            )),\n        }\n    }\n\n    fn handle_suggest_meta(\n        meta_result: MetaPartsResult,\n    ) -> Result<Option<QuerySearchLimit>, ChannelCommandError> {\n        match meta_result {\n            Ok((meta_key, meta_value)) => {\n                debug!(\"handle suggest meta: {} = {}\", meta_key, meta_value);\n\n                match meta_key {\n                    \"LIMIT\" => {\n                        // 'LIMIT(<count>)' where 0 <= <count> < 2^16\n                        if let Ok(suggest_limit_parsed) = meta_value.parse::<QuerySearchLimit>() {\n                            Ok(Some(suggest_limit_parsed))\n                        } else {\n                            Err(ChannelCommandBase::make_error_invalid_meta_value(\n                                meta_key, meta_value,\n                            ))\n                        }\n                    }\n                    _ => Err(ChannelCommandBase::make_error_invalid_meta_key(\n                        meta_key, meta_value,\n                    )),\n                }\n            }\n            Err(err) => Err(ChannelCommandBase::make_error_invalid_meta_key(\n                err.0, err.1,\n            )),\n        }\n    }\n\n    fn handle_list_meta(meta_result: MetaPartsResult) -> Result<ListMetaData, ChannelCommandError> {\n        match meta_result {\n            Ok((meta_key, meta_value)) => {\n                debug!(\"handle list meta: {} = {}\", meta_key, meta_value);\n\n                match meta_key {\n                    \"LIMIT\" => {\n                        // 'LIMIT(<count>)' where 0 <= <count> < 2^16\n                        if let Ok(list_limit_parsed) = meta_value.parse::<QuerySearchLimit>() {\n                            Ok((Some(list_limit_parsed), None))\n                        } else {\n                            Err(ChannelCommandBase::make_error_invalid_meta_value(\n                                meta_key, meta_value,\n                            ))\n                        }\n                    }\n                    \"OFFSET\" => {\n                        // 'OFFSET(<count>)' where 0 <= <count> < 2^32\n                        if let Ok(list_offset_parsed) = meta_value.parse::<QuerySearchOffset>() {\n                            Ok((None, Some(list_offset_parsed)))\n                        } else {\n                            Err(ChannelCommandBase::make_error_invalid_meta_value(\n                                meta_key, meta_value,\n                            ))\n                        }\n                    }\n                    _ => Err(ChannelCommandBase::make_error_invalid_meta_key(\n                        meta_key, meta_value,\n                    )),\n                }\n            }\n            Err(err) => Err(ChannelCommandBase::make_error_invalid_meta_key(\n                err.0, err.1,\n            )),\n        }\n    }\n}\n\nimpl ChannelCommandIngest {\n    pub fn dispatch_push(mut parts: SplitWhitespace) -> ChannelResult {\n        match (\n            parts.next(),\n            parts.next(),\n            parts.next(),\n            ChannelCommandBase::parse_text_parts(&mut parts),\n        ) {\n            (Some(collection), Some(bucket), Some(object), Some(text)) => {\n                debug!(\n                    \"dispatching ingest push in collection: {}, bucket: {} and object: {}\",\n                    collection, bucket, object\n                );\n                debug!(\"ingest push has text: {}\", text);\n\n                // Define push parameters\n                let mut push_lang = None;\n\n                // Parse meta parts (meta comes after text; extract meta parts second)\n                let mut last_meta_err = None;\n\n                while let Some(meta_result) = ChannelCommandBase::parse_next_meta_parts(&mut parts)\n                {\n                    match Self::handle_push_meta(meta_result) {\n                        Ok(Some(push_lang_parsed)) => push_lang = Some(push_lang_parsed),\n                        Err(parse_err) => last_meta_err = Some(parse_err),\n                        _ => {}\n                    }\n                }\n\n                if let Some(err) = last_meta_err {\n                    Err(err)\n                } else {\n                    debug!(\n                        \"will push for text: {} with hinted locale: <{:?}>\",\n                        text, push_lang\n                    );\n\n                    // Commit 'push' query\n                    ChannelCommandBase::commit_ok_operation(QueryBuilder::push(\n                        collection, bucket, object, &text, push_lang,\n                    ))\n                }\n            }\n            _ => Err(ChannelCommandError::InvalidFormat(\n                \"PUSH <collection> <bucket> <object> \\\"<text>\\\" [LANG(<locale>)]?\",\n            )),\n        }\n    }\n\n    pub fn dispatch_pop(mut parts: SplitWhitespace) -> ChannelResult {\n        match (\n            parts.next(),\n            parts.next(),\n            parts.next(),\n            ChannelCommandBase::parse_text_parts(&mut parts),\n            parts.next(),\n        ) {\n            (Some(collection), Some(bucket), Some(object), Some(text), None) => {\n                debug!(\n                    \"dispatching ingest pop in collection: {}, bucket: {} and object: {}\",\n                    collection, bucket, object\n                );\n                debug!(\"ingest pop has text: {}\", text);\n\n                // Make 'pop' query\n                ChannelCommandBase::commit_result_operation(QueryBuilder::pop(\n                    collection, bucket, object, &text,\n                ))\n            }\n            _ => Err(ChannelCommandError::InvalidFormat(\n                \"POP <collection> <bucket> <object> \\\"<text>\\\"\",\n            )),\n        }\n    }\n\n    pub fn dispatch_count(mut parts: SplitWhitespace) -> ChannelResult {\n        match (parts.next(), parts.next(), parts.next(), parts.next()) {\n            (Some(collection), bucket_part, object_part, None) => {\n                debug!(\"dispatching ingest count in collection: {}\", collection);\n\n                // Make 'count' query\n                ChannelCommandBase::commit_result_operation(QueryBuilder::count(\n                    collection,\n                    bucket_part,\n                    object_part,\n                ))\n            }\n            _ => Err(ChannelCommandError::InvalidFormat(\n                \"COUNT <collection> [<bucket> [<object>]?]?\",\n            )),\n        }\n    }\n\n    pub fn dispatch_flushc(mut parts: SplitWhitespace) -> ChannelResult {\n        match (parts.next(), parts.next()) {\n            (Some(collection), None) => {\n                debug!(\n                    \"dispatching ingest flush collection in collection: {}\",\n                    collection\n                );\n\n                // Make 'flushc' query\n                ChannelCommandBase::commit_result_operation(QueryBuilder::flushc(collection))\n            }\n            _ => Err(ChannelCommandError::InvalidFormat(\"FLUSHC <collection>\")),\n        }\n    }\n\n    pub fn dispatch_flushb(mut parts: SplitWhitespace) -> ChannelResult {\n        match (parts.next(), parts.next(), parts.next()) {\n            (Some(collection), Some(bucket), None) => {\n                debug!(\n                    \"dispatching ingest flush bucket in collection: {}, bucket: {}\",\n                    collection, bucket\n                );\n\n                // Make 'flushb' query\n                ChannelCommandBase::commit_result_operation(QueryBuilder::flushb(\n                    collection, bucket,\n                ))\n            }\n            _ => Err(ChannelCommandError::InvalidFormat(\n                \"FLUSHB <collection> <bucket>\",\n            )),\n        }\n    }\n\n    pub fn dispatch_flusho(mut parts: SplitWhitespace) -> ChannelResult {\n        match (parts.next(), parts.next(), parts.next(), parts.next()) {\n            (Some(collection), Some(bucket), Some(object), None) => {\n                debug!(\n                    \"dispatching ingest flush object in collection: {}, bucket: {}, object: {}\",\n                    collection, bucket, object\n                );\n\n                // Make 'flusho' query\n                ChannelCommandBase::commit_result_operation(QueryBuilder::flusho(\n                    collection, bucket, object,\n                ))\n            }\n            _ => Err(ChannelCommandError::InvalidFormat(\n                \"FLUSHO <collection> <bucket> <object>\",\n            )),\n        }\n    }\n\n    pub fn dispatch_help(parts: SplitWhitespace) -> ChannelResult {\n        ChannelCommandBase::generic_dispatch_help(parts, &*MANUAL_MODE_INGEST)\n    }\n\n    fn handle_push_meta(\n        meta_result: MetaPartsResult,\n    ) -> Result<Option<QueryGenericLang>, ChannelCommandError> {\n        match meta_result {\n            Ok((meta_key, meta_value)) => {\n                debug!(\"handle push meta: {} = {}\", meta_key, meta_value);\n\n                match meta_key {\n                    \"LANG\" => {\n                        // 'LANG(<locale>)' where <locale> ∈ ISO 639-3\n                        if let Some(query_lang_parsed) = QueryGenericLang::from_value(meta_value) {\n                            Ok(Some(query_lang_parsed))\n                        } else {\n                            Err(ChannelCommandBase::make_error_invalid_meta_value(\n                                meta_key, meta_value,\n                            ))\n                        }\n                    }\n                    _ => Err(ChannelCommandBase::make_error_invalid_meta_key(\n                        meta_key, meta_value,\n                    )),\n                }\n            }\n            Err(err) => Err(ChannelCommandBase::make_error_invalid_meta_key(\n                err.0, err.1,\n            )),\n        }\n    }\n}\n\nimpl ChannelCommandControl {\n    pub fn dispatch_trigger(mut parts: SplitWhitespace) -> ChannelResult {\n        match (parts.next(), parts.next(), parts.next()) {\n            (None, _, _) => Ok(vec![ChannelCommandResponse::Result(format!(\n                \"actions({})\",\n                CONTROL_TRIGGER_ACTIONS.join(\", \")\n            ))]),\n            (Some(action_key), data_part, last_part) => {\n                let action_key_lower = action_key.to_lowercase();\n\n                match action_key_lower.as_str() {\n                    \"consolidate\" => {\n                        if data_part.is_none() {\n                            // Force a FST consolidate\n                            StoreFSTPool::consolidate(true);\n\n                            Ok(vec![ChannelCommandResponse::Ok])\n                        } else {\n                            Err(ChannelCommandError::InvalidFormat(\"TRIGGER consolidate\"))\n                        }\n                    }\n                    \"backup\" => {\n                        match (data_part, last_part) {\n                            (Some(path), None) => {\n                                // Proceed KV + FST backup\n                                let path = Path::new(path);\n\n                                if StoreKVPool::backup(&path.join(BACKUP_KV_PATH)).is_ok()\n                                    && StoreFSTPool::backup(&path.join(BACKUP_FST_PATH)).is_ok()\n                                {\n                                    Ok(vec![ChannelCommandResponse::Ok])\n                                } else {\n                                    Err(ChannelCommandError::InternalError)\n                                }\n                            }\n                            _ => Err(ChannelCommandError::InvalidFormat(\"TRIGGER backup <path>\")),\n                        }\n                    }\n                    \"restore\" => {\n                        match (data_part, last_part) {\n                            (Some(path), None) => {\n                                // Proceed KV + FST restore\n                                let path = Path::new(path);\n\n                                if StoreKVPool::restore(&path.join(BACKUP_KV_PATH)).is_ok()\n                                    && StoreFSTPool::restore(&path.join(BACKUP_FST_PATH)).is_ok()\n                                {\n                                    Ok(vec![ChannelCommandResponse::Ok])\n                                } else {\n                                    Err(ChannelCommandError::InternalError)\n                                }\n                            }\n                            _ => Err(ChannelCommandError::InvalidFormat(\"TRIGGER restore <path>\")),\n                        }\n                    }\n                    _ => Err(ChannelCommandError::NotFound),\n                }\n            }\n        }\n    }\n\n    pub fn dispatch_info(mut parts: SplitWhitespace) -> ChannelResult {\n        match parts.next() {\n            None => {\n                let statistics = ChannelStatistics::gather();\n\n                Ok(vec![ChannelCommandResponse::Result(format!(\n                    \"uptime({}) clients_connected({}) commands_total({}) \\\n                     command_latency_best({}) command_latency_worst({}) \\\n                     kv_open_count({}) fst_open_count({}) fst_consolidate_count({})\",\n                    statistics.uptime,\n                    statistics.clients_connected,\n                    statistics.commands_total,\n                    statistics.command_latency_best,\n                    statistics.command_latency_worst,\n                    statistics.kv_open_count,\n                    statistics.fst_open_count,\n                    statistics.fst_consolidate_count\n                ))])\n            }\n            _ => Err(ChannelCommandError::InvalidFormat(\"INFO\")),\n        }\n    }\n\n    pub fn dispatch_help(parts: SplitWhitespace) -> ChannelResult {\n        ChannelCommandBase::generic_dispatch_help(parts, &*MANUAL_MODE_CONTROL)\n    }\n}\n\nimpl fmt::Display for ChannelCommandError {\n    fn fmt(&self, f: &mut fmt::Formatter<'_>) -> Result<(), fmt::Error> {\n        match self {\n            ChannelCommandError::UnknownCommand => write!(f, \"unknown_command\"),\n            ChannelCommandError::NotFound => write!(f, \"not_found\"),\n            ChannelCommandError::QueryError => write!(f, \"query_error\"),\n            ChannelCommandError::InternalError => write!(f, \"internal_error\"),\n            ChannelCommandError::ShuttingDown => write!(f, \"shutting_down\"),\n            ChannelCommandError::PolicyReject(reason) => write!(f, \"policy_reject({})\", reason),\n            ChannelCommandError::InvalidFormat(format) => write!(f, \"invalid_format({})\", format),\n            ChannelCommandError::InvalidMetaKey(ref data) => {\n                write!(f, \"invalid_meta_key({}[{}])\", data.0, data.1)\n            }\n            ChannelCommandError::InvalidMetaValue(ref data) => {\n                write!(f, \"invalid_meta_value({}[{}])\", data.0, data.1)\n            }\n        }\n    }\n}\n\n#[cfg(test)]\nmod tests {\n    use super::*;\n\n    #[test]\n    fn it_matches_command_response_string() {\n        assert_eq!(ChannelCommandResponse::Ok.to_args().0, \"OK\");\n        assert_eq!(ChannelCommandResponse::Pong.to_args().0, \"PONG\");\n        assert_eq!(ChannelCommandResponse::Ended(\"\").to_args().0, \"ENDED\");\n        assert_eq!(\n            ChannelCommandResponse::Err(ChannelCommandError::UnknownCommand)\n                .to_args()\n                .0,\n            \"ERR\"\n        );\n    }\n}\n"
  },
  {
    "path": "src/channel/format.rs",
    "content": "// Sonic\n//\n// Fast, lightweight and schema-less search backend\n// Copyright: 2019, Valerian Saliou <valerian@valeriansaliou.name>\n// License: Mozilla Public License v2.0 (MPL v2.0)\n\npub fn unescape(text: &str) -> String {\n    // Pre-reserve a byte-aware required capacity as to avoid heap resizes (30% performance \\\n    //   gain relative to initializing this with a zero-capacity)\n    let mut unescaped = String::with_capacity(text.as_bytes().len());\n    let mut characters = text.chars();\n\n    while let Some(character) = characters.next() {\n        if character == '\\\\' {\n            // Found escaped character\n            match characters.next() {\n                Some('n') => unescaped.push('\\n'),\n                Some('\\\"') => unescaped.push('\\\"'),\n                _ => unescaped.push(character),\n            };\n        } else {\n            unescaped.push(character);\n        }\n    }\n\n    unescaped\n}\n\n#[cfg(test)]\nmod tests {\n    use super::*;\n\n    #[test]\n    fn it_unescapes_command_text() {\n        assert_eq!(unescape(r#\"hello world!\"#), r#\"hello world!\"#.to_string());\n        assert_eq!(\n            unescape(r#\"i'm so good at this\"#),\n            r#\"i'm so good at this\"#.to_string()\n        );\n        assert_eq!(\n            unescape(r#\"look at \\\\\\\\\"\\\\\\\" me i'm \\\\\"\\\"trying to hack you\\\"\"#),\n            r#\"look at \\\\\"\\\" me i'm \\\"\"trying to hack you\"\"#.to_string()\n        );\n    }\n}\n\n#[cfg(all(feature = \"benchmark\", test))]\nmod benches {\n    extern crate test;\n\n    use super::*;\n    use test::Bencher;\n\n    #[bench]\n    fn bench_unescape_command_text(b: &mut Bencher) {\n        b.iter(|| unescape(r#\"i'm \\\\\"\\\"trying to hack you\\\"\"#));\n    }\n}\n"
  },
  {
    "path": "src/channel/handle.rs",
    "content": "// Sonic\n//\n// Fast, lightweight and schema-less search backend\n// Copyright: 2019, Valerian Saliou <valerian@valeriansaliou.name>\n// License: Mozilla Public License v2.0 (MPL v2.0)\n\nuse std::collections::VecDeque;\nuse std::io::{ErrorKind, Read, Write};\nuse std::net::TcpStream;\nuse std::result::Result;\nuse std::str;\nuse std::time::Duration;\n\nuse super::message::{\n    ChannelMessage, ChannelMessageModeControl, ChannelMessageModeIngest, ChannelMessageModeSearch,\n    ChannelMessageResult,\n};\nuse super::mode::ChannelMode;\nuse super::statistics::CLIENTS_CONNECTED;\nuse crate::APP_CONF;\nuse crate::LINE_FEED;\n\npub struct ChannelHandle;\n\nenum ChannelHandleError {\n    Closed,\n    InvalidMode,\n    AuthenticationRequired,\n    AuthenticationFailed,\n    NotRecognized,\n    TimedOut,\n    ConnectionAborted,\n    Interrupted,\n    Unknown,\n}\n\nconst LINE_END_GAP: usize = 1;\nconst BUFFER_SIZE: usize = 20000;\nconst MAX_LINE_SIZE: usize = BUFFER_SIZE + LINE_END_GAP + 1;\nconst TCP_TIMEOUT_NON_ESTABLISHED: u64 = 10;\nconst PROTOCOL_REVISION: u8 = 1;\nconst BUFFER_LINE_SEPARATOR: u8 = b'\\n';\n\nlazy_static! {\n    static ref CONNECTED_BANNER: String = format!(\n        \"CONNECTED <{} v{}>\",\n        env!(\"CARGO_PKG_NAME\"),\n        env!(\"CARGO_PKG_VERSION\")\n    );\n}\n\nimpl ChannelHandleError {\n    pub fn to_str(&self) -> &'static str {\n        match *self {\n            ChannelHandleError::Closed => \"closed\",\n            ChannelHandleError::InvalidMode => \"invalid_mode\",\n            ChannelHandleError::AuthenticationRequired => \"authentication_required\",\n            ChannelHandleError::AuthenticationFailed => \"authentication_failed\",\n            ChannelHandleError::NotRecognized => \"not_recognized\",\n            ChannelHandleError::TimedOut => \"timed_out\",\n            ChannelHandleError::ConnectionAborted => \"connection_aborted\",\n            ChannelHandleError::Interrupted => \"interrupted\",\n            ChannelHandleError::Unknown => \"unknown\",\n        }\n    }\n}\n\nimpl ChannelHandle {\n    pub fn client(mut stream: TcpStream) {\n        // Configure stream (non-established)\n        ChannelHandle::configure_stream(&stream, false);\n\n        // Send connected banner\n        write!(stream, \"{}{}\", *CONNECTED_BANNER, LINE_FEED).expect(\"write failed\");\n\n        // Increment connected clients count\n        *CLIENTS_CONNECTED.write().unwrap() += 1;\n\n        // Ensure channel mode is set\n        match Self::ensure_start(&stream) {\n            Ok(mode) => {\n                // Configure stream (established)\n                ChannelHandle::configure_stream(&stream, true);\n\n                // Send started acknowledgement (with environment variables)\n                write!(\n                    stream,\n                    \"STARTED {} protocol({}) buffer({}){}\",\n                    mode.to_str(),\n                    PROTOCOL_REVISION,\n                    BUFFER_SIZE,\n                    LINE_FEED\n                )\n                .expect(\"write failed\");\n\n                Self::handle_stream(mode, stream);\n            }\n            Err(err) => {\n                write!(stream, \"ENDED {}{}\", err.to_str(), LINE_FEED).expect(\"write failed\");\n            }\n        }\n\n        // Decrement connected clients count\n        *CLIENTS_CONNECTED.write().unwrap() -= 1;\n    }\n\n    fn configure_stream(stream: &TcpStream, is_established: bool) {\n        let tcp_timeout = if is_established {\n            APP_CONF.channel.tcp_timeout\n        } else {\n            TCP_TIMEOUT_NON_ESTABLISHED\n        };\n\n        assert!(stream.set_nodelay(true).is_ok());\n\n        assert!(stream\n            .set_read_timeout(Some(Duration::new(tcp_timeout, 0)))\n            .is_ok());\n        assert!(stream\n            .set_write_timeout(Some(Duration::new(tcp_timeout, 0)))\n            .is_ok());\n    }\n\n    fn handle_stream(mode: ChannelMode, mut stream: TcpStream) {\n        // Initialize packet buffer\n        let mut buffer: VecDeque<u8> = VecDeque::with_capacity(MAX_LINE_SIZE);\n\n        // Wait for incoming messages\n        'handler: loop {\n            let mut read = [0; MAX_LINE_SIZE];\n\n            match stream.read(&mut read) {\n                Ok(n) => {\n                    // Should close?\n                    if n == 0 {\n                        break;\n                    }\n\n                    // Buffer overflow?\n                    {\n                        let buffer_len = n + buffer.len();\n\n                        if buffer_len > MAX_LINE_SIZE {\n                            // Do not continue, as there is too much pending data in the buffer. \\\n                            //   Most likely the client does not implement a proper back-pressure \\\n                            //   management system, thus we terminate it.\n                            error!(\"closing channel thread because of buffer overflow\");\n\n                            panic!(\"buffer overflow ({}/{} bytes)\", buffer_len, MAX_LINE_SIZE);\n                        }\n                    }\n\n                    // Add chunk to buffer\n                    buffer.extend(&read[0..n]);\n\n                    // Handle full lines from buffer (keep the last incomplete line in buffer)\n                    {\n                        let mut processed_line = Vec::with_capacity(MAX_LINE_SIZE);\n\n                        while let Some(byte) = buffer.pop_front() {\n                            // Commit line and start a new one?\n                            if byte == BUFFER_LINE_SEPARATOR {\n                                if Self::on_message(&mode, &stream, &processed_line)\n                                    == ChannelMessageResult::Close\n                                {\n                                    // Should close?\n                                    break 'handler;\n                                }\n\n                                // Important: clear the contents of the line, as it has just been \\\n                                //   processed.\n                                processed_line.clear();\n                            } else {\n                                // Append current byte to processed line\n                                processed_line.push(byte);\n                            }\n                        }\n\n                        // Incomplete line remaining? Put it back in buffer.\n                        if !processed_line.is_empty() {\n                            buffer.extend(processed_line);\n                        }\n                    }\n                }\n                Err(err) => {\n                    error!(\"closing channel thread with traceback: {}\", err);\n\n                    panic!(\"closing channel\");\n                }\n            }\n        }\n    }\n\n    fn ensure_start(mut stream: &TcpStream) -> Result<ChannelMode, ChannelHandleError> {\n        #[allow(clippy::never_loop)]\n        loop {\n            let mut read = [0; MAX_LINE_SIZE];\n\n            match stream.read(&mut read) {\n                Ok(n) => {\n                    if n == 0 {\n                        return Err(ChannelHandleError::Closed);\n                    }\n\n                    let mut parts = str::from_utf8(&read[0..n]).unwrap_or(\"\").split_whitespace();\n\n                    if parts.next().unwrap_or(\"\").to_uppercase().as_str() == \"START\" {\n                        if let Some(res_mode) = parts.next() {\n                            debug!(\"got mode response: {}\", res_mode);\n\n                            // Extract mode\n                            if let Ok(mode) = ChannelMode::from_str(res_mode) {\n                                // Check if authenticated?\n                                if let Some(ref auth_password) = APP_CONF.channel.auth_password {\n                                    if let Some(provided_auth) = parts.next() {\n                                        // Compare provided password with configured password\n                                        if provided_auth != auth_password {\n                                            info!(\"password provided, but does not match\");\n\n                                            return Err(ChannelHandleError::AuthenticationFailed);\n                                        }\n                                    } else {\n                                        info!(\"no password provided, but one required\");\n\n                                        // No password was provided, but we require one\n                                        return Err(ChannelHandleError::AuthenticationRequired);\n                                    }\n                                }\n\n                                return Ok(mode);\n                            }\n                        }\n\n                        return Err(ChannelHandleError::InvalidMode);\n                    }\n\n                    return Err(ChannelHandleError::NotRecognized);\n                }\n                Err(err) => {\n                    let err_reason = match err.kind() {\n                        ErrorKind::TimedOut => ChannelHandleError::TimedOut,\n                        ErrorKind::ConnectionAborted => ChannelHandleError::ConnectionAborted,\n                        ErrorKind::Interrupted => ChannelHandleError::Interrupted,\n                        _ => ChannelHandleError::Unknown,\n                    };\n\n                    return Err(err_reason);\n                }\n            }\n        }\n    }\n\n    fn on_message(\n        mode: &ChannelMode,\n        stream: &TcpStream,\n        message_slice: &[u8],\n    ) -> ChannelMessageResult {\n        match mode {\n            ChannelMode::Search => {\n                ChannelMessage::on::<ChannelMessageModeSearch>(stream, message_slice)\n            }\n            ChannelMode::Ingest => {\n                ChannelMessage::on::<ChannelMessageModeIngest>(stream, message_slice)\n            }\n            ChannelMode::Control => {\n                ChannelMessage::on::<ChannelMessageModeControl>(stream, message_slice)\n            }\n        }\n    }\n}\n"
  },
  {
    "path": "src/channel/listen.rs",
    "content": "// Sonic\n//\n// Fast, lightweight and schema-less search backend\n// Copyright: 2019, Valerian Saliou <valerian@valeriansaliou.name>\n// License: Mozilla Public License v2.0 (MPL v2.0)\n\nuse std::net::TcpListener;\nuse std::process;\nuse std::sync::RwLock;\nuse std::thread;\n\nuse super::handle::ChannelHandle;\nuse crate::{APP_CONF, THREAD_NAME_CHANNEL_CLIENT};\n\npub struct ChannelListenBuilder;\npub struct ChannelListen;\n\nlazy_static! {\n    pub static ref CHANNEL_AVAILABLE: RwLock<bool> = RwLock::new(true);\n}\n\nimpl ChannelListenBuilder {\n    pub fn build() -> ChannelListen {\n        ChannelListen {}\n    }\n}\n\nimpl ChannelListen {\n    pub fn run(&self) {\n        match TcpListener::bind(APP_CONF.channel.inet) {\n            Ok(listener) => {\n                info!(\"listening on tcp://{}\", APP_CONF.channel.inet);\n\n                for stream in listener.incoming() {\n                    match stream {\n                        Ok(stream) => {\n                            thread::Builder::new()\n                                .name(THREAD_NAME_CHANNEL_CLIENT.to_string())\n                                .spawn(move || {\n                                    if let Ok(peer_addr) = stream.peer_addr() {\n                                        debug!(\"channel client connecting: {}\", peer_addr);\n                                    }\n\n                                    // Create client\n                                    ChannelHandle::client(stream);\n                                })\n                                .ok();\n                        }\n                        Err(err) => {\n                            warn!(\"error handling stream: {}\", err);\n                        }\n                    }\n                }\n            }\n            Err(err) => {\n                error!(\"error binding channel listener: {}\", err);\n\n                // Exit Sonic\n                process::exit(1);\n            }\n        }\n    }\n\n    pub fn teardown() {\n        // Channel cannot be used anymore\n        *CHANNEL_AVAILABLE.write().unwrap() = false;\n    }\n}\n"
  },
  {
    "path": "src/channel/macros.rs",
    "content": "// Sonic\n//\n// Fast, lightweight and schema-less search backend\n// Copyright: 2019, Valerian Saliou <valerian@valeriansaliou.name>\n// License: Mozilla Public License v2.0 (MPL v2.0)\n\n#[macro_export]\nmacro_rules! gen_channel_message_mode_handle {\n    ($message:ident, $commands:ident, { $($external:expr => $internal:expr),+, }) => {{\n        let (command, parts) = ChannelMessage::extract($message);\n\n        if command.is_empty() == true || $commands.contains(&command.as_str()) == true {\n            match command.as_str() {\n                \"\" => Ok(vec![ChannelCommandResponse::Void]),\n                $(\n                    $external => $internal(parts),\n                )+\n                \"PING\" => ChannelCommandBase::dispatch_ping(parts),\n                \"QUIT\" => ChannelCommandBase::dispatch_quit(parts),\n                _ => Ok(vec![ChannelCommandResponse::Err(\n                    ChannelCommandError::InternalError,\n                )]),\n            }\n        } else {\n            Ok(vec![ChannelCommandResponse::Err(\n                ChannelCommandError::UnknownCommand,\n            )])\n        }\n    }};\n}\n"
  },
  {
    "path": "src/channel/message.rs",
    "content": "// Sonic\n//\n// Fast, lightweight and schema-less search backend\n// Copyright: 2019, Valerian Saliou <valerian@valeriansaliou.name>\n// License: Mozilla Public License v2.0 (MPL v2.0)\n\nuse std::io::Write;\nuse std::net::TcpStream;\nuse std::str::{self, SplitWhitespace};\nuse std::time::Instant;\n\nuse super::command::{\n    ChannelCommandBase, ChannelCommandControl, ChannelCommandError, ChannelCommandIngest,\n    ChannelCommandResponse, ChannelCommandResponseArgs, ChannelCommandSearch,\n    COMMANDS_MODE_CONTROL, COMMANDS_MODE_INGEST, COMMANDS_MODE_SEARCH,\n};\nuse super::listen::CHANNEL_AVAILABLE;\nuse super::statistics::{COMMANDS_TOTAL, COMMAND_LATENCY_BEST, COMMAND_LATENCY_WORST};\nuse crate::LINE_FEED;\n\npub struct ChannelMessage;\npub struct ChannelMessageModeSearch;\npub struct ChannelMessageModeIngest;\npub struct ChannelMessageModeControl;\n\nconst COMMAND_ELAPSED_MILLIS_SLOW_WARN: u128 = 50;\n\n#[derive(PartialEq)]\npub enum ChannelMessageResult {\n    Continue,\n    Close,\n}\n\npub trait ChannelMessageMode {\n    fn handle(message: &str) -> Result<Vec<ChannelCommandResponse>, ChannelCommandError>;\n}\n\nimpl ChannelMessage {\n    pub fn on<M: ChannelMessageMode>(\n        mut stream: &TcpStream,\n        message_slice: &[u8],\n    ) -> ChannelMessageResult {\n        let message = str::from_utf8(message_slice).unwrap_or(\"\");\n\n        debug!(\"got channel message: {}\", message);\n\n        let command_start = Instant::now();\n\n        let mut result = ChannelMessageResult::Continue;\n\n        // Process response for issued command\n        let response_args_groups: Vec<ChannelCommandResponseArgs>;\n\n        if !(*CHANNEL_AVAILABLE.read().unwrap()) {\n            // Server going down, reject command\n            response_args_groups =\n                vec![ChannelCommandResponse::Err(ChannelCommandError::ShuttingDown).to_args()];\n        } else {\n            // Handle response arguments to issued command\n            response_args_groups = match M::handle(message) {\n                Ok(resp_groups) => resp_groups\n                    .iter()\n                    .map(|resp| match resp {\n                        ChannelCommandResponse::Ok\n                        | ChannelCommandResponse::Pong\n                        | ChannelCommandResponse::Pending(_)\n                        | ChannelCommandResponse::Result(_)\n                        | ChannelCommandResponse::Event(_, _, _)\n                        | ChannelCommandResponse::Void\n                        | ChannelCommandResponse::Err(_) => resp.to_args(),\n                        ChannelCommandResponse::Ended(_) => {\n                            result = ChannelMessageResult::Close;\n                            resp.to_args()\n                        }\n                    })\n                    .collect(),\n                Err(reason) => vec![ChannelCommandResponse::Err(reason).to_args()],\n            };\n        }\n\n        // Serve response messages on socket\n        for response_args in response_args_groups {\n            if !response_args.0.is_empty() {\n                if let Some(ref values) = response_args.1 {\n                    let values_string = values.join(\" \");\n\n                    write!(stream, \"{} {}{}\", response_args.0, values_string, LINE_FEED)\n                        .expect(\"write failed\");\n\n                    debug!(\n                        \"wrote response with values: {} ({})\",\n                        response_args.0, values_string\n                    );\n                } else {\n                    write!(stream, \"{}{}\", response_args.0, LINE_FEED).expect(\"write failed\");\n\n                    debug!(\"wrote response with no values: {}\", response_args.0);\n                }\n            }\n        }\n\n        // Measure and log time it took to execute command\n        // Notice: this is critical as to raise developer awareness on the performance bits when \\\n        //   altering commands-related code, or when making changes to underlying store executors.\n        let command_took = command_start.elapsed();\n\n        if command_took.as_millis() >= COMMAND_ELAPSED_MILLIS_SLOW_WARN {\n            warn!(\n                \"took a lot of time: {}ms to process channel message\",\n                command_took.as_millis(),\n            );\n        } else {\n            info!(\n                \"took {}ms/{}us/{}ns to process channel message\",\n                command_took.as_millis(),\n                command_took.as_micros(),\n                command_took.as_nanos(),\n            );\n        }\n\n        // Update command statistics\n        {\n            // Update performance measures\n            // Notice: commands that take 0ms are not accounted for there (ie. those are usually \\\n            //   commands that do no work or I/O; they would make statistics less accurate)\n            // Important: acquire write locks instead of read + write locks, as to prevent \\\n            //   deadlocks (explained here: https://github.com/valeriansaliou/sonic/pull/211)\n            let command_took_millis = command_took.as_millis() as u32;\n\n            {\n                let mut worst = COMMAND_LATENCY_WORST.write().unwrap();\n\n                if command_took_millis > *worst {\n                    *worst = command_took_millis;\n                }\n            }\n\n            {\n                let mut best = COMMAND_LATENCY_BEST.write().unwrap();\n\n                if command_took_millis > 0 && (*best == 0 || command_took_millis < *best) {\n                    *best = command_took_millis;\n                }\n            }\n\n            // Increment total commands\n            *COMMANDS_TOTAL.write().unwrap() += 1;\n        }\n\n        result\n    }\n\n    fn extract(message: &str) -> (String, SplitWhitespace<'_>) {\n        // Extract command name and arguments\n        let mut parts = message.split_whitespace();\n        let command = parts.next().unwrap_or(\"\").to_uppercase();\n\n        debug!(\"will dispatch search command: {}\", command);\n\n        (command, parts)\n    }\n}\n\nimpl ChannelMessageMode for ChannelMessageModeSearch {\n    fn handle(message: &str) -> Result<Vec<ChannelCommandResponse>, ChannelCommandError> {\n        gen_channel_message_mode_handle!(message, COMMANDS_MODE_SEARCH, {\n            \"QUERY\" => ChannelCommandSearch::dispatch_query,\n            \"SUGGEST\" => ChannelCommandSearch::dispatch_suggest,\n            \"LIST\" => ChannelCommandSearch::dispatch_list,\n            \"HELP\" => ChannelCommandSearch::dispatch_help,\n        })\n    }\n}\n\nimpl ChannelMessageMode for ChannelMessageModeIngest {\n    fn handle(message: &str) -> Result<Vec<ChannelCommandResponse>, ChannelCommandError> {\n        gen_channel_message_mode_handle!(message, COMMANDS_MODE_INGEST, {\n            \"PUSH\" => ChannelCommandIngest::dispatch_push,\n            \"POP\" => ChannelCommandIngest::dispatch_pop,\n            \"COUNT\" => ChannelCommandIngest::dispatch_count,\n            \"FLUSHC\" => ChannelCommandIngest::dispatch_flushc,\n            \"FLUSHB\" => ChannelCommandIngest::dispatch_flushb,\n            \"FLUSHO\" => ChannelCommandIngest::dispatch_flusho,\n            \"HELP\" => ChannelCommandIngest::dispatch_help,\n        })\n    }\n}\n\nimpl ChannelMessageMode for ChannelMessageModeControl {\n    fn handle(message: &str) -> Result<Vec<ChannelCommandResponse>, ChannelCommandError> {\n        gen_channel_message_mode_handle!(message, COMMANDS_MODE_CONTROL, {\n            \"TRIGGER\" => ChannelCommandControl::dispatch_trigger,\n            \"INFO\" => ChannelCommandControl::dispatch_info,\n            \"HELP\" => ChannelCommandControl::dispatch_help,\n        })\n    }\n}\n"
  },
  {
    "path": "src/channel/mod.rs",
    "content": "// Sonic\n//\n// Fast, lightweight and schema-less search backend\n// Copyright: 2019, Valerian Saliou <valerian@valeriansaliou.name>\n// License: Mozilla Public License v2.0 (MPL v2.0)\n\n#[macro_use]\nmod macros;\n\nmod command;\nmod format;\nmod handle;\nmod message;\nmod mode;\n\npub mod listen;\npub mod statistics;\n"
  },
  {
    "path": "src/channel/mode.rs",
    "content": "// Sonic\n//\n// Fast, lightweight and schema-less search backend\n// Copyright: 2019, Valerian Saliou <valerian@valeriansaliou.name>\n// License: Mozilla Public License v2.0 (MPL v2.0)\n\npub enum ChannelMode {\n    Search,\n    Ingest,\n    Control,\n}\n\nimpl ChannelMode {\n    pub fn from_str(value: &str) -> Result<Self, ()> {\n        match value {\n            \"search\" => Ok(ChannelMode::Search),\n            \"ingest\" => Ok(ChannelMode::Ingest),\n            \"control\" => Ok(ChannelMode::Control),\n            _ => Err(()),\n        }\n    }\n\n    pub fn to_str(&self) -> &'static str {\n        match *self {\n            ChannelMode::Search => \"search\",\n            ChannelMode::Ingest => \"ingest\",\n            ChannelMode::Control => \"control\",\n        }\n    }\n}\n"
  },
  {
    "path": "src/channel/statistics.rs",
    "content": "// Sonic\n//\n// Fast, lightweight and schema-less search backend\n// Copyright: 2019, Valerian Saliou <valerian@valeriansaliou.name>\n// License: Mozilla Public License v2.0 (MPL v2.0)\n\nuse std::ops::Deref;\nuse std::sync::RwLock;\nuse std::time::Instant;\n\nuse crate::store::fst::StoreFSTPool;\nuse crate::store::kv::StoreKVPool;\n\nlazy_static! {\n    static ref START_TIME: Instant = Instant::now();\n    pub static ref CLIENTS_CONNECTED: RwLock<u32> = RwLock::new(0);\n    pub static ref COMMANDS_TOTAL: RwLock<u64> = RwLock::new(0);\n    pub static ref COMMAND_LATENCY_BEST: RwLock<u32> = RwLock::new(0);\n    pub static ref COMMAND_LATENCY_WORST: RwLock<u32> = RwLock::new(0);\n}\n\n#[derive(Default)]\npub struct ChannelStatistics {\n    pub uptime: u64,\n    pub clients_connected: u32,\n    pub commands_total: u64,\n    pub command_latency_best: u32,\n    pub command_latency_worst: u32,\n    pub kv_open_count: usize,\n    pub fst_open_count: usize,\n    pub fst_consolidate_count: usize,\n}\n\npub fn ensure_states() {\n    // Ensure all statics are initialized (a `deref` is enough to lazily initialize them)\n    let (_, _, _, _, _) = (\n        START_TIME.deref(),\n        CLIENTS_CONNECTED.deref(),\n        COMMANDS_TOTAL.deref(),\n        COMMAND_LATENCY_BEST.deref(),\n        COMMAND_LATENCY_WORST.deref(),\n    );\n}\n\nimpl ChannelStatistics {\n    pub fn gather() -> ChannelStatistics {\n        let (kv_count, fst_count) = (StoreKVPool::count(), StoreFSTPool::count());\n\n        ChannelStatistics {\n            uptime: START_TIME.elapsed().as_secs(),\n            clients_connected: *CLIENTS_CONNECTED.read().unwrap(),\n            commands_total: *COMMANDS_TOTAL.read().unwrap(),\n            command_latency_best: *COMMAND_LATENCY_BEST.read().unwrap(),\n            command_latency_worst: *COMMAND_LATENCY_WORST.read().unwrap(),\n            kv_open_count: kv_count,\n            fst_open_count: fst_count.0,\n            fst_consolidate_count: fst_count.1,\n        }\n    }\n}\n"
  },
  {
    "path": "src/config/defaults.rs",
    "content": "// Sonic\n//\n// Fast, lightweight and schema-less search backend\n// Copyright: 2019, Valerian Saliou <valerian@valeriansaliou.name>\n// License: Mozilla Public License v2.0 (MPL v2.0)\n\nuse std::net::SocketAddr;\nuse std::path::PathBuf;\n\npub fn server_log_level() -> String {\n    \"error\".to_string()\n}\n\npub fn channel_inet() -> SocketAddr {\n    \"[::1]:1491\".parse().unwrap()\n}\n\npub fn channel_tcp_timeout() -> u64 {\n    300\n}\n\npub fn channel_search_query_limit_default() -> u16 {\n    10\n}\n\npub fn channel_search_query_limit_maximum() -> u16 {\n    100\n}\n\npub fn channel_search_query_alternates_try() -> usize {\n    4\n}\n\npub fn channel_search_suggest_limit_default() -> u16 {\n    5\n}\n\npub fn channel_search_suggest_limit_maximum() -> u16 {\n    20\n}\n\npub fn channel_search_list_limit_default() -> u16 {\n    100\n}\n\npub fn channel_search_list_limit_maximum() -> u16 {\n    500\n}\n\npub fn store_kv_path() -> PathBuf {\n    PathBuf::from(\"./data/store/kv/\")\n}\n\npub fn store_kv_retain_word_objects() -> usize {\n    1000\n}\n\npub fn store_kv_pool_inactive_after() -> u64 {\n    1800\n}\n\npub fn store_kv_database_flush_after() -> u64 {\n    900\n}\n\npub fn store_kv_database_compress() -> bool {\n    true\n}\n\npub fn store_kv_database_parallelism() -> u16 {\n    2\n}\n\npub fn store_kv_database_max_compactions() -> u16 {\n    1\n}\n\npub fn store_kv_database_max_flushes() -> u16 {\n    1\n}\n\npub fn store_kv_database_write_buffer() -> usize {\n    16384\n}\n\npub fn store_kv_database_write_ahead_log() -> bool {\n    true\n}\n\npub fn store_fst_path() -> PathBuf {\n    PathBuf::from(\"./data/store/fst/\")\n}\n\npub fn store_fst_pool_inactive_after() -> u64 {\n    300\n}\n\npub fn store_fst_graph_consolidate_after() -> u64 {\n    180\n}\n\npub fn store_fst_graph_max_size() -> usize {\n    2048\n}\n\npub fn store_fst_graph_max_words() -> usize {\n    250000\n}\n"
  },
  {
    "path": "src/config/env_var.rs",
    "content": "// Sonic\n//\n// Fast, lightweight and schema-less search backend\n// Copyright: 2019, Valerian Saliou <valerian@valeriansaliou.name>\n// License: Mozilla Public License v2.0 (MPL v2.0)\n\nuse regex::Regex;\nuse serde::{Deserialize, Deserializer};\nuse std::net::SocketAddr;\nuse std::path::PathBuf;\n\n#[derive(Deserialize, PartialEq)]\nstruct WrappedString(String);\n\npub fn str<'de, D>(deserializer: D) -> Result<String, D::Error>\nwhere\n    D: Deserializer<'de>,\n{\n    let value = String::deserialize(deserializer)?;\n\n    match is_env_var(&value) {\n        true => Ok(get_env_var(&value)),\n        false => Ok(value),\n    }\n}\n\npub fn opt_str<'de, D>(deserializer: D) -> Result<Option<String>, D::Error>\nwhere\n    D: Deserializer<'de>,\n{\n    Option::<WrappedString>::deserialize(deserializer).map(|option: Option<WrappedString>| {\n        option.map(|wrapped: WrappedString| {\n            let value = wrapped.0;\n\n            match is_env_var(&value) {\n                true => get_env_var(&value),\n                false => value,\n            }\n        })\n    })\n}\n\npub fn socket_addr<'de, D>(deserializer: D) -> Result<SocketAddr, D::Error>\nwhere\n    D: Deserializer<'de>,\n{\n    let value = String::deserialize(deserializer)?;\n\n    match is_env_var(&value) {\n        true => Ok(get_env_var(&value).parse().unwrap()),\n        false => Ok(value.parse().unwrap()),\n    }\n}\n\npub fn path_buf<'de, D>(deserializer: D) -> Result<PathBuf, D::Error>\nwhere\n    D: Deserializer<'de>,\n{\n    let value = String::deserialize(deserializer)?;\n\n    match is_env_var(&value) {\n        true => Ok(PathBuf::from(get_env_var(&value))),\n        false => Ok(PathBuf::from(value)),\n    }\n}\n\nfn is_env_var(value: &str) -> bool {\n    Regex::new(r\"^\\$\\{env\\.\\w+\\}$\")\n        .expect(\"env_var: regex is invalid\")\n        .is_match(value)\n}\n\nfn get_env_var(wrapped_key: &str) -> String {\n    let key: String = String::from(wrapped_key)\n        .drain(6..(wrapped_key.len() - 1))\n        .collect();\n\n    std::env::var(key.clone()).unwrap_or_else(|_| panic!(\"env_var: variable '{}' is not set\", key))\n}\n\n#[cfg(test)]\nmod tests {\n    use super::*;\n\n    #[test]\n    fn it_checks_environment_variable_patterns() {\n        assert!(is_env_var(\"${env.XXX}\"));\n        assert!(!is_env_var(\"${env.XXX\"));\n        assert!(!is_env_var(\"${env.XXX}a\"));\n        assert!(!is_env_var(\"a${env.XXX}\"));\n        assert!(!is_env_var(\"{env.XXX}\"));\n        assert!(!is_env_var(\"$env.XXX}\"));\n        assert!(!is_env_var(\"${envXXX}\"));\n        assert!(!is_env_var(\"${.XXX}\"));\n        assert!(!is_env_var(\"${XXX}\"));\n    }\n\n    #[test]\n    fn it_gets_environment_variable() {\n        std::env::set_var(\"TEST\", \"test\");\n\n        assert_eq!(get_env_var(\"${env.TEST}\"), \"test\");\n\n        std::env::remove_var(\"TEST\");\n    }\n}\n"
  },
  {
    "path": "src/config/logger.rs",
    "content": "// Sonic\n//\n// Fast, lightweight and schema-less search backend\n// Copyright: 2019, Valerian Saliou <valerian@valeriansaliou.name>\n// License: Mozilla Public License v2.0 (MPL v2.0)\n\nuse log::{Level, LevelFilter, Metadata, Record, SetLoggerError};\n\npub struct ConfigLogger;\n\nimpl log::Log for ConfigLogger {\n    fn enabled(&self, metadata: &Metadata) -> bool {\n        metadata.level() <= Level::Debug\n    }\n\n    fn log(&self, record: &Record) {\n        if self.enabled(record.metadata()) {\n            println!(\"({}) - {}\", record.level(), record.args());\n        }\n    }\n\n    fn flush(&self) {}\n}\n\nimpl ConfigLogger {\n    pub fn init(level: LevelFilter) -> Result<(), SetLoggerError> {\n        log::set_max_level(level);\n        log::set_logger(&ConfigLogger)\n    }\n}\n"
  },
  {
    "path": "src/config/mod.rs",
    "content": "// Sonic\n//\n// Fast, lightweight and schema-less search backend\n// Copyright: 2019, Valerian Saliou <valerian@valeriansaliou.name>\n// License: Mozilla Public License v2.0 (MPL v2.0)\n\nmod defaults;\nmod env_var;\n\npub mod logger;\npub mod options;\npub mod reader;\n"
  },
  {
    "path": "src/config/options.rs",
    "content": "// Sonic\n//\n// Fast, lightweight and schema-less search backend\n// Copyright: 2019, Valerian Saliou <valerian@valeriansaliou.name>\n// License: Mozilla Public License v2.0 (MPL v2.0)\n\nuse std::net::SocketAddr;\nuse std::path::PathBuf;\n\nuse super::defaults;\nuse super::env_var;\n\n#[derive(Deserialize)]\npub struct Config {\n    pub server: ConfigServer,\n    pub channel: ConfigChannel,\n    pub store: ConfigStore,\n}\n\n#[derive(Deserialize)]\npub struct ConfigServer {\n    #[serde(\n        default = \"defaults::server_log_level\",\n        deserialize_with = \"env_var::str\"\n    )]\n    pub log_level: String,\n}\n\n#[derive(Deserialize)]\npub struct ConfigChannel {\n    #[serde(\n        default = \"defaults::channel_inet\",\n        deserialize_with = \"env_var::socket_addr\"\n    )]\n    pub inet: SocketAddr,\n\n    #[serde(default = \"defaults::channel_tcp_timeout\")]\n    pub tcp_timeout: u64,\n\n    #[serde(default, deserialize_with = \"env_var::opt_str\")]\n    pub auth_password: Option<String>,\n\n    pub search: ConfigChannelSearch,\n}\n\n#[derive(Deserialize)]\npub struct ConfigChannelSearch {\n    #[serde(default = \"defaults::channel_search_query_limit_default\")]\n    pub query_limit_default: u16,\n\n    #[serde(default = \"defaults::channel_search_query_limit_maximum\")]\n    pub query_limit_maximum: u16,\n\n    #[serde(default = \"defaults::channel_search_query_alternates_try\")]\n    pub query_alternates_try: usize,\n\n    #[serde(default = \"defaults::channel_search_suggest_limit_default\")]\n    pub suggest_limit_default: u16,\n\n    #[serde(default = \"defaults::channel_search_suggest_limit_maximum\")]\n    pub suggest_limit_maximum: u16,\n\n    #[serde(default = \"defaults::channel_search_list_limit_default\")]\n    pub list_limit_default: u16,\n\n    #[serde(default = \"defaults::channel_search_list_limit_maximum\")]\n    pub list_limit_maximum: u16,\n}\n\n#[derive(Deserialize)]\npub struct ConfigStore {\n    pub kv: ConfigStoreKV,\n    pub fst: ConfigStoreFST,\n}\n\n#[derive(Deserialize)]\npub struct ConfigStoreKV {\n    #[serde(\n        default = \"defaults::store_kv_path\",\n        deserialize_with = \"env_var::path_buf\"\n    )]\n    pub path: PathBuf,\n\n    #[serde(default = \"defaults::store_kv_retain_word_objects\")]\n    pub retain_word_objects: usize,\n\n    pub pool: ConfigStoreKVPool,\n    pub database: ConfigStoreKVDatabase,\n}\n\n#[derive(Deserialize)]\npub struct ConfigStoreKVPool {\n    #[serde(default = \"defaults::store_kv_pool_inactive_after\")]\n    pub inactive_after: u64,\n}\n\n#[derive(Deserialize)]\npub struct ConfigStoreKVDatabase {\n    #[serde(default = \"defaults::store_kv_database_flush_after\")]\n    pub flush_after: u64,\n\n    #[serde(default = \"defaults::store_kv_database_compress\")]\n    pub compress: bool,\n\n    #[serde(default = \"defaults::store_kv_database_parallelism\")]\n    pub parallelism: u16,\n\n    pub max_files: Option<u32>,\n\n    #[serde(default = \"defaults::store_kv_database_max_compactions\")]\n    pub max_compactions: u16,\n\n    #[serde(default = \"defaults::store_kv_database_max_flushes\")]\n    pub max_flushes: u16,\n\n    #[serde(default = \"defaults::store_kv_database_write_buffer\")]\n    pub write_buffer: usize,\n\n    #[serde(default = \"defaults::store_kv_database_write_ahead_log\")]\n    pub write_ahead_log: bool,\n}\n\n#[derive(Deserialize)]\npub struct ConfigStoreFST {\n    #[serde(\n        default = \"defaults::store_fst_path\",\n        deserialize_with = \"env_var::path_buf\"\n    )]\n    pub path: PathBuf,\n\n    pub pool: ConfigStoreFSTPool,\n    pub graph: ConfigStoreFSTGraph,\n}\n\n#[derive(Deserialize)]\npub struct ConfigStoreFSTPool {\n    #[serde(default = \"defaults::store_fst_pool_inactive_after\")]\n    pub inactive_after: u64,\n}\n\n#[derive(Deserialize)]\npub struct ConfigStoreFSTGraph {\n    #[serde(default = \"defaults::store_fst_graph_consolidate_after\")]\n    pub consolidate_after: u64,\n\n    #[serde(default = \"defaults::store_fst_graph_max_size\")]\n    pub max_size: usize,\n\n    #[serde(default = \"defaults::store_fst_graph_max_words\")]\n    pub max_words: usize,\n}\n"
  },
  {
    "path": "src/config/reader.rs",
    "content": "// Sonic\n//\n// Fast, lightweight and schema-less search backend\n// Copyright: 2019, Valerian Saliou <valerian@valeriansaliou.name>\n// License: Mozilla Public License v2.0 (MPL v2.0)\n\nuse std::fs::File;\nuse std::io::Read;\n\nuse super::options::Config;\nuse crate::APP_ARGS;\n\npub struct ConfigReader;\n\nimpl ConfigReader {\n    pub fn make() -> Config {\n        debug!(\"reading config file: {}\", &APP_ARGS.config);\n\n        let mut file = File::open(&APP_ARGS.config).expect(\"cannot find config file\");\n        let mut conf = String::new();\n\n        file.read_to_string(&mut conf)\n            .expect(\"cannot read config file\");\n\n        debug!(\"read config file: {}\", &APP_ARGS.config);\n\n        // Parse configuration\n        let config = toml::from_str(&conf).expect(\"syntax error in config file\");\n\n        // Validate configuration\n        Self::validate(&config);\n\n        config\n    }\n\n    fn validate(config: &Config) {\n        // Check 'write_buffer' for KV\n        if config.store.kv.database.write_buffer == 0 {\n            panic!(\"write_buffer for kv must not be zero\");\n        }\n\n        // Check 'flush_after' for KV\n        if config.store.kv.database.flush_after >= config.store.kv.pool.inactive_after {\n            panic!(\"flush_after for kv must be strictly lower than inactive_after\");\n        }\n\n        // Check 'consolidate_after' for FST\n        if config.store.fst.graph.consolidate_after >= config.store.fst.pool.inactive_after {\n            panic!(\"consolidate_after for fst must be strictly lower than inactive_after\");\n        }\n    }\n}\n"
  },
  {
    "path": "src/executor/count.rs",
    "content": "// Sonic\n//\n// Fast, lightweight and schema-less search backend\n// Copyright: 2019, Valerian Saliou <valerian@valeriansaliou.name>\n// License: Mozilla Public License v2.0 (MPL v2.0)\n\nuse crate::store::fst::StoreFSTPool;\nuse crate::store::fst::{StoreFSTActionBuilder, StoreFSTMisc};\nuse crate::store::item::StoreItem;\nuse crate::store::kv::StoreKVActionBuilder;\nuse crate::store::kv::{StoreKVAcquireMode, StoreKVPool};\n\npub struct ExecutorCount;\n\nimpl ExecutorCount {\n    pub fn execute(store: StoreItem) -> Result<u32, ()> {\n        match store {\n            // Count terms in (collection, bucket, object) from KV\n            StoreItem(collection, Some(bucket), Some(object)) => {\n                // Important: acquire database access read lock, and reference it in context. This \\\n                //   prevents the database from being erased while using it in this block.\n                general_kv_access_lock_read!();\n\n                if let Ok(kv_store) = StoreKVPool::acquire(StoreKVAcquireMode::OpenOnly, collection)\n                {\n                    // Important: acquire bucket store read lock\n                    executor_kv_lock_read!(kv_store);\n\n                    let kv_action = StoreKVActionBuilder::access(bucket, kv_store);\n\n                    // Try to resolve existing OID to IID\n                    let oid = object.as_str();\n\n                    kv_action\n                        .get_oid_to_iid(oid)\n                        .unwrap_or(None)\n                        .map(|iid| {\n                            // List terms for IID\n                            if let Some(terms) = kv_action.get_iid_to_terms(iid).unwrap_or(None) {\n                                terms.len() as u32\n                            } else {\n                                0\n                            }\n                        })\n                        .ok_or(())\n                        .or(Ok(0))\n                } else {\n                    Err(())\n                }\n            }\n            // Count terms in (collection, bucket) from FST\n            StoreItem(collection, Some(bucket), None) => {\n                // Important: acquire graph access read lock, and reference it in context. This \\\n                //   prevents the graph from being erased while using it in this block.\n                general_fst_access_lock_read!();\n\n                if let Ok(fst_store) = StoreFSTPool::acquire(collection, bucket) {\n                    let fst_action = StoreFSTActionBuilder::access(fst_store);\n\n                    Ok(fst_action.count_words() as u32)\n                } else {\n                    Err(())\n                }\n            }\n            // Count buckets in (collection) from FS\n            StoreItem(collection, None, None) => {\n                StoreFSTMisc::count_collection_buckets(collection).map(|count| count as u32)\n            }\n            _ => Err(()),\n        }\n    }\n}\n"
  },
  {
    "path": "src/executor/flushb.rs",
    "content": "// Sonic\n//\n// Fast, lightweight and schema-less search backend\n// Copyright: 2019, Valerian Saliou <valerian@valeriansaliou.name>\n// License: Mozilla Public License v2.0 (MPL v2.0)\n\nuse crate::store::fst::StoreFSTActionBuilder;\nuse crate::store::item::StoreItem;\nuse crate::store::kv::{StoreKVAcquireMode, StoreKVActionBuilder, StoreKVPool};\n\npub struct ExecutorFlushB;\n\nimpl ExecutorFlushB {\n    pub fn execute(store: StoreItem) -> Result<u32, ()> {\n        if let StoreItem(collection, Some(bucket), None) = store {\n            // Important: acquire database access read lock, and reference it in context. This \\\n            //   prevents the database from being erased while using it in this block.\n            // Notice: acquire FST lock in write mode, as we will erase it.\n            general_kv_access_lock_read!();\n            general_fst_access_lock_write!();\n\n            if let Ok(kv_store) = StoreKVPool::acquire(StoreKVAcquireMode::OpenOnly, collection) {\n                // Important: acquire bucket store write lock\n                executor_kv_lock_write!(kv_store);\n\n                if kv_store.is_some() {\n                    // Store exists, proceed erasure.\n                    debug!(\n                        \"collection store exists, erasing: {} from {}\",\n                        bucket.as_str(),\n                        collection.as_str()\n                    );\n\n                    let kv_action = StoreKVActionBuilder::access(bucket, kv_store);\n\n                    // Notice: we cannot use the provided KV bucket erasure helper there, as \\\n                    //   erasing a bucket requires a database lock, which would incur a dead-lock, \\\n                    //   thus we need to perform the erasure from there.\n                    if let Ok(erase_count) = kv_action.batch_erase_bucket() {\n                        if StoreFSTActionBuilder::erase(collection, Some(bucket)).is_ok() {\n                            debug!(\"done with bucket erasure\");\n\n                            return Ok(erase_count);\n                        }\n                    }\n                } else {\n                    // Store does not exist, consider as already erased.\n                    debug!(\n                        \"collection store does not exist, consider {} from {} already erased\",\n                        bucket.as_str(),\n                        collection.as_str()\n                    );\n\n                    return Ok(0);\n                }\n            }\n        }\n\n        Err(())\n    }\n}\n"
  },
  {
    "path": "src/executor/flushc.rs",
    "content": "// Sonic\n//\n// Fast, lightweight and schema-less search backend\n// Copyright: 2019, Valerian Saliou <valerian@valeriansaliou.name>\n// License: Mozilla Public License v2.0 (MPL v2.0)\n\nuse crate::store::fst::StoreFSTActionBuilder;\nuse crate::store::item::StoreItem;\nuse crate::store::kv::StoreKVActionBuilder;\n\npub struct ExecutorFlushC;\n\nimpl ExecutorFlushC {\n    pub fn execute(store: StoreItem) -> Result<u32, ()> {\n        // Important: do not acquire the store from there, as otherwise it will remain open \\\n        //   even if dropped in the inner function, as this caller would still own a reference to \\\n        //   it.\n        if let StoreItem(collection, None, None) = store {\n            // Acquire KV + FST locks in write mode, as we will erase them, we need to prevent any \\\n            //   other consumer to use them.\n            general_kv_access_lock_write!();\n            general_fst_access_lock_write!();\n\n            match (\n                StoreKVActionBuilder::erase(collection, None),\n                StoreFSTActionBuilder::erase(collection, None),\n            ) {\n                (Ok(erase_count), Ok(_)) => Ok(erase_count),\n                _ => Err(()),\n            }\n        } else {\n            Err(())\n        }\n    }\n}\n"
  },
  {
    "path": "src/executor/flusho.rs",
    "content": "// Sonic\n//\n// Fast, lightweight and schema-less search backend\n// Copyright: 2019, Valerian Saliou <valerian@valeriansaliou.name>\n// License: Mozilla Public License v2.0 (MPL v2.0)\n\nuse crate::store::item::StoreItem;\nuse crate::store::kv::{StoreKVAcquireMode, StoreKVActionBuilder, StoreKVPool};\n\npub struct ExecutorFlushO;\n\nimpl ExecutorFlushO {\n    pub fn execute(store: StoreItem) -> Result<u32, ()> {\n        if let StoreItem(collection, Some(bucket), Some(object)) = store {\n            // Important: acquire database access read lock, and reference it in context. This \\\n            //   prevents the database from being erased while using it in this block.\n            general_kv_access_lock_read!();\n\n            if let Ok(kv_store) = StoreKVPool::acquire(StoreKVAcquireMode::OpenOnly, collection) {\n                // Important: acquire bucket store write lock\n                executor_kv_lock_write!(kv_store);\n\n                let kv_action = StoreKVActionBuilder::access(bucket, kv_store);\n\n                // Try to resolve existing OID to IID (if it does not exist, there is nothing to \\\n                //   be flushed)\n                let oid = object.as_str();\n\n                if let Ok(iid_value) = kv_action.get_oid_to_iid(oid) {\n                    let mut count_flushed = 0;\n\n                    if let Some(iid) = iid_value {\n                        // Resolve terms associated to IID\n                        let iid_terms = {\n                            if let Ok(iid_terms_value) = kv_action.get_iid_to_terms(iid) {\n                                iid_terms_value.unwrap_or_default()\n                            } else {\n                                error!(\"failed getting flusho executor iid-to-terms\");\n\n                                Vec::new()\n                            }\n                        };\n\n                        // Flush bucket (batch operation, as it is shared w/ other executors)\n                        if let Ok(batch_count) = kv_action.batch_flush_bucket(iid, oid, &iid_terms)\n                        {\n                            count_flushed += batch_count;\n                        } else {\n                            error!(\"failed executing batch-flush-bucket in flusho executor\");\n                        }\n                    }\n\n                    return Ok(count_flushed);\n                } else {\n                    error!(\"failed getting flusho executor oid-to-iid\");\n                }\n            }\n        }\n\n        Err(())\n    }\n}\n"
  },
  {
    "path": "src/executor/list.rs",
    "content": "// Sonic\n//\n// Fast, lightweight and schema-less search backend\n// Copyright: 2022, Troy Kohler <troy.kohler@zalando.de>\n// License: Mozilla Public License v2.0 (MPL v2.0)\n\nuse crate::query::types::{QuerySearchID, QuerySearchLimit, QuerySearchOffset};\nuse crate::store::fst::StoreFSTActionBuilder;\nuse crate::store::fst::StoreFSTPool;\nuse crate::store::item::StoreItem;\n\npub struct ExecutorList;\n\nimpl ExecutorList {\n    pub fn execute(\n        store: StoreItem,\n        _event_id: QuerySearchID,\n        limit: QuerySearchLimit,\n        offset: QuerySearchOffset,\n    ) -> Result<Vec<String>, ()> {\n        if let StoreItem(collection, Some(bucket), None) = store {\n            // Important: acquire graph access read lock, and reference it in context. This \\\n            //   prevents the graph from being erased while using it in this block.\n            general_fst_access_lock_read!();\n\n            if let Ok(fst_store) = StoreFSTPool::acquire(collection, bucket) {\n                let fst_action = StoreFSTActionBuilder::access(fst_store);\n\n                debug!(\"running list\");\n\n                return fst_action.list_words(limit as usize, offset as usize);\n            }\n        }\n\n        Err(())\n    }\n}\n"
  },
  {
    "path": "src/executor/macros.rs",
    "content": "// Sonic\n//\n// Fast, lightweight and schema-less search backend\n// Copyright: 2019, Valerian Saliou <valerian@valeriansaliou.name>\n// License: Mozilla Public License v2.0 (MPL v2.0)\n\n#[macro_export]\nmacro_rules! executor_ensure_op {\n    ($operation:expr) => {\n        match $operation {\n            Ok(_) => {}\n            Err(err) => error!(\"executor operation failed: {:?}\", err),\n        }\n    };\n}\n\n#[macro_export]\nmacro_rules! executor_kv_lock_read {\n    ($store:ident) => {\n        let kv_store_reference = $store.clone();\n\n        let _kv_store_lock = kv_store_reference\n            .as_ref()\n            .map(|inner| inner.lock.read().unwrap());\n    };\n}\n\n#[macro_export]\nmacro_rules! executor_kv_lock_write {\n    ($store:ident) => {\n        let kv_store_reference = $store.clone();\n\n        let _kv_store_lock = kv_store_reference\n            .as_ref()\n            .map(|inner| inner.lock.write().unwrap());\n    };\n}\n\n#[macro_export]\nmacro_rules! general_kv_access_lock_read {\n    () => {\n        use crate::store::kv::STORE_ACCESS_LOCK;\n\n        let _kv_access = STORE_ACCESS_LOCK.read().unwrap();\n    };\n}\n\n#[macro_export]\nmacro_rules! general_kv_access_lock_write {\n    () => {\n        use crate::store::kv::STORE_ACCESS_LOCK;\n\n        let _kv_access = STORE_ACCESS_LOCK.write().unwrap();\n    };\n}\n\n#[macro_export]\nmacro_rules! general_fst_access_lock_read {\n    () => {\n        use crate::store::fst::GRAPH_ACCESS_LOCK;\n\n        let _fst_access = GRAPH_ACCESS_LOCK.read().unwrap();\n    };\n}\n\n#[macro_export]\nmacro_rules! general_fst_access_lock_write {\n    () => {\n        use crate::store::fst::GRAPH_ACCESS_LOCK;\n\n        let _fst_access = GRAPH_ACCESS_LOCK.write().unwrap();\n    };\n}\n"
  },
  {
    "path": "src/executor/mod.rs",
    "content": "// Sonic\n//\n// Fast, lightweight and schema-less search backend\n// Copyright: 2019, Valerian Saliou <valerian@valeriansaliou.name>\n// License: Mozilla Public License v2.0 (MPL v2.0)\n\n#[macro_use]\nmod macros;\n\npub mod count;\npub mod flushb;\npub mod flushc;\npub mod flusho;\npub mod list;\npub mod pop;\npub mod push;\npub mod search;\npub mod suggest;\n"
  },
  {
    "path": "src/executor/pop.rs",
    "content": "// Sonic\n//\n// Fast, lightweight and schema-less search backend\n// Copyright: 2019, Valerian Saliou <valerian@valeriansaliou.name>\n// License: Mozilla Public License v2.0 (MPL v2.0)\n\nuse linked_hash_set::LinkedHashSet;\nuse std::iter::FromIterator;\n\nuse crate::lexer::token::TokenLexer;\nuse crate::store::fst::{StoreFSTActionBuilder, StoreFSTPool};\nuse crate::store::identifiers::StoreTermHashed;\nuse crate::store::item::StoreItem;\nuse crate::store::kv::{StoreKVAcquireMode, StoreKVActionBuilder, StoreKVPool};\n\npub struct ExecutorPop;\n\nimpl ExecutorPop {\n    pub fn execute<'a>(store: StoreItem<'a>, lexer: TokenLexer<'a>) -> Result<u32, ()> {\n        if let StoreItem(collection, Some(bucket), Some(object)) = store {\n            // Important: acquire database access read lock, and reference it in context. This \\\n            //   prevents the database from being erased while using it in this block.\n            general_kv_access_lock_read!();\n            general_fst_access_lock_read!();\n\n            if let (Ok(kv_store), Ok(fst_store)) = (\n                StoreKVPool::acquire(StoreKVAcquireMode::OpenOnly, collection),\n                StoreFSTPool::acquire(collection, bucket),\n            ) {\n                // Important: acquire bucket store write lock\n                executor_kv_lock_write!(kv_store);\n\n                let (kv_action, fst_action) = (\n                    StoreKVActionBuilder::access(bucket, kv_store),\n                    StoreFSTActionBuilder::access(fst_store),\n                );\n\n                // Try to resolve existing OID to IID (if it does not exist, there is nothing to \\\n                //   be flushed)\n                let oid = object.as_str();\n\n                if let Ok(iid_value) = kv_action.get_oid_to_iid(oid) {\n                    let mut count_popped = 0;\n\n                    if let Some(iid) = iid_value {\n                        // Try to resolve existing search terms from IID, and perform an algebraic \\\n                        //   AND on all popped terms to generate a list of terms to be cleaned up.\n                        if let Ok(Some(iid_terms_hashed_vec)) = kv_action.get_iid_to_terms(iid) {\n                            info!(\n                                \"got pop executor stored iid-to-terms: {:?}\",\n                                iid_terms_hashed_vec\n                            );\n\n                            let pop_terms: Vec<(String, StoreTermHashed)> = lexer.collect();\n\n                            let iid_terms_hashed: LinkedHashSet<StoreTermHashed> =\n                                LinkedHashSet::from_iter(iid_terms_hashed_vec.iter().copied());\n\n                            let remaining_terms: LinkedHashSet<StoreTermHashed> = iid_terms_hashed\n                                .difference(&LinkedHashSet::from_iter(\n                                    pop_terms.iter().map(|item| item.1),\n                                ))\n                                .copied()\n                                .collect();\n\n                            debug!(\n                                \"got pop executor terms remaining terms: {:?} for iid: {}\",\n                                remaining_terms, iid\n                            );\n\n                            count_popped = (iid_terms_hashed.len() - remaining_terms.len()) as u32;\n\n                            if count_popped > 0 {\n                                if remaining_terms.is_empty() {\n                                    info!(\"nuke whole bucket for pop executor\");\n\n                                    // Flush bucket (batch operation, as it is shared w/ other \\\n                                    //   executors)\n                                    executor_ensure_op!(kv_action.batch_flush_bucket(\n                                        iid,\n                                        oid,\n                                        &iid_terms_hashed_vec\n                                    ));\n                                } else {\n                                    info!(\"nuke only certain terms for pop executor\");\n\n                                    // Nuke IID in Term-to-IIDs list\n                                    for (pop_term, pop_term_hashed) in &pop_terms {\n                                        // Check that term is linked to IID (and should be removed)\n                                        if iid_terms_hashed.contains(pop_term_hashed) {\n                                            if let Ok(Some(mut pop_term_iids)) =\n                                                kv_action.get_term_to_iids(*pop_term_hashed)\n                                            {\n                                                // Remove IID from list of IIDs to be popped\n                                                pop_term_iids.retain(|cur_iid| cur_iid != &iid);\n\n                                                if pop_term_iids.is_empty() {\n                                                    // IIDs list was empty, delete whole key\n                                                    executor_ensure_op!(kv_action\n                                                        .delete_term_to_iids(*pop_term_hashed));\n\n                                                    // Pop from FST graph (does not exist anymore)\n                                                    if fst_action.pop_word(pop_term) {\n                                                        debug!(\n                                                            \"pop term hash nuked from graph: {}\",\n                                                            pop_term_hashed\n                                                        );\n                                                    }\n                                                } else {\n                                                    // Re-build IIDs list w/o current IID\n                                                    executor_ensure_op!(kv_action\n                                                        .set_term_to_iids(\n                                                            *pop_term_hashed,\n                                                            &pop_term_iids,\n                                                        ));\n                                                }\n                                            } else {\n                                                error!(\n                                                    \"failed getting term-to-iids in pop executor\"\n                                                );\n                                            }\n                                        }\n                                    }\n\n                                    // Bump IID-to-Terms list\n                                    let remaining_terms_vec: Vec<StoreTermHashed> =\n                                        Vec::from_iter(remaining_terms.into_iter());\n\n                                    executor_ensure_op!(\n                                        kv_action.set_iid_to_terms(iid, &remaining_terms_vec)\n                                    );\n                                }\n                            }\n                        } else {\n                            error!(\"failed getting iid-to-terms in pop executor\");\n                        }\n                    }\n\n                    return Ok(count_popped);\n                }\n            }\n        }\n\n        Err(())\n    }\n}\n"
  },
  {
    "path": "src/executor/push.rs",
    "content": "// Sonic\n//\n// Fast, lightweight and schema-less search backend\n// Copyright: 2019, Valerian Saliou <valerian@valeriansaliou.name>\n// License: Mozilla Public License v2.0 (MPL v2.0)\n\nuse linked_hash_set::LinkedHashSet;\nuse std::iter::FromIterator;\n\nuse crate::lexer::token::TokenLexer;\nuse crate::store::fst::{StoreFSTActionBuilder, StoreFSTPool};\nuse crate::store::identifiers::{StoreMetaKey, StoreMetaValue, StoreTermHashed};\nuse crate::store::item::StoreItem;\nuse crate::store::kv::{StoreKVAcquireMode, StoreKVActionBuilder, StoreKVPool};\nuse crate::APP_CONF;\n\npub struct ExecutorPush;\n\nimpl ExecutorPush {\n    pub fn execute<'a>(store: StoreItem<'a>, lexer: TokenLexer<'a>) -> Result<(), ()> {\n        if let StoreItem(collection, Some(bucket), Some(object)) = store {\n            // Important: acquire database access read lock, and reference it in context. This \\\n            //   prevents the database from being erased while using it in this block.\n            general_kv_access_lock_read!();\n            general_fst_access_lock_read!();\n\n            if let (Ok(kv_store), Ok(fst_store)) = (\n                StoreKVPool::acquire(StoreKVAcquireMode::Any, collection),\n                StoreFSTPool::acquire(collection, bucket),\n            ) {\n                // Important: acquire bucket store write lock\n                executor_kv_lock_write!(kv_store);\n\n                let (kv_action, fst_action) = (\n                    StoreKVActionBuilder::access(bucket, kv_store),\n                    StoreFSTActionBuilder::access(fst_store),\n                );\n\n                // Try to resolve existing OID to IID, otherwise initialize IID (store the \\\n                //   bi-directional relationship)\n                let oid = object.as_str();\n                let iid = kv_action.get_oid_to_iid(oid).unwrap_or(None).or_else(|| {\n                    info!(\"must initialize push executor oid-to-iid and iid-to-oid\");\n\n                    if let Ok(iid_incr) = kv_action.get_meta_to_value(StoreMetaKey::IIDIncr) {\n                        let iid_incr = if let Some(iid_incr) = iid_incr {\n                            match iid_incr {\n                                StoreMetaValue::IIDIncr(iid_incr) => iid_incr + 1,\n                            }\n                        } else {\n                            0\n                        };\n\n                        // Bump last stored increment\n                        if kv_action\n                            .set_meta_to_value(\n                                StoreMetaKey::IIDIncr,\n                                StoreMetaValue::IIDIncr(iid_incr),\n                            )\n                            .is_ok()\n                        {\n                            // Associate OID <> IID (bidirectional)\n                            executor_ensure_op!(kv_action.set_oid_to_iid(oid, iid_incr));\n                            executor_ensure_op!(kv_action.set_iid_to_oid(iid_incr, oid));\n\n                            Some(iid_incr)\n                        } else {\n                            error!(\"failed updating push executor meta-to-value iid increment\");\n\n                            None\n                        }\n                    } else {\n                        error!(\"failed getting push executor meta-to-value iid increment\");\n\n                        None\n                    }\n                });\n\n                if let Some(iid) = iid {\n                    let mut has_commits = false;\n\n                    // Acquire list of terms for IID\n                    let mut iid_terms_hashed: LinkedHashSet<StoreTermHashed> =\n                        LinkedHashSet::from_iter(\n                            kv_action\n                                .get_iid_to_terms(iid)\n                                .unwrap_or(None)\n                                .unwrap_or_default(),\n                        );\n\n                    info!(\n                        \"got push executor stored iid-to-terms: {:?}\",\n                        iid_terms_hashed\n                    );\n\n                    for (term, term_hashed) in lexer {\n                        // Check that term is not already linked to IID\n                        if !iid_terms_hashed.contains(&term_hashed) {\n                            if let Ok(term_iids) = kv_action.get_term_to_iids(term_hashed) {\n                                has_commits = true;\n\n                                // Add IID in first position in list for terms\n                                let mut term_iids = term_iids.unwrap_or_default();\n\n                                // Remove IID from list of IIDs to be popped before inserting in \\\n                                //   first position?\n                                if term_iids.contains(&iid) {\n                                    term_iids.retain(|cur_iid| cur_iid != &iid);\n                                }\n\n                                info!(\"has push executor term-to-iids: {}\", iid);\n\n                                term_iids.insert(0, iid);\n\n                                // Truncate IIDs linked to term? (ie. storage is too long)\n                                let truncate_limit = APP_CONF.store.kv.retain_word_objects;\n\n                                if term_iids.len() > truncate_limit {\n                                    info!(\n                                        \"push executor term-to-iids object too long (limit: {})\",\n                                        truncate_limit\n                                    );\n\n                                    // Drain overflowing IIDs (ie. oldest ones that overflow)\n                                    let term_iids_drain = term_iids.drain(truncate_limit..);\n\n                                    executor_ensure_op!(kv_action\n                                        .batch_truncate_object(term_hashed, term_iids_drain));\n                                }\n\n                                executor_ensure_op!(\n                                    kv_action.set_term_to_iids(term_hashed, &term_iids)\n                                );\n\n                                // Insert term into IID to terms map\n                                iid_terms_hashed.insert(term_hashed);\n                            } else {\n                                error!(\"failed getting push executor term-to-iids\");\n                            }\n                        }\n\n                        // Push to FST graph? (this consumes the term; to avoid sub-clones)\n                        if fst_action.push_word(&term) {\n                            debug!(\"push term committed to graph: {}\", term);\n                        }\n                    }\n\n                    // Commit updated list of terms for IID? (if any commit made)\n                    if has_commits {\n                        let collected_iids: Vec<StoreTermHashed> =\n                            iid_terms_hashed.into_iter().collect();\n\n                        info!(\n                            \"has push executor iid-to-terms commits: {:?}\",\n                            collected_iids\n                        );\n\n                        executor_ensure_op!(kv_action.set_iid_to_terms(iid, &collected_iids));\n                    }\n\n                    return Ok(());\n                }\n            }\n        }\n\n        Err(())\n    }\n}\n"
  },
  {
    "path": "src/executor/search.rs",
    "content": "// Sonic\n//\n// Fast, lightweight and schema-less search backend\n// Copyright: 2019, Valerian Saliou <valerian@valeriansaliou.name>\n// License: Mozilla Public License v2.0 (MPL v2.0)\n\nuse linked_hash_set::LinkedHashSet;\nuse std::iter::FromIterator;\n\nuse crate::lexer::token::TokenLexer;\nuse crate::query::types::{QuerySearchID, QuerySearchLimit, QuerySearchOffset};\nuse crate::store::fst::{StoreFSTActionBuilder, StoreFSTPool};\nuse crate::store::identifiers::{StoreObjectIID, StoreTermHash};\nuse crate::store::item::StoreItem;\nuse crate::store::kv::{StoreKVAcquireMode, StoreKVActionBuilder, StoreKVPool};\nuse crate::APP_CONF;\n\npub struct ExecutorSearch;\n\nimpl ExecutorSearch {\n    pub fn execute<'a>(\n        store: StoreItem<'a>,\n        _event_id: QuerySearchID,\n        lexer: TokenLexer<'a>,\n        limit: QuerySearchLimit,\n        offset: QuerySearchOffset,\n    ) -> Result<Option<Vec<String>>, ()> {\n        if let StoreItem(collection, Some(bucket), None) = store {\n            // Important: acquire database access read lock, and reference it in context. This \\\n            //   prevents the database from being erased while using it in this block.\n            general_kv_access_lock_read!();\n            general_fst_access_lock_read!();\n\n            if let (Ok(kv_store), Ok(fst_store)) = (\n                StoreKVPool::acquire(StoreKVAcquireMode::OpenOnly, collection),\n                StoreFSTPool::acquire(collection, bucket),\n            ) {\n                // Important: acquire bucket store read lock\n                executor_kv_lock_read!(kv_store);\n\n                let (kv_action, fst_action) = (\n                    StoreKVActionBuilder::access(bucket, kv_store),\n                    StoreFSTActionBuilder::access(fst_store),\n                );\n\n                // Try to resolve existing search terms to IIDs, and perform an algebraic AND on \\\n                //   all resulting IIDs for each given term.\n                let mut found_iids: LinkedHashSet<StoreObjectIID> = LinkedHashSet::new();\n\n                'lexing: for (term, term_hashed) in lexer {\n                    let mut iids = LinkedHashSet::from_iter(\n                        kv_action\n                            .get_term_to_iids(term_hashed)\n                            .unwrap_or(None)\n                            .unwrap_or_default()\n                            .into_iter(),\n                    );\n\n                    // No IIDs? Try to complete with a suggested alternate word\n                    // Notice: this may sound dirty to try generating as many results as the \\\n                    //   'retain_word_objects' value, but as we do not know if another lexed word \\\n                    //   comes next we need to exhaust all search space as to intersect it with \\\n                    //   the (likely) upcoming word.\n                    let (higher_limit, alternates_try) = (\n                        APP_CONF.store.kv.retain_word_objects,\n                        APP_CONF.channel.search.query_alternates_try,\n                    );\n\n                    if iids.len() < higher_limit && alternates_try > 0 {\n                        debug!(\n                            \"not enough iids were found ({}/{}), completing for term: {}\",\n                            iids.len(),\n                            higher_limit,\n                            term\n                        );\n\n                        // Suggest N words, in case the first one is found in FST as an exact \\\n                        //   match of term, we can pick next ones to complete search even further.\n                        // Notice: we add '1' to the 'alternates_try' number as to account for \\\n                        //   exact match suggestion that comes as first result and is to be ignored.\n                        if let Some(suggested_words) =\n                            fst_action.suggest_words(&term, alternates_try + 1, Some(1))\n                        {\n                            let mut iids_new_len = iids.len();\n\n                            // This loop will be broken early if we get enough results at some \\\n                            //   iteration\n                            'suggestions: for suggested_word in suggested_words {\n                                // Do not load base results twice for same term as base term\n                                if suggested_word == term {\n                                    continue 'suggestions;\n                                }\n\n                                debug!(\"got completed word: {} for term: {}\", suggested_word, term);\n\n                                if let Some(suggested_iids) = kv_action\n                                    .get_term_to_iids(StoreTermHash::from(&suggested_word))\n                                    .unwrap_or(None)\n                                {\n                                    for suggested_iid in suggested_iids {\n                                        // Do not append the same IID twice (can happen a lot \\\n                                        //   when completing from suggested results that point \\\n                                        //   to the same end-OID)\n                                        if !iids.contains(&suggested_iid) {\n                                            iids.insert(suggested_iid);\n\n                                            iids_new_len += 1;\n\n                                            // Higher limit now reached? Stop acquiring new \\\n                                            //   suggested IIDs now.\n                                            if iids_new_len >= higher_limit {\n                                                debug!(\n                                                    \"got enough completed results for term: {}\",\n                                                    term\n                                                );\n\n                                                break 'suggestions;\n                                            }\n                                        }\n                                    }\n                                }\n                            }\n\n                            debug!(\n                                \"done completing results for term: {}, now {} results\",\n                                term, iids_new_len\n                            );\n                        } else {\n                            debug!(\"did not get any completed word for term: {}\", term);\n                        }\n                    }\n\n                    debug!(\"got search executor iids: {:?} for term: {}\", iids, term);\n\n                    // Intersect found IIDs with previous batch\n                    if found_iids.is_empty() {\n                        found_iids = iids;\n                    } else {\n                        found_iids = found_iids.intersection(&iids).copied().collect();\n                    }\n\n                    debug!(\n                        \"got search executor iid intersection: {:?} for term: {}\",\n                        found_iids, term\n                    );\n\n                    // No IID found? (stop there)\n                    if found_iids.is_empty() {\n                        info!(\n                            \"stop search executor as no iid was found in common for term: {}\",\n                            term\n                        );\n\n                        break 'lexing;\n                    }\n                }\n\n                // Resolve OIDs from IIDs\n                // Notice: we also proceed paging from there\n                let (limit_usize, offset_usize) = (limit as usize, offset as usize);\n                let mut result_oids = Vec::with_capacity(limit_usize);\n\n                'paging: for (index, found_iid) in found_iids.iter().skip(offset_usize).enumerate()\n                {\n                    // Stop there?\n                    if index >= limit_usize {\n                        break 'paging;\n                    }\n\n                    // Read IID-to-OID for this found IID\n                    if let Ok(Some(oid)) = kv_action.get_iid_to_oid(*found_iid) {\n                        result_oids.push(oid);\n                    } else {\n                        error!(\"failed getting search executor iid-to-oid\");\n                    }\n                }\n\n                info!(\"got search executor final oids: {:?}\", result_oids);\n\n                return Ok(if !result_oids.is_empty() {\n                    Some(result_oids)\n                } else {\n                    None\n                });\n            }\n        }\n\n        Err(())\n    }\n}\n"
  },
  {
    "path": "src/executor/suggest.rs",
    "content": "// Sonic\n//\n// Fast, lightweight and schema-less search backend\n// Copyright: 2019, Valerian Saliou <valerian@valeriansaliou.name>\n// License: Mozilla Public License v2.0 (MPL v2.0)\n\nuse crate::lexer::token::TokenLexer;\nuse crate::query::types::{QuerySearchID, QuerySearchLimit};\nuse crate::store::fst::{StoreFSTActionBuilder, StoreFSTPool};\nuse crate::store::item::StoreItem;\n\npub struct ExecutorSuggest;\n\nimpl ExecutorSuggest {\n    pub fn execute<'a>(\n        store: StoreItem<'a>,\n        _event_id: QuerySearchID,\n        mut lexer: TokenLexer<'a>,\n        limit: QuerySearchLimit,\n    ) -> Result<Option<Vec<String>>, ()> {\n        if let StoreItem(collection, Some(bucket), None) = store {\n            // Important: acquire graph access read lock, and reference it in context. This \\\n            //   prevents the graph from being erased while using it in this block.\n            general_fst_access_lock_read!();\n\n            if let Ok(fst_store) = StoreFSTPool::acquire(collection, bucket) {\n                let fst_action = StoreFSTActionBuilder::access(fst_store);\n\n                if let (Some(word), None) = (lexer.next(), lexer.next()) {\n                    debug!(\"running suggest on word: {}\", word.0);\n\n                    return Ok(fst_action.suggest_words(&word.0, limit as usize, None));\n                }\n            }\n        }\n\n        Err(())\n    }\n}\n"
  },
  {
    "path": "src/lexer/mod.rs",
    "content": "// Sonic\n//\n// Fast, lightweight and schema-less search backend\n// Copyright: 2019, Valerian Saliou <valerian@valeriansaliou.name>\n// License: Mozilla Public License v2.0 (MPL v2.0)\n\nmod stopwords;\n\npub mod ranges;\npub mod token;\n"
  },
  {
    "path": "src/lexer/ranges.rs",
    "content": "// Sonic\n//\n// Fast, lightweight and schema-less search backend\n// Copyright: 2019, Valerian Saliou <valerian@valeriansaliou.name>\n// License: Mozilla Public License v2.0 (MPL v2.0)\n\nuse std::fmt;\nuse whatlang::{detect_script, Script};\n\nstruct LexerRange;\n\n#[derive(PartialEq, Debug)]\npub struct LexerRegexRange(&'static [(char, char)]);\n\nconst RANGE_LATIN: &[(char, char)] = &[('\\u{0000}', '\\u{024F}')];\nconst RANGE_CYRILLIC: &[(char, char)] = &[('\\u{0400}', '\\u{052F}')];\nconst RANGE_ARABIC: &[(char, char)] = &[('\\u{0600}', '\\u{06FF}'), ('\\u{0750}', '\\u{077F}')];\nconst RANGE_ARMENIAN: &[(char, char)] = &[('\\u{0530}', '\\u{058F}')];\nconst RANGE_DEVANAGARI: &[(char, char)] = &[('\\u{0900}', '\\u{097F}')];\nconst RANGE_HIRAGANA: &[(char, char)] = &[('\\u{3040}', '\\u{309F}')];\nconst RANGE_KATAKANA: &[(char, char)] = &[('\\u{30A0}', '\\u{30FF}'), ('\\u{31F0}', '\\u{31FF}')];\nconst RANGE_ETHIOPIC: &[(char, char)] = &[('\\u{1200}', '\\u{139F}'), ('\\u{2D80}', '\\u{2DDF}')];\nconst RANGE_HEBREW: &[(char, char)] = &[('\\u{0590}', '\\u{05FF}')];\nconst RANGE_BENGALI: &[(char, char)] = &[('\\u{0980}', '\\u{09FF}')];\nconst RANGE_GEORGIAN: &[(char, char)] = &[('\\u{10A0}', '\\u{10FF}'), ('\\u{2D00}', '\\u{2D2F}')];\nconst RANGE_MANDARIN: &[(char, char)] = &[\n    ('\\u{4E00}', '\\u{9FFF}'),\n    ('\\u{3400}', '\\u{4DBF}'),\n    ('\\u{20000}', '\\u{2A6DF}'),\n    ('\\u{2A700}', '\\u{2CEAF}'),\n];\nconst RANGE_HANGUL: &[(char, char)] = &[('\\u{1100}', '\\u{11FF}'), ('\\u{3130}', '\\u{318F}')];\nconst RANGE_GREEK: &[(char, char)] = &[('\\u{0370}', '\\u{03FF}'), ('\\u{1F00}', '\\u{1FFF}')];\nconst RANGE_KANNADA: &[(char, char)] = &[('\\u{0C80}', '\\u{0CFF}')];\nconst RANGE_TAMIL: &[(char, char)] = &[('\\u{0B80}', '\\u{0BFF}')];\nconst RANGE_THAI: &[(char, char)] = &[('\\u{0E00}', '\\u{0E7F}')];\nconst RANGE_GUJARATI: &[(char, char)] = &[('\\u{0A80}', '\\u{0AFF}')];\nconst RANGE_GURMUKHI: &[(char, char)] = &[('\\u{0A00}', '\\u{0A7F}')];\nconst RANGE_TELUGU: &[(char, char)] = &[('\\u{0C00}', '\\u{0C7F}')];\nconst RANGE_MALAYALAM: &[(char, char)] = &[('\\u{0D00}', '\\u{0D7F}')];\nconst RANGE_ORIYA: &[(char, char)] = &[('\\u{0B00}', '\\u{0B7F}')];\nconst RANGE_MYANMAR: &[(char, char)] = &[('\\u{1000}', '\\u{109F}')];\nconst RANGE_SINHALA: &[(char, char)] = &[('\\u{0D80}', '\\u{0DFF}')];\nconst RANGE_KHMER: &[(char, char)] = &[('\\u{1780}', '\\u{17FF}'), ('\\u{19E0}', '\\u{19FF}')];\n\nimpl LexerRange {\n    pub fn from(text: &str) -> Option<&'static [(char, char)]> {\n        detect_script(text).map(|script| match script {\n            Script::Latin => RANGE_LATIN,\n            Script::Cyrillic => RANGE_CYRILLIC,\n            Script::Arabic => RANGE_ARABIC,\n            Script::Armenian => RANGE_ARMENIAN,\n            Script::Devanagari => RANGE_DEVANAGARI,\n            Script::Hiragana => RANGE_HIRAGANA,\n            Script::Katakana => RANGE_KATAKANA,\n            Script::Ethiopic => RANGE_ETHIOPIC,\n            Script::Hebrew => RANGE_HEBREW,\n            Script::Bengali => RANGE_BENGALI,\n            Script::Georgian => RANGE_GEORGIAN,\n            Script::Mandarin => RANGE_MANDARIN,\n            Script::Hangul => RANGE_HANGUL,\n            Script::Greek => RANGE_GREEK,\n            Script::Kannada => RANGE_KANNADA,\n            Script::Tamil => RANGE_TAMIL,\n            Script::Thai => RANGE_THAI,\n            Script::Gujarati => RANGE_GUJARATI,\n            Script::Gurmukhi => RANGE_GURMUKHI,\n            Script::Telugu => RANGE_TELUGU,\n            Script::Malayalam => RANGE_MALAYALAM,\n            Script::Oriya => RANGE_ORIYA,\n            Script::Myanmar => RANGE_MYANMAR,\n            Script::Sinhala => RANGE_SINHALA,\n            Script::Khmer => RANGE_KHMER,\n        })\n    }\n}\n\nimpl LexerRegexRange {\n    pub fn from(text: &str) -> Option<Self> {\n        LexerRange::from(text).map(LexerRegexRange)\n    }\n\n    pub fn write_to<W: fmt::Write>(&self, formatter: &mut W) -> Result<(), fmt::Error> {\n        // Format range to regex range\n        formatter.write_char('[')?;\n\n        for range in self.0 {\n            write!(\n                formatter,\n                \"\\\\x{{{:X}}}-\\\\x{{{:X}}}\",\n                range.0 as u32, range.1 as u32\n            )?;\n        }\n\n        formatter.write_char(']')?;\n\n        Ok(())\n    }\n}\n\nimpl Default for LexerRegexRange {\n    fn default() -> Self {\n        LexerRegexRange(RANGE_LATIN)\n    }\n}\n\n#[cfg(test)]\nmod tests {\n    use super::*;\n\n    #[test]\n    fn it_gives_ranges() {\n        assert_eq!(LexerRange::from(\"fox\"), Some(RANGE_LATIN));\n        assert_eq!(LexerRange::from(\"快狐跨懒狗\"), Some(RANGE_MANDARIN));\n        assert_eq!(LexerRange::from(\"Доброе утро.\"), Some(RANGE_CYRILLIC));\n    }\n\n    #[test]\n    fn it_gives_regex_range() {\n        assert_eq!(\n            LexerRegexRange::from(\"fox\"),\n            Some(LexerRegexRange(RANGE_LATIN))\n        );\n    }\n}\n\n#[cfg(all(feature = \"benchmark\", test))]\nmod benches {\n    extern crate test;\n\n    use super::*;\n    use test::Bencher;\n\n    #[bench]\n    fn bench_give_ranges_latin(b: &mut Bencher) {\n        b.iter(|| LexerRange::from(\"fox\"));\n    }\n\n    #[bench]\n    fn bench_give_ranges_mandarin(b: &mut Bencher) {\n        b.iter(|| LexerRange::from(\"快狐跨懒狗\"));\n    }\n\n    #[bench]\n    fn bench_give_ranges_cyrillic(b: &mut Bencher) {\n        b.iter(|| LexerRange::from(\"Доброе утро.\"));\n    }\n\n    #[bench]\n    fn bench_give_regex_range_latin(b: &mut Bencher) {\n        b.iter(|| LexerRegexRange::from(\"fox\"));\n    }\n}\n"
  },
  {
    "path": "src/lexer/stopwords.rs",
    "content": "// Sonic\n//\n// Fast, lightweight and schema-less search backend\n// Copyright: 2019, Valerian Saliou <valerian@valeriansaliou.name>\n// License: Mozilla Public License v2.0 (MPL v2.0)\n\nuse hashbrown::HashSet;\nuse whatlang::{Lang, Script};\n\nuse crate::stopwords::*;\n\npub struct LexerStopWord;\n\n// Recursion group #1 (10 items)\nlazy_static! {\n    static ref STOPWORDS_EPO: HashSet<&'static str> = make(epo::STOPWORDS_EPO);\n    static ref STOPWORDS_ENG: HashSet<&'static str> = make(eng::STOPWORDS_ENG);\n    static ref STOPWORDS_RUS: HashSet<&'static str> = make(rus::STOPWORDS_RUS);\n    static ref STOPWORDS_CMN: HashSet<&'static str> = make(cmn::STOPWORDS_CMN);\n    static ref STOPWORDS_SPA: HashSet<&'static str> = make(spa::STOPWORDS_SPA);\n    static ref STOPWORDS_POR: HashSet<&'static str> = make(por::STOPWORDS_POR);\n    static ref STOPWORDS_ITA: HashSet<&'static str> = make(ita::STOPWORDS_ITA);\n    static ref STOPWORDS_BEN: HashSet<&'static str> = make(ben::STOPWORDS_BEN);\n    static ref STOPWORDS_FRA: HashSet<&'static str> = make(fra::STOPWORDS_FRA);\n    static ref STOPWORDS_DEU: HashSet<&'static str> = make(deu::STOPWORDS_DEU);\n}\n\n// Recursion group #2 (10 items)\nlazy_static! {\n    static ref STOPWORDS_UKR: HashSet<&'static str> = make(ukr::STOPWORDS_UKR);\n    static ref STOPWORDS_KAT: HashSet<&'static str> = make(kat::STOPWORDS_KAT);\n    static ref STOPWORDS_ARA: HashSet<&'static str> = make(ara::STOPWORDS_ARA);\n    static ref STOPWORDS_HIN: HashSet<&'static str> = make(hin::STOPWORDS_HIN);\n    static ref STOPWORDS_JPN: HashSet<&'static str> = make(jpn::STOPWORDS_JPN);\n    static ref STOPWORDS_HEB: HashSet<&'static str> = make(heb::STOPWORDS_HEB);\n    static ref STOPWORDS_YID: HashSet<&'static str> = make(yid::STOPWORDS_YID);\n    static ref STOPWORDS_POL: HashSet<&'static str> = make(pol::STOPWORDS_POL);\n    static ref STOPWORDS_AMH: HashSet<&'static str> = make(amh::STOPWORDS_AMH);\n    static ref STOPWORDS_JAV: HashSet<&'static str> = make(jav::STOPWORDS_JAV);\n}\n\n// Recursion group #3 (10 items)\nlazy_static! {\n    static ref STOPWORDS_KOR: HashSet<&'static str> = make(kor::STOPWORDS_KOR);\n    static ref STOPWORDS_NOB: HashSet<&'static str> = make(nob::STOPWORDS_NOB);\n    static ref STOPWORDS_DAN: HashSet<&'static str> = make(dan::STOPWORDS_DAN);\n    static ref STOPWORDS_SWE: HashSet<&'static str> = make(swe::STOPWORDS_SWE);\n    static ref STOPWORDS_FIN: HashSet<&'static str> = make(fin::STOPWORDS_FIN);\n    static ref STOPWORDS_TUR: HashSet<&'static str> = make(tur::STOPWORDS_TUR);\n    static ref STOPWORDS_NLD: HashSet<&'static str> = make(nld::STOPWORDS_NLD);\n    static ref STOPWORDS_HUN: HashSet<&'static str> = make(hun::STOPWORDS_HUN);\n    static ref STOPWORDS_CES: HashSet<&'static str> = make(ces::STOPWORDS_CES);\n    static ref STOPWORDS_ELL: HashSet<&'static str> = make(ell::STOPWORDS_ELL);\n}\n\n// Recursion group #4 (10 items)\nlazy_static! {\n    static ref STOPWORDS_BUL: HashSet<&'static str> = make(bul::STOPWORDS_BUL);\n    static ref STOPWORDS_BEL: HashSet<&'static str> = make(bel::STOPWORDS_BEL);\n    static ref STOPWORDS_MAR: HashSet<&'static str> = make(mar::STOPWORDS_MAR);\n    static ref STOPWORDS_KAN: HashSet<&'static str> = make(kan::STOPWORDS_KAN);\n    static ref STOPWORDS_RON: HashSet<&'static str> = make(ron::STOPWORDS_RON);\n    static ref STOPWORDS_SLV: HashSet<&'static str> = make(slv::STOPWORDS_SLV);\n    static ref STOPWORDS_HRV: HashSet<&'static str> = make(hrv::STOPWORDS_HRV);\n    static ref STOPWORDS_SRP: HashSet<&'static str> = make(srp::STOPWORDS_SRP);\n    static ref STOPWORDS_MKD: HashSet<&'static str> = make(mkd::STOPWORDS_MKD);\n    static ref STOPWORDS_LIT: HashSet<&'static str> = make(lit::STOPWORDS_LIT);\n}\n\n// Recursion group #5 (10 items)\nlazy_static! {\n    static ref STOPWORDS_LAV: HashSet<&'static str> = make(lav::STOPWORDS_LAV);\n    static ref STOPWORDS_EST: HashSet<&'static str> = make(est::STOPWORDS_EST);\n    static ref STOPWORDS_TAM: HashSet<&'static str> = make(tam::STOPWORDS_TAM);\n    static ref STOPWORDS_VIE: HashSet<&'static str> = make(vie::STOPWORDS_VIE);\n    static ref STOPWORDS_URD: HashSet<&'static str> = make(urd::STOPWORDS_URD);\n    static ref STOPWORDS_THA: HashSet<&'static str> = make(tha::STOPWORDS_THA);\n    static ref STOPWORDS_GUJ: HashSet<&'static str> = make(guj::STOPWORDS_GUJ);\n    static ref STOPWORDS_UZB: HashSet<&'static str> = make(uzb::STOPWORDS_UZB);\n    static ref STOPWORDS_PAN: HashSet<&'static str> = make(pan::STOPWORDS_PAN);\n    static ref STOPWORDS_AZE: HashSet<&'static str> = make(aze::STOPWORDS_AZE);\n}\n\n// Recursion group #6 (10 items)\nlazy_static! {\n    static ref STOPWORDS_IND: HashSet<&'static str> = make(ind::STOPWORDS_IND);\n    static ref STOPWORDS_TEL: HashSet<&'static str> = make(tel::STOPWORDS_TEL);\n    static ref STOPWORDS_PES: HashSet<&'static str> = make(pes::STOPWORDS_PES);\n    static ref STOPWORDS_MAL: HashSet<&'static str> = make(mal::STOPWORDS_MAL);\n    static ref STOPWORDS_ORI: HashSet<&'static str> = make(ori::STOPWORDS_ORI);\n    static ref STOPWORDS_MYA: HashSet<&'static str> = make(mya::STOPWORDS_MYA);\n    static ref STOPWORDS_NEP: HashSet<&'static str> = make(nep::STOPWORDS_NEP);\n    static ref STOPWORDS_SIN: HashSet<&'static str> = make(sin::STOPWORDS_SIN);\n    static ref STOPWORDS_KHM: HashSet<&'static str> = make(khm::STOPWORDS_KHM);\n    static ref STOPWORDS_TUK: HashSet<&'static str> = make(tuk::STOPWORDS_TUK);\n}\n\n// Recursion group #7 (9 items)\nlazy_static! {\n    static ref STOPWORDS_AKA: HashSet<&'static str> = make(aka::STOPWORDS_AKA);\n    static ref STOPWORDS_ZUL: HashSet<&'static str> = make(zul::STOPWORDS_ZUL);\n    static ref STOPWORDS_SNA: HashSet<&'static str> = make(sna::STOPWORDS_SNA);\n    static ref STOPWORDS_AFR: HashSet<&'static str> = make(afr::STOPWORDS_AFR);\n    static ref STOPWORDS_LAT: HashSet<&'static str> = make(lat::STOPWORDS_LAT);\n    static ref STOPWORDS_SLK: HashSet<&'static str> = make(slk::STOPWORDS_SLK);\n    static ref STOPWORDS_CAT: HashSet<&'static str> = make(cat::STOPWORDS_CAT);\n    static ref STOPWORDS_TGL: HashSet<&'static str> = make(tgl::STOPWORDS_TGL);\n    static ref STOPWORDS_HYE: HashSet<&'static str> = make(hye::STOPWORDS_HYE);\n}\n\nfn make<'a>(words: &[&'a str]) -> HashSet<&'a str> {\n    words.iter().copied().collect()\n}\n\nimpl LexerStopWord {\n    pub fn is(word: &str, locale: Option<Lang>) -> bool {\n        if let Some(locale) = locale {\n            // Word is a stopword (given locale)\n            if Self::lang_stopwords(locale).contains(word) {\n                return true;\n            }\n        }\n\n        // Not a stopword, or may not be (default)\n        false\n    }\n\n    pub fn guess_lang(text: &str, script: Script) -> Option<Lang> {\n        debug!(\n            \"guessing locale from stopwords for script: {} and text: {}\",\n            script, text\n        );\n\n        let script_langs = Self::script_langs(script);\n\n        // Count found stop-words in text for each language\n        let (mut likely_count, mut likely_lang) = (0, None);\n\n        // Split the text and consume the iterator\n        // Notice: this may seem dirty as we allocate memory, but there may be a lot of \\\n        //   'script_langs' to iterate over (plus, we need to exhaust the whole list as we \\\n        //   cannot break early by design). We have noticed a 65% performance increase on \\\n        //   texts of ~100 characters when collecting the iterator there, with a very low memory \\\n        //   cost as the strings are references and thus there should be no heap allocation. We \\\n        //   expect this gain to increase even further for longer texts.\n        let text_split = text.split_whitespace().collect::<Vec<&str>>();\n\n        for script_lang in script_langs {\n            let lang_stopwords = Self::lang_stopwords(*script_lang);\n\n            if !lang_stopwords.is_empty() {\n                let mut lang_count = 0;\n\n                // This is a simple split, that does not take into account uppercase letters and \\\n                //   punctuation, as to prevent memory allocations and other heavy operations. \\\n                //   Trade-offs are made as this is a best-effort last-resort check.\n                for word in &text_split {\n                    if lang_stopwords.contains(word) {\n                        lang_count += 1;\n                    }\n                }\n\n                // Found stopwords for this locale in text?\n                if lang_count > 0 {\n                    debug!(\n                        \"got {} common stopwords in guess for locale: {}\",\n                        lang_count, script_lang\n                    );\n\n                    if lang_count > likely_count {\n                        likely_count = lang_count;\n                        likely_lang = Some(*script_lang);\n                    }\n                }\n            }\n        }\n\n        // Return most likely locale (if any)\n        likely_lang\n    }\n\n    fn lang_stopwords(lang: Lang) -> &'static HashSet<&'static str> {\n        match lang {\n            Lang::Epo => &*STOPWORDS_EPO,\n            Lang::Eng => &*STOPWORDS_ENG,\n            Lang::Rus => &*STOPWORDS_RUS,\n            Lang::Cmn => &*STOPWORDS_CMN,\n            Lang::Spa => &*STOPWORDS_SPA,\n            Lang::Por => &*STOPWORDS_POR,\n            Lang::Ita => &*STOPWORDS_ITA,\n            Lang::Ben => &*STOPWORDS_BEN,\n            Lang::Fra => &*STOPWORDS_FRA,\n            Lang::Deu => &*STOPWORDS_DEU,\n            Lang::Ukr => &*STOPWORDS_UKR,\n            Lang::Kat => &*STOPWORDS_KAT,\n            Lang::Ara => &*STOPWORDS_ARA,\n            Lang::Hin => &*STOPWORDS_HIN,\n            Lang::Jpn => &*STOPWORDS_JPN,\n            Lang::Heb => &*STOPWORDS_HEB,\n            Lang::Yid => &*STOPWORDS_YID,\n            Lang::Pol => &*STOPWORDS_POL,\n            Lang::Amh => &*STOPWORDS_AMH,\n            Lang::Jav => &*STOPWORDS_JAV,\n            Lang::Kor => &*STOPWORDS_KOR,\n            Lang::Nob => &*STOPWORDS_NOB,\n            Lang::Dan => &*STOPWORDS_DAN,\n            Lang::Swe => &*STOPWORDS_SWE,\n            Lang::Fin => &*STOPWORDS_FIN,\n            Lang::Tur => &*STOPWORDS_TUR,\n            Lang::Nld => &*STOPWORDS_NLD,\n            Lang::Hun => &*STOPWORDS_HUN,\n            Lang::Ces => &*STOPWORDS_CES,\n            Lang::Ell => &*STOPWORDS_ELL,\n            Lang::Bul => &*STOPWORDS_BUL,\n            Lang::Bel => &*STOPWORDS_BEL,\n            Lang::Mar => &*STOPWORDS_MAR,\n            Lang::Kan => &*STOPWORDS_KAN,\n            Lang::Ron => &*STOPWORDS_RON,\n            Lang::Slv => &*STOPWORDS_SLV,\n            Lang::Hrv => &*STOPWORDS_HRV,\n            Lang::Srp => &*STOPWORDS_SRP,\n            Lang::Mkd => &*STOPWORDS_MKD,\n            Lang::Lit => &*STOPWORDS_LIT,\n            Lang::Lav => &*STOPWORDS_LAV,\n            Lang::Est => &*STOPWORDS_EST,\n            Lang::Tam => &*STOPWORDS_TAM,\n            Lang::Vie => &*STOPWORDS_VIE,\n            Lang::Urd => &*STOPWORDS_URD,\n            Lang::Tha => &*STOPWORDS_THA,\n            Lang::Guj => &*STOPWORDS_GUJ,\n            Lang::Uzb => &*STOPWORDS_UZB,\n            Lang::Pan => &*STOPWORDS_PAN,\n            Lang::Aze => &*STOPWORDS_AZE,\n            Lang::Ind => &*STOPWORDS_IND,\n            Lang::Tel => &*STOPWORDS_TEL,\n            Lang::Pes => &*STOPWORDS_PES,\n            Lang::Mal => &*STOPWORDS_MAL,\n            Lang::Ori => &*STOPWORDS_ORI,\n            Lang::Mya => &*STOPWORDS_MYA,\n            Lang::Nep => &*STOPWORDS_NEP,\n            Lang::Sin => &*STOPWORDS_SIN,\n            Lang::Khm => &*STOPWORDS_KHM,\n            Lang::Tuk => &*STOPWORDS_TUK,\n            Lang::Aka => &*STOPWORDS_AKA,\n            Lang::Zul => &*STOPWORDS_ZUL,\n            Lang::Sna => &*STOPWORDS_SNA,\n            Lang::Afr => &*STOPWORDS_AFR,\n            Lang::Lat => &*STOPWORDS_LAT,\n            Lang::Slk => &*STOPWORDS_SLK,\n            Lang::Cat => &*STOPWORDS_CAT,\n            Lang::Tgl => &*STOPWORDS_TGL,\n            Lang::Hye => &*STOPWORDS_HYE,\n        }\n    }\n\n    fn script_langs(script: Script) -> &'static [Lang] {\n        match script {\n            Script::Latin => &[\n                Lang::Spa,\n                Lang::Eng,\n                Lang::Por,\n                Lang::Ind,\n                Lang::Fra,\n                Lang::Deu,\n                Lang::Jav,\n                Lang::Vie,\n                Lang::Ita,\n                Lang::Tur,\n                Lang::Pol,\n                Lang::Ron,\n                Lang::Hrv,\n                Lang::Nld,\n                Lang::Uzb,\n                Lang::Hun,\n                Lang::Aze,\n                Lang::Ces,\n                Lang::Zul,\n                Lang::Swe,\n                Lang::Aka,\n                Lang::Sna,\n                Lang::Afr,\n                Lang::Fin,\n                Lang::Tuk,\n                Lang::Dan,\n                Lang::Nob,\n                Lang::Lit,\n                Lang::Slv,\n                Lang::Epo,\n                Lang::Lav,\n                Lang::Est,\n                Lang::Lat,\n                Lang::Slk,\n                Lang::Cat,\n                Lang::Tgl,\n            ],\n            Script::Cyrillic => &[\n                Lang::Rus,\n                Lang::Ukr,\n                Lang::Srp,\n                Lang::Aze,\n                Lang::Bel,\n                Lang::Bul,\n                Lang::Tuk,\n                Lang::Mkd,\n            ],\n            Script::Arabic => &[Lang::Ara, Lang::Urd, Lang::Pes],\n            Script::Armenian => &[Lang::Hye],\n            Script::Devanagari => &[Lang::Hin, Lang::Mar, Lang::Nep],\n            Script::Ethiopic => &[Lang::Amh],\n            Script::Hebrew => &[Lang::Heb, Lang::Yid],\n            Script::Mandarin => &[Lang::Cmn],\n            Script::Bengali => &[Lang::Ben],\n            Script::Hangul => &[Lang::Kor],\n            Script::Georgian => &[Lang::Kat],\n            Script::Greek => &[Lang::Ell],\n            Script::Kannada => &[Lang::Kan],\n            Script::Tamil => &[Lang::Tam],\n            Script::Thai => &[Lang::Tha],\n            Script::Gujarati => &[Lang::Guj],\n            Script::Gurmukhi => &[Lang::Pan],\n            Script::Telugu => &[Lang::Tel],\n            Script::Malayalam => &[Lang::Mal],\n            Script::Oriya => &[Lang::Ori],\n            Script::Myanmar => &[Lang::Mya],\n            Script::Sinhala => &[Lang::Sin],\n            Script::Khmer => &[Lang::Khm],\n            Script::Katakana | Script::Hiragana => &[Lang::Jpn],\n        }\n    }\n}\n\n#[cfg(test)]\nmod tests {\n    use super::*;\n\n    #[test]\n    fn it_detects_stopwords() {\n        assert!(!LexerStopWord::is(\"the\", None));\n        assert!(LexerStopWord::is(\"the\", Some(Lang::Eng)));\n        assert!(!LexerStopWord::is(\"fox\", Some(Lang::Eng)));\n        assert!(!LexerStopWord::is(\"bonjour\", Some(Lang::Fra)));\n        assert!(LexerStopWord::is(\"ici\", Some(Lang::Fra)));\n        assert!(LexerStopWord::is(\"adéu\", Some(Lang::Cat)));\n    }\n\n    #[test]\n    fn it_guesses_language() {\n        assert_eq!(\n            LexerStopWord::guess_lang(\n                \"I believe there is an extremely simple way to whip climate change.\",\n                Script::Latin\n            ),\n            Some(Lang::Eng)\n        );\n        assert_eq!(\n            LexerStopWord::guess_lang(\n                \"permettre aux pharmaciens de délivrer sous certaines conditions des médicaments\",\n                Script::Latin\n            ),\n            Some(Lang::Fra)\n        );\n        assert_eq!(\n            LexerStopWord::guess_lang(\n                \"Tarlós István főpolgármester utasítása alapján a Főváros a Budapest Portálon\",\n                Script::Latin\n            ),\n            Some(Lang::Hun)\n        );\n        assert_eq!(\n            LexerStopWord::guess_lang(\n                \"Tots els éssers humans neixen lliures i iguals en dignitat i en drets.\",\n                Script::Latin\n            ),\n            Some(Lang::Cat)\n        );\n        assert_eq!(\n            LexerStopWord::guess_lang(\"aux\", Script::Latin),\n            Some(Lang::Fra)\n        );\n        assert_eq!(\n            LexerStopWord::guess_lang(\"feefeffd zd\", Script::Latin),\n            None\n        );\n    }\n}\n\n#[cfg(all(feature = \"benchmark\", test))]\nmod benches {\n    extern crate test;\n\n    use super::*;\n    use test::Bencher;\n\n    #[bench]\n    fn bench_detect_stopwords_not_found(b: &mut Bencher) {\n        b.iter(|| LexerStopWord::is(\"fox\", Some(Lang::Eng)));\n    }\n\n    #[bench]\n    fn bench_detect_stopwords_found(b: &mut Bencher) {\n        b.iter(|| LexerStopWord::is(\"the\", Some(Lang::Eng)));\n    }\n\n    #[bench]\n    fn bench_guess_language_latin(b: &mut Bencher) {\n        b.iter(|| {\n            LexerStopWord::guess_lang(\n                \"I believe there is an extremely simple way to whip climate change.\",\n                Script::Latin,\n            )\n        });\n    }\n\n    #[bench]\n    fn bench_guess_language_mandarin(b: &mut Bencher) {\n        b.iter(|| LexerStopWord::guess_lang(\"快狐跨懒狗\", Script::Mandarin));\n    }\n}\n"
  },
  {
    "path": "src/lexer/token.rs",
    "content": "// Sonic\n//\n// Fast, lightweight and schema-less search backend\n// Copyright: 2019, Valerian Saliou <valerian@valeriansaliou.name>\n// License: Mozilla Public License v2.0 (MPL v2.0)\n\nuse hashbrown::HashSet;\nuse std::time::Instant;\nuse unicode_segmentation::{UnicodeSegmentation, UnicodeWords};\nuse whatlang::{\n    detect as lang_detect_all, detect_lang as lang_detect, detect_script as script_detect, Lang,\n};\n\n#[cfg(feature = \"tokenizer-chinese\")]\nuse std::vec::IntoIter;\n\nuse super::stopwords::LexerStopWord;\nuse crate::query::types::QueryGenericLang;\nuse crate::store::identifiers::{StoreTermHash, StoreTermHashed};\n\npub struct TokenLexerBuilder;\n\npub struct TokenLexer<'a> {\n    mode: TokenLexerMode,\n    locale: Option<Lang>,\n    words: TokenLexerWords<'a>,\n    yields: HashSet<StoreTermHashed>,\n}\n\n#[derive(PartialEq)]\npub enum TokenLexerMode {\n    NormalizeAndCleanup(Option<Lang>),\n    NormalizeOnly,\n}\n\nenum TokenLexerWords<'a> {\n    UAX29(UnicodeWords<'a>),\n\n    #[cfg(feature = \"tokenizer-chinese\")]\n    JieBa(IntoIter<&'a str>),\n\n    #[cfg(feature = \"tokenizer-japanese\")]\n    Lindera(IntoIter<lindera_tokenizer::token::Token<'a>>),\n}\n\nconst TEXT_LANG_TRUNCATE_OVER_CHARS: usize = 200;\nconst TEXT_LANG_DETECT_PROCEED_OVER_CHARS: usize = 20;\nconst TEXT_LANG_DETECT_NGRAM_UNDER_CHARS: usize = 60;\n\n#[cfg(feature = \"tokenizer-chinese\")]\nlazy_static! {\n    static ref TOKENIZER_JIEBA: jieba_rs::Jieba = jieba_rs::Jieba::new();\n}\n\n#[cfg(feature = \"tokenizer-japanese\")]\nlazy_static! {\n    static ref TOKENIZER_LINDERA: lindera_tokenizer::tokenizer::Tokenizer =\n        lindera_tokenizer::tokenizer::Tokenizer::from_config(\n            lindera_tokenizer::tokenizer::TokenizerConfig {\n                dictionary: lindera_dictionary::DictionaryConfig {\n                    kind: Some(lindera_dictionary::DictionaryKind::UniDic),\n                    path: None\n                },\n                user_dictionary: None,\n                mode: lindera_core::mode::Mode::Normal,\n            }\n        )\n        .expect(\"unable to initialize japanese tokenizer\");\n}\n\nimpl TokenLexerBuilder {\n    pub fn from(mode: TokenLexerMode, text: &str) -> Result<TokenLexer<'_>, ()> {\n        let locale = match mode {\n            TokenLexerMode::NormalizeAndCleanup(None) => {\n                // Detect text language (current lexer mode asks for a cleanup)\n                debug!(\"detecting locale from lexer text: {}\", text);\n\n                Self::detect_lang(text)\n            }\n            TokenLexerMode::NormalizeAndCleanup(Some(lang)) => {\n                // Use hinted language (current lexer mode asks for a cleanup)\n                debug!(\"using hinted locale: {} from lexer text: {}\", lang, text);\n\n                Some(lang)\n            }\n            TokenLexerMode::NormalizeOnly => {\n                debug!(\"not detecting locale from lexer text: {}\", text);\n\n                // May be 'NormalizeOnly' mode; no need to perform a locale detection\n                None\n            }\n        };\n\n        // Build final token builder iterator\n        Ok(TokenLexer::new(mode, text, locale))\n    }\n\n    fn detect_lang(text: &str) -> Option<Lang> {\n        // Detect only if text is long-enough to allow the text locale detection system to \\\n        //   function properly\n        if text.len() < TEXT_LANG_DETECT_PROCEED_OVER_CHARS {\n            return None;\n        }\n\n        // Truncate text if necessary, as to avoid the ngram or stopwords detector to be \\\n        //   ran on more words than those that are enough to reliably detect a locale.\n        let safe_text = if text.len() > TEXT_LANG_TRUNCATE_OVER_CHARS {\n            debug!(\n                \"lexer text needs to be truncated, as it is too long ({}/{}): {}\",\n                text.len(),\n                TEXT_LANG_TRUNCATE_OVER_CHARS,\n                text\n            );\n\n            // Perform an UTF-8 aware truncation\n            // Notice: then 'len()' check above was not UTF-8 aware, but is better than \\\n            //   nothing as it avoids entering the below iterator for small strings.\n            // Notice: we fallback on text if the result is 'None'; as if it is 'None' there \\\n            //   was less characters than the truncate limit in the UTF-8 parsed text. With \\\n            //   this unwrap-way, we avoid doing a 'text.chars().count()' every time, which is \\\n            //   a O(N) operation, and rather guard this block with a 'text.len()' which is \\\n            //   a O(1) operation but which is not 100% reliable when approaching the truncate \\\n            //   limit. This is a trade-off, which saves quite a lot CPU cycles at scale.\n            text.char_indices()\n                .nth(TEXT_LANG_TRUNCATE_OVER_CHARS)\n                .map(|(end_index, _)| &text[0..end_index])\n                .unwrap_or(text)\n        } else {\n            text\n        };\n\n        debug!(\"will detect locale for lexer safe text: {}\", safe_text);\n\n        // Attempt to detect the locale from text using an hybrid method that maximizes both \\\n        //   accuracy and performance.\n        // Notice: as the 'ngram' method is almost 10x slower than the 'stopwords' method, we \\\n        //   prefer using the 'stopwords' method on long texts where we can be sure to see quite \\\n        //   a lot of stopwords which will produce a reliable result. However, for shorter texts \\\n        //   there are not enough north none stopwords, thus we use the slower 'ngram' method as \\\n        //   an attempt to extract the locale using trigrams. Still, if either of these methods \\\n        //   fails at detecting a locale it will try using the other method in fallback as to \\\n        //   produce the most reliable result while minimizing CPU cycles.\n        if safe_text.len() < TEXT_LANG_DETECT_NGRAM_UNDER_CHARS {\n            debug!(\n                \"lexer text is shorter than {} characters, using the slow method\",\n                TEXT_LANG_DETECT_NGRAM_UNDER_CHARS\n            );\n\n            Self::detect_lang_slow(safe_text)\n        } else {\n            debug!(\n                \"lexer text is equal or longer than {} characters, using the fast method\",\n                TEXT_LANG_DETECT_NGRAM_UNDER_CHARS\n            );\n\n            Self::detect_lang_fast(safe_text)\n        }\n    }\n\n    fn detect_lang_slow(safe_text: &str) -> Option<Lang> {\n        let ngram_start = Instant::now();\n\n        match lang_detect_all(safe_text) {\n            Some(detector) => {\n                let ngram_took = ngram_start.elapsed();\n\n                let mut locale = detector.lang();\n\n                info!(\n                    \"[slow lexer] locale detected from text: {} ({} from {} at {}/1; {}s + {}ms)\",\n                    safe_text,\n                    locale,\n                    detector.script(),\n                    detector.confidence(),\n                    ngram_took.as_secs(),\n                    ngram_took.subsec_millis()\n                );\n\n                // Confidence is low, try to detect locale from stop-words.\n                // Notice: this is a fallback but should not be too reliable for short \\\n                //   texts.\n                if !detector.is_reliable() {\n                    debug!(\"[slow lexer] trying to detect locale from stopwords instead\");\n\n                    // Better alternate locale found?\n                    if let Some(alternate_locale) =\n                        LexerStopWord::guess_lang(safe_text, detector.script())\n                    {\n                        info!(\n                            \"[slow lexer] detected more accurate locale from stopwords: {}\",\n                            alternate_locale\n                        );\n\n                        locale = alternate_locale;\n                    }\n                }\n\n                Some(locale)\n            }\n            None => {\n                info!(\n                    \"[slow lexer] no locale could be detected from text: {}\",\n                    safe_text\n                );\n\n                None\n            }\n        }\n    }\n\n    fn detect_lang_fast(safe_text: &str) -> Option<Lang> {\n        let stopwords_start = Instant::now();\n\n        match script_detect(safe_text) {\n            Some(script) => {\n                // Locale found?\n                if let Some(locale) = LexerStopWord::guess_lang(safe_text, script) {\n                    let stopwords_took = stopwords_start.elapsed();\n\n                    info!(\n                        \"[fast lexer] locale detected from text: {} ({}; {}s + {}ms)\",\n                        safe_text,\n                        locale,\n                        stopwords_took.as_secs(),\n                        stopwords_took.subsec_millis()\n                    );\n\n                    Some(locale)\n                } else {\n                    debug!(\"[fast lexer] trying to detect locale from fallback ngram instead\");\n\n                    // No locale found, fallback on slow ngram.\n                    lang_detect(safe_text)\n                }\n            }\n            None => {\n                info!(\n                    \"[fast lexer] no script could be detected from text: {}\",\n                    safe_text\n                );\n\n                None\n            }\n        }\n    }\n}\n\nimpl<'a> TokenLexer<'a> {\n    fn new(mode: TokenLexerMode, text: &'a str, locale: Option<Lang>) -> TokenLexer<'a> {\n        // Tokenize words (depending on the locale)\n        let words = match locale {\n            #[cfg(feature = \"tokenizer-chinese\")]\n            Some(Lang::Cmn) => TokenLexerWords::JieBa(TOKENIZER_JIEBA.cut(text, false).into_iter()),\n            #[cfg(feature = \"tokenizer-japanese\")]\n            Some(Lang::Jpn) => match TOKENIZER_LINDERA.tokenize(text) {\n                Ok(tokens) => TokenLexerWords::Lindera(tokens.into_iter()),\n                Err(err) => {\n                    warn!(\"unable to tokenize japanese, falling back: {}\", err);\n\n                    TokenLexerWords::UAX29(text.unicode_words())\n                }\n            },\n            _ => TokenLexerWords::UAX29(text.unicode_words()),\n        };\n\n        TokenLexer {\n            mode,\n            locale,\n            words,\n            yields: HashSet::new(),\n        }\n    }\n}\n\nimpl TokenLexerMode {\n    pub fn from_query_lang(lang: Option<QueryGenericLang>) -> TokenLexerMode {\n        match lang {\n            Some(QueryGenericLang::Enabled(lang)) => {\n                // Cleanup with provided language\n                TokenLexerMode::NormalizeAndCleanup(Some(lang))\n            }\n            Some(QueryGenericLang::Disabled) => {\n                // Normalize only (language purposefully set to 'none')\n                TokenLexerMode::NormalizeOnly\n            }\n            None => {\n                // Auto-detect language and cleanup (this is the default behavior)\n                TokenLexerMode::NormalizeAndCleanup(None)\n            }\n        }\n    }\n}\n\nimpl<'a> Iterator for TokenLexer<'a> {\n    type Item = (String, StoreTermHashed);\n\n    // Guarantees provided by the lexer on the output: \\\n    //   - Text is split per-word in a script-aware way \\\n    //   - Words are normalized (ie. lower-case) \\\n    //   - Gibberish words are removed (ie. words that may just be junk) \\\n    //   - Stop-words are removed\n    fn next(&mut self) -> Option<Self::Item> {\n        for word in &mut self.words {\n            // Lower-case word\n            // Notice: unfortunately, as Rust is unicode-aware, we need to convert the str slice \\\n            //   to a heap-indexed String; as lower-cased characters may change in bit size.\n            let word = word.to_lowercase();\n\n            // Check if normalized word is a stop-word? (if should normalize and cleanup)\n            if self.mode == TokenLexerMode::NormalizeOnly || !LexerStopWord::is(&word, self.locale)\n            {\n                // Hash the term (this is used by all iterator consumers, as well as internally \\\n                //   in the iterator to keep track of already-yielded words in a space-optimized \\\n                //   manner, ie. by using 32-bit unsigned integer hashes)\n                let term_hash = StoreTermHash::from(&word);\n\n                // Check if word was not already yielded? (we return unique words)\n                if !self.yields.contains(&term_hash) {\n                    debug!(\"lexer yielded word: {}\", word);\n\n                    self.yields.insert(term_hash);\n\n                    return Some((word, term_hash));\n                } else {\n                    debug!(\n                        \"lexer did not yield word: {} because: word already yielded\",\n                        word\n                    );\n                }\n            } else {\n                debug!(\n                    \"lexer did not yield word: {} because: word is a stop-word\",\n                    word\n                );\n            }\n        }\n\n        None\n    }\n}\n\nimpl<'a> Iterator for TokenLexerWords<'a> {\n    type Item = &'a str;\n\n    fn next(&mut self) -> Option<Self::Item> {\n        match self {\n            TokenLexerWords::UAX29(token) => token.next(),\n\n            #[cfg(feature = \"tokenizer-chinese\")]\n            TokenLexerWords::JieBa(token) => token.next(),\n\n            #[cfg(feature = \"tokenizer-japanese\")]\n            TokenLexerWords::Lindera(token) => match token.next() {\n                Some(inner) => Some(inner.text),\n                None => None,\n            },\n        }\n    }\n}\n\n#[cfg(test)]\nmod tests {\n    use super::*;\n\n    #[test]\n    fn it_cleans_token_english() {\n        let mut token_cleaner = TokenLexerBuilder::from(\n            TokenLexerMode::NormalizeAndCleanup(None),\n            \"The quick brown fox jumps over the lazy dog!\",\n        )\n        .unwrap();\n\n        assert_eq!(token_cleaner.locale, Some(Lang::Eng));\n        assert_eq!(\n            token_cleaner.next(),\n            Some((\"quick\".to_string(), 4179131656))\n        );\n        assert_eq!(\n            token_cleaner.next(),\n            Some((\"brown\".to_string(), 1268820067))\n        );\n        assert_eq!(token_cleaner.next(), Some((\"fox\".to_string(), 667256324)));\n        assert_eq!(token_cleaner.next(), Some((\"jumps\".to_string(), 633865164)));\n        assert_eq!(token_cleaner.next(), Some((\"lazy\".to_string(), 4130433347)));\n        assert_eq!(token_cleaner.next(), Some((\"dog\".to_string(), 2044924251)));\n        assert_eq!(token_cleaner.next(), None);\n    }\n\n    #[test]\n    fn it_cleans_token_french() {\n        let mut token_cleaner = TokenLexerBuilder::from(\n            TokenLexerMode::NormalizeAndCleanup(None),\n            \"Le vif renard brun saute par dessus le chien paresseux.\",\n        )\n        .unwrap();\n\n        assert_eq!(token_cleaner.locale, Some(Lang::Fra));\n        assert_eq!(\n            token_cleaner.next(),\n            Some((\"renard\".to_string(), 1635186311))\n        );\n        assert_eq!(token_cleaner.next(), Some((\"brun\".to_string(), 2763604928)));\n        assert_eq!(\n            token_cleaner.next(),\n            Some((\"saute\".to_string(), 1918158211))\n        );\n        assert_eq!(\n            token_cleaner.next(),\n            Some((\"chien\".to_string(), 2177818351))\n        );\n        assert_eq!(\n            token_cleaner.next(),\n            Some((\"paresseux\".to_string(), 1678693110))\n        );\n        assert_eq!(token_cleaner.next(), None);\n    }\n\n    #[cfg(feature = \"tokenizer-chinese\")]\n    #[test]\n    fn it_cleans_token_chinese_jieba() {\n        let mut token_cleaner = TokenLexerBuilder::from(\n            TokenLexerMode::NormalizeAndCleanup(None),\n            \"我们中出了一个叛徒\",\n        )\n        .unwrap();\n\n        assert_eq!(token_cleaner.locale, Some(Lang::Cmn));\n        assert_eq!(token_cleaner.next(), Some((\"出\".to_string(), 241978070)));\n        assert_eq!(token_cleaner.next(), Some((\"一个\".to_string(), 2596274530)));\n        assert_eq!(token_cleaner.next(), Some((\"叛徒\".to_string(), 3244183759)));\n        assert_eq!(token_cleaner.next(), None);\n    }\n\n    #[cfg(not(feature = \"tokenizer-chinese\"))]\n    #[test]\n    fn it_cleans_token_chinese_naive() {\n        let mut token_cleaner = TokenLexerBuilder::from(\n            TokenLexerMode::NormalizeAndCleanup(None),\n            \"快狐跨懒狗快狐跨懒狗\",\n        )\n        .unwrap();\n\n        assert_eq!(token_cleaner.locale, Some(Lang::Cmn));\n        assert_eq!(token_cleaner.next(), Some((\"快\".to_string(), 126546256)));\n        assert_eq!(token_cleaner.next(), Some((\"狐\".to_string(), 2879689662)));\n        assert_eq!(token_cleaner.next(), Some((\"跨\".to_string(), 2913342670)));\n        assert_eq!(token_cleaner.next(), Some((\"懒\".to_string(), 3199935961)));\n        assert_eq!(token_cleaner.next(), Some((\"狗\".to_string(), 3360772096)));\n        assert_eq!(token_cleaner.next(), None);\n    }\n\n    #[cfg(feature = \"tokenizer-japanese\")]\n    #[test]\n    fn it_cleans_token_japanese_lindera_product() {\n        let mut token_cleaner = TokenLexerBuilder::from(\n            TokenLexerMode::NormalizeAndCleanup(None),\n            \"関西国際空港限定トートバッグ\",\n        )\n        .unwrap();\n\n        assert_eq!(token_cleaner.locale, Some(Lang::Jpn));\n        assert_eq!(token_cleaner.next(), Some((\"関西\".to_string(), 1283572620)));\n        assert_eq!(token_cleaner.next(), Some((\"国際\".to_string(), 2132457693)));\n        assert_eq!(token_cleaner.next(), Some((\"空港\".to_string(), 865668138)));\n        assert_eq!(token_cleaner.next(), Some((\"限定\".to_string(), 3708465176)));\n        assert_eq!(\n            token_cleaner.next(),\n            Some((\"トート\".to_string(), 881444746))\n        );\n        assert_eq!(\n            token_cleaner.next(),\n            Some((\"バッグ\".to_string(), 3515727814))\n        );\n        assert_eq!(token_cleaner.next(), None);\n    }\n\n    #[cfg(feature = \"tokenizer-japanese\")]\n    #[test]\n    fn it_cleans_token_japanese_lindera_food() {\n        let token_cleaner =\n            TokenLexerBuilder::from(TokenLexerMode::NormalizeAndCleanup(None), \"𠮷野家\").unwrap();\n\n        assert_eq!(token_cleaner.locale, None);\n\n        let token_cleaner =\n            TokenLexerBuilder::from(TokenLexerMode::NormalizeAndCleanup(None), \"ヱビスビール\")\n                .unwrap();\n\n        assert_eq!(token_cleaner.locale, None);\n    }\n\n    #[cfg(feature = \"tokenizer-japanese\")]\n    #[test]\n    fn it_cleans_token_japanese_lindera_sentence() {\n        let mut token_cleaner = TokenLexerBuilder::from(\n            TokenLexerMode::NormalizeAndCleanup(None),\n            \"𠮷野家でヱビスビールを飲んだ\",\n        )\n        .unwrap();\n\n        assert_eq!(token_cleaner.locale, Some(Lang::Jpn));\n        assert_eq!(token_cleaner.next(), Some((\"𠮷\".to_string(), 2866455824)));\n        assert_eq!(token_cleaner.next(), Some((\"野家\".to_string(), 1324395598)));\n        assert_eq!(\n            token_cleaner.next(),\n            Some((\"ヱビス\".to_string(), 1696836208))\n        );\n        assert_eq!(\n            token_cleaner.next(),\n            Some((\"ビール\".to_string(), 3421909800))\n        );\n        assert_eq!(token_cleaner.next(), Some((\"飲ん\".to_string(), 3196735184)));\n        assert_eq!(token_cleaner.next(), None);\n    }\n\n    #[test]\n    fn it_cleans_token_emojis() {\n        let mut token_cleaner =\n            TokenLexerBuilder::from(TokenLexerMode::NormalizeAndCleanup(None), \"🚀 🙋‍♂️🙋‍♂️🙋‍♂️\")\n                .unwrap();\n\n        assert_eq!(token_cleaner.locale, None);\n        assert_eq!(token_cleaner.next(), None);\n    }\n\n    #[test]\n    fn it_cleans_token_lang_hinted() {\n        let mut token_cleaner_right = TokenLexerBuilder::from(\n            TokenLexerMode::NormalizeAndCleanup(Some(Lang::Eng)),\n            \"This will be cleaned properly, as English was hinted rightfully so.\",\n        )\n        .unwrap();\n        let mut token_cleaner_wrong = TokenLexerBuilder::from(\n            TokenLexerMode::NormalizeAndCleanup(Some(Lang::Fra)),\n            \"This will not be cleaned properly, as French was hinted but this is English.\",\n        )\n        .unwrap();\n\n        assert_eq!(token_cleaner_right.locale, Some(Lang::Eng));\n        assert_eq!(token_cleaner_wrong.locale, Some(Lang::Fra));\n\n        assert_eq!(\n            token_cleaner_right.next(),\n            Some((\"cleaned\".to_string(), 3550382624))\n        );\n        assert_eq!(\n            token_cleaner_wrong.next(),\n            Some((\"this\".to_string(), 493303710))\n        );\n    }\n\n    #[test]\n    fn it_detects_lang_english_regular() {\n        assert_eq!(\n            TokenLexerBuilder::detect_lang(\"The quick brown fox jumps over the lazy dog!\"),\n            Some(Lang::Eng)\n        );\n    }\n\n    #[test]\n    fn it_detects_lang_english_long() {\n        assert_eq!(\n            TokenLexerBuilder::detect_lang(\n                r#\"Running an electrical current through water splits it into oxygen and hydrogen,\n            the latter of which can be used as a reliable, zero-emission fuel source. In the past,\n            the process of purifying water beforehand was too energy intensive for this process to\n            be useful — but now scientists have figured out how to skip the process altogether and\n            convert seawater into usable hydrogen\"#\n            ),\n            Some(Lang::Eng)\n        );\n    }\n\n    #[test]\n    fn it_doesnt_detect_lang_english_tiny() {\n        assert_eq!(TokenLexerBuilder::detect_lang(\"The quick\"), None);\n    }\n}\n\n#[cfg(all(feature = \"benchmark\", test))]\nmod benches {\n    extern crate test;\n\n    use super::*;\n    use test::Bencher;\n\n    #[bench]\n    fn bench_normalize_token_french_build(b: &mut Bencher) {\n        b.iter(|| {\n            TokenLexerBuilder::from(\n                TokenLexerMode::NormalizeOnly,\n                \"Le vif renard brun saute par dessus le chien paresseux.\",\n            )\n        });\n    }\n\n    #[bench]\n    fn bench_normalize_token_french_exhaust(b: &mut Bencher) {\n        b.iter(|| {\n            let token_cleaner = TokenLexerBuilder::from(\n                TokenLexerMode::NormalizeOnly,\n                \"Le vif renard brun saute par dessus le chien paresseux.\",\n            )\n            .unwrap();\n\n            token_cleaner.map(|value| value.1).collect::<Vec<u32>>()\n        });\n    }\n\n    #[bench]\n    fn bench_clean_token_english_regular_build(b: &mut Bencher) {\n        b.iter(|| {\n            TokenLexerBuilder::from(\n                TokenLexerMode::NormalizeAndCleanup(None),\n                \"The quick brown fox jumps over the lazy dog!\",\n            )\n        });\n    }\n\n    #[bench]\n    fn bench_clean_token_english_regular_exhaust(b: &mut Bencher) {\n        b.iter(|| {\n            let token_cleaner = TokenLexerBuilder::from(\n                TokenLexerMode::NormalizeAndCleanup(None),\n                \"The quick brown fox jumps over the lazy dog!\",\n            )\n            .unwrap();\n\n            token_cleaner.map(|value| value.1).collect::<Vec<u32>>()\n        });\n    }\n\n    #[bench]\n    fn bench_clean_token_english_long_exhaust(b: &mut Bencher) {\n        b.iter(|| {\n            let token_cleaner = TokenLexerBuilder::from(\n                TokenLexerMode::NormalizeAndCleanup(None),\n                r#\"Running an electrical current through water splits it into oxygen and hydrogen,\n                the latter of which can be used as a reliable, zero-emission fuel source. In the\n                past, the process of purifying water beforehand was too energy intensive for this\n                process to be useful — but now scientists have figured out how to skip the process\n                altogether and convert seawater into usable hydrogen\"#,\n            )\n            .unwrap();\n\n            token_cleaner.map(|value| value.1).collect::<Vec<u32>>()\n        });\n    }\n\n    #[bench]\n    fn bench_clean_token_english_hinted_build(b: &mut Bencher) {\n        b.iter(|| {\n            TokenLexerBuilder::from(\n                TokenLexerMode::NormalizeAndCleanup(Some(Lang::Eng)),\n                \"The quick brown fox jumps over the lazy dog!\",\n            )\n        });\n    }\n\n    #[bench]\n    fn bench_clean_token_english_hinted_exhaust(b: &mut Bencher) {\n        b.iter(|| {\n            let token_cleaner = TokenLexerBuilder::from(\n                TokenLexerMode::NormalizeAndCleanup(Some(Lang::Eng)),\n                \"The quick brown fox jumps over the lazy dog!\",\n            )\n            .unwrap();\n\n            token_cleaner.map(|value| value.1).collect::<Vec<u32>>()\n        });\n    }\n\n    #[bench]\n    fn bench_clean_token_chinese_build(b: &mut Bencher) {\n        b.iter(|| {\n            TokenLexerBuilder::from(\n                TokenLexerMode::NormalizeAndCleanup(None),\n                \"我们中出了一个叛徒\",\n            )\n        });\n    }\n\n    #[bench]\n    fn bench_clean_token_chinese_exhaust(b: &mut Bencher) {\n        b.iter(|| {\n            let token_cleaner = TokenLexerBuilder::from(\n                TokenLexerMode::NormalizeAndCleanup(None),\n                \"我们中出了一个叛徒\",\n            )\n            .unwrap();\n\n            token_cleaner.map(|value| value.1).collect::<Vec<u32>>()\n        });\n    }\n\n    #[bench]\n    fn bench_clean_token_japanese_build(b: &mut Bencher) {\n        b.iter(|| {\n            TokenLexerBuilder::from(\n                TokenLexerMode::NormalizeAndCleanup(None),\n                \"関西国際空港限定トートバッグ\",\n            )\n        });\n    }\n\n    #[bench]\n    fn bench_clean_token_japanese_exhaust(b: &mut Bencher) {\n        b.iter(|| {\n            let token_cleaner = TokenLexerBuilder::from(\n                TokenLexerMode::NormalizeAndCleanup(None),\n                \"関西国際空港限定トートバッグ\",\n            )\n            .unwrap();\n\n            token_cleaner.map(|value| value.1).collect::<Vec<u32>>()\n        });\n    }\n\n    #[bench]\n    fn bench_detect_lang_english_short(b: &mut Bencher) {\n        b.iter(|| TokenLexerBuilder::detect_lang(\"The quick brown fox.\"));\n    }\n\n    #[bench]\n    fn bench_detect_lang_english_regular(b: &mut Bencher) {\n        b.iter(|| TokenLexerBuilder::detect_lang(\"The quick brown fox jumps over the lazy dog!\"));\n    }\n\n    #[bench]\n    fn bench_detect_lang_english_long(b: &mut Bencher) {\n        b.iter(|| {\n            TokenLexerBuilder::detect_lang(\n                r#\"Running an electrical current through water splits it into oxygen and hydrogen,\n            the latter of which can be used as a reliable, zero-emission fuel source. In the past,\n            the process of purifying water beforehand was too energy intensive for this process to\n            be useful — but now scientists have figured out how to skip the process altogether and\n            convert seawater into usable hydrogen\"#,\n            )\n        });\n    }\n\n    #[bench]\n    fn bench_dont_detect_lang_english_tiny(b: &mut Bencher) {\n        b.iter(|| TokenLexerBuilder::detect_lang(\"The quick\"));\n    }\n}\n"
  },
  {
    "path": "src/main.rs",
    "content": "// Sonic\n//\n// Fast, lightweight and schema-less search backend\n// Copyright: 2019, Valerian Saliou <valerian@valeriansaliou.name>\n// License: Mozilla Public License v2.0 (MPL v2.0)\n\n#![cfg_attr(feature = \"benchmark\", feature(test))]\n#![deny(unstable_features, unused_imports, unused_qualifications, clippy::all)]\n\n#[macro_use]\nextern crate log;\n#[macro_use]\nextern crate lazy_static;\n#[macro_use]\nextern crate serde_derive;\n\nmod channel;\nmod config;\nmod executor;\nmod lexer;\nmod query;\nmod stopwords;\nmod store;\nmod tasker;\n\nuse std::ops::Deref;\nuse std::str::FromStr;\nuse std::thread;\nuse std::time::Duration;\n\nuse clap::{App, Arg};\nuse log::LevelFilter;\n\nuse channel::listen::{ChannelListen, ChannelListenBuilder};\nuse channel::statistics::ensure_states as ensure_states_channel_statistics;\nuse config::logger::ConfigLogger;\nuse config::options::Config;\nuse config::reader::ConfigReader;\nuse store::fst::StoreFSTPool;\nuse store::kv::StoreKVPool;\nuse tasker::runtime::TaskerBuilder;\nuse tasker::shutdown::ShutdownSignal;\n\nstruct AppArgs {\n    config: String,\n}\n\n#[cfg(unix)]\n#[cfg(feature = \"allocator-jemalloc\")]\n#[global_allocator]\nstatic ALLOC: tikv_jemallocator::Jemalloc = tikv_jemallocator::Jemalloc;\n\npub static LINE_FEED: &str = \"\\r\\n\";\n\npub static THREAD_NAME_CHANNEL_MASTER: &str = \"sonic-channel-master\";\npub static THREAD_NAME_CHANNEL_CLIENT: &str = \"sonic-channel-client\";\npub static THREAD_NAME_TASKER: &str = \"sonic-tasker\";\n\nmacro_rules! gen_spawn_managed {\n    ($name:expr, $method:ident, $thread_name:ident, $managed_fn:ident) => {\n        fn $method() {\n            debug!(\"spawn managed thread: {}\", $name);\n\n            let worker = thread::Builder::new()\n                .name($thread_name.to_string())\n                .spawn(|| $managed_fn::build().run());\n\n            // Block on worker thread (join it)\n            let has_error = if let Ok(worker_thread) = worker {\n                worker_thread.join().is_err()\n            } else {\n                true\n            };\n\n            // Worker thread crashed?\n            if has_error == true {\n                error!(\"managed thread crashed ({}), setting it up again\", $name);\n\n                // Prevents thread start loop floods\n                thread::sleep(Duration::from_secs(1));\n\n                $method();\n            }\n        }\n    };\n}\n\nlazy_static! {\n    static ref APP_ARGS: AppArgs = make_app_args();\n    static ref APP_CONF: Config = ConfigReader::make();\n}\n\ngen_spawn_managed!(\n    \"channel\",\n    spawn_channel,\n    THREAD_NAME_CHANNEL_MASTER,\n    ChannelListenBuilder\n);\ngen_spawn_managed!(\"tasker\", spawn_tasker, THREAD_NAME_TASKER, TaskerBuilder);\n\nfn make_app_args() -> AppArgs {\n    let matches = App::new(clap::crate_name!())\n        .version(clap::crate_version!())\n        .author(clap::crate_authors!())\n        .about(clap::crate_description!())\n        .arg(\n            Arg::new(\"config\")\n                .short('c')\n                .long(\"config\")\n                .help(\"Path to configuration file\")\n                .default_value(\"./config.cfg\")\n                .takes_value(true),\n        )\n        .get_matches();\n\n    // Generate owned app arguments\n    AppArgs {\n        config: String::from(matches.value_of(\"config\").expect(\"invalid config value\")),\n    }\n}\n\nfn ensure_states() {\n    // Ensure all statics are valid (a `deref` is enough to lazily initialize them)\n    let (_, _) = (APP_ARGS.deref(), APP_CONF.deref());\n\n    // Ensure per-module states\n    ensure_states_channel_statistics();\n}\n\nfn main() {\n    let _logger = ConfigLogger::init(\n        LevelFilter::from_str(&APP_CONF.server.log_level).expect(\"invalid log level\"),\n    );\n\n    let shutdown_signal = ShutdownSignal::new();\n\n    info!(\"starting up\");\n\n    // Ensure all states are bound\n    ensure_states();\n\n    // Spawn tasker (background thread)\n    thread::spawn(spawn_tasker);\n\n    // Spawn channel (foreground thread)\n    thread::spawn(spawn_channel);\n\n    info!(\"started\");\n\n    shutdown_signal.at_exit(move |signal| {\n        info!(\"stopping gracefully (got signal: {})\", signal);\n\n        // Teardown Sonic Channel\n        ChannelListen::teardown();\n\n        // Perform a KV flush (ensures all in-memory changes are synced on-disk before shutdown)\n        StoreKVPool::flush(true);\n\n        // Perform a FST consolidation (ensures all in-memory items are synced on-disk before \\\n        //   shutdown; otherwise we would lose all non-consolidated FST changes)\n        StoreFSTPool::consolidate(true);\n\n        info!(\"stopped\");\n    });\n}\n"
  },
  {
    "path": "src/query/actions.rs",
    "content": "// Sonic\n//\n// Fast, lightweight and schema-less search backend\n// Copyright: 2019, Valerian Saliou <valerian@valeriansaliou.name>\n// License: Mozilla Public License v2.0 (MPL v2.0)\n\nuse super::types::*;\nuse crate::lexer::token::TokenLexer;\nuse crate::store::item::StoreItem;\n\npub enum Query<'a> {\n    Search(\n        StoreItem<'a>,\n        QuerySearchID<'a>,\n        TokenLexer<'a>,\n        QuerySearchLimit,\n        QuerySearchOffset,\n    ),\n    Suggest(\n        StoreItem<'a>,\n        QuerySearchID<'a>,\n        TokenLexer<'a>,\n        QuerySearchLimit,\n    ),\n    List(\n        StoreItem<'a>,\n        QuerySearchID<'a>,\n        QuerySearchLimit,\n        QuerySearchOffset,\n    ),\n    Push(StoreItem<'a>, TokenLexer<'a>),\n    Pop(StoreItem<'a>, TokenLexer<'a>),\n    Count(StoreItem<'a>),\n    FlushC(StoreItem<'a>),\n    FlushB(StoreItem<'a>),\n    FlushO(StoreItem<'a>),\n}\n"
  },
  {
    "path": "src/query/builder.rs",
    "content": "// Sonic\n//\n// Fast, lightweight and schema-less search backend\n// Copyright: 2019, Valerian Saliou <valerian@valeriansaliou.name>\n// License: Mozilla Public License v2.0 (MPL v2.0)\n\nuse super::actions::Query;\nuse super::types::{QueryGenericLang, QuerySearchLimit, QuerySearchOffset};\nuse crate::lexer::token::{TokenLexerBuilder, TokenLexerMode};\nuse crate::store::item::StoreItemBuilder;\n\npub struct QueryBuilder;\n\npub type QueryBuilderResult<'a> = Result<Query<'a>, ()>;\n\nimpl QueryBuilder {\n    pub fn search<'a>(\n        query_id: &'a str,\n        collection: &'a str,\n        bucket: &'a str,\n        terms: &'a str,\n        limit: QuerySearchLimit,\n        offset: QuerySearchOffset,\n        lang: Option<QueryGenericLang>,\n    ) -> QueryBuilderResult<'a> {\n        match (\n            StoreItemBuilder::from_depth_2(collection, bucket),\n            TokenLexerBuilder::from(TokenLexerMode::from_query_lang(lang), terms),\n        ) {\n            (Ok(store), Ok(text_lexed)) => {\n                Ok(Query::Search(store, query_id, text_lexed, limit, offset))\n            }\n            _ => Err(()),\n        }\n    }\n\n    pub fn suggest<'a>(\n        query_id: &'a str,\n        collection: &'a str,\n        bucket: &'a str,\n        terms: &'a str,\n        limit: QuerySearchLimit,\n    ) -> QueryBuilderResult<'a> {\n        match (\n            StoreItemBuilder::from_depth_2(collection, bucket),\n            TokenLexerBuilder::from(TokenLexerMode::NormalizeOnly, terms),\n        ) {\n            (Ok(store), Ok(text_lexed)) => Ok(Query::Suggest(store, query_id, text_lexed, limit)),\n            _ => Err(()),\n        }\n    }\n\n    pub fn list<'a>(\n        query_id: &'a str,\n        collection: &'a str,\n        bucket: &'a str,\n        limit: QuerySearchLimit,\n        offset: QuerySearchOffset,\n    ) -> QueryBuilderResult<'a> {\n        match StoreItemBuilder::from_depth_2(collection, bucket) {\n            Ok(store) => Ok(Query::List(store, query_id, limit, offset)),\n            _ => Err(()),\n        }\n    }\n\n    pub fn push<'a>(\n        collection: &'a str,\n        bucket: &'a str,\n        object: &'a str,\n        text: &'a str,\n        lang: Option<QueryGenericLang>,\n    ) -> QueryBuilderResult<'a> {\n        match (\n            StoreItemBuilder::from_depth_3(collection, bucket, object),\n            TokenLexerBuilder::from(TokenLexerMode::from_query_lang(lang), text),\n        ) {\n            (Ok(store), Ok(text_lexed)) => Ok(Query::Push(store, text_lexed)),\n            _ => Err(()),\n        }\n    }\n\n    pub fn pop<'a>(\n        collection: &'a str,\n        bucket: &'a str,\n        object: &'a str,\n        text: &'a str,\n    ) -> QueryBuilderResult<'a> {\n        match (\n            StoreItemBuilder::from_depth_3(collection, bucket, object),\n            TokenLexerBuilder::from(TokenLexerMode::NormalizeOnly, text),\n        ) {\n            (Ok(store), Ok(text_lexed)) => Ok(Query::Pop(store, text_lexed)),\n            _ => Err(()),\n        }\n    }\n\n    pub fn count<'a>(\n        collection: &'a str,\n        bucket: Option<&'a str>,\n        object: Option<&'a str>,\n    ) -> QueryBuilderResult<'a> {\n        let store_result = match (bucket, object) {\n            (Some(bucket_inner), Some(object_inner)) => {\n                StoreItemBuilder::from_depth_3(collection, bucket_inner, object_inner)\n            }\n            (Some(bucket_inner), None) => StoreItemBuilder::from_depth_2(collection, bucket_inner),\n            _ => StoreItemBuilder::from_depth_1(collection),\n        };\n\n        match store_result {\n            Ok(store) => Ok(Query::Count(store)),\n            _ => Err(()),\n        }\n    }\n\n    pub fn flushc(collection: &str) -> QueryBuilderResult<'_> {\n        match StoreItemBuilder::from_depth_1(collection) {\n            Ok(store) => Ok(Query::FlushC(store)),\n            _ => Err(()),\n        }\n    }\n\n    pub fn flushb<'a>(collection: &'a str, bucket: &'a str) -> QueryBuilderResult<'a> {\n        match StoreItemBuilder::from_depth_2(collection, bucket) {\n            Ok(store) => Ok(Query::FlushB(store)),\n            _ => Err(()),\n        }\n    }\n\n    pub fn flusho<'a>(\n        collection: &'a str,\n        bucket: &'a str,\n        object: &'a str,\n    ) -> QueryBuilderResult<'a> {\n        match StoreItemBuilder::from_depth_3(collection, bucket, object) {\n            Ok(store) => Ok(Query::FlushO(store)),\n            _ => Err(()),\n        }\n    }\n}\n\n#[cfg(test)]\nmod tests {\n    use super::*;\n\n    #[test]\n    fn it_builds_search_query() {\n        assert!(\n            QueryBuilder::search(\"id1\", \"c:test:1\", \"b:test:1\", \"Michael Dake\", 10, 20, None)\n                .is_ok()\n        );\n        assert!(QueryBuilder::search(\"id2\", \"c:test:1\", \"\", \"Michael Dake\", 1, 0, None).is_err());\n    }\n\n    #[test]\n    fn it_builds_suggest_query() {\n        assert!(QueryBuilder::suggest(\"id1\", \"c:test:2\", \"b:test:2\", \"Micha\", 5).is_ok());\n        assert!(QueryBuilder::suggest(\"id2\", \"c:test:2\", \"\", \"Micha\", 1).is_err());\n    }\n\n    #[test]\n    fn it_builds_list_query() {\n        assert!(QueryBuilder::list(\"id1\", \"c:test:2\", \"b:test:2\", 100, 0).is_ok());\n        assert!(QueryBuilder::list(\"id2\", \"c:test:2\", \"\", 10, 0).is_err());\n    }\n\n    #[test]\n    fn it_builds_push_query() {\n        assert!(QueryBuilder::push(\n            \"c:test:3\",\n            \"b:test:3\",\n            \"o:test:3\",\n            \"My name is Michael Dake. I'm ordering in the US.\",\n            None\n        )\n        .is_ok());\n        assert!(\n            QueryBuilder::push(\"c:test:3\", \"\", \"o:test:3\", \"My name is Michael Dake.\", None)\n                .is_err()\n        );\n    }\n\n    #[test]\n    fn it_builds_pop_query() {\n        assert!(QueryBuilder::pop(\"c:test:4\", \"b:test:4\", \"o:test:4\", \"ordering US\").is_ok());\n        assert!(QueryBuilder::pop(\"c:test:4\", \"\", \"o:test:4\", \"ordering US\").is_err());\n    }\n\n    #[test]\n    fn it_builds_count_query() {\n        assert!(QueryBuilder::count(\"c:test:5\", None, None).is_ok());\n        assert!(QueryBuilder::count(\"c:test:5\", Some(\"b:test:5\"), None).is_ok());\n        assert!(QueryBuilder::count(\"c:test:5\", Some(\"b:test:5\"), Some(\"o:test:5\")).is_ok());\n        assert!(QueryBuilder::count(\"c:test:5\", Some(\"\"), Some(\"o:test:5\")).is_err());\n    }\n\n    #[test]\n    fn it_builds_flushc_query() {\n        assert!(QueryBuilder::flushc(\"c:test:6\").is_ok());\n        assert!(QueryBuilder::flushc(\"\").is_err());\n    }\n\n    #[test]\n    fn it_builds_flushb_query() {\n        assert!(QueryBuilder::flushb(\"c:test:7\", \"b:test:7\").is_ok());\n        assert!(QueryBuilder::flushb(\"c:test:7\", \"\").is_err());\n    }\n\n    #[test]\n    fn it_builds_flusho_query() {\n        assert!(QueryBuilder::flusho(\"c:test:8\", \"b:test:8\", \"o:test:8\").is_ok());\n        assert!(QueryBuilder::flusho(\"c:test:8\", \"b:test:8\", \"\").is_err());\n    }\n}\n"
  },
  {
    "path": "src/query/mod.rs",
    "content": "// Sonic\n//\n// Fast, lightweight and schema-less search backend\n// Copyright: 2019, Valerian Saliou <valerian@valeriansaliou.name>\n// License: Mozilla Public License v2.0 (MPL v2.0)\n\npub mod actions;\npub mod builder;\npub mod types;\n"
  },
  {
    "path": "src/query/types.rs",
    "content": "// Sonic\n//\n// Fast, lightweight and schema-less search backend\n// Copyright: 2019, Valerian Saliou <valerian@valeriansaliou.name>\n// License: Mozilla Public License v2.0 (MPL v2.0)\n\nuse whatlang::Lang;\n\n#[derive(Debug, PartialEq)]\npub enum QueryGenericLang {\n    Enabled(Lang),\n    Disabled,\n}\n\npub type QuerySearchID<'a> = &'a str;\npub type QuerySearchLimit = u16;\npub type QuerySearchOffset = u32;\n\npub type QueryMetaData = (\n    Option<QuerySearchLimit>,\n    Option<QuerySearchOffset>,\n    Option<QueryGenericLang>,\n);\n\npub type ListMetaData = (Option<QuerySearchLimit>, Option<QuerySearchOffset>);\n\nimpl QueryGenericLang {\n    pub fn from_value(value: &str) -> Option<QueryGenericLang> {\n        if value == \"none\" {\n            Some(QueryGenericLang::Disabled)\n        } else {\n            Lang::from_code(value).map(QueryGenericLang::Enabled)\n        }\n    }\n}\n\n#[cfg(test)]\nmod tests {\n    use super::*;\n\n    #[test]\n    fn it_parses_generic_lang_from_value() {\n        assert_eq!(\n            QueryGenericLang::from_value(\"none\"),\n            Some(QueryGenericLang::Disabled)\n        );\n        assert_eq!(\n            QueryGenericLang::from_value(\"fra\"),\n            Some(QueryGenericLang::Enabled(Lang::Fra))\n        );\n        assert_eq!(QueryGenericLang::from_value(\"xxx\"), None);\n    }\n}\n"
  },
  {
    "path": "src/stopwords/afr.rs",
    "content": "// Sonic\n//\n// Fast, lightweight and schema-less search backend\n// Copyright: 2019, Valerian Saliou <valerian@valeriansaliou.name>\n// License: Mozilla Public License v2.0 (MPL v2.0)\n\npub static STOPWORDS_AFR: &[&str] = &[\n    \"'n\", \"aan\", \"af\", \"al\", \"as\", \"baie\", \"by\", \"daar\", \"dag\", \"dat\", \"die\", \"dit\", \"een\", \"ek\",\n    \"en\", \"gaan\", \"gesê\", \"haar\", \"het\", \"hom\", \"hulle\", \"hy\", \"in\", \"is\", \"jou\", \"jy\", \"kan\",\n    \"kom\", \"ma\", \"maar\", \"met\", \"my\", \"na\", \"nie\", \"om\", \"ons\", \"op\", \"saam\", \"sal\", \"se\", \"sien\",\n    \"so\", \"sy\", \"te\", \"toe\", \"uit\", \"van\", \"vir\", \"was\", \"wat\", \"ŉ\",\n];\n"
  },
  {
    "path": "src/stopwords/aka.rs",
    "content": "// Sonic\n//\n// Fast, lightweight and schema-less search backend\n// Copyright: 2019, Valerian Saliou <valerian@valeriansaliou.name>\n// License: Mozilla Public License v2.0 (MPL v2.0)\n\n// Notice: we do not have stopwords for this language yet.\npub static STOPWORDS_AKA: &[&str] = &[];\n"
  },
  {
    "path": "src/stopwords/amh.rs",
    "content": "// Sonic\n//\n// Fast, lightweight and schema-less search backend\n// Copyright: 2019, Valerian Saliou <valerian@valeriansaliou.name>\n// License: Mozilla Public License v2.0 (MPL v2.0)\n\n// Notice: we do not have stopwords for this language yet.\npub static STOPWORDS_AMH: &[&str] = &[];\n"
  },
  {
    "path": "src/stopwords/ara.rs",
    "content": "// Sonic\n//\n// Fast, lightweight and schema-less search backend\n// Copyright: 2019, Valerian Saliou <valerian@valeriansaliou.name>\n// License: Mozilla Public License v2.0 (MPL v2.0)\n\npub static STOPWORDS_ARA: &[&str] = &[\n    \"،\",\n    \"آض\",\n    \"آمينَ\",\n    \"آه\",\n    \"آهاً\",\n    \"آي\",\n    \"أ\",\n    \"أب\",\n    \"أجل\",\n    \"أجمع\",\n    \"أخ\",\n    \"أخذ\",\n    \"أصبح\",\n    \"أضحى\",\n    \"أقبل\",\n    \"أقل\",\n    \"أكثر\",\n    \"ألا\",\n    \"أم\",\n    \"أما\",\n    \"أمامك\",\n    \"أمامكَ\",\n    \"أمسى\",\n    \"أمّا\",\n    \"أن\",\n    \"أنا\",\n    \"أنت\",\n    \"أنتم\",\n    \"أنتما\",\n    \"أنتن\",\n    \"أنتِ\",\n    \"أنشأ\",\n    \"أنّى\",\n    \"أو\",\n    \"أوشك\",\n    \"أولئك\",\n    \"أولئكم\",\n    \"أولاء\",\n    \"أولالك\",\n    \"أوّهْ\",\n    \"أي\",\n    \"أيا\",\n    \"أين\",\n    \"أينما\",\n    \"أيّ\",\n    \"أَنَّ\",\n    \"أََيُّ\",\n    \"أُفٍّ\",\n    \"إذ\",\n    \"إذا\",\n    \"إذاً\",\n    \"إذما\",\n    \"إذن\",\n    \"إلى\",\n    \"إليكم\",\n    \"إليكما\",\n    \"إليكنّ\",\n    \"إليكَ\",\n    \"إلَيْكَ\",\n    \"إلّا\",\n    \"إمّا\",\n    \"إن\",\n    \"إنّما\",\n    \"إي\",\n    \"إياك\",\n    \"إياكم\",\n    \"إياكما\",\n    \"إياكن\",\n    \"إيانا\",\n    \"إياه\",\n    \"إياها\",\n    \"إياهم\",\n    \"إياهما\",\n    \"إياهن\",\n    \"إياي\",\n    \"إيهٍ\",\n    \"إِنَّ\",\n    \"ا\",\n    \"ابتدأ\",\n    \"اثر\",\n    \"اجل\",\n    \"احد\",\n    \"اخرى\",\n    \"اخلولق\",\n    \"اذا\",\n    \"اربعة\",\n    \"ارتدّ\",\n    \"استحال\",\n    \"اطار\",\n    \"اعادة\",\n    \"اعلنت\",\n    \"اف\",\n    \"اكثر\",\n    \"اكد\",\n    \"الألاء\",\n    \"الألى\",\n    \"الا\",\n    \"الاخيرة\",\n    \"الان\",\n    \"الاول\",\n    \"الاولى\",\n    \"التى\",\n    \"التي\",\n    \"الثاني\",\n    \"الثانية\",\n    \"الذاتي\",\n    \"الذى\",\n    \"الذي\",\n    \"الذين\",\n    \"السابق\",\n    \"الف\",\n    \"اللائي\",\n    \"اللاتي\",\n    \"اللتان\",\n    \"اللتيا\",\n    \"اللتين\",\n    \"اللذان\",\n    \"اللذين\",\n    \"اللواتي\",\n    \"الماضي\",\n    \"المقبل\",\n    \"الوقت\",\n    \"الى\",\n    \"اليوم\",\n    \"اما\",\n    \"امام\",\n    \"امس\",\n    \"ان\",\n    \"انبرى\",\n    \"انقلب\",\n    \"انه\",\n    \"انها\",\n    \"او\",\n    \"اول\",\n    \"اي\",\n    \"ايار\",\n    \"ايام\",\n    \"ايضا\",\n    \"ب\",\n    \"بات\",\n    \"باسم\",\n    \"بان\",\n    \"بخٍ\",\n    \"برس\",\n    \"بسبب\",\n    \"بسّ\",\n    \"بشكل\",\n    \"بضع\",\n    \"بطآن\",\n    \"بعد\",\n    \"بعض\",\n    \"بك\",\n    \"بكم\",\n    \"بكما\",\n    \"بكن\",\n    \"بل\",\n    \"بلى\",\n    \"بما\",\n    \"بماذا\",\n    \"بمن\",\n    \"بن\",\n    \"بنا\",\n    \"به\",\n    \"بها\",\n    \"بي\",\n    \"بيد\",\n    \"بين\",\n    \"بَسْ\",\n    \"بَلْهَ\",\n    \"بِئْسَ\",\n    \"تانِ\",\n    \"تانِك\",\n    \"تبدّل\",\n    \"تجاه\",\n    \"تحوّل\",\n    \"تلقاء\",\n    \"تلك\",\n    \"تلكم\",\n    \"تلكما\",\n    \"تم\",\n    \"تينك\",\n    \"تَيْنِ\",\n    \"تِه\",\n    \"تِي\",\n    \"ثلاثة\",\n    \"ثم\",\n    \"ثمّ\",\n    \"ثمّة\",\n    \"ثُمَّ\",\n    \"جعل\",\n    \"جلل\",\n    \"جميع\",\n    \"جير\",\n    \"حار\",\n    \"حاشا\",\n    \"حاليا\",\n    \"حاي\",\n    \"حتى\",\n    \"حرى\",\n    \"حسب\",\n    \"حم\",\n    \"حوالى\",\n    \"حول\",\n    \"حيث\",\n    \"حيثما\",\n    \"حين\",\n    \"حيَّ\",\n    \"حَبَّذَا\",\n    \"حَتَّى\",\n    \"حَذارِ\",\n    \"خلا\",\n    \"خلال\",\n    \"دون\",\n    \"دونك\",\n    \"ذا\",\n    \"ذات\",\n    \"ذاك\",\n    \"ذانك\",\n    \"ذانِ\",\n    \"ذلك\",\n    \"ذلكم\",\n    \"ذلكما\",\n    \"ذلكن\",\n    \"ذو\",\n    \"ذوا\",\n    \"ذواتا\",\n    \"ذواتي\",\n    \"ذيت\",\n    \"ذينك\",\n    \"ذَيْنِ\",\n    \"ذِه\",\n    \"ذِي\",\n    \"راح\",\n    \"رجع\",\n    \"رويدك\",\n    \"ريث\",\n    \"رُبَّ\",\n    \"زيارة\",\n    \"سبحان\",\n    \"سرعان\",\n    \"سنة\",\n    \"سنوات\",\n    \"سوف\",\n    \"سوى\",\n    \"سَاءَ\",\n    \"سَاءَمَا\",\n    \"شبه\",\n    \"شخصا\",\n    \"شرع\",\n    \"شَتَّانَ\",\n    \"صار\",\n    \"صباح\",\n    \"صفر\",\n    \"صهٍ\",\n    \"صهْ\",\n    \"ضد\",\n    \"ضمن\",\n    \"طاق\",\n    \"طالما\",\n    \"طفق\",\n    \"طَق\",\n    \"ظلّ\",\n    \"عاد\",\n    \"عام\",\n    \"عاما\",\n    \"عامة\",\n    \"عدا\",\n    \"عدة\",\n    \"عدد\",\n    \"عدم\",\n    \"عسى\",\n    \"عشر\",\n    \"عشرة\",\n    \"علق\",\n    \"على\",\n    \"عليك\",\n    \"عليه\",\n    \"عليها\",\n    \"علًّ\",\n    \"عن\",\n    \"عند\",\n    \"عندما\",\n    \"عوض\",\n    \"عين\",\n    \"عَدَسْ\",\n    \"عَمَّا\",\n    \"غدا\",\n    \"غير\",\n    \"ـ\",\n    \"ف\",\n    \"فان\",\n    \"فلان\",\n    \"فو\",\n    \"فى\",\n    \"في\",\n    \"فيم\",\n    \"فيما\",\n    \"فيه\",\n    \"فيها\",\n    \"قال\",\n    \"قام\",\n    \"قبل\",\n    \"قد\",\n    \"قطّ\",\n    \"قلما\",\n    \"قوة\",\n    \"كأنّما\",\n    \"كأين\",\n    \"كأيّ\",\n    \"كأيّن\",\n    \"كاد\",\n    \"كان\",\n    \"كانت\",\n    \"كذا\",\n    \"كذلك\",\n    \"كرب\",\n    \"كل\",\n    \"كلا\",\n    \"كلاهما\",\n    \"كلتا\",\n    \"كلم\",\n    \"كليكما\",\n    \"كليهما\",\n    \"كلّما\",\n    \"كلَّا\",\n    \"كم\",\n    \"كما\",\n    \"كي\",\n    \"كيت\",\n    \"كيف\",\n    \"كيفما\",\n    \"كَأَنَّ\",\n    \"كِخ\",\n    \"لئن\",\n    \"لا\",\n    \"لات\",\n    \"لاسيما\",\n    \"لدن\",\n    \"لدى\",\n    \"لعمر\",\n    \"لقاء\",\n    \"لك\",\n    \"لكم\",\n    \"لكما\",\n    \"لكن\",\n    \"لكنَّما\",\n    \"لكي\",\n    \"لكيلا\",\n    \"للامم\",\n    \"لم\",\n    \"لما\",\n    \"لمّا\",\n    \"لن\",\n    \"لنا\",\n    \"له\",\n    \"لها\",\n    \"لو\",\n    \"لوكالة\",\n    \"لولا\",\n    \"لوما\",\n    \"لي\",\n    \"لَسْتَ\",\n    \"لَسْتُ\",\n    \"لَسْتُم\",\n    \"لَسْتُمَا\",\n    \"لَسْتُنَّ\",\n    \"لَسْتِ\",\n    \"لَسْنَ\",\n    \"لَعَلَّ\",\n    \"لَكِنَّ\",\n    \"لَيْتَ\",\n    \"لَيْسَ\",\n    \"لَيْسَا\",\n    \"لَيْسَتَا\",\n    \"لَيْسَتْ\",\n    \"لَيْسُوا\",\n    \"لَِسْنَا\",\n    \"ما\",\n    \"ماانفك\",\n    \"مابرح\",\n    \"مادام\",\n    \"ماذا\",\n    \"مازال\",\n    \"مافتئ\",\n    \"مايو\",\n    \"متى\",\n    \"مثل\",\n    \"مذ\",\n    \"مساء\",\n    \"مع\",\n    \"معاذ\",\n    \"مقابل\",\n    \"مكانكم\",\n    \"مكانكما\",\n    \"مكانكنّ\",\n    \"مكانَك\",\n    \"مليار\",\n    \"مليون\",\n    \"مما\",\n    \"ممن\",\n    \"من\",\n    \"منذ\",\n    \"منها\",\n    \"مه\",\n    \"مهما\",\n    \"مَنْ\",\n    \"مِن\",\n    \"نحن\",\n    \"نحو\",\n    \"نعم\",\n    \"نفس\",\n    \"نفسه\",\n    \"نهاية\",\n    \"نَخْ\",\n    \"نِعِمّا\",\n    \"نِعْمَ\",\n    \"ها\",\n    \"هاؤم\",\n    \"هاكَ\",\n    \"هاهنا\",\n    \"هبّ\",\n    \"هذا\",\n    \"هذه\",\n    \"هكذا\",\n    \"هل\",\n    \"هلمَّ\",\n    \"هلّا\",\n    \"هم\",\n    \"هما\",\n    \"هن\",\n    \"هنا\",\n    \"هناك\",\n    \"هنالك\",\n    \"هو\",\n    \"هي\",\n    \"هيا\",\n    \"هيت\",\n    \"هيّا\",\n    \"هَؤلاء\",\n    \"هَاتانِ\",\n    \"هَاتَيْنِ\",\n    \"هَاتِه\",\n    \"هَاتِي\",\n    \"هَجْ\",\n    \"هَذا\",\n    \"هَذانِ\",\n    \"هَذَيْنِ\",\n    \"هَذِه\",\n    \"هَذِي\",\n    \"هَيْهَاتَ\",\n    \"و\",\n    \"و6\",\n    \"وا\",\n    \"واحد\",\n    \"واضاف\",\n    \"واضافت\",\n    \"واكد\",\n    \"وان\",\n    \"واهاً\",\n    \"واوضح\",\n    \"وراءَك\",\n    \"وفي\",\n    \"وقال\",\n    \"وقالت\",\n    \"وقد\",\n    \"وقف\",\n    \"وكان\",\n    \"وكانت\",\n    \"ولا\",\n    \"ولم\",\n    \"ومن\",\n    \"وهو\",\n    \"وهي\",\n    \"ويكأنّ\",\n    \"وَيْ\",\n    \"وُشْكَانََ\",\n    \"يكون\",\n    \"يمكن\",\n    \"يوم\",\n    \"ّأيّان\",\n];\n"
  },
  {
    "path": "src/stopwords/aze.rs",
    "content": "// Sonic\n//\n// Fast, lightweight and schema-less search backend\n// Copyright: 2019, Valerian Saliou <valerian@valeriansaliou.name>\n// License: Mozilla Public License v2.0 (MPL v2.0)\n\npub static STOPWORDS_AZE: &[&str] = &[\n    \"a\",\n    \"ad\",\n    \"altı\",\n    \"altmış\",\n    \"amma\",\n    \"arasında\",\n    \"artıq\",\n    \"ay\",\n    \"az\",\n    \"bax\",\n    \"belə\",\n    \"bəli\",\n    \"bəlkə\",\n    \"beş\",\n    \"bəy\",\n    \"bəzən\",\n    \"bəzi\",\n    \"bilər\",\n    \"bir\",\n    \"biraz\",\n    \"biri\",\n    \"birşey\",\n    \"biz\",\n    \"bizim\",\n    \"bizlər\",\n    \"bu\",\n    \"buna\",\n    \"bundan\",\n    \"bunların\",\n    \"bunu\",\n    \"bunun\",\n    \"buradan\",\n    \"bütün\",\n    \"ci\",\n    \"cı\",\n    \"çox\",\n    \"cu\",\n    \"cü\",\n    \"çünki\",\n    \"da\",\n    \"daha\",\n    \"də\",\n    \"dedi\",\n    \"dək\",\n    \"dən\",\n    \"dəqiqə\",\n    \"deyil\",\n    \"dir\",\n    \"doqquz\",\n    \"doqsan\",\n    \"dörd\",\n    \"düz\",\n    \"ə\",\n    \"edən\",\n    \"edir\",\n    \"əgər\",\n    \"əlbəttə\",\n    \"elə\",\n    \"əlli\",\n    \"ən\",\n    \"əslində\",\n    \"et\",\n    \"etdi\",\n    \"etmə\",\n    \"etmək\",\n    \"faiz\",\n    \"gilə\",\n    \"görə\",\n    \"ha\",\n    \"haqqında\",\n    \"harada\",\n    \"hə\",\n    \"heç\",\n    \"həm\",\n    \"həmin\",\n    \"həmişə\",\n    \"hər\",\n    \"ı\",\n    \"idi\",\n    \"iki\",\n    \"il\",\n    \"ildə\",\n    \"ilə\",\n    \"ilk\",\n    \"in\",\n    \"indi\",\n    \"isə\",\n    \"istifadə\",\n    \"iyirmi\",\n    \"ki\",\n    \"kim\",\n    \"kimə\",\n    \"kimi\",\n    \"lakin\",\n    \"lap\",\n    \"məhz\",\n    \"mən\",\n    \"mənə\",\n    \"mirşey\",\n    \"nə\",\n    \"nəhayət\",\n    \"niyə\",\n    \"o\",\n    \"obirisi\",\n    \"of\",\n    \"olan\",\n    \"olar\",\n    \"olaraq\",\n    \"oldu\",\n    \"olduğu\",\n    \"olmadı\",\n    \"olmaz\",\n    \"olmuşdur\",\n    \"olsun\",\n    \"olur\",\n    \"on\",\n    \"ona\",\n    \"ondan\",\n    \"onlar\",\n    \"onlardan\",\n    \"onların \",\n    \"onsuzda\",\n    \"onu\",\n    \"onun\",\n    \"oradan\",\n    \"otuz\",\n    \"öz\",\n    \"özü\",\n    \"qarşı\",\n    \"qədər\",\n    \"qırx\",\n    \"saat\",\n    \"sadəcə\",\n    \"saniyə\",\n    \"səhv\",\n    \"səkkiz\",\n    \"səksən\",\n    \"sən\",\n    \"sənə\",\n    \"sənin\",\n    \"siz\",\n    \"sizin\",\n    \"sizlər\",\n    \"sonra\",\n    \"təəssüf\",\n    \"ü\",\n    \"üç\",\n    \"üçün\",\n    \"var\",\n    \"və\",\n    \"xan\",\n    \"xanım\",\n    \"xeyr\",\n    \"ya\",\n    \"yalnız\",\n    \"yaxşı\",\n    \"yeddi\",\n    \"yenə\",\n    \"yəni\",\n    \"yetmiş\",\n    \"yox\",\n    \"yoxdur\",\n    \"yoxsa\",\n    \"yüz\",\n    \"zaman\",\n];\n"
  },
  {
    "path": "src/stopwords/bel.rs",
    "content": "// Sonic\n//\n// Fast, lightweight and schema-less search backend\n// Copyright: 2019, Valerian Saliou <valerian@valeriansaliou.name>\n// License: Mozilla Public License v2.0 (MPL v2.0)\n\n// Notice: we do not have stopwords for this language yet.\npub static STOPWORDS_BEL: &[&str] = &[];\n"
  },
  {
    "path": "src/stopwords/ben.rs",
    "content": "// Sonic\n//\n// Fast, lightweight and schema-less search backend\n// Copyright: 2019, Valerian Saliou <valerian@valeriansaliou.name>\n// License: Mozilla Public License v2.0 (MPL v2.0)\n\npub static STOPWORDS_BEN: &[&str] = &[\n    \"অতএব\",\n    \"অথচ\",\n    \"অথবা\",\n    \"অনুযায়ী\",\n    \"অনেক\",\n    \"অনেকে\",\n    \"অনেকেই\",\n    \"অন্তত\",\n    \"অন্য\",\n    \"অবধি\",\n    \"অবশ্য\",\n    \"অর্থাত\",\n    \"আই\",\n    \"আগামী\",\n    \"আগে\",\n    \"আগেই\",\n    \"আছে\",\n    \"আজ\",\n    \"আদ্যভাগে\",\n    \"আপনার\",\n    \"আপনি\",\n    \"আবার\",\n    \"আমরা\",\n    \"আমাকে\",\n    \"আমাদের\",\n    \"আমার\",\n    \"আমি\",\n    \"আর\",\n    \"আরও\",\n    \"ই\",\n    \"ইত্যাদি\",\n    \"ইহা\",\n    \"উচিত\",\n    \"উত্তর\",\n    \"উনি\",\n    \"উপর\",\n    \"উপরে\",\n    \"এ\",\n    \"এঁদের\",\n    \"এঁরা\",\n    \"এই\",\n    \"একই\",\n    \"একটি\",\n    \"একবার\",\n    \"একে\",\n    \"এক্\",\n    \"এখন\",\n    \"এখনও\",\n    \"এখানে\",\n    \"এখানেই\",\n    \"এটা\",\n    \"এটাই\",\n    \"এটি\",\n    \"এত\",\n    \"এতটাই\",\n    \"এতে\",\n    \"এদের\",\n    \"এব\",\n    \"এবং\",\n    \"এবার\",\n    \"এমন\",\n    \"এমনকী\",\n    \"এমনি\",\n    \"এর\",\n    \"এরা\",\n    \"এল\",\n    \"এস\",\n    \"এসে\",\n    \"ঐ\",\n    \"ও\",\n    \"ওঁদের\",\n    \"ওঁর\",\n    \"ওঁরা\",\n    \"ওই\",\n    \"ওকে\",\n    \"ওখানে\",\n    \"ওদের\",\n    \"ওর\",\n    \"ওরা\",\n    \"কখনও\",\n    \"কত\",\n    \"কবে\",\n    \"কমনে\",\n    \"কয়েক\",\n    \"কয়েকটি\",\n    \"করছে\",\n    \"করছেন\",\n    \"করতে\",\n    \"করবে\",\n    \"করবেন\",\n    \"করলে\",\n    \"করলেন\",\n    \"করা\",\n    \"করাই\",\n    \"করায়\",\n    \"করার\",\n    \"করি\",\n    \"করিতে\",\n    \"করিয়া\",\n    \"করিয়ে\",\n    \"করে\",\n    \"করেই\",\n    \"করেছিলেন\",\n    \"করেছে\",\n    \"করেছেন\",\n    \"করেন\",\n    \"কাউকে\",\n    \"কাছ\",\n    \"কাছে\",\n    \"কাজ\",\n    \"কাজে\",\n    \"কারও\",\n    \"কারণ\",\n    \"কি\",\n    \"কিংবা\",\n    \"কিছু\",\n    \"কিছুই\",\n    \"কিন্তু\",\n    \"কী\",\n    \"কে\",\n    \"কেউ\",\n    \"কেউই\",\n    \"কেখা\",\n    \"কেন\",\n    \"কোটি\",\n    \"কোন\",\n    \"কোনও\",\n    \"কোনো\",\n    \"ক্ষেত্রে\",\n    \"কয়েক\",\n    \"খুব\",\n    \"গিয়ে\",\n    \"গিয়েছে\",\n    \"গিয়ে\",\n    \"গুলি\",\n    \"গেছে\",\n    \"গেল\",\n    \"গেলে\",\n    \"গোটা\",\n    \"চলে\",\n    \"চান\",\n    \"চায়\",\n    \"চার\",\n    \"চালু\",\n    \"চেয়ে\",\n    \"চেষ্টা\",\n    \"ছাড়া\",\n    \"ছাড়াও\",\n    \"ছিল\",\n    \"ছিলেন\",\n    \"জন\",\n    \"জনকে\",\n    \"জনের\",\n    \"জন্য\",\n    \"জন্যওজে\",\n    \"জানতে\",\n    \"জানা\",\n    \"জানানো\",\n    \"জানায়\",\n    \"জানিয়ে\",\n    \"জানিয়েছে\",\n    \"জে\",\n    \"জ্নজন\",\n    \"টি\",\n    \"ঠিক\",\n    \"তখন\",\n    \"তত\",\n    \"তথা\",\n    \"তবু\",\n    \"তবে\",\n    \"তা\",\n    \"তাঁকে\",\n    \"তাঁদের\",\n    \"তাঁর\",\n    \"তাঁরা\",\n    \"তাঁাহারা\",\n    \"তাই\",\n    \"তাও\",\n    \"তাকে\",\n    \"তাতে\",\n    \"তাদের\",\n    \"তার\",\n    \"তারপর\",\n    \"তারা\",\n    \"তারৈ\",\n    \"তাহলে\",\n    \"তাহা\",\n    \"তাহাতে\",\n    \"তাহার\",\n    \"তিনঐ\",\n    \"তিনি\",\n    \"তিনিও\",\n    \"তুমি\",\n    \"তুলে\",\n    \"তেমন\",\n    \"তো\",\n    \"তোমার\",\n    \"থাকবে\",\n    \"থাকবেন\",\n    \"থাকা\",\n    \"থাকায়\",\n    \"থাকে\",\n    \"থাকেন\",\n    \"থেকে\",\n    \"থেকেই\",\n    \"থেকেও\",\n    \"দিকে\",\n    \"দিতে\",\n    \"দিন\",\n    \"দিয়ে\",\n    \"দিয়েছে\",\n    \"দিয়েছেন\",\n    \"দিলেন\",\n    \"দু\",\n    \"দুই\",\n    \"দুটি\",\n    \"দুটো\",\n    \"দেওয়া\",\n    \"দেওয়ার\",\n    \"দেওয়া\",\n    \"দেখতে\",\n    \"দেখা\",\n    \"দেখে\",\n    \"দেন\",\n    \"দেয়\",\n    \"দ্বারা\",\n    \"ধরা\",\n    \"ধরে\",\n    \"ধামার\",\n    \"নতুন\",\n    \"নয়\",\n    \"না\",\n    \"নাই\",\n    \"নাকি\",\n    \"নাগাদ\",\n    \"নানা\",\n    \"নিজে\",\n    \"নিজেই\",\n    \"নিজেদের\",\n    \"নিজের\",\n    \"নিতে\",\n    \"নিয়ে\",\n    \"নিয়ে\",\n    \"নেই\",\n    \"নেওয়া\",\n    \"নেওয়ার\",\n    \"নেওয়া\",\n    \"নয়\",\n    \"পক্ষে\",\n    \"পর\",\n    \"পরে\",\n    \"পরেই\",\n    \"পরেও\",\n    \"পর্যন্ত\",\n    \"পাওয়া\",\n    \"পাচ\",\n    \"পারি\",\n    \"পারে\",\n    \"পারেন\",\n    \"পি\",\n    \"পেয়ে\",\n    \"পেয়্র্\",\n    \"প্রতি\",\n    \"প্রথম\",\n    \"প্রভৃতি\",\n    \"প্রযন্ত\",\n    \"প্রাথমিক\",\n    \"প্রায়\",\n    \"প্রায়\",\n    \"ফলে\",\n    \"ফিরে\",\n    \"ফের\",\n    \"বক্তব্য\",\n    \"বদলে\",\n    \"বন\",\n    \"বরং\",\n    \"বলতে\",\n    \"বলল\",\n    \"বললেন\",\n    \"বলা\",\n    \"বলে\",\n    \"বলেছেন\",\n    \"বলেন\",\n    \"বসে\",\n    \"বহু\",\n    \"বা\",\n    \"বাদে\",\n    \"বার\",\n    \"বি\",\n    \"বিনা\",\n    \"বিভিন্ন\",\n    \"বিশেষ\",\n    \"বিষয়টি\",\n    \"বেশ\",\n    \"বেশি\",\n    \"ব্যবহার\",\n    \"ব্যাপারে\",\n    \"ভাবে\",\n    \"ভাবেই\",\n    \"মতো\",\n    \"মতোই\",\n    \"মধ্যভাগে\",\n    \"মধ্যে\",\n    \"মধ্যেই\",\n    \"মধ্যেও\",\n    \"মনে\",\n    \"মাত্র\",\n    \"মাধ্যমে\",\n    \"মোট\",\n    \"মোটেই\",\n    \"যখন\",\n    \"যত\",\n    \"যতটা\",\n    \"যথেষ্ট\",\n    \"যদি\",\n    \"যদিও\",\n    \"যা\",\n    \"যাঁর\",\n    \"যাঁরা\",\n    \"যাওয়া\",\n    \"যাওয়ার\",\n    \"যাওয়া\",\n    \"যাকে\",\n    \"যাচ্ছে\",\n    \"যাতে\",\n    \"যাদের\",\n    \"যান\",\n    \"যাবে\",\n    \"যায়\",\n    \"যার\",\n    \"যারা\",\n    \"যিনি\",\n    \"যে\",\n    \"যেখানে\",\n    \"যেতে\",\n    \"যেন\",\n    \"যেমন\",\n    \"র\",\n    \"রকম\",\n    \"রয়েছে\",\n    \"রাখা\",\n    \"রেখে\",\n    \"লক্ষ\",\n    \"শুধু\",\n    \"শুরু\",\n    \"সঙ্গে\",\n    \"সঙ্গেও\",\n    \"সব\",\n    \"সবার\",\n    \"সমস্ত\",\n    \"সম্প্রতি\",\n    \"সহ\",\n    \"সহিত\",\n    \"সাধারণ\",\n    \"সামনে\",\n    \"সি\",\n    \"সুতরাং\",\n    \"সে\",\n    \"সেই\",\n    \"সেখান\",\n    \"সেখানে\",\n    \"সেটা\",\n    \"সেটাই\",\n    \"সেটাও\",\n    \"সেটি\",\n    \"স্পষ্ট\",\n    \"স্বয়ং\",\n    \"হইতে\",\n    \"হইবে\",\n    \"হইয়া\",\n    \"হওয়া\",\n    \"হওয়ায়\",\n    \"হওয়ার\",\n    \"হচ্ছে\",\n    \"হত\",\n    \"হতে\",\n    \"হতেই\",\n    \"হন\",\n    \"হবে\",\n    \"হবেন\",\n    \"হয়\",\n    \"হয়তো\",\n    \"হয়নি\",\n    \"হয়ে\",\n    \"হয়েই\",\n    \"হয়েছিল\",\n    \"হয়েছে\",\n    \"হয়েছেন\",\n    \"হল\",\n    \"হলে\",\n    \"হলেই\",\n    \"হলেও\",\n    \"হলো\",\n    \"হাজার\",\n    \"হিসাবে\",\n    \"হৈলে\",\n    \"হোক\",\n    \"হয়\",\n];\n"
  },
  {
    "path": "src/stopwords/bul.rs",
    "content": "// Sonic\n//\n// Fast, lightweight and schema-less search backend\n// Copyright: 2019, Valerian Saliou <valerian@valeriansaliou.name>\n// License: Mozilla Public License v2.0 (MPL v2.0)\n\npub static STOPWORDS_BUL: &[&str] = &[\n    \"ð°\",\n    \"ð°ð²ñ‚ðµð½ñ‚ð¸ñ‡ðµð½\",\n    \"ð°ð·\",\n    \"ð°ðºð¾\",\n    \"ð°ð»ð°\",\n    \"ð±ðµ\",\n    \"ð±ðµð·\",\n    \"ð±ðµñˆðµ\",\n    \"ð±ð¸\",\n    \"ð±ð¸ð²ñˆ\",\n    \"ð±ð¸ð²ñˆð°\",\n    \"ð±ð¸ð²ñˆð¾\",\n    \"ð±ð¸ð»\",\n    \"ð±ð¸ð»ð°\",\n    \"ð±ð¸ð»ð¸\",\n    \"ð±ð¸ð»ð¾\",\n    \"ð±ð»ð°ð³ð¾ð´ð°ñ€ñ\",\n    \"ð±ð»ð¸ð·ð¾\",\n    \"ð±ññ…ð°\",\n    \"ð±ñšð´ð°ñ‚\",\n    \"ð±ñšð´ðµ\",\n    \"ð²\",\n    \"ð²ð°ñ\",\n    \"ð²ð°ñˆ\",\n    \"ð²ð°ñˆð°\",\n    \"ð²ðµñ‡ðµ\",\n    \"ð²ðµñ€ð¾ññ‚ð½ð¾\",\n    \"ð²ð·ðµð¼ð°\",\n    \"ð²ð¸\",\n    \"ð²ð¸ðµ\",\n    \"ð²ð¸ð½ð°ð³ð¸\",\n    \"ð²ð½ð¸ð¼ð°ð²ð°\",\n    \"ð²ñðµ\",\n    \"ð²ñðµðºð¸\",\n    \"ð²ñð¸ñ‡ðºð¸\",\n    \"ð²ñð¸ñ‡ðºð¾\",\n    \"ð²ññðºð°\",\n    \"ð²ñšð²\",\n    \"ð²ñšð¿ñ€ðµðºð¸\",\n    \"ð²ñšñ€ñ…ñƒ\",\n    \"ð²ñ€ðµð¼ðµ\",\n    \"ð³\",\n    \"ð³ð¸\",\n    \"ð³ð»ð°ð²ðµð½\",\n    \"ð³ð»ð°ð²ð½ð°\",\n    \"ð³ð»ð°ð²ð½ð¾\",\n    \"ð³ð»ð°ñ\",\n    \"ð³ð¾\",\n    \"ð³ð¾ð´ð¸ð½ð°\",\n    \"ð³ð¾ð´ð¸ð½ð¸\",\n    \"ð³ð¾ð´ð¸ñˆðµð½\",\n    \"ð´\",\n    \"ð´ð°\",\n    \"ð´ð°ð»ð¸\",\n    \"ð´ð²ð°\",\n    \"ð´ð²ð°ð¼ð°\",\n    \"ð´ð²ð°ð¼ð°ñ‚ð°\",\n    \"ð´ð²ðµ\",\n    \"ð´ð²ðµñ‚ðµ\",\n    \"ð´ðµð½\",\n    \"ð´ð½ðµñ\",\n    \"ð´ð½ð¸\",\n    \"ð´ð¾\",\n    \"ð´ð¾ð±ñšñ€\",\n    \"ð´ð¾ð±ñ€ð°\",\n    \"ð´ð¾ð±ñ€ðµ\",\n    \"ð´ð¾ð±ñ€ð¾\",\n    \"ð´ð¾ðºð°ñ‚ð¾\",\n    \"ð´ð¾ðºð¾ð³ð°\",\n    \"ð´ð¾ñðµð³ð°\",\n    \"ð´ð¾ññ‚ð°\",\n    \"ð´ð¾ñ€ð¸\",\n    \"ð´ñ€ñƒð³\",\n    \"ð´ñ€ñƒð³ð°\",\n    \"ð´ñ€ñƒð³ð¸\",\n    \"ðµ\",\n    \"ðµð²ñ‚ð¸ð½\",\n    \"ðµð´ð²ð°\",\n    \"ðµð´ð¸ð½\",\n    \"ðµð´ð½ð°\",\n    \"ðµð´ð½ð°ðºð²ð°\",\n    \"ðµð´ð½ð°ðºð²ð¸\",\n    \"ðµð´ð½ð°ðºñšð²\",\n    \"ðµð´ð½ð¾\",\n    \"ðµðºð¸ð¿\",\n    \"ðµñ‚ð¾\",\n    \"ð¶ð¸ð²ð¾ñ‚\",\n    \"ð·ð°\",\n    \"ð·ð°ð±ð°ð²ñð¼\",\n    \"ð·ð°ð´\",\n    \"ð·ð°ðµð´ð½ð¾\",\n    \"ð·ð°ñðµð³ð°\",\n    \"ð·ð°ñð¿ð°ð»\",\n    \"ð·ð°ñ‚ð¾ð²ð°\",\n    \"ð·ð°ñ‰ð¾\",\n    \"ð·ð°ñ‰ð¾ñ‚ð¾\",\n    \"ð·ð°ñ€ð°ð´ð¸\",\n    \"ð¸\",\n    \"ð¸ð·\",\n    \"ð¸ð»ð¸\",\n    \"ð¸ð¼\",\n    \"ð¸ð¼ð°\",\n    \"ð¸ð¼ð°ñ‚\",\n    \"ð¸ñðºð°\",\n    \"ð¹\",\n    \"ðºð°ð·ð°\",\n    \"ðºð°ðº\",\n    \"ðºð°ðºð²ð°\",\n    \"ðºð°ðºð²ð¾\",\n    \"ðºð°ðºñšð²\",\n    \"ðºð°ðºñ‚ð¾\",\n    \"ðºð°ñ‚ð¾\",\n    \"ðºð¾ð³ð°\",\n    \"ðºð¾ð³ð°ñ‚ð¾\",\n    \"ðºð¾ðµñ‚ð¾\",\n    \"ðºð¾ð¸ñ‚ð¾\",\n    \"ðºð¾ð¹\",\n    \"ðºð¾ð¹ñ‚ð¾\",\n    \"ðºð¾ð»ðºð¾\",\n    \"ðºð¾ññ‚ð¾\",\n    \"ðºñšð´ðµ\",\n    \"ðºñšð´ðµñ‚ð¾\",\n    \"ðºñšð¼\",\n    \"ð»ðµñðµð½\",\n    \"ð»ðµñð½ð¾\",\n    \"ð»ð¸\",\n    \"ð»ð¾ñˆ\",\n    \"ð¼\",\n    \"ð¼ð°ð¹\",\n    \"ð¼ð°ð»ðºð¾\",\n    \"ð¼ðµ\",\n    \"ð¼ðµð¶ð´ñƒ\",\n    \"ð¼ðµðº\",\n    \"ð¼ðµð½\",\n    \"ð¼ðµñðµñ†\",\n    \"ð¼ð¸\",\n    \"ð¼ð½ð¾ð³ð¾\",\n    \"ð¼ð½ð¾ð·ð¸ð½ð°\",\n    \"ð¼ð¾ð³ð°\",\n    \"ð¼ð¾ð³ð°ñ‚\",\n    \"ð¼ð¾ð¶ðµ\",\n    \"ð¼ð¾ðºñšñ€\",\n    \"ð¼ð¾ð»ñ\",\n    \"ð¼ð¾ð¼ðµð½ñ‚ð°\",\n    \"ð¼ñƒ\",\n    \"ð½\",\n    \"ð½ð°\",\n    \"ð½ð°ð´\",\n    \"ð½ð°ð·ð°ð´\",\n    \"ð½ð°ð¹\",\n    \"ð½ð°ð¿ñ€ð°ð²ð¸\",\n    \"ð½ð°ð¿ñ€ðµð´\",\n    \"ð½ð°ð¿ñ€ð¸ð¼ðµñ€\",\n    \"ð½ð°ñ\",\n    \"ð½ðµ\",\n    \"ð½ðµð³ð¾\",\n    \"ð½ðµñ\",\n    \"ð½ðµñ‰ð¾\",\n    \"ð½ð¸\",\n    \"ð½ð¸ðµ\",\n    \"ð½ð¸ðºð¾ð¹\",\n    \"ð½ð¸ñ‚ð¾\",\n    \"ð½ð¸ñ‰ð¾\",\n    \"ð½ð¾\",\n    \"ð½ð¾ð²\",\n    \"ð½ð¾ð²ð°\",\n    \"ð½ð¾ð²ð¸\",\n    \"ð½ð¾ð²ð¸ð½ð°\",\n    \"ð½ñðºð¾ð¸\",\n    \"ð½ñðºð¾ð¹\",\n    \"ð½ñðºð¾ð»ðºð¾\",\n    \"ð½ñð¼ð°\",\n    \"ð¾ð±ð°ñ‡ðµ\",\n    \"ð¾ðºð¾ð»ð¾\",\n    \"ð¾ñð²ðµð½\",\n    \"ð¾ñð¾ð±ðµð½ð¾\",\n    \"ð¾ñ‚\",\n    \"ð¾ñ‚ð³ð¾ñ€ðµ\",\n    \"ð¾ñ‚ð½ð¾ð²ð¾\",\n    \"ð¾ñ‰ðµ\",\n    \"ð¿ð°ðº\",\n    \"ð¿ð¾\",\n    \"ð¿ð¾ð²ðµñ‡ðµ\",\n    \"ð¿ð¾ð²ðµñ‡ðµñ‚ð¾\",\n    \"ð¿ð¾ð´\",\n    \"ð¿ð¾ð½ðµ\",\n    \"ð¿ð¾ñð»ðµ\",\n    \"ð¿ð¾ñ‡ñ‚ð¸\",\n    \"ð¿ð¾ñ€ð°ð´ð¸\",\n    \"ð¿ñšðº\",\n    \"ð¿ñšñ‚ð¸\",\n    \"ð¿ñšñ€ð²ð°ñ‚ð°\",\n    \"ð¿ñšñ€ð²ð¸\",\n    \"ð¿ñšñ€ð²ð¾\",\n    \"ð¿ñ€ð°ð²ð¸\",\n    \"ð¿ñ€ðµð´\",\n    \"ð¿ñ€ðµð´ð¸\",\n    \"ð¿ñ€ðµð·\",\n    \"ð¿ñ€ð¸\",\n    \"ñ\",\n    \"ñð°\",\n    \"ñð°ð¼\",\n    \"ñð°ð¼ð¾\",\n    \"ñðµ\",\n    \"ñðµð³ð°\",\n    \"ñð¸\",\n    \"ñð¸ð½\",\n    \"ñðºð¾ñ€ð¾\",\n    \"ñð»ðµð´\",\n    \"ñð»ðµð´ð²ð°ñ‰\",\n    \"ñð¼ðµ\",\n    \"ñð¼ññ…\",\n    \"ñð¿ð¾ñ€ðµð´\",\n    \"ññšð¼\",\n    \"ññšñ\",\n    \"ññšñ‰ð¾\",\n    \"ññ‚ðµ\",\n    \"ññ€ðµð´\",\n    \"ññ€ðµñ‰ñƒ\",\n    \"ñ\",\n    \"ñðº\",\n    \"ñžð¼ñ€ñƒðº\",\n    \"ñƒ\",\n    \"ñƒñ‚ñ€ðµ\",\n    \"ñ‚\",\n    \"ñ‚.ð½.\",\n    \"ñ‚ð°ð·ð¸\",\n    \"ñ‚ð°ðºð°\",\n    \"ñ‚ð°ðºð¸ð²ð°\",\n    \"ñ‚ð°ðºñšð²\",\n    \"ñ‚ð°ð¼\",\n    \"ñ‚ð²ð¾ð¹\",\n    \"ñ‚ðµ\",\n    \"ñ‚ðµð·ð¸\",\n    \"ñ‚ð¸\",\n    \"ñ‚ð¾\",\n    \"ñ‚ð¾ð²ð°\",\n    \"ñ‚ð¾ð³ð°ð²ð°\",\n    \"ñ‚ð¾ð·ð¸\",\n    \"ñ‚ð¾ð¹\",\n    \"ñ‚ð¾ð»ðºð¾ð²ð°\",\n    \"ñ‚ð¾ñ‡ð½ð¾\",\n    \"ñ‚ñ\",\n    \"ñ‚ññ…\",\n    \"ñ‚ñšð¹\",\n    \"ñ‚ñƒðº\",\n    \"ñ‚ñ€ð¸\",\n    \"ñ‚ñ€ñð±ð²ð°\",\n    \"ñ‡\",\n    \"ñ‡ð°ñð°\",\n    \"ñ‡ðµ\",\n    \"ñ‡ðµññ‚ð¾\",\n    \"ñ‡ñ€ðµð·\",\n    \"ñ…ð°ñ€ðµñð²ð°\",\n    \"ñ…ð¸ð»ñð´ð¸\",\n    \"ñ‰ðµ\",\n    \"ñ‰ð¾ð¼\",\n    \"ñ€ð°ð²ðµð½\",\n    \"ñ€ð°ð²ð½ð°\",\n    \"а\",\n    \"автентичен\",\n    \"аз\",\n    \"ако\",\n    \"ала\",\n    \"бе\",\n    \"без\",\n    \"беше\",\n    \"би\",\n    \"бивш\",\n    \"бивша\",\n    \"бившо\",\n    \"бил\",\n    \"била\",\n    \"били\",\n    \"било\",\n    \"благодаря\",\n    \"близо\",\n    \"бъдат\",\n    \"бъде\",\n    \"бяха\",\n    \"в\",\n    \"вас\",\n    \"ваш\",\n    \"ваша\",\n    \"вероятно\",\n    \"вече\",\n    \"взема\",\n    \"ви\",\n    \"вие\",\n    \"винаги\",\n    \"внимава\",\n    \"време\",\n    \"все\",\n    \"всеки\",\n    \"всички\",\n    \"всичко\",\n    \"всяка\",\n    \"във\",\n    \"въпреки\",\n    \"върху\",\n    \"г\",\n    \"ги\",\n    \"главен\",\n    \"главна\",\n    \"главно\",\n    \"глас\",\n    \"го\",\n    \"година\",\n    \"години\",\n    \"годишен\",\n    \"д\",\n    \"да\",\n    \"дали\",\n    \"два\",\n    \"двама\",\n    \"двамата\",\n    \"две\",\n    \"двете\",\n    \"ден\",\n    \"днес\",\n    \"дни\",\n    \"до\",\n    \"добра\",\n    \"добре\",\n    \"добро\",\n    \"добър\",\n    \"докато\",\n    \"докога\",\n    \"дори\",\n    \"досега\",\n    \"доста\",\n    \"друг\",\n    \"друга\",\n    \"други\",\n    \"е\",\n    \"евтин\",\n    \"едва\",\n    \"един\",\n    \"една\",\n    \"еднаква\",\n    \"еднакви\",\n    \"еднакъв\",\n    \"едно\",\n    \"екип\",\n    \"ето\",\n    \"живот\",\n    \"за\",\n    \"забавям\",\n    \"зад\",\n    \"заедно\",\n    \"заради\",\n    \"засега\",\n    \"заспал\",\n    \"затова\",\n    \"защо\",\n    \"защото\",\n    \"и\",\n    \"из\",\n    \"или\",\n    \"им\",\n    \"има\",\n    \"имат\",\n    \"иска\",\n    \"й\",\n    \"каза\",\n    \"как\",\n    \"каква\",\n    \"какво\",\n    \"както\",\n    \"какъв\",\n    \"като\",\n    \"кога\",\n    \"когато\",\n    \"което\",\n    \"които\",\n    \"кой\",\n    \"който\",\n    \"колко\",\n    \"която\",\n    \"къде\",\n    \"където\",\n    \"към\",\n    \"лесен\",\n    \"лесно\",\n    \"ли\",\n    \"лош\",\n    \"м\",\n    \"май\",\n    \"малко\",\n    \"ме\",\n    \"между\",\n    \"мек\",\n    \"мен\",\n    \"месец\",\n    \"ми\",\n    \"много\",\n    \"мнозина\",\n    \"мога\",\n    \"могат\",\n    \"може\",\n    \"мокър\",\n    \"моля\",\n    \"момента\",\n    \"му\",\n    \"н\",\n    \"на\",\n    \"над\",\n    \"назад\",\n    \"най\",\n    \"направи\",\n    \"напред\",\n    \"например\",\n    \"нас\",\n    \"не\",\n    \"него\",\n    \"нещо\",\n    \"нея\",\n    \"ни\",\n    \"ние\",\n    \"никой\",\n    \"нито\",\n    \"нищо\",\n    \"но\",\n    \"нов\",\n    \"нова\",\n    \"нови\",\n    \"новина\",\n    \"някои\",\n    \"някой\",\n    \"няколко\",\n    \"няма\",\n    \"обаче\",\n    \"около\",\n    \"освен\",\n    \"особено\",\n    \"от\",\n    \"отгоре\",\n    \"отново\",\n    \"още\",\n    \"пак\",\n    \"по\",\n    \"повече\",\n    \"повечето\",\n    \"под\",\n    \"поне\",\n    \"поради\",\n    \"после\",\n    \"почти\",\n    \"прави\",\n    \"пред\",\n    \"преди\",\n    \"през\",\n    \"при\",\n    \"пък\",\n    \"първата\",\n    \"първи\",\n    \"първо\",\n    \"пъти\",\n    \"равен\",\n    \"равна\",\n    \"с\",\n    \"са\",\n    \"сам\",\n    \"само\",\n    \"се\",\n    \"сега\",\n    \"си\",\n    \"син\",\n    \"скоро\",\n    \"след\",\n    \"следващ\",\n    \"сме\",\n    \"смях\",\n    \"според\",\n    \"сред\",\n    \"срещу\",\n    \"сте\",\n    \"съм\",\n    \"със\",\n    \"също\",\n    \"т\",\n    \"т.н.\",\n    \"тази\",\n    \"така\",\n    \"такива\",\n    \"такъв\",\n    \"там\",\n    \"твой\",\n    \"те\",\n    \"тези\",\n    \"ти\",\n    \"то\",\n    \"това\",\n    \"тогава\",\n    \"този\",\n    \"той\",\n    \"толкова\",\n    \"точно\",\n    \"три\",\n    \"трябва\",\n    \"тук\",\n    \"тъй\",\n    \"тя\",\n    \"тях\",\n    \"у\",\n    \"утре\",\n    \"харесва\",\n    \"хиляди\",\n    \"ч\",\n    \"часа\",\n    \"че\",\n    \"често\",\n    \"чрез\",\n    \"ще\",\n    \"щом\",\n    \"юмрук\",\n    \"я\",\n    \"як\",\n];\n"
  },
  {
    "path": "src/stopwords/cat.rs",
    "content": "// Sonic\n//\n// Fast, lightweight and schema-less search backend\n// Copyright: 2020, Valerian Saliou <valerian@valeriansaliou.name>\n// License: Mozilla Public License v2.0 (MPL v2.0)\n\n// Stopwords list's original author: Lluís de Yzaguirre i Maura, Laboratori de Tecnologies \\\n//   Lingüístiques de l'IULA-UPF (Institut de Lingüística Aplicada de la Universitat Pompeu Fabra)\n\npub static STOPWORDS_CAT: &[&str] = &[\n    \"a\",\n    \"abans\",\n    \"abans-d'ahir\",\n    \"abintestat\",\n    \"ací\",\n    \"adesiara\",\n    \"adés\",\n    \"adéu\",\n    \"adàgio\",\n    \"ah\",\n    \"ahir\",\n    \"ai\",\n    \"aitambé\",\n    \"aitampoc\",\n    \"aitan\",\n    \"aitant\",\n    \"aitantost\",\n    \"aixà\",\n    \"això\",\n    \"així\",\n    \"aleshores\",\n    \"algun\",\n    \"alguna\",\n    \"algunes\",\n    \"alguns\",\n    \"algú\",\n    \"alhora\",\n    \"allà\",\n    \"allèn\",\n    \"allò\",\n    \"allí\",\n    \"almenys\",\n    \"alto\",\n    \"altra\",\n    \"altre\",\n    \"altres\",\n    \"altresí\",\n    \"altri\",\n    \"alça\",\n    \"al·legro\",\n    \"amargament\",\n    \"amb\",\n    \"ambdues\",\n    \"ambdós\",\n    \"amunt\",\n    \"amén\",\n    \"anc\",\n    \"andante\",\n    \"andantino\",\n    \"anit\",\n    \"ans\",\n    \"antany\",\n    \"apa\",\n    \"aprés\",\n    \"aqueix\",\n    \"aqueixa\",\n    \"aqueixes\",\n    \"aqueixos\",\n    \"aqueixs\",\n    \"aquell\",\n    \"aquella\",\n    \"aquelles\",\n    \"aquells\",\n    \"aquest\",\n    \"aquesta\",\n    \"aquestes\",\n    \"aquests\",\n    \"aquèn\",\n    \"aquí\",\n    \"ara\",\n    \"arran\",\n    \"arrera\",\n    \"arrere\",\n    \"arreu\",\n    \"arri\",\n    \"arruix\",\n    \"atxim\",\n    \"au\",\n    \"avall\",\n    \"avant\",\n    \"aviat\",\n    \"avui\",\n    \"açò\",\n    \"bah\",\n    \"baix\",\n    \"baldament\",\n    \"ballmanetes\",\n    \"banzim-banzam\",\n    \"bastant\",\n    \"bastants\",\n    \"ben\",\n    \"bis\",\n    \"bitllo-bitllo\",\n    \"bo\",\n    \"bé\",\n    \"ca\",\n    \"cada\",\n    \"cal\",\n    \"cap\",\n    \"car\",\n    \"caram\",\n    \"catorze\",\n    \"cent\",\n    \"centes\",\n    \"cents\",\n    \"cerca\",\n    \"cert\",\n    \"certa\",\n    \"certes\",\n    \"certs\",\n    \"cinc\",\n    \"cinquanta\",\n    \"cinquena\",\n    \"cinquenes\",\n    \"cinquens\",\n    \"cinquè\",\n    \"com\",\n    \"comsevulla\",\n    \"contra\",\n    \"cordons\",\n    \"corrents\",\n    \"cric-crac\",\n    \"d\",\n    \"daixonses\",\n    \"daixò\",\n    \"dallonses\",\n    \"dallò\",\n    \"dalt\",\n    \"daltabaix\",\n    \"damunt\",\n    \"darrera\",\n    \"darrere\",\n    \"davall\",\n    \"davant\",\n    \"de\",\n    \"debades\",\n    \"dedins\",\n    \"defora\",\n    \"dejorn\",\n    \"dejús\",\n    \"dellà\",\n    \"dementre\",\n    \"dempeus\",\n    \"demés\",\n    \"demà\",\n    \"des\",\n    \"desena\",\n    \"desenes\",\n    \"desens\",\n    \"després\",\n    \"dessobre\",\n    \"dessota\",\n    \"dessús\",\n    \"desè\",\n    \"deu\",\n    \"devers\",\n    \"devora\",\n    \"deçà\",\n    \"diferents\",\n    \"dinou\",\n    \"dins\",\n    \"dintre\",\n    \"disset\",\n    \"divers\",\n    \"diversa\",\n    \"diverses\",\n    \"diversos\",\n    \"divuit\",\n    \"doncs\",\n    \"dos\",\n    \"dotze\",\n    \"dues\",\n    \"durant\",\n    \"ecs\",\n    \"eh\",\n    \"el\",\n    \"ela\",\n    \"elis\",\n    \"ell\",\n    \"ella\",\n    \"elles\",\n    \"ells\",\n    \"els\",\n    \"em\",\n    \"emperò\",\n    \"en\",\n    \"enans\",\n    \"enant\",\n    \"encara\",\n    \"encontinent\",\n    \"endalt\",\n    \"endarrera\",\n    \"endarrere\",\n    \"endavant\",\n    \"endebades\",\n    \"endemig\",\n    \"endemés\",\n    \"endemà\",\n    \"endins\",\n    \"endintre\",\n    \"enfora\",\n    \"engir\",\n    \"enguany\",\n    \"enguanyasses\",\n    \"enjús\",\n    \"enlaire\",\n    \"enlloc\",\n    \"enllà\",\n    \"enrera\",\n    \"enrere\",\n    \"ens\",\n    \"ensems\",\n    \"ensota\",\n    \"ensús\",\n    \"entorn\",\n    \"entre\",\n    \"entremig\",\n    \"entretant\",\n    \"entrò\",\n    \"envers\",\n    \"envides\",\n    \"environs\",\n    \"enviró\",\n    \"ençà\",\n    \"ep\",\n    \"ep\",\n    \"era\",\n    \"eren\",\n    \"eres\",\n    \"ergo\",\n    \"es\",\n    \"escar\",\n    \"essent\",\n    \"esser\",\n    \"est\",\n    \"esta\",\n    \"estada\",\n    \"estades\",\n    \"estan\",\n    \"estant\",\n    \"estar\",\n    \"estaran\",\n    \"estarem\",\n    \"estareu\",\n    \"estaria\",\n    \"estarien\",\n    \"estaries\",\n    \"estaré\",\n    \"estarà\",\n    \"estaràs\",\n    \"estaríem\",\n    \"estaríeu\",\n    \"estat\",\n    \"estats\",\n    \"estava\",\n    \"estaven\",\n    \"estaves\",\n    \"estem\",\n    \"estes\",\n    \"esteu\",\n    \"estic\",\n    \"estiguem\",\n    \"estigueren\",\n    \"estigueres\",\n    \"estigues\",\n    \"estiguessis\",\n    \"estigueu\",\n    \"estigui\",\n    \"estiguin\",\n    \"estiguis\",\n    \"estigué\",\n    \"estiguérem\",\n    \"estiguéreu\",\n    \"estigués\",\n    \"estiguí\",\n    \"estos\",\n    \"està\",\n    \"estàs\",\n    \"estàvem\",\n    \"estàveu\",\n    \"et\",\n    \"etc\",\n    \"etcètera\",\n    \"ets\",\n    \"excepte\",\n    \"fins\",\n    \"fora\",\n    \"foren\",\n    \"fores\",\n    \"força\",\n    \"fos\",\n    \"fossin\",\n    \"fossis\",\n    \"fou\",\n    \"fra\",\n    \"fui\",\n    \"fóra\",\n    \"fórem\",\n    \"fóreu\",\n    \"fóreu\",\n    \"fóssim\",\n    \"fóssiu\",\n    \"gaire\",\n    \"gairebé\",\n    \"gaires\",\n    \"gens\",\n    \"girientorn\",\n    \"gratis\",\n    \"ha\",\n    \"hagi\",\n    \"hagin\",\n    \"hagis\",\n    \"haguda\",\n    \"hagudes\",\n    \"hagueren\",\n    \"hagueres\",\n    \"haguessin\",\n    \"haguessis\",\n    \"hagut\",\n    \"haguts\",\n    \"hagué\",\n    \"haguérem\",\n    \"haguéreu\",\n    \"hagués\",\n    \"haguéssim\",\n    \"haguéssiu\",\n    \"haguí\",\n    \"hala\",\n    \"han\",\n    \"has\",\n    \"hauran\",\n    \"haurem\",\n    \"haureu\",\n    \"hauria\",\n    \"haurien\",\n    \"hauries\",\n    \"hauré\",\n    \"haurà\",\n    \"hauràs\",\n    \"hauríem\",\n    \"hauríeu\",\n    \"havem\",\n    \"havent\",\n    \"haver\",\n    \"haveu\",\n    \"havia\",\n    \"havien\",\n    \"havies\",\n    \"havíem\",\n    \"havíeu\",\n    \"he\",\n    \"hem\",\n    \"heu\",\n    \"hi\",\n    \"ho\",\n    \"hom\",\n    \"hui\",\n    \"hàgim\",\n    \"hàgiu\",\n    \"i\",\n    \"igual\",\n    \"iguals\",\n    \"inclusive\",\n    \"ja\",\n    \"jamai\",\n    \"jo\",\n    \"l\",\n    \"la\",\n    \"leri-leri\",\n    \"les\",\n    \"li\",\n    \"lla\",\n    \"llavors\",\n    \"llevat\",\n    \"lluny\",\n    \"llur\",\n    \"llurs\",\n    \"lo\",\n    \"los\",\n    \"ls\",\n    \"m\",\n    \"ma\",\n    \"mai\",\n    \"mal\",\n    \"malament\",\n    \"malgrat\",\n    \"manco\",\n    \"mant\",\n    \"manta\",\n    \"mantes\",\n    \"mantinent\",\n    \"mants\",\n    \"massa\",\n    \"mateix\",\n    \"mateixa\",\n    \"mateixes\",\n    \"mateixos\",\n    \"me\",\n    \"mentre\",\n    \"mentrestant\",\n    \"menys\",\n    \"mes\",\n    \"meu\",\n    \"meua\",\n    \"meues\",\n    \"meus\",\n    \"meva\",\n    \"meves\",\n    \"mi\",\n    \"mig\",\n    \"mil\",\n    \"mitges\",\n    \"mitja\",\n    \"mitjançant\",\n    \"mitjos\",\n    \"moixoni\",\n    \"molt\",\n    \"molta\",\n    \"moltes\",\n    \"molts\",\n    \"mon\",\n    \"mos\",\n    \"més\",\n    \"n\",\n    \"na\",\n    \"ne\",\n    \"ni\",\n    \"ningú\",\n    \"no\",\n    \"nogensmenys\",\n    \"només\",\n    \"noranta\",\n    \"nos\",\n    \"nosaltres\",\n    \"nostra\",\n    \"nostre\",\n    \"nostres\",\n    \"nou\",\n    \"novena\",\n    \"novenes\",\n    \"novens\",\n    \"novè\",\n    \"ns\",\n    \"nòs\",\n    \"nós\",\n    \"o\",\n    \"oh\",\n    \"oi\",\n    \"oidà\",\n    \"on\",\n    \"onsevulga\",\n    \"onsevulla\",\n    \"onze\",\n    \"pas\",\n    \"pengim-penjam\",\n    \"per\",\n    \"perquè\",\n    \"pertot\",\n    \"però\",\n    \"piano\",\n    \"pla\",\n    \"poc\",\n    \"poca\",\n    \"pocs\",\n    \"poques\",\n    \"potser\",\n    \"prest\",\n    \"primer\",\n    \"primera\",\n    \"primeres\",\n    \"primers\",\n    \"pro\",\n    \"prompte\",\n    \"prop\",\n    \"prou\",\n    \"puix\",\n    \"pus\",\n    \"pàssim\",\n    \"qual\",\n    \"quals\",\n    \"qualsevol\",\n    \"qualsevulla\",\n    \"qualssevol\",\n    \"qualssevulla\",\n    \"quan\",\n    \"quant\",\n    \"quanta\",\n    \"quantes\",\n    \"quants\",\n    \"quaranta\",\n    \"quart\",\n    \"quarta\",\n    \"quartes\",\n    \"quarts\",\n    \"quasi\",\n    \"quatre\",\n    \"que\",\n    \"quelcom\",\n    \"qui\",\n    \"quin\",\n    \"quina\",\n    \"quines\",\n    \"quins\",\n    \"quinze\",\n    \"quisvulla\",\n    \"què\",\n    \"ran\",\n    \"re\",\n    \"rebé\",\n    \"renoi\",\n    \"rera\",\n    \"rere\",\n    \"res\",\n    \"retruc\",\n    \"s\",\n    \"sa\",\n    \"salvament\",\n    \"salvant\",\n    \"salvat\",\n    \"se\",\n    \"segon\",\n    \"segona\",\n    \"segones\",\n    \"segons\",\n    \"seguida\",\n    \"seixanta\",\n    \"sempre\",\n    \"sengles\",\n    \"sens\",\n    \"sense\",\n    \"ser\",\n    \"seran\",\n    \"serem\",\n    \"sereu\",\n    \"seria\",\n    \"serien\",\n    \"series\",\n    \"seré\",\n    \"serà\",\n    \"seràs\",\n    \"seríem\",\n    \"seríeu\",\n    \"ses\",\n    \"set\",\n    \"setanta\",\n    \"setena\",\n    \"setenes\",\n    \"setens\",\n    \"setze\",\n    \"setè\",\n    \"seu\",\n    \"seua\",\n    \"seues\",\n    \"seus\",\n    \"seva\",\n    \"seves\",\n    \"si\",\n    \"sia\",\n    \"siau\",\n    \"sic\",\n    \"siguem\",\n    \"sigues\",\n    \"sigueu\",\n    \"sigui\",\n    \"siguin\",\n    \"siguis\",\n    \"sinó\",\n    \"sis\",\n    \"sisena\",\n    \"sisenes\",\n    \"sisens\",\n    \"sisè\",\n    \"sobre\",\n    \"sobretot\",\n    \"sol\",\n    \"sola\",\n    \"solament\",\n    \"soles\",\n    \"sols\",\n    \"som\",\n    \"son\",\n    \"sos\",\n    \"sota\",\n    \"sots\",\n    \"sou\",\n    \"sovint\",\n    \"suara\",\n    \"sí\",\n    \"sóc\",\n    \"són\",\n    \"t\",\n    \"ta\",\n    \"tal\",\n    \"tals\",\n    \"també\",\n    \"tampoc\",\n    \"tan\",\n    \"tanmateix\",\n    \"tant\",\n    \"tanta\",\n    \"tantes\",\n    \"tantost\",\n    \"tants\",\n    \"te\",\n    \"tercer\",\n    \"tercera\",\n    \"terceres\",\n    \"tercers\",\n    \"tes\",\n    \"teu\",\n    \"teua\",\n    \"teues\",\n    \"teus\",\n    \"teva\",\n    \"teves\",\n    \"ton\",\n    \"tos\",\n    \"tost\",\n    \"tostemps\",\n    \"tot\",\n    \"tota\",\n    \"total\",\n    \"totes\",\n    \"tothom\",\n    \"tothora\",\n    \"tots\",\n    \"trenta\",\n    \"tres\",\n    \"tret\",\n    \"tretze\",\n    \"tu\",\n    \"tururut\",\n    \"u\",\n    \"uf\",\n    \"ui\",\n    \"uix\",\n    \"ultra\",\n    \"un\",\n    \"una\",\n    \"unes\",\n    \"uns\",\n    \"up\",\n    \"upa\",\n    \"us\",\n    \"va\",\n    \"vagi\",\n    \"vagin\",\n    \"vagis\",\n    \"vaig\",\n    \"vair\",\n    \"vam\",\n    \"van\",\n    \"vares\",\n    \"vas\",\n    \"vau\",\n    \"vem\",\n    \"verbigràcia\",\n    \"vers\",\n    \"vet\",\n    \"veu\",\n    \"vint\",\n    \"vora\",\n    \"vos\",\n    \"vosaltres\",\n    \"vostra\",\n    \"vostre\",\n    \"vostres\",\n    \"vostè\",\n    \"vostès\",\n    \"vuit\",\n    \"vuitanta\",\n    \"vuitena\",\n    \"vuitenes\",\n    \"vuitens\",\n    \"vuitè\",\n    \"vés\",\n    \"vàreig\",\n    \"vàrem\",\n    \"vàreu\",\n    \"vós\",\n    \"xano-xano\",\n    \"xau-xau\",\n    \"xec\",\n    \"érem\",\n    \"éreu\",\n    \"és\",\n    \"ésser\",\n    \"àdhuc\",\n    \"àlies\",\n    \"ça\",\n    \"ço\",\n    \"òlim\",\n    \"ídem\",\n    \"últim\",\n    \"última\",\n    \"últimes\",\n    \"últims\",\n    \"únic\",\n    \"única\",\n    \"únics\",\n    \"úniques\",\n];\n"
  },
  {
    "path": "src/stopwords/ces.rs",
    "content": "// Sonic\n//\n// Fast, lightweight and schema-less search backend\n// Copyright: 2019, Valerian Saliou <valerian@valeriansaliou.name>\n// License: Mozilla Public License v2.0 (MPL v2.0)\n\npub static STOPWORDS_CES: &[&str] = &[\n    \"a\",\n    \"aby\",\n    \"ahoj\",\n    \"aj\",\n    \"ale\",\n    \"anebo\",\n    \"ani\",\n    \"aniž\",\n    \"ano\",\n    \"asi\",\n    \"aspoåˆ\",\n    \"aspoň\",\n    \"atd\",\n    \"atp\",\n    \"az\",\n    \"aäkoli\",\n    \"ačkoli\",\n    \"až\",\n    \"bez\",\n    \"beze\",\n    \"blã\\u{AD}zko\",\n    \"blízko\",\n    \"bohuå¾el\",\n    \"bohužel\",\n    \"brzo\",\n    \"bude\",\n    \"budem\",\n    \"budeme\",\n    \"budes\",\n    \"budete\",\n    \"budeå¡\",\n    \"budeš\",\n    \"budou\",\n    \"budu\",\n    \"by\",\n    \"byl\",\n    \"byla\",\n    \"byli\",\n    \"bylo\",\n    \"byly\",\n    \"bys\",\n    \"byt\",\n    \"bä›hem\",\n    \"být\",\n    \"během\",\n    \"chce\",\n    \"chceme\",\n    \"chcete\",\n    \"chceå¡\",\n    \"chceš\",\n    \"chci\",\n    \"chtã\\u{AD}t\",\n    \"chtä›jã\\u{AD}\",\n    \"chtít\",\n    \"chtějí\",\n    \"chut'\",\n    \"chuti\",\n    \"ci\",\n    \"clanek\",\n    \"clanku\",\n    \"clanky\",\n    \"co\",\n    \"coz\",\n    \"což\",\n    \"cz\",\n    \"daleko\",\n    \"dalsi\",\n    \"další\",\n    \"den\",\n    \"deset\",\n    \"design\",\n    \"devatenáct\",\n    \"devatenã¡ct\",\n    \"devä›t\",\n    \"devět\",\n    \"dnes\",\n    \"do\",\n    \"dobrã½\",\n    \"dobrý\",\n    \"docela\",\n    \"dva\",\n    \"dvacet\",\n    \"dvanáct\",\n    \"dvanã¡ct\",\n    \"dvä›\",\n    \"dvě\",\n    \"dál\",\n    \"dále\",\n    \"dã¡l\",\n    \"dã¡le\",\n    \"dä›kovat\",\n    \"dä›kujeme\",\n    \"dä›kuji\",\n    \"děkovat\",\n    \"děkujeme\",\n    \"děkuji\",\n    \"email\",\n    \"ho\",\n    \"hodnä›\",\n    \"hodně\",\n    \"i\",\n    \"jak\",\n    \"jakmile\",\n    \"jako\",\n    \"jakož\",\n    \"jde\",\n    \"je\",\n    \"jeden\",\n    \"jedenáct\",\n    \"jedenã¡ct\",\n    \"jedna\",\n    \"jedno\",\n    \"jednou\",\n    \"jedou\",\n    \"jeho\",\n    \"jehož\",\n    \"jej\",\n    \"jeji\",\n    \"jejich\",\n    \"jejã\\u{AD}\",\n    \"její\",\n    \"jelikož\",\n    \"jemu\",\n    \"jen\",\n    \"jenom\",\n    \"jenž\",\n    \"jeste\",\n    \"jestli\",\n    \"jestliå¾e\",\n    \"jestliže\",\n    \"jeå¡tä›\",\n    \"ještě\",\n    \"jež\",\n    \"ji\",\n    \"jich\",\n    \"jimi\",\n    \"jinak\",\n    \"jine\",\n    \"jiné\",\n    \"jiz\",\n    \"již\",\n    \"jsem\",\n    \"jses\",\n    \"jseš\",\n    \"jsi\",\n    \"jsme\",\n    \"jsou\",\n    \"jste\",\n    \"já\",\n    \"jã¡\",\n    \"jã\\u{AD}\",\n    \"jã\\u{AD}m\",\n    \"jí\",\n    \"jím\",\n    \"jíž\",\n    \"jšte\",\n    \"k\",\n    \"kam\",\n    \"každý\",\n    \"kde\",\n    \"kdo\",\n    \"kdy\",\n    \"kdyz\",\n    \"kdyå¾\",\n    \"když\",\n    \"ke\",\n    \"kolik\",\n    \"kromä›\",\n    \"kromě\",\n    \"ktera\",\n    \"ktere\",\n    \"kteri\",\n    \"kterou\",\n    \"ktery\",\n    \"která\",\n    \"kterã¡\",\n    \"kterã©\",\n    \"kterã½\",\n    \"které\",\n    \"který\",\n    \"kteå™ã\\u{AD}\",\n    \"kteři\",\n    \"kteří\",\n    \"ku\",\n    \"kvå¯li\",\n    \"kvůli\",\n    \"ma\",\n    \"majã\\u{AD}\",\n    \"mají\",\n    \"mate\",\n    \"me\",\n    \"mezi\",\n    \"mi\",\n    \"mit\",\n    \"mne\",\n    \"mnou\",\n    \"mnä›\",\n    \"mně\",\n    \"moc\",\n    \"mohl\",\n    \"mohou\",\n    \"moje\",\n    \"moji\",\n    \"moå¾nã¡\",\n    \"možná\",\n    \"muj\",\n    \"musã\\u{AD}\",\n    \"musí\",\n    \"muze\",\n    \"my\",\n    \"má\",\n    \"málo\",\n    \"mám\",\n    \"máme\",\n    \"máte\",\n    \"máš\",\n    \"mã¡\",\n    \"mã¡lo\",\n    \"mã¡m\",\n    \"mã¡me\",\n    \"mã¡te\",\n    \"mã¡å¡\",\n    \"mã©\",\n    \"mã\\u{AD}\",\n    \"mã\\u{AD}t\",\n    \"mä›\",\n    \"må¯j\",\n    \"må¯å¾e\",\n    \"mé\",\n    \"mí\",\n    \"mít\",\n    \"mě\",\n    \"můj\",\n    \"může\",\n    \"na\",\n    \"nad\",\n    \"nade\",\n    \"nam\",\n    \"napiste\",\n    \"napište\",\n    \"naproti\",\n    \"nas\",\n    \"nasi\",\n    \"naå¡e\",\n    \"naå¡i\",\n    \"načež\",\n    \"naše\",\n    \"naši\",\n    \"ne\",\n    \"nebo\",\n    \"nebyl\",\n    \"nebyla\",\n    \"nebyli\",\n    \"nebyly\",\n    \"nechť\",\n    \"nedä›lajã\\u{AD}\",\n    \"nedä›lã¡\",\n    \"nedä›lã¡m\",\n    \"nedä›lã¡me\",\n    \"nedä›lã¡te\",\n    \"nedä›lã¡å¡\",\n    \"nedělají\",\n    \"nedělá\",\n    \"nedělám\",\n    \"neděláme\",\n    \"neděláte\",\n    \"neděláš\",\n    \"neg\",\n    \"nejsi\",\n    \"nejsou\",\n    \"nemajã\\u{AD}\",\n    \"nemají\",\n    \"nemáme\",\n    \"nemáte\",\n    \"nemã¡me\",\n    \"nemã¡te\",\n    \"nemä›l\",\n    \"neměl\",\n    \"neni\",\n    \"nenã\\u{AD}\",\n    \"není\",\n    \"nestaäã\\u{AD}\",\n    \"nestačí\",\n    \"nevadã\\u{AD}\",\n    \"nevadí\",\n    \"nez\",\n    \"neå¾\",\n    \"než\",\n    \"nic\",\n    \"nich\",\n    \"nimi\",\n    \"nove\",\n    \"novy\",\n    \"nové\",\n    \"nový\",\n    \"nula\",\n    \"ná\",\n    \"nám\",\n    \"námi\",\n    \"nás\",\n    \"náš\",\n    \"nã¡m\",\n    \"nã¡mi\",\n    \"nã¡s\",\n    \"nã¡å¡\",\n    \"nã\\u{AD}m\",\n    \"nä›\",\n    \"nä›co\",\n    \"nä›jak\",\n    \"nä›kde\",\n    \"nä›kdo\",\n    \"nä›mu\",\n    \"ní\",\n    \"ním\",\n    \"ně\",\n    \"něco\",\n    \"nějak\",\n    \"někde\",\n    \"někdo\",\n    \"němu\",\n    \"němuž\",\n    \"o\",\n    \"od\",\n    \"ode\",\n    \"on\",\n    \"ona\",\n    \"oni\",\n    \"ono\",\n    \"ony\",\n    \"osm\",\n    \"osmnáct\",\n    \"osmnã¡ct\",\n    \"pak\",\n    \"patnáct\",\n    \"patnã¡ct\",\n    \"po\",\n    \"pod\",\n    \"podle\",\n    \"pokud\",\n    \"potom\",\n    \"pouze\",\n    \"pozdä›\",\n    \"pozdě\",\n    \"poå™ã¡d\",\n    \"pořád\",\n    \"prave\",\n    \"pravé\",\n    \"pred\",\n    \"pres\",\n    \"pri\",\n    \"pro\",\n    \"proc\",\n    \"prostä›\",\n    \"prostě\",\n    \"prosã\\u{AD}m\",\n    \"prosím\",\n    \"proti\",\n    \"proto\",\n    \"protoze\",\n    \"protoå¾e\",\n    \"protože\",\n    \"proä\",\n    \"proč\",\n    \"prvni\",\n    \"první\",\n    \"práve\",\n    \"pta\",\n    \"pä›t\",\n    \"på™ed\",\n    \"på™es\",\n    \"på™ese\",\n    \"pět\",\n    \"před\",\n    \"přede\",\n    \"přes\",\n    \"přese\",\n    \"při\",\n    \"přičemž\",\n    \"re\",\n    \"rovnä›\",\n    \"rovně\",\n    \"s\",\n    \"se\",\n    \"sedm\",\n    \"sedmnáct\",\n    \"sedmnã¡ct\",\n    \"si\",\n    \"sice\",\n    \"skoro\",\n    \"smã\\u{AD}\",\n    \"smä›jã\\u{AD}\",\n    \"smí\",\n    \"smějí\",\n    \"snad\",\n    \"spolu\",\n    \"sta\",\n    \"sto\",\n    \"strana\",\n    \"stã©\",\n    \"sté\",\n    \"sve\",\n    \"svych\",\n    \"svym\",\n    \"svymi\",\n    \"své\",\n    \"svých\",\n    \"svým\",\n    \"svými\",\n    \"svůj\",\n    \"ta\",\n    \"tady\",\n    \"tak\",\n    \"take\",\n    \"takhle\",\n    \"taky\",\n    \"takze\",\n    \"také\",\n    \"takže\",\n    \"tam\",\n    \"tamhle\",\n    \"tamhleto\",\n    \"tamto\",\n    \"tato\",\n    \"te\",\n    \"tebe\",\n    \"tebou\",\n    \"ted'\",\n    \"tedy\",\n    \"tema\",\n    \"ten\",\n    \"tento\",\n    \"teto\",\n    \"ti\",\n    \"tim\",\n    \"timto\",\n    \"tipy\",\n    \"tisã\\u{AD}c\",\n    \"tisã\\u{AD}ce\",\n    \"tisíc\",\n    \"tisíce\",\n    \"to\",\n    \"tobä›\",\n    \"tobě\",\n    \"tohle\",\n    \"toho\",\n    \"tohoto\",\n    \"tom\",\n    \"tomto\",\n    \"tomu\",\n    \"tomuto\",\n    \"toto\",\n    \"troå¡ku\",\n    \"trošku\",\n    \"tu\",\n    \"tuto\",\n    \"tvoje\",\n    \"tvá\",\n    \"tvã¡\",\n    \"tvã©\",\n    \"två¯j\",\n    \"tvé\",\n    \"tvůj\",\n    \"ty\",\n    \"tyto\",\n    \"tä›\",\n    \"tå™eba\",\n    \"tå™i\",\n    \"tå™inã¡ct\",\n    \"téma\",\n    \"této\",\n    \"tím\",\n    \"tímto\",\n    \"tě\",\n    \"těm\",\n    \"těma\",\n    \"těmu\",\n    \"třeba\",\n    \"tři\",\n    \"třináct\",\n    \"u\",\n    \"uräitä›\",\n    \"určitě\",\n    \"uz\",\n    \"uå¾\",\n    \"už\",\n    \"v\",\n    \"vam\",\n    \"vas\",\n    \"vase\",\n    \"vaå¡e\",\n    \"vaå¡i\",\n    \"vaše\",\n    \"vaši\",\n    \"ve\",\n    \"vedle\",\n    \"veäer\",\n    \"večer\",\n    \"vice\",\n    \"vlastnä›\",\n    \"vlastně\",\n    \"vsak\",\n    \"vy\",\n    \"vám\",\n    \"vámi\",\n    \"vás\",\n    \"váš\",\n    \"vã¡m\",\n    \"vã¡mi\",\n    \"vã¡s\",\n    \"vã¡å¡\",\n    \"vå¡echno\",\n    \"vå¡ichni\",\n    \"vå¯bec\",\n    \"vå¾dy\",\n    \"více\",\n    \"však\",\n    \"všechen\",\n    \"všechno\",\n    \"všichni\",\n    \"vůbec\",\n    \"vždy\",\n    \"z\",\n    \"za\",\n    \"zatã\\u{AD}mco\",\n    \"zatímco\",\n    \"zaä\",\n    \"zač\",\n    \"zda\",\n    \"zde\",\n    \"ze\",\n    \"zpet\",\n    \"zpravy\",\n    \"zprávy\",\n    \"zpět\",\n    \"äau\",\n    \"ätrnã¡ct\",\n    \"ätyå™i\",\n    \"å¡est\",\n    \"å¡estnã¡ct\",\n    \"å¾e\",\n    \"čau\",\n    \"či\",\n    \"článek\",\n    \"článku\",\n    \"články\",\n    \"čtrnáct\",\n    \"čtyři\",\n    \"šest\",\n    \"šestnáct\",\n    \"že\",\n];\n"
  },
  {
    "path": "src/stopwords/cmn.rs",
    "content": "// Sonic\n//\n// Fast, lightweight and schema-less search backend\n// Copyright: 2019, Valerian Saliou <valerian@valeriansaliou.name>\n// License: Mozilla Public License v2.0 (MPL v2.0)\n\npub static STOPWORDS_CMN: &[&str] = &[\n    \"、\",\n    \"。\",\n    \"〈\",\n    \"〉\",\n    \"《\",\n    \"》\",\n    \"一\",\n    \"一些\",\n    \"一何\",\n    \"一切\",\n    \"一则\",\n    \"一方面\",\n    \"一旦\",\n    \"一来\",\n    \"一样\",\n    \"一般\",\n    \"一转眼\",\n    \"七\",\n    \"万一\",\n    \"三\",\n    \"上\",\n    \"上下\",\n    \"下\",\n    \"不\",\n    \"不仅\",\n    \"不但\",\n    \"不光\",\n    \"不单\",\n    \"不只\",\n    \"不外乎\",\n    \"不如\",\n    \"不妨\",\n    \"不尽\",\n    \"不尽然\",\n    \"不得\",\n    \"不怕\",\n    \"不惟\",\n    \"不成\",\n    \"不拘\",\n    \"不料\",\n    \"不是\",\n    \"不比\",\n    \"不然\",\n    \"不特\",\n    \"不独\",\n    \"不管\",\n    \"不至于\",\n    \"不若\",\n    \"不论\",\n    \"不过\",\n    \"不问\",\n    \"与\",\n    \"与其\",\n    \"与其说\",\n    \"与否\",\n    \"与此同时\",\n    \"且\",\n    \"且不说\",\n    \"且说\",\n    \"两者\",\n    \"个\",\n    \"个别\",\n    \"中\",\n    \"临\",\n    \"为\",\n    \"为了\",\n    \"为什么\",\n    \"为何\",\n    \"为止\",\n    \"为此\",\n    \"为着\",\n    \"乃\",\n    \"乃至\",\n    \"乃至于\",\n    \"么\",\n    \"之\",\n    \"之一\",\n    \"之所以\",\n    \"之类\",\n    \"乌乎\",\n    \"乎\",\n    \"乘\",\n    \"九\",\n    \"也\",\n    \"也好\",\n    \"也罢\",\n    \"了\",\n    \"二\",\n    \"二来\",\n    \"于\",\n    \"于是\",\n    \"于是乎\",\n    \"云云\",\n    \"云尔\",\n    \"五\",\n    \"些\",\n    \"亦\",\n    \"人\",\n    \"人们\",\n    \"人家\",\n    \"什\",\n    \"什么\",\n    \"什么样\",\n    \"今\",\n    \"介于\",\n    \"仍\",\n    \"仍旧\",\n    \"从\",\n    \"从此\",\n    \"从而\",\n    \"他\",\n    \"他人\",\n    \"他们\",\n    \"他们们\",\n    \"以\",\n    \"以上\",\n    \"以为\",\n    \"以便\",\n    \"以免\",\n    \"以及\",\n    \"以故\",\n    \"以期\",\n    \"以来\",\n    \"以至\",\n    \"以至于\",\n    \"以致\",\n    \"们\",\n    \"任\",\n    \"任何\",\n    \"任凭\",\n    \"会\",\n    \"似的\",\n    \"但\",\n    \"但凡\",\n    \"但是\",\n    \"何\",\n    \"何以\",\n    \"何况\",\n    \"何处\",\n    \"何时\",\n    \"余外\",\n    \"作为\",\n    \"你\",\n    \"你们\",\n    \"使\",\n    \"使得\",\n    \"例如\",\n    \"依\",\n    \"依据\",\n    \"依照\",\n    \"便于\",\n    \"俺\",\n    \"俺们\",\n    \"倘\",\n    \"倘使\",\n    \"倘或\",\n    \"倘然\",\n    \"倘若\",\n    \"借\",\n    \"借傥然\",\n    \"假使\",\n    \"假如\",\n    \"假若\",\n    \"做\",\n    \"像\",\n    \"儿\",\n    \"先不先\",\n    \"光是\",\n    \"全体\",\n    \"全部\",\n    \"八\",\n    \"六\",\n    \"兮\",\n    \"共\",\n    \"关于\",\n    \"关于具体地说\",\n    \"其\",\n    \"其一\",\n    \"其中\",\n    \"其二\",\n    \"其他\",\n    \"其余\",\n    \"其它\",\n    \"其次\",\n    \"具体地说\",\n    \"具体说来\",\n    \"兼之\",\n    \"内\",\n    \"再\",\n    \"再其次\",\n    \"再则\",\n    \"再有\",\n    \"再者\",\n    \"再者说\",\n    \"再说\",\n    \"冒\",\n    \"冲\",\n    \"况且\",\n    \"几\",\n    \"几时\",\n    \"凡\",\n    \"凡是\",\n    \"凭\",\n    \"凭借\",\n    \"出于\",\n    \"出来\",\n    \"分\",\n    \"分别\",\n    \"则\",\n    \"则甚\",\n    \"别\",\n    \"别人\",\n    \"别处\",\n    \"别是\",\n    \"别的\",\n    \"别管\",\n    \"别说\",\n    \"到\",\n    \"前后\",\n    \"前此\",\n    \"前者\",\n    \"加之\",\n    \"加以\",\n    \"即\",\n    \"即令\",\n    \"即使\",\n    \"即便\",\n    \"即如\",\n    \"即或\",\n    \"即若\",\n    \"却\",\n    \"去\",\n    \"又\",\n    \"又及\",\n    \"及\",\n    \"及其\",\n    \"及至\",\n    \"反之\",\n    \"反而\",\n    \"反过来\",\n    \"反过来说\",\n    \"受到\",\n    \"另\",\n    \"另一方面\",\n    \"另外\",\n    \"另悉\",\n    \"只\",\n    \"只当\",\n    \"只怕\",\n    \"只是\",\n    \"只有\",\n    \"只消\",\n    \"只要\",\n    \"只限\",\n    \"叫\",\n    \"叮咚\",\n    \"可\",\n    \"可以\",\n    \"可是\",\n    \"可见\",\n    \"各\",\n    \"各个\",\n    \"各位\",\n    \"各种\",\n    \"各自\",\n    \"同\",\n    \"同时\",\n    \"后\",\n    \"后者\",\n    \"向\",\n    \"向使\",\n    \"向着\",\n    \"吓\",\n    \"吗\",\n    \"否则\",\n    \"吧\",\n    \"吧哒\",\n    \"含\",\n    \"吱\",\n    \"呀\",\n    \"呃\",\n    \"呕\",\n    \"呗\",\n    \"呜\",\n    \"呜呼\",\n    \"呢\",\n    \"呵\",\n    \"呵呵\",\n    \"呸\",\n    \"呼哧\",\n    \"咋\",\n    \"和\",\n    \"咚\",\n    \"咦\",\n    \"咧\",\n    \"咱\",\n    \"咱们\",\n    \"咳\",\n    \"哇\",\n    \"哈\",\n    \"哈哈\",\n    \"哉\",\n    \"哎\",\n    \"哎呀\",\n    \"哎哟\",\n    \"哗\",\n    \"哟\",\n    \"哦\",\n    \"哩\",\n    \"哪\",\n    \"哪个\",\n    \"哪些\",\n    \"哪儿\",\n    \"哪天\",\n    \"哪年\",\n    \"哪怕\",\n    \"哪样\",\n    \"哪边\",\n    \"哪里\",\n    \"哼\",\n    \"哼唷\",\n    \"唉\",\n    \"唯有\",\n    \"啊\",\n    \"啐\",\n    \"啥\",\n    \"啦\",\n    \"啪达\",\n    \"啷当\",\n    \"喂\",\n    \"喏\",\n    \"喔唷\",\n    \"喽\",\n    \"嗡\",\n    \"嗡嗡\",\n    \"嗬\",\n    \"嗯\",\n    \"嗳\",\n    \"嘎\",\n    \"嘎登\",\n    \"嘘\",\n    \"嘛\",\n    \"嘻\",\n    \"嘿\",\n    \"嘿嘿\",\n    \"四\",\n    \"因\",\n    \"因为\",\n    \"因了\",\n    \"因此\",\n    \"因着\",\n    \"因而\",\n    \"固然\",\n    \"在\",\n    \"在下\",\n    \"在于\",\n    \"地\",\n    \"基于\",\n    \"处在\",\n    \"多\",\n    \"多么\",\n    \"多少\",\n    \"大\",\n    \"大家\",\n    \"她\",\n    \"她们\",\n    \"好\",\n    \"如\",\n    \"如上\",\n    \"如上所述\",\n    \"如下\",\n    \"如何\",\n    \"如其\",\n    \"如同\",\n    \"如是\",\n    \"如果\",\n    \"如此\",\n    \"如若\",\n    \"始而\",\n    \"孰料\",\n    \"孰知\",\n    \"宁\",\n    \"宁可\",\n    \"宁愿\",\n    \"宁肯\",\n    \"它\",\n    \"它们\",\n    \"对\",\n    \"对于\",\n    \"对待\",\n    \"对方\",\n    \"对比\",\n    \"将\",\n    \"小\",\n    \"尔\",\n    \"尔后\",\n    \"尔尔\",\n    \"尚且\",\n    \"就\",\n    \"就是\",\n    \"就是了\",\n    \"就是说\",\n    \"就算\",\n    \"就要\",\n    \"尽\",\n    \"尽管\",\n    \"尽管如此\",\n    \"岂但\",\n    \"己\",\n    \"已\",\n    \"已矣\",\n    \"巴\",\n    \"巴巴\",\n    \"年\",\n    \"并\",\n    \"并且\",\n    \"庶乎\",\n    \"庶几\",\n    \"开外\",\n    \"开始\",\n    \"归\",\n    \"归齐\",\n    \"当\",\n    \"当地\",\n    \"当然\",\n    \"当着\",\n    \"彼\",\n    \"彼时\",\n    \"彼此\",\n    \"往\",\n    \"待\",\n    \"很\",\n    \"得\",\n    \"得了\",\n    \"怎\",\n    \"怎么\",\n    \"怎么办\",\n    \"怎么样\",\n    \"怎奈\",\n    \"怎样\",\n    \"总之\",\n    \"总的来看\",\n    \"总的来说\",\n    \"总的说来\",\n    \"总而言之\",\n    \"恰恰相反\",\n    \"您\",\n    \"惟其\",\n    \"慢说\",\n    \"我\",\n    \"我们\",\n    \"或\",\n    \"或则\",\n    \"或是\",\n    \"或曰\",\n    \"或者\",\n    \"截至\",\n    \"所\",\n    \"所以\",\n    \"所在\",\n    \"所幸\",\n    \"所有\",\n    \"才\",\n    \"才能\",\n    \"打\",\n    \"打从\",\n    \"把\",\n    \"抑或\",\n    \"拿\",\n    \"按\",\n    \"按照\",\n    \"换句话说\",\n    \"换言之\",\n    \"据\",\n    \"据此\",\n    \"接着\",\n    \"故\",\n    \"故此\",\n    \"故而\",\n    \"旁人\",\n    \"无\",\n    \"无宁\",\n    \"无论\",\n    \"既\",\n    \"既往\",\n    \"既是\",\n    \"既然\",\n    \"日\",\n    \"时\",\n    \"时候\",\n    \"是\",\n    \"是以\",\n    \"是的\",\n    \"更\",\n    \"曾\",\n    \"替\",\n    \"替代\",\n    \"最\",\n    \"月\",\n    \"有\",\n    \"有些\",\n    \"有关\",\n    \"有及\",\n    \"有时\",\n    \"有的\",\n    \"望\",\n    \"朝\",\n    \"朝着\",\n    \"本\",\n    \"本人\",\n    \"本地\",\n    \"本着\",\n    \"本身\",\n    \"来\",\n    \"来着\",\n    \"来自\",\n    \"来说\",\n    \"极了\",\n    \"果然\",\n    \"果真\",\n    \"某\",\n    \"某个\",\n    \"某些\",\n    \"某某\",\n    \"根据\",\n    \"欤\",\n    \"正值\",\n    \"正如\",\n    \"正巧\",\n    \"正是\",\n    \"此\",\n    \"此地\",\n    \"此处\",\n    \"此外\",\n    \"此时\",\n    \"此次\",\n    \"此间\",\n    \"毋宁\",\n    \"每\",\n    \"每当\",\n    \"比\",\n    \"比及\",\n    \"比如\",\n    \"比方\",\n    \"没奈何\",\n    \"沿\",\n    \"沿着\",\n    \"漫说\",\n    \"焉\",\n    \"然则\",\n    \"然后\",\n    \"然而\",\n    \"照\",\n    \"照着\",\n    \"犹且\",\n    \"犹自\",\n    \"甚且\",\n    \"甚么\",\n    \"甚或\",\n    \"甚而\",\n    \"甚至\",\n    \"甚至于\",\n    \"用\",\n    \"用来\",\n    \"由\",\n    \"由于\",\n    \"由是\",\n    \"由此\",\n    \"由此可见\",\n    \"的\",\n    \"的确\",\n    \"的话\",\n    \"直到\",\n    \"相对而言\",\n    \"省得\",\n    \"看\",\n    \"眨眼\",\n    \"着\",\n    \"着呢\",\n    \"矣\",\n    \"矣乎\",\n    \"矣哉\",\n    \"离\",\n    \"秒\",\n    \"竟而\",\n    \"第\",\n    \"等\",\n    \"等到\",\n    \"等等\",\n    \"简言之\",\n    \"管\",\n    \"类如\",\n    \"紧接着\",\n    \"纵\",\n    \"纵令\",\n    \"纵使\",\n    \"纵然\",\n    \"经\",\n    \"经过\",\n    \"结果\",\n    \"给\",\n    \"继之\",\n    \"继后\",\n    \"继而\",\n    \"综上所述\",\n    \"罢了\",\n    \"者\",\n    \"而\",\n    \"而且\",\n    \"而况\",\n    \"而后\",\n    \"而外\",\n    \"而已\",\n    \"而是\",\n    \"而言\",\n    \"能\",\n    \"能否\",\n    \"腾\",\n    \"自\",\n    \"自个儿\",\n    \"自从\",\n    \"自各儿\",\n    \"自后\",\n    \"自家\",\n    \"自己\",\n    \"自打\",\n    \"自身\",\n    \"至\",\n    \"至于\",\n    \"至今\",\n    \"至若\",\n    \"致\",\n    \"般的\",\n    \"若\",\n    \"若夫\",\n    \"若是\",\n    \"若果\",\n    \"若非\",\n    \"莫不然\",\n    \"莫如\",\n    \"莫若\",\n    \"虽\",\n    \"虽则\",\n    \"虽然\",\n    \"虽说\",\n    \"被\",\n    \"要\",\n    \"要不\",\n    \"要不是\",\n    \"要不然\",\n    \"要么\",\n    \"要是\",\n    \"譬喻\",\n    \"譬如\",\n    \"让\",\n    \"许多\",\n    \"论\",\n    \"设使\",\n    \"设或\",\n    \"设若\",\n    \"诚如\",\n    \"诚然\",\n    \"该\",\n    \"说\",\n    \"说来\",\n    \"请\",\n    \"诸\",\n    \"诸位\",\n    \"诸如\",\n    \"谁\",\n    \"谁人\",\n    \"谁料\",\n    \"谁知\",\n    \"贼死\",\n    \"赖以\",\n    \"赶\",\n    \"起\",\n    \"起见\",\n    \"趁\",\n    \"趁着\",\n    \"越是\",\n    \"距\",\n    \"跟\",\n    \"较\",\n    \"较之\",\n    \"边\",\n    \"过\",\n    \"还\",\n    \"还是\",\n    \"还有\",\n    \"还要\",\n    \"这\",\n    \"这一来\",\n    \"这个\",\n    \"这么\",\n    \"这么些\",\n    \"这么样\",\n    \"这么点儿\",\n    \"这些\",\n    \"这会儿\",\n    \"这儿\",\n    \"这就是说\",\n    \"这时\",\n    \"这样\",\n    \"这次\",\n    \"这般\",\n    \"这边\",\n    \"这里\",\n    \"进而\",\n    \"连\",\n    \"连同\",\n    \"逐步\",\n    \"通过\",\n    \"遵循\",\n    \"遵照\",\n    \"那\",\n    \"那个\",\n    \"那么\",\n    \"那么些\",\n    \"那么样\",\n    \"那些\",\n    \"那会儿\",\n    \"那儿\",\n    \"那时\",\n    \"那样\",\n    \"那般\",\n    \"那边\",\n    \"那里\",\n    \"都\",\n    \"鄙人\",\n    \"鉴于\",\n    \"针对\",\n    \"阿\",\n    \"除\",\n    \"除了\",\n    \"除外\",\n    \"除开\",\n    \"除此之外\",\n    \"除非\",\n    \"随\",\n    \"随后\",\n    \"随时\",\n    \"随着\",\n    \"难道说\",\n    \"零\",\n    \"非\",\n    \"非但\",\n    \"非徒\",\n    \"非特\",\n    \"非独\",\n    \"靠\",\n    \"顺\",\n    \"顺着\",\n    \"首先\",\n    \"︿\",\n    \"！\",\n    \"＃\",\n    \"＄\",\n    \"％\",\n    \"＆\",\n    \"（\",\n    \"）\",\n    \"＊\",\n    \"＋\",\n    \"，\",\n    \"０\",\n    \"１\",\n    \"２\",\n    \"３\",\n    \"４\",\n    \"５\",\n    \"６\",\n    \"７\",\n    \"８\",\n    \"９\",\n    \"：\",\n    \"；\",\n    \"＜\",\n    \"＞\",\n    \"？\",\n    \"＠\",\n    \"［\",\n    \"］\",\n    \"｛\",\n    \"｜\",\n    \"｝\",\n    \"～\",\n    \"￥\",\n    \"一則\",\n    \"一來\",\n    \"一樣\",\n    \"一轉眼\",\n    \"萬一\",\n    \"不僅\",\n    \"不單\",\n    \"不盡\",\n    \"不盡然\",\n    \"不獨\",\n    \"不至於\",\n    \"不論\",\n    \"不過\",\n    \"不問\",\n    \"與\",\n    \"與其\",\n    \"與其說\",\n    \"與否\",\n    \"與此同時\",\n    \"且不說\",\n    \"且說\",\n    \"兩者\",\n    \"個\",\n    \"個別\",\n    \"臨\",\n    \"爲\",\n    \"爲了\",\n    \"爲什麼\",\n    \"爲何\",\n    \"爲止\",\n    \"爲此\",\n    \"爲著\",\n    \"乃至於\",\n    \"麼\",\n    \"之類\",\n    \"烏乎\",\n    \"也罷\",\n    \"二來\",\n    \"於\",\n    \"於是\",\n    \"於是乎\",\n    \"云爾\",\n    \"人們\",\n    \"什麼\",\n    \"什麼樣\",\n    \"介於\",\n    \"仍舊\",\n    \"從\",\n    \"從此\",\n    \"從而\",\n    \"他們\",\n    \"他們們\",\n    \"以爲\",\n    \"以來\",\n    \"以至於\",\n    \"們\",\n    \"任憑\",\n    \"會\",\n    \"何況\",\n    \"何處\",\n    \"何時\",\n    \"餘外\",\n    \"作爲\",\n    \"你們\",\n    \"依據\",\n    \"便於\",\n    \"俺們\",\n    \"借儻然\",\n    \"兒\",\n    \"全體\",\n    \"關於\",\n    \"關於具體地說\",\n    \"其餘\",\n    \"具體地說\",\n    \"具體說來\",\n    \"內\",\n    \"再則\",\n    \"再者說\",\n    \"再說\",\n    \"衝\",\n    \"況且\",\n    \"幾\",\n    \"幾時\",\n    \"憑\",\n    \"憑藉\",\n    \"出於\",\n    \"出來\",\n    \"分別\",\n    \"則\",\n    \"則甚\",\n    \"別\",\n    \"別人\",\n    \"別處\",\n    \"別是\",\n    \"別的\",\n    \"別管\",\n    \"別說\",\n    \"前後\",\n    \"卻\",\n    \"反過來\",\n    \"反過來說\",\n    \"只當\",\n    \"可見\",\n    \"各個\",\n    \"各種\",\n    \"同時\",\n    \"後\",\n    \"後者\",\n    \"嚇\",\n    \"嗎\",\n    \"否則\",\n    \"吧噠\",\n    \"嘔\",\n    \"唄\",\n    \"嗚\",\n    \"嗚呼\",\n    \"咱們\",\n    \"哎喲\",\n    \"譁\",\n    \"喲\",\n    \"哪個\",\n    \"哪兒\",\n    \"哪樣\",\n    \"哪邊\",\n    \"哪裡\",\n    \"啪達\",\n    \"啷噹\",\n    \"嘍\",\n    \"噯\",\n    \"噓\",\n    \"因爲\",\n    \"在於\",\n    \"基於\",\n    \"處在\",\n    \"多麼\",\n    \"她們\",\n    \"寧\",\n    \"寧可\",\n    \"寧願\",\n    \"寧肯\",\n    \"它們\",\n    \"對\",\n    \"對於\",\n    \"對待\",\n    \"對方\",\n    \"對比\",\n    \"將\",\n    \"爾\",\n    \"爾後\",\n    \"爾爾\",\n    \"就是說\",\n    \"盡\",\n    \"儘管\",\n    \"儘管如此\",\n    \"豈但\",\n    \"並\",\n    \"並且\",\n    \"庶幾\",\n    \"開外\",\n    \"開始\",\n    \"歸\",\n    \"歸齊\",\n    \"當\",\n    \"當地\",\n    \"當然\",\n    \"當著\",\n    \"彼時\",\n    \"怎麼\",\n    \"怎麼辦\",\n    \"怎麼樣\",\n    \"怎樣\",\n    \"總之\",\n    \"總的來看\",\n    \"總的來說\",\n    \"總的說來\",\n    \"總而言之\",\n    \"慢說\",\n    \"我們\",\n    \"或則\",\n    \"打從\",\n    \"換句話說\",\n    \"換言之\",\n    \"據\",\n    \"據此\",\n    \"無\",\n    \"無寧\",\n    \"無論\",\n    \"時\",\n    \"時候\",\n    \"有關\",\n    \"有時\",\n    \"來\",\n    \"來著\",\n    \"來自\",\n    \"來說\",\n    \"極了\",\n    \"某個\",\n    \"根據\",\n    \"歟\",\n    \"此處\",\n    \"此時\",\n    \"此間\",\n    \"毋寧\",\n    \"每當\",\n    \"沒奈何\",\n    \"漫說\",\n    \"然則\",\n    \"然後\",\n    \"猶且\",\n    \"猶自\",\n    \"甚麼\",\n    \"甚至於\",\n    \"用來\",\n    \"由於\",\n    \"由此可見\",\n    \"的確\",\n    \"的話\",\n    \"相對而言\",\n    \"離\",\n    \"簡言之\",\n    \"類如\",\n    \"緊接著\",\n    \"縱\",\n    \"縱令\",\n    \"縱使\",\n    \"縱然\",\n    \"經\",\n    \"經過\",\n    \"結果\",\n    \"給\",\n    \"繼之\",\n    \"繼後\",\n    \"繼而\",\n    \"綜上所述\",\n    \"罷了\",\n    \"而況\",\n    \"而後\",\n    \"騰\",\n    \"自個兒\",\n    \"自從\",\n    \"自各兒\",\n    \"自後\",\n    \"至於\",\n    \"雖\",\n    \"雖則\",\n    \"雖然\",\n    \"雖說\",\n    \"要麼\",\n    \"讓\",\n    \"許多\",\n    \"論\",\n    \"設使\",\n    \"設或\",\n    \"設若\",\n    \"誠如\",\n    \"誠然\",\n    \"該\",\n    \"說\",\n    \"說來\",\n    \"請\",\n    \"諸\",\n    \"諸位\",\n    \"諸如\",\n    \"誰\",\n    \"誰人\",\n    \"誰料\",\n    \"誰知\",\n    \"賊死\",\n    \"賴以\",\n    \"趕\",\n    \"起見\",\n    \"較\",\n    \"較之\",\n    \"邊\",\n    \"過\",\n    \"還\",\n    \"還是\",\n    \"還有\",\n    \"還要\",\n    \"這\",\n    \"這一來\",\n    \"這個\",\n    \"這麼\",\n    \"這麼些\",\n    \"這麼樣\",\n    \"這麼點兒\",\n    \"這些\",\n    \"這會兒\",\n    \"這兒\",\n    \"這就是說\",\n    \"這時\",\n    \"這樣\",\n    \"這次\",\n    \"這般\",\n    \"這邊\",\n    \"這裡\",\n    \"進而\",\n    \"連\",\n    \"連同\",\n    \"通過\",\n    \"那個\",\n    \"那麼\",\n    \"那麼些\",\n    \"那麼樣\",\n    \"那會兒\",\n    \"那兒\",\n    \"那時\",\n    \"那樣\",\n    \"那邊\",\n    \"那裡\",\n    \"鑑於\",\n    \"針對\",\n    \"除開\",\n    \"隨\",\n    \"隨後\",\n    \"隨時\",\n    \"隨著\",\n    \"難道說\",\n    \"非獨\",\n    \"順\",\n    \"順著\",\n];\n"
  },
  {
    "path": "src/stopwords/dan.rs",
    "content": "// Sonic\n//\n// Fast, lightweight and schema-less search backend\n// Copyright: 2019, Valerian Saliou <valerian@valeriansaliou.name>\n// License: Mozilla Public License v2.0 (MPL v2.0)\n\npub static STOPWORDS_DAN: &[&str] = &[\n    \"ad\", \"af\", \"aldrig\", \"alle\", \"alt\", \"anden\", \"andet\", \"andre\", \"at\", \"bare\", \"begge\", \"blev\",\n    \"blive\", \"bliver\", \"da\", \"de\", \"dem\", \"den\", \"denne\", \"der\", \"deres\", \"det\", \"dette\", \"dig\",\n    \"din\", \"dine\", \"disse\", \"dit\", \"dog\", \"du\", \"efter\", \"ej\", \"eller\", \"en\", \"end\", \"ene\",\n    \"eneste\", \"enhver\", \"er\", \"et\", \"far\", \"fem\", \"fik\", \"fire\", \"flere\", \"fleste\", \"for\", \"fordi\",\n    \"forrige\", \"fra\", \"få\", \"får\", \"før\", \"god\", \"godt\", \"ham\", \"han\", \"hans\", \"har\", \"havde\",\n    \"have\", \"hej\", \"helt\", \"hende\", \"hendes\", \"her\", \"hos\", \"hun\", \"hvad\", \"hvem\", \"hver\",\n    \"hvilken\", \"hvis\", \"hvor\", \"hvordan\", \"hvorfor\", \"hvornår\", \"i\", \"ikke\", \"ind\", \"ingen\",\n    \"intet\", \"ja\", \"jeg\", \"jer\", \"jeres\", \"jo\", \"kan\", \"kom\", \"komme\", \"kommer\", \"kun\", \"kunne\",\n    \"lad\", \"lav\", \"lidt\", \"lige\", \"lille\", \"man\", \"mand\", \"mange\", \"med\", \"meget\", \"men\", \"mens\",\n    \"mere\", \"mig\", \"min\", \"mine\", \"mit\", \"mod\", \"må\", \"ned\", \"nej\", \"ni\", \"nogen\", \"noget\",\n    \"nogle\", \"nu\", \"ny\", \"nyt\", \"når\", \"nær\", \"næste\", \"næsten\", \"og\", \"også\", \"okay\", \"om\", \"op\",\n    \"os\", \"otte\", \"over\", \"på\", \"se\", \"seks\", \"selv\", \"ser\", \"ses\", \"sig\", \"sige\", \"sin\", \"sine\",\n    \"sit\", \"skal\", \"skulle\", \"som\", \"stor\", \"store\", \"syv\", \"så\", \"sådan\", \"tag\", \"tage\", \"thi\",\n    \"ti\", \"til\", \"to\", \"tre\", \"ud\", \"under\", \"var\", \"ved\", \"vi\", \"vil\", \"ville\", \"vor\", \"vores\",\n    \"være\", \"været\",\n];\n"
  },
  {
    "path": "src/stopwords/deu.rs",
    "content": "// Sonic\n//\n// Fast, lightweight and schema-less search backend\n// Copyright: 2019, Valerian Saliou <valerian@valeriansaliou.name>\n// License: Mozilla Public License v2.0 (MPL v2.0)\n\npub static STOPWORDS_DEU: &[&str] = &[\n    \"a\",\n    \"ab\",\n    \"aber\",\n    \"ach\",\n    \"acht\",\n    \"achte\",\n    \"achten\",\n    \"achter\",\n    \"achtes\",\n    \"ag\",\n    \"alle\",\n    \"allein\",\n    \"allem\",\n    \"allen\",\n    \"aller\",\n    \"allerdings\",\n    \"alles\",\n    \"allgemeinen\",\n    \"als\",\n    \"also\",\n    \"am\",\n    \"an\",\n    \"ander\",\n    \"andere\",\n    \"anderem\",\n    \"anderen\",\n    \"anderer\",\n    \"anderes\",\n    \"anderm\",\n    \"andern\",\n    \"anderr\",\n    \"anders\",\n    \"au\",\n    \"auch\",\n    \"auf\",\n    \"aus\",\n    \"ausser\",\n    \"ausserdem\",\n    \"außer\",\n    \"außerdem\",\n    \"b\",\n    \"bald\",\n    \"bei\",\n    \"beide\",\n    \"beiden\",\n    \"beim\",\n    \"beispiel\",\n    \"bekannt\",\n    \"bereits\",\n    \"besonders\",\n    \"besser\",\n    \"besten\",\n    \"bin\",\n    \"bis\",\n    \"bisher\",\n    \"bist\",\n    \"c\",\n    \"d\",\n    \"d.h\",\n    \"da\",\n    \"dabei\",\n    \"dadurch\",\n    \"dafür\",\n    \"dagegen\",\n    \"daher\",\n    \"dahin\",\n    \"dahinter\",\n    \"damals\",\n    \"damit\",\n    \"danach\",\n    \"daneben\",\n    \"dank\",\n    \"dann\",\n    \"daran\",\n    \"darauf\",\n    \"daraus\",\n    \"darf\",\n    \"darfst\",\n    \"darin\",\n    \"darum\",\n    \"darunter\",\n    \"darüber\",\n    \"das\",\n    \"dasein\",\n    \"daselbst\",\n    \"dass\",\n    \"dasselbe\",\n    \"davon\",\n    \"davor\",\n    \"dazu\",\n    \"dazwischen\",\n    \"daß\",\n    \"dein\",\n    \"deine\",\n    \"deinem\",\n    \"deinen\",\n    \"deiner\",\n    \"deines\",\n    \"dem\",\n    \"dementsprechend\",\n    \"demgegenüber\",\n    \"demgemäss\",\n    \"demgemäß\",\n    \"demselben\",\n    \"demzufolge\",\n    \"den\",\n    \"denen\",\n    \"denn\",\n    \"denselben\",\n    \"der\",\n    \"deren\",\n    \"derer\",\n    \"derjenige\",\n    \"derjenigen\",\n    \"dermassen\",\n    \"dermaßen\",\n    \"derselbe\",\n    \"derselben\",\n    \"des\",\n    \"deshalb\",\n    \"desselben\",\n    \"dessen\",\n    \"deswegen\",\n    \"dich\",\n    \"die\",\n    \"diejenige\",\n    \"diejenigen\",\n    \"dies\",\n    \"diese\",\n    \"dieselbe\",\n    \"dieselben\",\n    \"diesem\",\n    \"diesen\",\n    \"dieser\",\n    \"dieses\",\n    \"dir\",\n    \"doch\",\n    \"dort\",\n    \"drei\",\n    \"drin\",\n    \"dritte\",\n    \"dritten\",\n    \"dritter\",\n    \"drittes\",\n    \"du\",\n    \"durch\",\n    \"durchaus\",\n    \"durfte\",\n    \"durften\",\n    \"dürfen\",\n    \"dürft\",\n    \"e\",\n    \"eben\",\n    \"ebenso\",\n    \"ehrlich\",\n    \"ei\",\n    \"ei,\",\n    \"eigen\",\n    \"eigene\",\n    \"eigenen\",\n    \"eigener\",\n    \"eigenes\",\n    \"ein\",\n    \"einander\",\n    \"eine\",\n    \"einem\",\n    \"einen\",\n    \"einer\",\n    \"eines\",\n    \"einig\",\n    \"einige\",\n    \"einigem\",\n    \"einigen\",\n    \"einiger\",\n    \"einiges\",\n    \"einmal\",\n    \"eins\",\n    \"elf\",\n    \"en\",\n    \"ende\",\n    \"endlich\",\n    \"entweder\",\n    \"er\",\n    \"ernst\",\n    \"erst\",\n    \"erste\",\n    \"ersten\",\n    \"erster\",\n    \"erstes\",\n    \"es\",\n    \"etwa\",\n    \"etwas\",\n    \"euch\",\n    \"euer\",\n    \"eure\",\n    \"eurem\",\n    \"euren\",\n    \"eurer\",\n    \"eures\",\n    \"f\",\n    \"folgende\",\n    \"früher\",\n    \"fünf\",\n    \"fünfte\",\n    \"fünften\",\n    \"fünfter\",\n    \"fünftes\",\n    \"für\",\n    \"g\",\n    \"gab\",\n    \"ganz\",\n    \"ganze\",\n    \"ganzen\",\n    \"ganzer\",\n    \"ganzes\",\n    \"gar\",\n    \"gedurft\",\n    \"gegen\",\n    \"gegenüber\",\n    \"gehabt\",\n    \"gehen\",\n    \"geht\",\n    \"gekannt\",\n    \"gekonnt\",\n    \"gemacht\",\n    \"gemocht\",\n    \"gemusst\",\n    \"genug\",\n    \"gerade\",\n    \"gern\",\n    \"gesagt\",\n    \"geschweige\",\n    \"gewesen\",\n    \"gewollt\",\n    \"geworden\",\n    \"gibt\",\n    \"ging\",\n    \"gleich\",\n    \"gott\",\n    \"gross\",\n    \"grosse\",\n    \"grossen\",\n    \"grosser\",\n    \"grosses\",\n    \"groß\",\n    \"große\",\n    \"großen\",\n    \"großer\",\n    \"großes\",\n    \"gut\",\n    \"gute\",\n    \"guter\",\n    \"gutes\",\n    \"h\",\n    \"hab\",\n    \"habe\",\n    \"haben\",\n    \"habt\",\n    \"hast\",\n    \"hat\",\n    \"hatte\",\n    \"hatten\",\n    \"hattest\",\n    \"hattet\",\n    \"heisst\",\n    \"her\",\n    \"heute\",\n    \"hier\",\n    \"hin\",\n    \"hinter\",\n    \"hoch\",\n    \"hätte\",\n    \"hätten\",\n    \"i\",\n    \"ich\",\n    \"ihm\",\n    \"ihn\",\n    \"ihnen\",\n    \"ihr\",\n    \"ihre\",\n    \"ihrem\",\n    \"ihren\",\n    \"ihrer\",\n    \"ihres\",\n    \"im\",\n    \"immer\",\n    \"in\",\n    \"indem\",\n    \"infolgedessen\",\n    \"ins\",\n    \"irgend\",\n    \"ist\",\n    \"j\",\n    \"ja\",\n    \"jahr\",\n    \"jahre\",\n    \"jahren\",\n    \"je\",\n    \"jede\",\n    \"jedem\",\n    \"jeden\",\n    \"jeder\",\n    \"jedermann\",\n    \"jedermanns\",\n    \"jedes\",\n    \"jedoch\",\n    \"jemand\",\n    \"jemandem\",\n    \"jemanden\",\n    \"jene\",\n    \"jenem\",\n    \"jenen\",\n    \"jener\",\n    \"jenes\",\n    \"jetzt\",\n    \"k\",\n    \"kam\",\n    \"kann\",\n    \"kannst\",\n    \"kaum\",\n    \"kein\",\n    \"keine\",\n    \"keinem\",\n    \"keinen\",\n    \"keiner\",\n    \"keines\",\n    \"kleine\",\n    \"kleinen\",\n    \"kleiner\",\n    \"kleines\",\n    \"kommen\",\n    \"kommt\",\n    \"konnte\",\n    \"konnten\",\n    \"kurz\",\n    \"können\",\n    \"könnt\",\n    \"könnte\",\n    \"l\",\n    \"lang\",\n    \"lange\",\n    \"leicht\",\n    \"leide\",\n    \"lieber\",\n    \"los\",\n    \"m\",\n    \"machen\",\n    \"macht\",\n    \"machte\",\n    \"mag\",\n    \"magst\",\n    \"mahn\",\n    \"mal\",\n    \"man\",\n    \"manche\",\n    \"manchem\",\n    \"manchen\",\n    \"mancher\",\n    \"manches\",\n    \"mann\",\n    \"mehr\",\n    \"mein\",\n    \"meine\",\n    \"meinem\",\n    \"meinen\",\n    \"meiner\",\n    \"meines\",\n    \"mensch\",\n    \"menschen\",\n    \"mich\",\n    \"mir\",\n    \"mit\",\n    \"mittel\",\n    \"mochte\",\n    \"mochten\",\n    \"morgen\",\n    \"muss\",\n    \"musst\",\n    \"musste\",\n    \"mussten\",\n    \"muß\",\n    \"mußt\",\n    \"möchte\",\n    \"mögen\",\n    \"möglich\",\n    \"mögt\",\n    \"müssen\",\n    \"müsst\",\n    \"müßt\",\n    \"n\",\n    \"na\",\n    \"nach\",\n    \"nachdem\",\n    \"nahm\",\n    \"natürlich\",\n    \"neben\",\n    \"nein\",\n    \"neue\",\n    \"neuen\",\n    \"neun\",\n    \"neunte\",\n    \"neunten\",\n    \"neunter\",\n    \"neuntes\",\n    \"nicht\",\n    \"nichts\",\n    \"nie\",\n    \"niemand\",\n    \"niemandem\",\n    \"niemanden\",\n    \"noch\",\n    \"nun\",\n    \"nur\",\n    \"o\",\n    \"ob\",\n    \"oben\",\n    \"oder\",\n    \"offen\",\n    \"oft\",\n    \"ohne\",\n    \"ordnung\",\n    \"p\",\n    \"q\",\n    \"r\",\n    \"recht\",\n    \"rechte\",\n    \"rechten\",\n    \"rechter\",\n    \"rechtes\",\n    \"richtig\",\n    \"rund\",\n    \"s\",\n    \"sa\",\n    \"sache\",\n    \"sagt\",\n    \"sagte\",\n    \"sah\",\n    \"satt\",\n    \"schlecht\",\n    \"schluss\",\n    \"schon\",\n    \"sechs\",\n    \"sechste\",\n    \"sechsten\",\n    \"sechster\",\n    \"sechstes\",\n    \"sehr\",\n    \"sei\",\n    \"seid\",\n    \"seien\",\n    \"sein\",\n    \"seine\",\n    \"seinem\",\n    \"seinen\",\n    \"seiner\",\n    \"seines\",\n    \"seit\",\n    \"seitdem\",\n    \"selbst\",\n    \"sich\",\n    \"sie\",\n    \"sieben\",\n    \"siebente\",\n    \"siebenten\",\n    \"siebenter\",\n    \"siebentes\",\n    \"sind\",\n    \"so\",\n    \"solang\",\n    \"solche\",\n    \"solchem\",\n    \"solchen\",\n    \"solcher\",\n    \"solches\",\n    \"soll\",\n    \"sollen\",\n    \"sollst\",\n    \"sollt\",\n    \"sollte\",\n    \"sollten\",\n    \"sondern\",\n    \"sonst\",\n    \"soweit\",\n    \"sowie\",\n    \"später\",\n    \"startseite\",\n    \"statt\",\n    \"steht\",\n    \"suche\",\n    \"t\",\n    \"tag\",\n    \"tage\",\n    \"tagen\",\n    \"tat\",\n    \"teil\",\n    \"tel\",\n    \"tritt\",\n    \"trotzdem\",\n    \"tun\",\n    \"u\",\n    \"uhr\",\n    \"um\",\n    \"und\",\n    \"und?\",\n    \"uns\",\n    \"unse\",\n    \"unsem\",\n    \"unsen\",\n    \"unser\",\n    \"unsere\",\n    \"unserer\",\n    \"unses\",\n    \"unter\",\n    \"v\",\n    \"vergangenen\",\n    \"viel\",\n    \"viele\",\n    \"vielem\",\n    \"vielen\",\n    \"vielleicht\",\n    \"vier\",\n    \"vierte\",\n    \"vierten\",\n    \"vierter\",\n    \"viertes\",\n    \"vom\",\n    \"von\",\n    \"vor\",\n    \"w\",\n    \"wahr?\",\n    \"wann\",\n    \"war\",\n    \"waren\",\n    \"warst\",\n    \"wart\",\n    \"warum\",\n    \"was\",\n    \"weg\",\n    \"wegen\",\n    \"weil\",\n    \"weit\",\n    \"weiter\",\n    \"weitere\",\n    \"weiteren\",\n    \"weiteres\",\n    \"welche\",\n    \"welchem\",\n    \"welchen\",\n    \"welcher\",\n    \"welches\",\n    \"wem\",\n    \"wen\",\n    \"wenig\",\n    \"wenige\",\n    \"weniger\",\n    \"weniges\",\n    \"wenigstens\",\n    \"wenn\",\n    \"wer\",\n    \"werde\",\n    \"werden\",\n    \"werdet\",\n    \"weshalb\",\n    \"wessen\",\n    \"wie\",\n    \"wieder\",\n    \"wieso\",\n    \"will\",\n    \"willst\",\n    \"wir\",\n    \"wird\",\n    \"wirklich\",\n    \"wirst\",\n    \"wissen\",\n    \"wo\",\n    \"woher\",\n    \"wohin\",\n    \"wohl\",\n    \"wollen\",\n    \"wollt\",\n    \"wollte\",\n    \"wollten\",\n    \"worden\",\n    \"wurde\",\n    \"wurden\",\n    \"während\",\n    \"währenddem\",\n    \"währenddessen\",\n    \"wäre\",\n    \"würde\",\n    \"würden\",\n    \"x\",\n    \"y\",\n    \"z\",\n    \"z.b\",\n    \"zehn\",\n    \"zehnte\",\n    \"zehnten\",\n    \"zehnter\",\n    \"zehntes\",\n    \"zeit\",\n    \"zu\",\n    \"zuerst\",\n    \"zugleich\",\n    \"zum\",\n    \"zunächst\",\n    \"zur\",\n    \"zurück\",\n    \"zusammen\",\n    \"zwanzig\",\n    \"zwar\",\n    \"zwei\",\n    \"zweite\",\n    \"zweiten\",\n    \"zweiter\",\n    \"zweites\",\n    \"zwischen\",\n    \"zwölf\",\n    \"über\",\n    \"überhaupt\",\n    \"übrigens\",\n];\n"
  },
  {
    "path": "src/stopwords/ell.rs",
    "content": "// Sonic\n//\n// Fast, lightweight and schema-less search backend\n// Copyright: 2019, Valerian Saliou <valerian@valeriansaliou.name>\n// License: Mozilla Public License v2.0 (MPL v2.0)\n\npub static STOPWORDS_ELL: &[&str] = &[\n    \"αλλα\",\n    \"αν\",\n    \"αντι\",\n    \"απο\",\n    \"αυτα\",\n    \"αυτεσ\",\n    \"αυτη\",\n    \"αυτο\",\n    \"αυτοι\",\n    \"αυτοσ\",\n    \"αυτουσ\",\n    \"αυτων\",\n    \"αἱ\",\n    \"αἳ\",\n    \"αἵ\",\n    \"αὐτόσ\",\n    \"αὐτὸς\",\n    \"αὖ\",\n    \"γάρ\",\n    \"γα\",\n    \"γα^\",\n    \"γε\",\n    \"για\",\n    \"γοῦν\",\n    \"γὰρ\",\n    \"δ'\",\n    \"δέ\",\n    \"δή\",\n    \"δαί\",\n    \"δαίσ\",\n    \"δαὶ\",\n    \"δαὶς\",\n    \"δε\",\n    \"δεν\",\n    \"δι'\",\n    \"διά\",\n    \"διὰ\",\n    \"δὲ\",\n    \"δὴ\",\n    \"δ’\",\n    \"εαν\",\n    \"ειμαι\",\n    \"ειμαστε\",\n    \"ειναι\",\n    \"εισαι\",\n    \"ειστε\",\n    \"εκεινα\",\n    \"εκεινεσ\",\n    \"εκεινη\",\n    \"εκεινο\",\n    \"εκεινοι\",\n    \"εκεινοσ\",\n    \"εκεινουσ\",\n    \"εκεινων\",\n    \"ενω\",\n    \"επ\",\n    \"επι\",\n    \"εἰ\",\n    \"εἰμί\",\n    \"εἰμὶ\",\n    \"εἰς\",\n    \"εἰσ\",\n    \"εἴ\",\n    \"εἴμι\",\n    \"εἴτε\",\n    \"η\",\n    \"θα\",\n    \"ισωσ\",\n    \"κ\",\n    \"καί\",\n    \"καίτοι\",\n    \"καθ\",\n    \"και\",\n    \"κατ\",\n    \"κατά\",\n    \"κατα\",\n    \"κατὰ\",\n    \"καὶ\",\n    \"κι\",\n    \"κἀν\",\n    \"κἂν\",\n    \"μέν\",\n    \"μή\",\n    \"μήτε\",\n    \"μα\",\n    \"με\",\n    \"μεθ\",\n    \"μετ\",\n    \"μετά\",\n    \"μετα\",\n    \"μετὰ\",\n    \"μη\",\n    \"μην\",\n    \"μἐν\",\n    \"μὲν\",\n    \"μὴ\",\n    \"μὴν\",\n    \"να\",\n    \"ο\",\n    \"οι\",\n    \"ομωσ\",\n    \"οπωσ\",\n    \"οσο\",\n    \"οτι\",\n    \"οἱ\",\n    \"οἳ\",\n    \"οἷς\",\n    \"οὐ\",\n    \"οὐδ\",\n    \"οὐδέ\",\n    \"οὐδείσ\",\n    \"οὐδεὶς\",\n    \"οὐδὲ\",\n    \"οὐδὲν\",\n    \"οὐκ\",\n    \"οὐχ\",\n    \"οὐχὶ\",\n    \"οὓς\",\n    \"οὔτε\",\n    \"οὕτω\",\n    \"οὕτως\",\n    \"οὕτωσ\",\n    \"οὖν\",\n    \"οὗ\",\n    \"οὗτος\",\n    \"οὗτοσ\",\n    \"παρ\",\n    \"παρά\",\n    \"παρα\",\n    \"παρὰ\",\n    \"περί\",\n    \"περὶ\",\n    \"ποια\",\n    \"ποιεσ\",\n    \"ποιο\",\n    \"ποιοι\",\n    \"ποιοσ\",\n    \"ποιουσ\",\n    \"ποιων\",\n    \"ποτε\",\n    \"που\",\n    \"ποῦ\",\n    \"προ\",\n    \"προσ\",\n    \"πρόσ\",\n    \"πρὸ\",\n    \"πρὸς\",\n    \"πως\",\n    \"πωσ\",\n    \"σε\",\n    \"στη\",\n    \"στην\",\n    \"στο\",\n    \"στον\",\n    \"σόσ\",\n    \"σύ\",\n    \"σύν\",\n    \"σὸς\",\n    \"σὺ\",\n    \"σὺν\",\n    \"τά\",\n    \"τήν\",\n    \"τί\",\n    \"τίς\",\n    \"τίσ\",\n    \"τα\",\n    \"ταῖς\",\n    \"τε\",\n    \"την\",\n    \"τησ\",\n    \"τι\",\n    \"τινα\",\n    \"τις\",\n    \"τισ\",\n    \"το\",\n    \"τοί\",\n    \"τοι\",\n    \"τοιοῦτος\",\n    \"τοιοῦτοσ\",\n    \"τον\",\n    \"τοτε\",\n    \"του\",\n    \"τούσ\",\n    \"τοὺς\",\n    \"τοῖς\",\n    \"τοῦ\",\n    \"των\",\n    \"τό\",\n    \"τόν\",\n    \"τότε\",\n    \"τὰ\",\n    \"τὰς\",\n    \"τὴν\",\n    \"τὸ\",\n    \"τὸν\",\n    \"τῆς\",\n    \"τῆσ\",\n    \"τῇ\",\n    \"τῶν\",\n    \"τῷ\",\n    \"ωσ\",\n    \"ἀλλ'\",\n    \"ἀλλά\",\n    \"ἀλλὰ\",\n    \"ἀλλ’\",\n    \"ἀπ\",\n    \"ἀπό\",\n    \"ἀπὸ\",\n    \"ἀφ\",\n    \"ἂν\",\n    \"ἃ\",\n    \"ἄλλος\",\n    \"ἄλλοσ\",\n    \"ἄν\",\n    \"ἄρα\",\n    \"ἅμα\",\n    \"ἐάν\",\n    \"ἐγώ\",\n    \"ἐγὼ\",\n    \"ἐκ\",\n    \"ἐμόσ\",\n    \"ἐμὸς\",\n    \"ἐν\",\n    \"ἐξ\",\n    \"ἐπί\",\n    \"ἐπεὶ\",\n    \"ἐπὶ\",\n    \"ἐστι\",\n    \"ἐφ\",\n    \"ἐὰν\",\n    \"ἑαυτοῦ\",\n    \"ἔτι\",\n    \"ἡ\",\n    \"ἢ\",\n    \"ἣ\",\n    \"ἤ\",\n    \"ἥ\",\n    \"ἧς\",\n    \"ἵνα\",\n    \"ὁ\",\n    \"ὃ\",\n    \"ὃν\",\n    \"ὃς\",\n    \"ὅ\",\n    \"ὅδε\",\n    \"ὅθεν\",\n    \"ὅπερ\",\n    \"ὅς\",\n    \"ὅσ\",\n    \"ὅστις\",\n    \"ὅστισ\",\n    \"ὅτε\",\n    \"ὅτι\",\n    \"ὑμόσ\",\n    \"ὑπ\",\n    \"ὑπέρ\",\n    \"ὑπό\",\n    \"ὑπὲρ\",\n    \"ὑπὸ\",\n    \"ὡς\",\n    \"ὡσ\",\n    \"ὥς\",\n    \"ὥστε\",\n    \"ὦ\",\n    \"ᾧ\",\n];\n"
  },
  {
    "path": "src/stopwords/eng.rs",
    "content": "// Sonic\n//\n// Fast, lightweight and schema-less search backend\n// Copyright: 2019, Valerian Saliou <valerian@valeriansaliou.name>\n// License: Mozilla Public License v2.0 (MPL v2.0)\n\npub static STOPWORDS_ENG: &[&str] = &[\n    \"'ll\",\n    \"'tis\",\n    \"'twas\",\n    \"'ve\",\n    \"10\",\n    \"39\",\n    \"a\",\n    \"a's\",\n    \"able\",\n    \"ableabout\",\n    \"about\",\n    \"above\",\n    \"abroad\",\n    \"abst\",\n    \"accordance\",\n    \"according\",\n    \"accordingly\",\n    \"across\",\n    \"act\",\n    \"actually\",\n    \"ad\",\n    \"added\",\n    \"adj\",\n    \"adopted\",\n    \"ae\",\n    \"af\",\n    \"affected\",\n    \"affecting\",\n    \"affects\",\n    \"after\",\n    \"afterwards\",\n    \"ag\",\n    \"again\",\n    \"against\",\n    \"ago\",\n    \"ah\",\n    \"ahead\",\n    \"ai\",\n    \"ain't\",\n    \"aint\",\n    \"al\",\n    \"all\",\n    \"allow\",\n    \"allows\",\n    \"almost\",\n    \"alone\",\n    \"along\",\n    \"alongside\",\n    \"already\",\n    \"also\",\n    \"although\",\n    \"always\",\n    \"am\",\n    \"amid\",\n    \"amidst\",\n    \"among\",\n    \"amongst\",\n    \"amoungst\",\n    \"amount\",\n    \"an\",\n    \"and\",\n    \"announce\",\n    \"another\",\n    \"any\",\n    \"anybody\",\n    \"anyhow\",\n    \"anymore\",\n    \"anyone\",\n    \"anything\",\n    \"anyway\",\n    \"anyways\",\n    \"anywhere\",\n    \"ao\",\n    \"apart\",\n    \"apparently\",\n    \"appear\",\n    \"appreciate\",\n    \"appropriate\",\n    \"approximately\",\n    \"aq\",\n    \"ar\",\n    \"are\",\n    \"area\",\n    \"areas\",\n    \"aren\",\n    \"aren't\",\n    \"arent\",\n    \"arise\",\n    \"around\",\n    \"arpa\",\n    \"as\",\n    \"aside\",\n    \"ask\",\n    \"asked\",\n    \"asking\",\n    \"asks\",\n    \"associated\",\n    \"at\",\n    \"au\",\n    \"auth\",\n    \"available\",\n    \"aw\",\n    \"away\",\n    \"awfully\",\n    \"az\",\n    \"b\",\n    \"ba\",\n    \"back\",\n    \"backed\",\n    \"backing\",\n    \"backs\",\n    \"backward\",\n    \"backwards\",\n    \"bb\",\n    \"bd\",\n    \"be\",\n    \"became\",\n    \"because\",\n    \"become\",\n    \"becomes\",\n    \"becoming\",\n    \"been\",\n    \"before\",\n    \"beforehand\",\n    \"began\",\n    \"begin\",\n    \"beginning\",\n    \"beginnings\",\n    \"begins\",\n    \"behind\",\n    \"being\",\n    \"beings\",\n    \"believe\",\n    \"below\",\n    \"beside\",\n    \"besides\",\n    \"best\",\n    \"better\",\n    \"between\",\n    \"beyond\",\n    \"bf\",\n    \"bg\",\n    \"bh\",\n    \"bi\",\n    \"big\",\n    \"bill\",\n    \"billion\",\n    \"biol\",\n    \"bj\",\n    \"bm\",\n    \"bn\",\n    \"bo\",\n    \"both\",\n    \"bottom\",\n    \"br\",\n    \"brief\",\n    \"briefly\",\n    \"bs\",\n    \"bt\",\n    \"but\",\n    \"buy\",\n    \"bv\",\n    \"bw\",\n    \"by\",\n    \"bz\",\n    \"c\",\n    \"c'mon\",\n    \"c's\",\n    \"ca\",\n    \"call\",\n    \"came\",\n    \"can\",\n    \"can't\",\n    \"cannot\",\n    \"cant\",\n    \"caption\",\n    \"case\",\n    \"cases\",\n    \"cause\",\n    \"causes\",\n    \"cc\",\n    \"cd\",\n    \"certain\",\n    \"certainly\",\n    \"cf\",\n    \"cg\",\n    \"ch\",\n    \"changes\",\n    \"ci\",\n    \"ck\",\n    \"cl\",\n    \"clear\",\n    \"clearly\",\n    \"click\",\n    \"cm\",\n    \"cmon\",\n    \"cn\",\n    \"co\",\n    \"co.\",\n    \"com\",\n    \"come\",\n    \"comes\",\n    \"computer\",\n    \"con\",\n    \"concerning\",\n    \"consequently\",\n    \"consider\",\n    \"considering\",\n    \"contain\",\n    \"containing\",\n    \"contains\",\n    \"copy\",\n    \"corresponding\",\n    \"could\",\n    \"could've\",\n    \"couldn\",\n    \"couldn't\",\n    \"couldnt\",\n    \"course\",\n    \"cr\",\n    \"cry\",\n    \"cs\",\n    \"cu\",\n    \"currently\",\n    \"cv\",\n    \"cx\",\n    \"cy\",\n    \"cz\",\n    \"d\",\n    \"dare\",\n    \"daren't\",\n    \"darent\",\n    \"date\",\n    \"de\",\n    \"dear\",\n    \"definitely\",\n    \"describe\",\n    \"described\",\n    \"despite\",\n    \"detail\",\n    \"did\",\n    \"didn\",\n    \"didn't\",\n    \"didnt\",\n    \"differ\",\n    \"different\",\n    \"differently\",\n    \"directly\",\n    \"dj\",\n    \"dk\",\n    \"dm\",\n    \"do\",\n    \"does\",\n    \"doesn\",\n    \"doesn't\",\n    \"doesnt\",\n    \"doing\",\n    \"don\",\n    \"don't\",\n    \"done\",\n    \"dont\",\n    \"doubtful\",\n    \"down\",\n    \"downed\",\n    \"downing\",\n    \"downs\",\n    \"downwards\",\n    \"due\",\n    \"during\",\n    \"dz\",\n    \"e\",\n    \"each\",\n    \"early\",\n    \"ec\",\n    \"ed\",\n    \"edu\",\n    \"ee\",\n    \"effect\",\n    \"eg\",\n    \"eh\",\n    \"eight\",\n    \"eighty\",\n    \"either\",\n    \"eleven\",\n    \"else\",\n    \"elsewhere\",\n    \"empty\",\n    \"end\",\n    \"ended\",\n    \"ending\",\n    \"ends\",\n    \"enough\",\n    \"entirely\",\n    \"er\",\n    \"es\",\n    \"especially\",\n    \"et\",\n    \"et-al\",\n    \"etc\",\n    \"even\",\n    \"evenly\",\n    \"ever\",\n    \"evermore\",\n    \"every\",\n    \"everybody\",\n    \"everyone\",\n    \"everything\",\n    \"everywhere\",\n    \"ex\",\n    \"exactly\",\n    \"example\",\n    \"except\",\n    \"f\",\n    \"face\",\n    \"faces\",\n    \"fact\",\n    \"facts\",\n    \"fairly\",\n    \"far\",\n    \"farther\",\n    \"felt\",\n    \"few\",\n    \"fewer\",\n    \"ff\",\n    \"fi\",\n    \"fifteen\",\n    \"fifth\",\n    \"fifty\",\n    \"fify\",\n    \"fill\",\n    \"find\",\n    \"finds\",\n    \"fire\",\n    \"first\",\n    \"five\",\n    \"fix\",\n    \"fj\",\n    \"fk\",\n    \"fm\",\n    \"fo\",\n    \"followed\",\n    \"following\",\n    \"follows\",\n    \"for\",\n    \"forever\",\n    \"former\",\n    \"formerly\",\n    \"forth\",\n    \"forty\",\n    \"forward\",\n    \"found\",\n    \"four\",\n    \"fr\",\n    \"free\",\n    \"from\",\n    \"front\",\n    \"full\",\n    \"fully\",\n    \"further\",\n    \"furthered\",\n    \"furthering\",\n    \"furthermore\",\n    \"furthers\",\n    \"fx\",\n    \"g\",\n    \"ga\",\n    \"gave\",\n    \"gb\",\n    \"gd\",\n    \"ge\",\n    \"general\",\n    \"generally\",\n    \"get\",\n    \"gets\",\n    \"getting\",\n    \"gf\",\n    \"gg\",\n    \"gh\",\n    \"gi\",\n    \"give\",\n    \"given\",\n    \"gives\",\n    \"giving\",\n    \"gl\",\n    \"gm\",\n    \"gmt\",\n    \"gn\",\n    \"go\",\n    \"goes\",\n    \"going\",\n    \"gone\",\n    \"good\",\n    \"goods\",\n    \"got\",\n    \"gotten\",\n    \"gov\",\n    \"gp\",\n    \"gq\",\n    \"gr\",\n    \"great\",\n    \"greater\",\n    \"greatest\",\n    \"greetings\",\n    \"group\",\n    \"grouped\",\n    \"grouping\",\n    \"groups\",\n    \"gs\",\n    \"gt\",\n    \"gu\",\n    \"gw\",\n    \"gy\",\n    \"h\",\n    \"had\",\n    \"hadn't\",\n    \"hadnt\",\n    \"half\",\n    \"happens\",\n    \"hardly\",\n    \"has\",\n    \"hasn\",\n    \"hasn't\",\n    \"hasnt\",\n    \"have\",\n    \"haven\",\n    \"haven't\",\n    \"havent\",\n    \"having\",\n    \"he\",\n    \"he'd\",\n    \"he'll\",\n    \"he's\",\n    \"hed\",\n    \"hell\",\n    \"hello\",\n    \"help\",\n    \"hence\",\n    \"her\",\n    \"here\",\n    \"here's\",\n    \"hereafter\",\n    \"hereby\",\n    \"herein\",\n    \"heres\",\n    \"hereupon\",\n    \"hers\",\n    \"herself\",\n    \"herse”\",\n    \"hes\",\n    \"hi\",\n    \"hid\",\n    \"high\",\n    \"higher\",\n    \"highest\",\n    \"him\",\n    \"himself\",\n    \"himse”\",\n    \"his\",\n    \"hither\",\n    \"hk\",\n    \"hm\",\n    \"hn\",\n    \"home\",\n    \"homepage\",\n    \"hopefully\",\n    \"how\",\n    \"how'd\",\n    \"how'll\",\n    \"how's\",\n    \"howbeit\",\n    \"however\",\n    \"hr\",\n    \"ht\",\n    \"htm\",\n    \"html\",\n    \"http\",\n    \"hu\",\n    \"hundred\",\n    \"i\",\n    \"i'd\",\n    \"i'll\",\n    \"i'm\",\n    \"i've\",\n    \"i.e.\",\n    \"id\",\n    \"ie\",\n    \"if\",\n    \"ignored\",\n    \"ii\",\n    \"il\",\n    \"ill\",\n    \"im\",\n    \"immediate\",\n    \"immediately\",\n    \"importance\",\n    \"important\",\n    \"in\",\n    \"inasmuch\",\n    \"inc\",\n    \"inc.\",\n    \"indeed\",\n    \"index\",\n    \"indicate\",\n    \"indicated\",\n    \"indicates\",\n    \"information\",\n    \"inner\",\n    \"inside\",\n    \"insofar\",\n    \"instead\",\n    \"int\",\n    \"interest\",\n    \"interested\",\n    \"interesting\",\n    \"interests\",\n    \"into\",\n    \"invention\",\n    \"inward\",\n    \"io\",\n    \"iq\",\n    \"ir\",\n    \"is\",\n    \"isn\",\n    \"isn't\",\n    \"isnt\",\n    \"it\",\n    \"it'd\",\n    \"it'll\",\n    \"it's\",\n    \"itd\",\n    \"itll\",\n    \"its\",\n    \"itself\",\n    \"itse”\",\n    \"ive\",\n    \"j\",\n    \"je\",\n    \"jm\",\n    \"jo\",\n    \"join\",\n    \"jp\",\n    \"just\",\n    \"k\",\n    \"ke\",\n    \"keep\",\n    \"keeps\",\n    \"kept\",\n    \"keys\",\n    \"kg\",\n    \"kh\",\n    \"ki\",\n    \"kind\",\n    \"km\",\n    \"kn\",\n    \"knew\",\n    \"know\",\n    \"known\",\n    \"knows\",\n    \"kp\",\n    \"kr\",\n    \"kw\",\n    \"ky\",\n    \"kz\",\n    \"l\",\n    \"la\",\n    \"large\",\n    \"largely\",\n    \"last\",\n    \"lately\",\n    \"later\",\n    \"latest\",\n    \"latter\",\n    \"latterly\",\n    \"lb\",\n    \"lc\",\n    \"least\",\n    \"length\",\n    \"less\",\n    \"lest\",\n    \"let\",\n    \"let's\",\n    \"lets\",\n    \"li\",\n    \"like\",\n    \"liked\",\n    \"likely\",\n    \"likewise\",\n    \"line\",\n    \"little\",\n    \"lk\",\n    \"ll\",\n    \"long\",\n    \"longer\",\n    \"longest\",\n    \"look\",\n    \"looking\",\n    \"looks\",\n    \"low\",\n    \"lower\",\n    \"lr\",\n    \"ls\",\n    \"lt\",\n    \"ltd\",\n    \"lu\",\n    \"lv\",\n    \"ly\",\n    \"m\",\n    \"ma\",\n    \"made\",\n    \"mainly\",\n    \"make\",\n    \"makes\",\n    \"making\",\n    \"man\",\n    \"many\",\n    \"may\",\n    \"maybe\",\n    \"mayn't\",\n    \"maynt\",\n    \"mc\",\n    \"md\",\n    \"me\",\n    \"mean\",\n    \"means\",\n    \"meantime\",\n    \"meanwhile\",\n    \"member\",\n    \"members\",\n    \"men\",\n    \"merely\",\n    \"mg\",\n    \"mh\",\n    \"microsoft\",\n    \"might\",\n    \"might've\",\n    \"mightn't\",\n    \"mightnt\",\n    \"mil\",\n    \"mill\",\n    \"million\",\n    \"mine\",\n    \"minus\",\n    \"miss\",\n    \"mk\",\n    \"ml\",\n    \"mm\",\n    \"mn\",\n    \"mo\",\n    \"more\",\n    \"moreover\",\n    \"most\",\n    \"mostly\",\n    \"move\",\n    \"mp\",\n    \"mq\",\n    \"mr\",\n    \"mrs\",\n    \"ms\",\n    \"msie\",\n    \"mt\",\n    \"mu\",\n    \"much\",\n    \"mug\",\n    \"must\",\n    \"must've\",\n    \"mustn't\",\n    \"mustnt\",\n    \"mv\",\n    \"mw\",\n    \"mx\",\n    \"my\",\n    \"myself\",\n    \"myse”\",\n    \"mz\",\n    \"n\",\n    \"na\",\n    \"name\",\n    \"namely\",\n    \"nay\",\n    \"nc\",\n    \"nd\",\n    \"ne\",\n    \"near\",\n    \"nearly\",\n    \"necessarily\",\n    \"necessary\",\n    \"need\",\n    \"needed\",\n    \"needing\",\n    \"needn't\",\n    \"neednt\",\n    \"needs\",\n    \"neither\",\n    \"net\",\n    \"netscape\",\n    \"never\",\n    \"neverf\",\n    \"neverless\",\n    \"nevertheless\",\n    \"new\",\n    \"newer\",\n    \"newest\",\n    \"next\",\n    \"nf\",\n    \"ng\",\n    \"ni\",\n    \"nine\",\n    \"ninety\",\n    \"nl\",\n    \"no\",\n    \"no-one\",\n    \"nobody\",\n    \"non\",\n    \"none\",\n    \"nonetheless\",\n    \"noone\",\n    \"nor\",\n    \"normally\",\n    \"nos\",\n    \"not\",\n    \"noted\",\n    \"nothing\",\n    \"notwithstanding\",\n    \"novel\",\n    \"now\",\n    \"nowhere\",\n    \"np\",\n    \"nr\",\n    \"nu\",\n    \"null\",\n    \"number\",\n    \"numbers\",\n    \"nz\",\n    \"o\",\n    \"obtain\",\n    \"obtained\",\n    \"obviously\",\n    \"of\",\n    \"off\",\n    \"often\",\n    \"oh\",\n    \"ok\",\n    \"okay\",\n    \"old\",\n    \"older\",\n    \"oldest\",\n    \"om\",\n    \"omitted\",\n    \"on\",\n    \"once\",\n    \"one\",\n    \"one's\",\n    \"ones\",\n    \"only\",\n    \"onto\",\n    \"open\",\n    \"opened\",\n    \"opening\",\n    \"opens\",\n    \"opposite\",\n    \"or\",\n    \"ord\",\n    \"order\",\n    \"ordered\",\n    \"ordering\",\n    \"orders\",\n    \"org\",\n    \"other\",\n    \"others\",\n    \"otherwise\",\n    \"ought\",\n    \"oughtn't\",\n    \"oughtnt\",\n    \"our\",\n    \"ours\",\n    \"ourselves\",\n    \"out\",\n    \"outside\",\n    \"over\",\n    \"overall\",\n    \"owing\",\n    \"own\",\n    \"p\",\n    \"pa\",\n    \"page\",\n    \"pages\",\n    \"part\",\n    \"parted\",\n    \"particular\",\n    \"particularly\",\n    \"parting\",\n    \"parts\",\n    \"past\",\n    \"pe\",\n    \"per\",\n    \"perhaps\",\n    \"pf\",\n    \"pg\",\n    \"ph\",\n    \"pk\",\n    \"pl\",\n    \"place\",\n    \"placed\",\n    \"places\",\n    \"please\",\n    \"plus\",\n    \"pm\",\n    \"pmid\",\n    \"pn\",\n    \"point\",\n    \"pointed\",\n    \"pointing\",\n    \"points\",\n    \"poorly\",\n    \"possible\",\n    \"possibly\",\n    \"potentially\",\n    \"pp\",\n    \"pr\",\n    \"predominantly\",\n    \"present\",\n    \"presented\",\n    \"presenting\",\n    \"presents\",\n    \"presumably\",\n    \"previously\",\n    \"primarily\",\n    \"probably\",\n    \"problem\",\n    \"problems\",\n    \"promptly\",\n    \"proud\",\n    \"provided\",\n    \"provides\",\n    \"pt\",\n    \"put\",\n    \"puts\",\n    \"pw\",\n    \"py\",\n    \"q\",\n    \"qa\",\n    \"que\",\n    \"quickly\",\n    \"quite\",\n    \"qv\",\n    \"r\",\n    \"ran\",\n    \"rather\",\n    \"rd\",\n    \"re\",\n    \"readily\",\n    \"really\",\n    \"reasonably\",\n    \"recent\",\n    \"recently\",\n    \"ref\",\n    \"refs\",\n    \"regarding\",\n    \"regardless\",\n    \"regards\",\n    \"related\",\n    \"relatively\",\n    \"research\",\n    \"reserved\",\n    \"respectively\",\n    \"resulted\",\n    \"resulting\",\n    \"results\",\n    \"right\",\n    \"ring\",\n    \"ro\",\n    \"room\",\n    \"rooms\",\n    \"round\",\n    \"ru\",\n    \"run\",\n    \"rw\",\n    \"s\",\n    \"sa\",\n    \"said\",\n    \"same\",\n    \"saw\",\n    \"say\",\n    \"saying\",\n    \"says\",\n    \"sb\",\n    \"sc\",\n    \"sd\",\n    \"se\",\n    \"sec\",\n    \"second\",\n    \"secondly\",\n    \"seconds\",\n    \"section\",\n    \"see\",\n    \"seeing\",\n    \"seem\",\n    \"seemed\",\n    \"seeming\",\n    \"seems\",\n    \"seen\",\n    \"sees\",\n    \"self\",\n    \"selves\",\n    \"sensible\",\n    \"sent\",\n    \"serious\",\n    \"seriously\",\n    \"seven\",\n    \"seventy\",\n    \"several\",\n    \"sg\",\n    \"sh\",\n    \"shall\",\n    \"shan't\",\n    \"shant\",\n    \"she\",\n    \"she'd\",\n    \"she'll\",\n    \"she's\",\n    \"shed\",\n    \"shell\",\n    \"shes\",\n    \"should\",\n    \"should've\",\n    \"shouldn\",\n    \"shouldn't\",\n    \"shouldnt\",\n    \"show\",\n    \"showed\",\n    \"showing\",\n    \"shown\",\n    \"showns\",\n    \"shows\",\n    \"si\",\n    \"side\",\n    \"sides\",\n    \"significant\",\n    \"significantly\",\n    \"similar\",\n    \"similarly\",\n    \"since\",\n    \"sincere\",\n    \"site\",\n    \"six\",\n    \"sixty\",\n    \"sj\",\n    \"sk\",\n    \"sl\",\n    \"slightly\",\n    \"sm\",\n    \"small\",\n    \"smaller\",\n    \"smallest\",\n    \"sn\",\n    \"so\",\n    \"some\",\n    \"somebody\",\n    \"someday\",\n    \"somehow\",\n    \"someone\",\n    \"somethan\",\n    \"something\",\n    \"sometime\",\n    \"sometimes\",\n    \"somewhat\",\n    \"somewhere\",\n    \"soon\",\n    \"sorry\",\n    \"specifically\",\n    \"specified\",\n    \"specify\",\n    \"specifying\",\n    \"sr\",\n    \"st\",\n    \"state\",\n    \"states\",\n    \"still\",\n    \"stop\",\n    \"strongly\",\n    \"su\",\n    \"sub\",\n    \"substantially\",\n    \"successfully\",\n    \"such\",\n    \"sufficiently\",\n    \"suggest\",\n    \"sup\",\n    \"sure\",\n    \"sv\",\n    \"sy\",\n    \"system\",\n    \"sz\",\n    \"t\",\n    \"t's\",\n    \"take\",\n    \"taken\",\n    \"taking\",\n    \"tc\",\n    \"td\",\n    \"tell\",\n    \"ten\",\n    \"tends\",\n    \"test\",\n    \"text\",\n    \"tf\",\n    \"tg\",\n    \"th\",\n    \"than\",\n    \"thank\",\n    \"thanks\",\n    \"thanx\",\n    \"that\",\n    \"that'll\",\n    \"that's\",\n    \"that've\",\n    \"thatll\",\n    \"thats\",\n    \"thatve\",\n    \"the\",\n    \"their\",\n    \"theirs\",\n    \"them\",\n    \"themselves\",\n    \"then\",\n    \"thence\",\n    \"there\",\n    \"there'd\",\n    \"there'll\",\n    \"there're\",\n    \"there's\",\n    \"there've\",\n    \"thereafter\",\n    \"thereby\",\n    \"thered\",\n    \"therefore\",\n    \"therein\",\n    \"therell\",\n    \"thereof\",\n    \"therere\",\n    \"theres\",\n    \"thereto\",\n    \"thereupon\",\n    \"thereve\",\n    \"these\",\n    \"they\",\n    \"they'd\",\n    \"they'll\",\n    \"they're\",\n    \"they've\",\n    \"theyd\",\n    \"theyll\",\n    \"theyre\",\n    \"theyve\",\n    \"thick\",\n    \"thin\",\n    \"thing\",\n    \"things\",\n    \"think\",\n    \"thinks\",\n    \"third\",\n    \"thirty\",\n    \"this\",\n    \"thorough\",\n    \"thoroughly\",\n    \"those\",\n    \"thou\",\n    \"though\",\n    \"thoughh\",\n    \"thought\",\n    \"thoughts\",\n    \"thousand\",\n    \"three\",\n    \"throug\",\n    \"through\",\n    \"throughout\",\n    \"thru\",\n    \"thus\",\n    \"til\",\n    \"till\",\n    \"tip\",\n    \"tis\",\n    \"tj\",\n    \"tk\",\n    \"tm\",\n    \"tn\",\n    \"to\",\n    \"today\",\n    \"together\",\n    \"too\",\n    \"took\",\n    \"top\",\n    \"toward\",\n    \"towards\",\n    \"tp\",\n    \"tr\",\n    \"tried\",\n    \"tries\",\n    \"trillion\",\n    \"truly\",\n    \"try\",\n    \"trying\",\n    \"ts\",\n    \"tt\",\n    \"turn\",\n    \"turned\",\n    \"turning\",\n    \"turns\",\n    \"tv\",\n    \"tw\",\n    \"twas\",\n    \"twelve\",\n    \"twenty\",\n    \"twice\",\n    \"two\",\n    \"tz\",\n    \"u\",\n    \"ua\",\n    \"ug\",\n    \"uk\",\n    \"um\",\n    \"un\",\n    \"under\",\n    \"underneath\",\n    \"undoing\",\n    \"unfortunately\",\n    \"unless\",\n    \"unlike\",\n    \"unlikely\",\n    \"until\",\n    \"unto\",\n    \"up\",\n    \"upon\",\n    \"ups\",\n    \"upwards\",\n    \"us\",\n    \"use\",\n    \"used\",\n    \"useful\",\n    \"usefully\",\n    \"usefulness\",\n    \"uses\",\n    \"using\",\n    \"usually\",\n    \"uucp\",\n    \"uy\",\n    \"uz\",\n    \"v\",\n    \"va\",\n    \"value\",\n    \"various\",\n    \"vc\",\n    \"ve\",\n    \"versus\",\n    \"very\",\n    \"vg\",\n    \"vi\",\n    \"via\",\n    \"viz\",\n    \"vn\",\n    \"vol\",\n    \"vols\",\n    \"vs\",\n    \"vu\",\n    \"w\",\n    \"want\",\n    \"wanted\",\n    \"wanting\",\n    \"wants\",\n    \"was\",\n    \"wasn\",\n    \"wasn't\",\n    \"wasnt\",\n    \"way\",\n    \"ways\",\n    \"we\",\n    \"we'd\",\n    \"we'll\",\n    \"we're\",\n    \"we've\",\n    \"web\",\n    \"webpage\",\n    \"website\",\n    \"wed\",\n    \"welcome\",\n    \"well\",\n    \"wells\",\n    \"went\",\n    \"were\",\n    \"weren\",\n    \"weren't\",\n    \"werent\",\n    \"weve\",\n    \"wf\",\n    \"what\",\n    \"what'd\",\n    \"what'll\",\n    \"what's\",\n    \"what've\",\n    \"whatever\",\n    \"whatll\",\n    \"whats\",\n    \"whatve\",\n    \"when\",\n    \"when'd\",\n    \"when'll\",\n    \"when's\",\n    \"whence\",\n    \"whenever\",\n    \"where\",\n    \"where'd\",\n    \"where'll\",\n    \"where's\",\n    \"whereafter\",\n    \"whereas\",\n    \"whereby\",\n    \"wherein\",\n    \"wheres\",\n    \"whereupon\",\n    \"wherever\",\n    \"whether\",\n    \"which\",\n    \"whichever\",\n    \"while\",\n    \"whilst\",\n    \"whim\",\n    \"whither\",\n    \"who\",\n    \"who'd\",\n    \"who'll\",\n    \"who's\",\n    \"whod\",\n    \"whoever\",\n    \"whole\",\n    \"wholl\",\n    \"whom\",\n    \"whomever\",\n    \"whos\",\n    \"whose\",\n    \"why\",\n    \"why'd\",\n    \"why'll\",\n    \"why's\",\n    \"widely\",\n    \"width\",\n    \"will\",\n    \"willing\",\n    \"wish\",\n    \"with\",\n    \"within\",\n    \"without\",\n    \"won\",\n    \"won't\",\n    \"wonder\",\n    \"wont\",\n    \"words\",\n    \"work\",\n    \"worked\",\n    \"working\",\n    \"works\",\n    \"world\",\n    \"would\",\n    \"would've\",\n    \"wouldn\",\n    \"wouldn't\",\n    \"wouldnt\",\n    \"ws\",\n    \"www\",\n    \"x\",\n    \"y\",\n    \"ye\",\n    \"year\",\n    \"years\",\n    \"yes\",\n    \"yet\",\n    \"you\",\n    \"you'd\",\n    \"you'll\",\n    \"you're\",\n    \"you've\",\n    \"youd\",\n    \"youll\",\n    \"young\",\n    \"younger\",\n    \"youngest\",\n    \"your\",\n    \"youre\",\n    \"yours\",\n    \"yourself\",\n    \"yourselves\",\n    \"youve\",\n    \"yt\",\n    \"yu\",\n    \"z\",\n    \"za\",\n    \"zero\",\n    \"zm\",\n    \"zr\",\n];\n"
  },
  {
    "path": "src/stopwords/epo.rs",
    "content": "// Sonic\n//\n// Fast, lightweight and schema-less search backend\n// Copyright: 2019, Valerian Saliou <valerian@valeriansaliou.name>\n// License: Mozilla Public License v2.0 (MPL v2.0)\n\npub static STOPWORDS_EPO: &[&str] = &[\n    \"adiaŭ\",\n    \"ajn\",\n    \"al\",\n    \"ankoraŭ\",\n    \"antaŭ\",\n    \"aŭ\",\n    \"bonan\",\n    \"bonvole\",\n    \"bonvolu\",\n    \"bv\",\n    \"ci\",\n    \"cia\",\n    \"cian\",\n    \"cin\",\n    \"d-ro\",\n    \"da\",\n    \"de\",\n    \"dek\",\n    \"deka\",\n    \"do\",\n    \"doktor'\",\n    \"doktoro\",\n    \"du\",\n    \"dua\",\n    \"dum\",\n    \"eble\",\n    \"ekz\",\n    \"ekzemple\",\n    \"en\",\n    \"estas\",\n    \"estis\",\n    \"estos\",\n    \"estu\",\n    \"estus\",\n    \"eĉ\",\n    \"f-no\",\n    \"feliĉan\",\n    \"for\",\n    \"fraŭlino\",\n    \"ha\",\n    \"havas\",\n    \"havis\",\n    \"havos\",\n    \"havu\",\n    \"havus\",\n    \"he\",\n    \"ho\",\n    \"hu\",\n    \"ili\",\n    \"ilia\",\n    \"ilian\",\n    \"ilin\",\n    \"inter\",\n    \"io\",\n    \"ion\",\n    \"iu\",\n    \"iujn\",\n    \"iun\",\n    \"ja\",\n    \"jam\",\n    \"je\",\n    \"jes\",\n    \"k\",\n    \"kaj\",\n    \"ke\",\n    \"kio\",\n    \"kion\",\n    \"kiu\",\n    \"kiujn\",\n    \"kiun\",\n    \"kvankam\",\n    \"kvar\",\n    \"kvara\",\n    \"kvazaŭ\",\n    \"kvin\",\n    \"kvina\",\n    \"la\",\n    \"li\",\n    \"lia\",\n    \"lian\",\n    \"lin\",\n    \"malantaŭ\",\n    \"male\",\n    \"malgraŭ\",\n    \"mem\",\n    \"mi\",\n    \"mia\",\n    \"mian\",\n    \"min\",\n    \"minus\",\n    \"naŭ\",\n    \"naŭa\",\n    \"ne\",\n    \"nek\",\n    \"nenio\",\n    \"nenion\",\n    \"neniu\",\n    \"neniun\",\n    \"nepre\",\n    \"ni\",\n    \"nia\",\n    \"nian\",\n    \"nin\",\n    \"nu\",\n    \"nun\",\n    \"nur\",\n    \"ok\",\n    \"oka\",\n    \"oni\",\n    \"onia\",\n    \"onian\",\n    \"onin\",\n    \"plej\",\n    \"pli\",\n    \"plu\",\n    \"plus\",\n    \"por\",\n    \"post\",\n    \"preter\",\n    \"s-no\",\n    \"s-ro\",\n    \"se\",\n    \"sed\",\n    \"sep\",\n    \"sepa\",\n    \"ses\",\n    \"sesa\",\n    \"si\",\n    \"sia\",\n    \"sian\",\n    \"sin\",\n    \"sinjor'\",\n    \"sinjorino\",\n    \"sinjoro\",\n    \"sub\",\n    \"super\",\n    \"supren\",\n    \"sur\",\n    \"tamen\",\n    \"tio\",\n    \"tion\",\n    \"tiu\",\n    \"tiujn\",\n    \"tiun\",\n    \"tra\",\n    \"tri\",\n    \"tria\",\n    \"tuj\",\n    \"tute\",\n    \"unu\",\n    \"unua\",\n    \"ve\",\n    \"verŝajne\",\n    \"vi\",\n    \"via\",\n    \"vian\",\n    \"vin\",\n    \"ĉi\",\n    \"ĉio\",\n    \"ĉion\",\n    \"ĉiu\",\n    \"ĉiujn\",\n    \"ĉiun\",\n    \"ĉu\",\n    \"ĝi\",\n    \"ĝia\",\n    \"ĝian\",\n    \"ĝin\",\n    \"ĝis\",\n    \"ĵus\",\n    \"ŝi\",\n    \"ŝia\",\n    \"ŝin\",\n];\n"
  },
  {
    "path": "src/stopwords/est.rs",
    "content": "// Sonic\n//\n// Fast, lightweight and schema-less search backend\n// Copyright: 2019, Valerian Saliou <valerian@valeriansaliou.name>\n// License: Mozilla Public License v2.0 (MPL v2.0)\n\npub static STOPWORDS_EST: &[&str] = &[\n    \"aga\", \"ei\", \"et\", \"ja\", \"jah\", \"kas\", \"kui\", \"kõik\", \"ma\", \"me\", \"mida\", \"midagi\", \"mind\",\n    \"minu\", \"mis\", \"mu\", \"mul\", \"mulle\", \"nad\", \"nii\", \"oled\", \"olen\", \"oli\", \"oma\", \"on\", \"pole\",\n    \"sa\", \"seda\", \"see\", \"selle\", \"siin\", \"siis\", \"ta\", \"te\", \"ära\",\n];\n"
  },
  {
    "path": "src/stopwords/fin.rs",
    "content": "// Sonic\n//\n// Fast, lightweight and schema-less search backend\n// Copyright: 2019, Valerian Saliou <valerian@valeriansaliou.name>\n// License: Mozilla Public License v2.0 (MPL v2.0)\n\npub static STOPWORDS_FIN: &[&str] = &[\n    \"aiemmin\",\n    \"aika\",\n    \"aikaa\",\n    \"aikaan\",\n    \"aikaisemmin\",\n    \"aikaisin\",\n    \"aikajen\",\n    \"aikana\",\n    \"aikoina\",\n    \"aikoo\",\n    \"aikovat\",\n    \"aina\",\n    \"ainakaan\",\n    \"ainakin\",\n    \"ainoa\",\n    \"ainoat\",\n    \"aiomme\",\n    \"aion\",\n    \"aiotte\",\n    \"aist\",\n    \"aivan\",\n    \"ajan\",\n    \"alas\",\n    \"alemmas\",\n    \"alkuisin\",\n    \"alkuun\",\n    \"alla\",\n    \"alle\",\n    \"aloitamme\",\n    \"aloitan\",\n    \"aloitat\",\n    \"aloitatte\",\n    \"aloitattivat\",\n    \"aloitettava\",\n    \"aloitettevaksi\",\n    \"aloitettu\",\n    \"aloitimme\",\n    \"aloitin\",\n    \"aloitit\",\n    \"aloititte\",\n    \"aloittaa\",\n    \"aloittamatta\",\n    \"aloitti\",\n    \"aloittivat\",\n    \"alta\",\n    \"aluksi\",\n    \"alussa\",\n    \"alusta\",\n    \"annettavaksi\",\n    \"annetteva\",\n    \"annettu\",\n    \"ansiosta\",\n    \"antaa\",\n    \"antamatta\",\n    \"antoi\",\n    \"aoua\",\n    \"apu\",\n    \"asia\",\n    \"asiaa\",\n    \"asian\",\n    \"asiasta\",\n    \"asiat\",\n    \"asioiden\",\n    \"asioihin\",\n    \"asioita\",\n    \"asti\",\n    \"avuksi\",\n    \"avulla\",\n    \"avun\",\n    \"avutta\",\n    \"edelle\",\n    \"edelleen\",\n    \"edellä\",\n    \"edeltä\",\n    \"edemmäs\",\n    \"edes\",\n    \"edessä\",\n    \"edestä\",\n    \"ehkä\",\n    \"ei\",\n    \"eikä\",\n    \"eilen\",\n    \"eivät\",\n    \"eli\",\n    \"ellei\",\n    \"elleivät\",\n    \"ellemme\",\n    \"ellen\",\n    \"ellet\",\n    \"ellette\",\n    \"emme\",\n    \"en\",\n    \"enemmän\",\n    \"eniten\",\n    \"ennen\",\n    \"ensi\",\n    \"ensimmäinen\",\n    \"ensimmäiseksi\",\n    \"ensimmäisen\",\n    \"ensimmäisenä\",\n    \"ensimmäiset\",\n    \"ensimmäisiksi\",\n    \"ensimmäisinä\",\n    \"ensimmäisiä\",\n    \"ensimmäistä\",\n    \"ensin\",\n    \"entinen\",\n    \"entisen\",\n    \"entisiä\",\n    \"entisten\",\n    \"entistä\",\n    \"enää\",\n    \"eri\",\n    \"erittäin\",\n    \"erityisesti\",\n    \"eräiden\",\n    \"eräs\",\n    \"eräät\",\n    \"esi\",\n    \"esiin\",\n    \"esillä\",\n    \"esimerkiksi\",\n    \"et\",\n    \"eteen\",\n    \"etenkin\",\n    \"etessa\",\n    \"ette\",\n    \"ettei\",\n    \"että\",\n    \"haikki\",\n    \"halua\",\n    \"haluaa\",\n    \"haluamatta\",\n    \"haluamme\",\n    \"haluan\",\n    \"haluat\",\n    \"haluatte\",\n    \"haluavat\",\n    \"halunnut\",\n    \"halusi\",\n    \"halusimme\",\n    \"halusin\",\n    \"halusit\",\n    \"halusitte\",\n    \"halusivat\",\n    \"halutessa\",\n    \"haluton\",\n    \"he\",\n    \"hei\",\n    \"heidän\",\n    \"heidät\",\n    \"heihin\",\n    \"heille\",\n    \"heillä\",\n    \"heiltä\",\n    \"heissä\",\n    \"heistä\",\n    \"heitä\",\n    \"helposti\",\n    \"heti\",\n    \"hetkellä\",\n    \"hieman\",\n    \"hitaasti\",\n    \"hoikein\",\n    \"huolimatta\",\n    \"huomenna\",\n    \"hyvien\",\n    \"hyviin\",\n    \"hyviksi\",\n    \"hyville\",\n    \"hyviltä\",\n    \"hyvin\",\n    \"hyvinä\",\n    \"hyvissä\",\n    \"hyvistä\",\n    \"hyviä\",\n    \"hyvä\",\n    \"hyvät\",\n    \"hyvää\",\n    \"hän\",\n    \"häneen\",\n    \"hänelle\",\n    \"hänellä\",\n    \"häneltä\",\n    \"hänen\",\n    \"hänessä\",\n    \"hänestä\",\n    \"hänet\",\n    \"häntä\",\n    \"ihan\",\n    \"ilman\",\n    \"ilmeisesti\",\n    \"itse\",\n    \"itsensä\",\n    \"itseään\",\n    \"ja\",\n    \"jo\",\n    \"johon\",\n    \"joiden\",\n    \"joihin\",\n    \"joiksi\",\n    \"joilla\",\n    \"joille\",\n    \"joilta\",\n    \"joina\",\n    \"joissa\",\n    \"joista\",\n    \"joita\",\n    \"joka\",\n    \"jokainen\",\n    \"jokin\",\n    \"joko\",\n    \"joksi\",\n    \"joku\",\n    \"jolla\",\n    \"jolle\",\n    \"jolloin\",\n    \"jolta\",\n    \"jompikumpi\",\n    \"jona\",\n    \"jonka\",\n    \"jonkin\",\n    \"jonne\",\n    \"joo\",\n    \"jopa\",\n    \"jos\",\n    \"joskus\",\n    \"jossa\",\n    \"josta\",\n    \"jota\",\n    \"jotain\",\n    \"joten\",\n    \"jotenkin\",\n    \"jotenkuten\",\n    \"jotka\",\n    \"jotta\",\n    \"jouduimme\",\n    \"jouduin\",\n    \"jouduit\",\n    \"jouduitte\",\n    \"joudumme\",\n    \"joudun\",\n    \"joudutte\",\n    \"joukkoon\",\n    \"joukossa\",\n    \"joukosta\",\n    \"joutua\",\n    \"joutui\",\n    \"joutuivat\",\n    \"joutumaan\",\n    \"joutuu\",\n    \"joutuvat\",\n    \"juuri\",\n    \"jälkeen\",\n    \"jälleen\",\n    \"jää\",\n    \"kahdeksan\",\n    \"kahdeksannen\",\n    \"kahdella\",\n    \"kahdelle\",\n    \"kahdelta\",\n    \"kahden\",\n    \"kahdessa\",\n    \"kahdesta\",\n    \"kahta\",\n    \"kahteen\",\n    \"kai\",\n    \"kaiken\",\n    \"kaikille\",\n    \"kaikilta\",\n    \"kaikkea\",\n    \"kaikki\",\n    \"kaikkia\",\n    \"kaikkiaan\",\n    \"kaikkialla\",\n    \"kaikkialle\",\n    \"kaikkialta\",\n    \"kaikkien\",\n    \"kaikkin\",\n    \"kaksi\",\n    \"kannalta\",\n    \"kannattaa\",\n    \"kanssa\",\n    \"kanssaan\",\n    \"kanssamme\",\n    \"kanssani\",\n    \"kanssanne\",\n    \"kanssasi\",\n    \"kauan\",\n    \"kauemmas\",\n    \"kaukana\",\n    \"kautta\",\n    \"kehen\",\n    \"keiden\",\n    \"keihin\",\n    \"keiksi\",\n    \"keille\",\n    \"keillä\",\n    \"keiltä\",\n    \"keinä\",\n    \"keissä\",\n    \"keistä\",\n    \"keitten\",\n    \"keittä\",\n    \"keitä\",\n    \"keneen\",\n    \"keneksi\",\n    \"kenelle\",\n    \"kenellä\",\n    \"keneltä\",\n    \"kenen\",\n    \"kenenä\",\n    \"kenessä\",\n    \"kenestä\",\n    \"kenet\",\n    \"kenettä\",\n    \"kennessästä\",\n    \"kenties\",\n    \"kerran\",\n    \"kerta\",\n    \"kertaa\",\n    \"keskellä\",\n    \"kesken\",\n    \"keskimäärin\",\n    \"ketkä\",\n    \"ketä\",\n    \"kiitos\",\n    \"kohti\",\n    \"koko\",\n    \"kokonaan\",\n    \"kolmas\",\n    \"kolme\",\n    \"kolmen\",\n    \"kolmesti\",\n    \"koska\",\n    \"koskaan\",\n    \"kovin\",\n    \"kuin\",\n    \"kuinka\",\n    \"kuinkan\",\n    \"kuitenkaan\",\n    \"kuitenkin\",\n    \"kuka\",\n    \"kukaan\",\n    \"kukin\",\n    \"kukka\",\n    \"kumpainen\",\n    \"kumpainenkaan\",\n    \"kumpi\",\n    \"kumpikaan\",\n    \"kumpikin\",\n    \"kun\",\n    \"kuten\",\n    \"kuuden\",\n    \"kuusi\",\n    \"kuutta\",\n    \"kylliksi\",\n    \"kyllä\",\n    \"kymmenen\",\n    \"kyse\",\n    \"liian\",\n    \"liki\",\n    \"lisäksi\",\n    \"lisää\",\n    \"lla\",\n    \"luo\",\n    \"luona\",\n    \"lähekkäin\",\n    \"lähelle\",\n    \"lähellä\",\n    \"läheltä\",\n    \"lähemmäs\",\n    \"lähes\",\n    \"lähinnä\",\n    \"lähtien\",\n    \"läpi\",\n    \"mahdollisimman\",\n    \"mahdollista\",\n    \"me\",\n    \"meidän\",\n    \"meidät\",\n    \"meihin\",\n    \"meille\",\n    \"meillä\",\n    \"meiltä\",\n    \"meissä\",\n    \"meistä\",\n    \"meitä\",\n    \"melkein\",\n    \"melko\",\n    \"menee\",\n    \"meneet\",\n    \"menemme\",\n    \"menen\",\n    \"menet\",\n    \"menette\",\n    \"menevät\",\n    \"meni\",\n    \"menimme\",\n    \"menin\",\n    \"menit\",\n    \"menivät\",\n    \"mennessä\",\n    \"mennyt\",\n    \"menossa\",\n    \"mihin\",\n    \"mikin\",\n    \"miksi\",\n    \"mikä\",\n    \"mikäli\",\n    \"mikään\",\n    \"mille\",\n    \"milloin\",\n    \"milloinkan\",\n    \"millä\",\n    \"miltä\",\n    \"minkä\",\n    \"minne\",\n    \"minua\",\n    \"minulla\",\n    \"minulle\",\n    \"minulta\",\n    \"minun\",\n    \"minussa\",\n    \"minusta\",\n    \"minut\",\n    \"minuun\",\n    \"minä\",\n    \"missä\",\n    \"mistä\",\n    \"miten\",\n    \"mitkä\",\n    \"mitä\",\n    \"mitään\",\n    \"moi\",\n    \"molemmat\",\n    \"mones\",\n    \"monesti\",\n    \"monet\",\n    \"moni\",\n    \"moniaalla\",\n    \"moniaalle\",\n    \"moniaalta\",\n    \"monta\",\n    \"muassa\",\n    \"muiden\",\n    \"muita\",\n    \"muka\",\n    \"mukaan\",\n    \"mukaansa\",\n    \"mukana\",\n    \"mutta\",\n    \"muu\",\n    \"muualla\",\n    \"muualle\",\n    \"muualta\",\n    \"muuanne\",\n    \"muulloin\",\n    \"muun\",\n    \"muut\",\n    \"muuta\",\n    \"muutama\",\n    \"muutaman\",\n    \"muuten\",\n    \"myöhemmin\",\n    \"myös\",\n    \"myöskin\",\n    \"myöskään\",\n    \"myötä\",\n    \"ne\",\n    \"neljä\",\n    \"neljän\",\n    \"neljää\",\n    \"niiden\",\n    \"niihin\",\n    \"niiksi\",\n    \"niille\",\n    \"niillä\",\n    \"niiltä\",\n    \"niin\",\n    \"niinä\",\n    \"niissä\",\n    \"niistä\",\n    \"niitä\",\n    \"noiden\",\n    \"noihin\",\n    \"noiksi\",\n    \"noilla\",\n    \"noille\",\n    \"noilta\",\n    \"noin\",\n    \"noina\",\n    \"noissa\",\n    \"noista\",\n    \"noita\",\n    \"nopeammin\",\n    \"nopeasti\",\n    \"nopeiten\",\n    \"nro\",\n    \"nuo\",\n    \"nyt\",\n    \"näiden\",\n    \"näihin\",\n    \"näiksi\",\n    \"näille\",\n    \"näillä\",\n    \"näiltä\",\n    \"näin\",\n    \"näinä\",\n    \"näissä\",\n    \"näissähin\",\n    \"näissälle\",\n    \"näissältä\",\n    \"näissästä\",\n    \"näistä\",\n    \"näitä\",\n    \"nämä\",\n    \"ohi\",\n    \"oikea\",\n    \"oikealla\",\n    \"oikein\",\n    \"ole\",\n    \"olemme\",\n    \"olen\",\n    \"olet\",\n    \"olette\",\n    \"oleva\",\n    \"olevan\",\n    \"olevat\",\n    \"oli\",\n    \"olimme\",\n    \"olin\",\n    \"olisi\",\n    \"olisimme\",\n    \"olisin\",\n    \"olisit\",\n    \"olisitte\",\n    \"olisivat\",\n    \"olit\",\n    \"olitte\",\n    \"olivat\",\n    \"olla\",\n    \"olleet\",\n    \"olli\",\n    \"ollut\",\n    \"oma\",\n    \"omaa\",\n    \"omaan\",\n    \"omaksi\",\n    \"omalle\",\n    \"omalta\",\n    \"oman\",\n    \"omassa\",\n    \"omat\",\n    \"omia\",\n    \"omien\",\n    \"omiin\",\n    \"omiksi\",\n    \"omille\",\n    \"omilta\",\n    \"omissa\",\n    \"omista\",\n    \"on\",\n    \"onkin\",\n    \"onko\",\n    \"ovat\",\n    \"paikoittain\",\n    \"paitsi\",\n    \"pakosti\",\n    \"paljon\",\n    \"paremmin\",\n    \"parempi\",\n    \"parhaillaan\",\n    \"parhaiten\",\n    \"perusteella\",\n    \"peräti\",\n    \"pian\",\n    \"pieneen\",\n    \"pieneksi\",\n    \"pienelle\",\n    \"pienellä\",\n    \"pieneltä\",\n    \"pienempi\",\n    \"pienestä\",\n    \"pieni\",\n    \"pienin\",\n    \"poikki\",\n    \"puolesta\",\n    \"puolestaan\",\n    \"päälle\",\n    \"runsaasti\",\n    \"saakka\",\n    \"sadam\",\n    \"sama\",\n    \"samaa\",\n    \"samaan\",\n    \"samalla\",\n    \"samallalta\",\n    \"samallassa\",\n    \"samallasta\",\n    \"saman\",\n    \"samat\",\n    \"samoin\",\n    \"sata\",\n    \"sataa\",\n    \"satojen\",\n    \"se\",\n    \"seitsemän\",\n    \"sekä\",\n    \"sen\",\n    \"seuraavat\",\n    \"siellä\",\n    \"sieltä\",\n    \"siihen\",\n    \"siinä\",\n    \"siis\",\n    \"siitä\",\n    \"sijaan\",\n    \"siksi\",\n    \"sille\",\n    \"silloin\",\n    \"sillä\",\n    \"silti\",\n    \"siltä\",\n    \"sinne\",\n    \"sinua\",\n    \"sinulla\",\n    \"sinulle\",\n    \"sinulta\",\n    \"sinun\",\n    \"sinussa\",\n    \"sinusta\",\n    \"sinut\",\n    \"sinuun\",\n    \"sinä\",\n    \"sisäkkäin\",\n    \"sisällä\",\n    \"siten\",\n    \"sitten\",\n    \"sitä\",\n    \"ssa\",\n    \"sta\",\n    \"suoraan\",\n    \"suuntaan\",\n    \"suuren\",\n    \"suuret\",\n    \"suuri\",\n    \"suuria\",\n    \"suurin\",\n    \"suurten\",\n    \"taa\",\n    \"taas\",\n    \"taemmas\",\n    \"tahansa\",\n    \"tai\",\n    \"takaa\",\n    \"takaisin\",\n    \"takana\",\n    \"takia\",\n    \"tallä\",\n    \"tapauksessa\",\n    \"tarpeeksi\",\n    \"tavalla\",\n    \"tavoitteena\",\n    \"te\",\n    \"teidän\",\n    \"teidät\",\n    \"teihin\",\n    \"teille\",\n    \"teillä\",\n    \"teiltä\",\n    \"teissä\",\n    \"teistä\",\n    \"teitä\",\n    \"tietysti\",\n    \"todella\",\n    \"toinen\",\n    \"toisaalla\",\n    \"toisaalle\",\n    \"toisaalta\",\n    \"toiseen\",\n    \"toiseksi\",\n    \"toisella\",\n    \"toiselle\",\n    \"toiselta\",\n    \"toisemme\",\n    \"toisen\",\n    \"toisensa\",\n    \"toisessa\",\n    \"toisesta\",\n    \"toista\",\n    \"toistaiseksi\",\n    \"toki\",\n    \"tosin\",\n    \"tuhannen\",\n    \"tuhat\",\n    \"tule\",\n    \"tulee\",\n    \"tulemme\",\n    \"tulen\",\n    \"tulet\",\n    \"tulette\",\n    \"tulevat\",\n    \"tulimme\",\n    \"tulin\",\n    \"tulisi\",\n    \"tulisimme\",\n    \"tulisin\",\n    \"tulisit\",\n    \"tulisitte\",\n    \"tulisivat\",\n    \"tulit\",\n    \"tulitte\",\n    \"tulivat\",\n    \"tulla\",\n    \"tulleet\",\n    \"tullut\",\n    \"tuntuu\",\n    \"tuo\",\n    \"tuohon\",\n    \"tuoksi\",\n    \"tuolla\",\n    \"tuolle\",\n    \"tuolloin\",\n    \"tuolta\",\n    \"tuon\",\n    \"tuona\",\n    \"tuonne\",\n    \"tuossa\",\n    \"tuosta\",\n    \"tuota\",\n    \"tuotä\",\n    \"tuskin\",\n    \"tykö\",\n    \"tähän\",\n    \"täksi\",\n    \"tälle\",\n    \"tällä\",\n    \"tällöin\",\n    \"tältä\",\n    \"tämä\",\n    \"tämän\",\n    \"tänne\",\n    \"tänä\",\n    \"tänään\",\n    \"tässä\",\n    \"tästä\",\n    \"täten\",\n    \"tätä\",\n    \"täysin\",\n    \"täytyvät\",\n    \"täytyy\",\n    \"täällä\",\n    \"täältä\",\n    \"ulkopuolella\",\n    \"usea\",\n    \"useasti\",\n    \"useimmiten\",\n    \"usein\",\n    \"useita\",\n    \"uudeksi\",\n    \"uudelleen\",\n    \"uuden\",\n    \"uudet\",\n    \"uusi\",\n    \"uusia\",\n    \"uusien\",\n    \"uusinta\",\n    \"uuteen\",\n    \"uutta\",\n    \"vaan\",\n    \"vahemmän\",\n    \"vai\",\n    \"vaiheessa\",\n    \"vaikea\",\n    \"vaikean\",\n    \"vaikeat\",\n    \"vaikeilla\",\n    \"vaikeille\",\n    \"vaikeilta\",\n    \"vaikeissa\",\n    \"vaikeista\",\n    \"vaikka\",\n    \"vain\",\n    \"varmasti\",\n    \"varsin\",\n    \"varsinkin\",\n    \"varten\",\n    \"vasen\",\n    \"vasenmalla\",\n    \"vasta\",\n    \"vastaan\",\n    \"vastakkain\",\n    \"vastan\",\n    \"verran\",\n    \"vielä\",\n    \"vierekkäin\",\n    \"vieressä\",\n    \"vieri\",\n    \"viiden\",\n    \"viime\",\n    \"viimeinen\",\n    \"viimeisen\",\n    \"viimeksi\",\n    \"viisi\",\n    \"voi\",\n    \"voidaan\",\n    \"voimme\",\n    \"voin\",\n    \"voisi\",\n    \"voit\",\n    \"voitte\",\n    \"voivat\",\n    \"vuoden\",\n    \"vuoksi\",\n    \"vuosi\",\n    \"vuosien\",\n    \"vuosina\",\n    \"vuotta\",\n    \"vähemmän\",\n    \"vähintään\",\n    \"vähiten\",\n    \"vähän\",\n    \"välillä\",\n    \"yhdeksän\",\n    \"yhden\",\n    \"yhdessä\",\n    \"yhteen\",\n    \"yhteensä\",\n    \"yhteydessä\",\n    \"yhteyteen\",\n    \"yhtä\",\n    \"yhtäälle\",\n    \"yhtäällä\",\n    \"yhtäältä\",\n    \"yhtään\",\n    \"yhä\",\n    \"yksi\",\n    \"yksin\",\n    \"yksittäin\",\n    \"yleensä\",\n    \"ylemmäs\",\n    \"yli\",\n    \"ylös\",\n    \"ympäri\",\n    \"älköön\",\n    \"älä\",\n];\n"
  },
  {
    "path": "src/stopwords/fra.rs",
    "content": "// Sonic\n//\n// Fast, lightweight and schema-less search backend\n// Copyright: 2019, Valerian Saliou <valerian@valeriansaliou.name>\n// License: Mozilla Public License v2.0 (MPL v2.0)\n\npub static STOPWORDS_FRA: &[&str] = &[\n    \"a\",\n    \"abord\",\n    \"absolument\",\n    \"afin\",\n    \"ah\",\n    \"ai\",\n    \"aie\",\n    \"aient\",\n    \"aies\",\n    \"ailleurs\",\n    \"ainsi\",\n    \"ait\",\n    \"allaient\",\n    \"allo\",\n    \"allons\",\n    \"allô\",\n    \"alors\",\n    \"anterieur\",\n    \"anterieure\",\n    \"anterieures\",\n    \"apres\",\n    \"après\",\n    \"as\",\n    \"assez\",\n    \"attendu\",\n    \"au\",\n    \"aucun\",\n    \"aucune\",\n    \"aucuns\",\n    \"aujourd\",\n    \"aujourd'hui\",\n    \"aupres\",\n    \"auquel\",\n    \"aura\",\n    \"aurai\",\n    \"auraient\",\n    \"aurais\",\n    \"aurait\",\n    \"auras\",\n    \"aurez\",\n    \"auriez\",\n    \"aurions\",\n    \"aurons\",\n    \"auront\",\n    \"aussi\",\n    \"autre\",\n    \"autrefois\",\n    \"autrement\",\n    \"autres\",\n    \"autrui\",\n    \"aux\",\n    \"auxquelles\",\n    \"auxquels\",\n    \"avaient\",\n    \"avais\",\n    \"avait\",\n    \"avant\",\n    \"avec\",\n    \"avez\",\n    \"aviez\",\n    \"avions\",\n    \"avoir\",\n    \"avons\",\n    \"ayant\",\n    \"ayez\",\n    \"ayons\",\n    \"b\",\n    \"bah\",\n    \"bas\",\n    \"basee\",\n    \"bat\",\n    \"beau\",\n    \"beaucoup\",\n    \"bien\",\n    \"bigre\",\n    \"bon\",\n    \"boum\",\n    \"bravo\",\n    \"brrr\",\n    \"c\",\n    \"car\",\n    \"ce\",\n    \"ceci\",\n    \"cela\",\n    \"celle\",\n    \"celle-ci\",\n    \"celle-là\",\n    \"celles\",\n    \"celles-ci\",\n    \"celles-là\",\n    \"celui\",\n    \"celui-ci\",\n    \"celui-là\",\n    \"celà\",\n    \"cent\",\n    \"cependant\",\n    \"certain\",\n    \"certaine\",\n    \"certaines\",\n    \"certains\",\n    \"certes\",\n    \"ces\",\n    \"cet\",\n    \"cette\",\n    \"ceux\",\n    \"ceux-ci\",\n    \"ceux-là\",\n    \"chacun\",\n    \"chacune\",\n    \"chaque\",\n    \"cher\",\n    \"chers\",\n    \"chez\",\n    \"chiche\",\n    \"chut\",\n    \"chère\",\n    \"chères\",\n    \"ci\",\n    \"cinq\",\n    \"cinquantaine\",\n    \"cinquante\",\n    \"cinquantième\",\n    \"cinquième\",\n    \"clac\",\n    \"clic\",\n    \"combien\",\n    \"comme\",\n    \"comment\",\n    \"comparable\",\n    \"comparables\",\n    \"compris\",\n    \"concernant\",\n    \"contre\",\n    \"couic\",\n    \"crac\",\n    \"d\",\n    \"da\",\n    \"dans\",\n    \"de\",\n    \"debout\",\n    \"dedans\",\n    \"dehors\",\n    \"deja\",\n    \"delà\",\n    \"depuis\",\n    \"dernier\",\n    \"derniere\",\n    \"derriere\",\n    \"derrière\",\n    \"des\",\n    \"desormais\",\n    \"desquelles\",\n    \"desquels\",\n    \"dessous\",\n    \"dessus\",\n    \"deux\",\n    \"deuxième\",\n    \"deuxièmement\",\n    \"devant\",\n    \"devers\",\n    \"devra\",\n    \"devrait\",\n    \"different\",\n    \"differentes\",\n    \"differents\",\n    \"différent\",\n    \"différente\",\n    \"différentes\",\n    \"différents\",\n    \"dire\",\n    \"directe\",\n    \"directement\",\n    \"dit\",\n    \"dite\",\n    \"dits\",\n    \"divers\",\n    \"diverse\",\n    \"diverses\",\n    \"dix\",\n    \"dix-huit\",\n    \"dix-neuf\",\n    \"dix-sept\",\n    \"dixième\",\n    \"doit\",\n    \"doivent\",\n    \"donc\",\n    \"dont\",\n    \"dos\",\n    \"douze\",\n    \"douzième\",\n    \"dring\",\n    \"droite\",\n    \"du\",\n    \"duquel\",\n    \"durant\",\n    \"dès\",\n    \"début\",\n    \"désormais\",\n    \"e\",\n    \"effet\",\n    \"egale\",\n    \"egalement\",\n    \"egales\",\n    \"eh\",\n    \"elle\",\n    \"elle-même\",\n    \"elles\",\n    \"elles-mêmes\",\n    \"en\",\n    \"encore\",\n    \"enfin\",\n    \"entre\",\n    \"envers\",\n    \"environ\",\n    \"es\",\n    \"essai\",\n    \"est\",\n    \"et\",\n    \"etant\",\n    \"etc\",\n    \"etre\",\n    \"eu\",\n    \"eue\",\n    \"eues\",\n    \"euh\",\n    \"eurent\",\n    \"eus\",\n    \"eusse\",\n    \"eussent\",\n    \"eusses\",\n    \"eussiez\",\n    \"eussions\",\n    \"eut\",\n    \"eux\",\n    \"eux-mêmes\",\n    \"exactement\",\n    \"excepté\",\n    \"extenso\",\n    \"exterieur\",\n    \"eûmes\",\n    \"eût\",\n    \"eûtes\",\n    \"f\",\n    \"fais\",\n    \"faisaient\",\n    \"faisant\",\n    \"fait\",\n    \"faites\",\n    \"façon\",\n    \"feront\",\n    \"fi\",\n    \"flac\",\n    \"floc\",\n    \"fois\",\n    \"font\",\n    \"force\",\n    \"furent\",\n    \"fus\",\n    \"fusse\",\n    \"fussent\",\n    \"fusses\",\n    \"fussiez\",\n    \"fussions\",\n    \"fut\",\n    \"fûmes\",\n    \"fût\",\n    \"fûtes\",\n    \"g\",\n    \"gens\",\n    \"h\",\n    \"ha\",\n    \"haut\",\n    \"hein\",\n    \"hem\",\n    \"hep\",\n    \"hi\",\n    \"ho\",\n    \"holà\",\n    \"hop\",\n    \"hormis\",\n    \"hors\",\n    \"hou\",\n    \"houp\",\n    \"hue\",\n    \"hui\",\n    \"huit\",\n    \"huitième\",\n    \"hum\",\n    \"hurrah\",\n    \"hé\",\n    \"hélas\",\n    \"i\",\n    \"ici\",\n    \"il\",\n    \"ils\",\n    \"importe\",\n    \"j\",\n    \"je\",\n    \"jusqu\",\n    \"jusque\",\n    \"juste\",\n    \"k\",\n    \"l\",\n    \"la\",\n    \"laisser\",\n    \"laquelle\",\n    \"las\",\n    \"le\",\n    \"lequel\",\n    \"les\",\n    \"lesquelles\",\n    \"lesquels\",\n    \"leur\",\n    \"leurs\",\n    \"longtemps\",\n    \"lors\",\n    \"lorsque\",\n    \"lui\",\n    \"lui-meme\",\n    \"lui-même\",\n    \"là\",\n    \"lès\",\n    \"m\",\n    \"ma\",\n    \"maint\",\n    \"maintenant\",\n    \"mais\",\n    \"malgre\",\n    \"malgré\",\n    \"maximale\",\n    \"me\",\n    \"meme\",\n    \"memes\",\n    \"merci\",\n    \"mes\",\n    \"mien\",\n    \"mienne\",\n    \"miennes\",\n    \"miens\",\n    \"mille\",\n    \"mince\",\n    \"mine\",\n    \"minimale\",\n    \"moi\",\n    \"moi-meme\",\n    \"moi-même\",\n    \"moindres\",\n    \"moins\",\n    \"mon\",\n    \"mot\",\n    \"moyennant\",\n    \"multiple\",\n    \"multiples\",\n    \"même\",\n    \"mêmes\",\n    \"n\",\n    \"na\",\n    \"naturel\",\n    \"naturelle\",\n    \"naturelles\",\n    \"ne\",\n    \"neanmoins\",\n    \"necessaire\",\n    \"necessairement\",\n    \"neuf\",\n    \"neuvième\",\n    \"ni\",\n    \"nombreuses\",\n    \"nombreux\",\n    \"nommés\",\n    \"non\",\n    \"nos\",\n    \"notamment\",\n    \"notre\",\n    \"nous\",\n    \"nous-mêmes\",\n    \"nouveau\",\n    \"nouveaux\",\n    \"nul\",\n    \"néanmoins\",\n    \"nôtre\",\n    \"nôtres\",\n    \"o\",\n    \"oh\",\n    \"ohé\",\n    \"ollé\",\n    \"olé\",\n    \"on\",\n    \"ont\",\n    \"onze\",\n    \"onzième\",\n    \"ore\",\n    \"ou\",\n    \"ouf\",\n    \"ouias\",\n    \"oust\",\n    \"ouste\",\n    \"outre\",\n    \"ouvert\",\n    \"ouverte\",\n    \"ouverts\",\n    \"o|\",\n    \"où\",\n    \"p\",\n    \"paf\",\n    \"pan\",\n    \"par\",\n    \"parce\",\n    \"parfois\",\n    \"parle\",\n    \"parlent\",\n    \"parler\",\n    \"parmi\",\n    \"parole\",\n    \"parseme\",\n    \"partant\",\n    \"particulier\",\n    \"particulière\",\n    \"particulièrement\",\n    \"pas\",\n    \"passé\",\n    \"pendant\",\n    \"pense\",\n    \"permet\",\n    \"personne\",\n    \"personnes\",\n    \"peu\",\n    \"peut\",\n    \"peuvent\",\n    \"peux\",\n    \"pff\",\n    \"pfft\",\n    \"pfut\",\n    \"pif\",\n    \"pire\",\n    \"pièce\",\n    \"plein\",\n    \"plouf\",\n    \"plupart\",\n    \"plus\",\n    \"plusieurs\",\n    \"plutôt\",\n    \"possessif\",\n    \"possessifs\",\n    \"possible\",\n    \"possibles\",\n    \"pouah\",\n    \"pour\",\n    \"pourquoi\",\n    \"pourrais\",\n    \"pourrait\",\n    \"pouvait\",\n    \"prealable\",\n    \"precisement\",\n    \"premier\",\n    \"première\",\n    \"premièrement\",\n    \"pres\",\n    \"probable\",\n    \"probante\",\n    \"procedant\",\n    \"proche\",\n    \"près\",\n    \"psitt\",\n    \"pu\",\n    \"puis\",\n    \"puisque\",\n    \"pur\",\n    \"pure\",\n    \"q\",\n    \"qu\",\n    \"quand\",\n    \"quant\",\n    \"quant-à-soi\",\n    \"quanta\",\n    \"quarante\",\n    \"quatorze\",\n    \"quatre\",\n    \"quatre-vingt\",\n    \"quatrième\",\n    \"quatrièmement\",\n    \"que\",\n    \"quel\",\n    \"quelconque\",\n    \"quelle\",\n    \"quelles\",\n    \"quelqu'un\",\n    \"quelque\",\n    \"quelques\",\n    \"quels\",\n    \"qui\",\n    \"quiconque\",\n    \"quinze\",\n    \"quoi\",\n    \"quoique\",\n    \"r\",\n    \"rare\",\n    \"rarement\",\n    \"rares\",\n    \"relative\",\n    \"relativement\",\n    \"remarquable\",\n    \"rend\",\n    \"rendre\",\n    \"restant\",\n    \"reste\",\n    \"restent\",\n    \"restrictif\",\n    \"retour\",\n    \"revoici\",\n    \"revoilà\",\n    \"rien\",\n    \"s\",\n    \"sa\",\n    \"sacrebleu\",\n    \"sait\",\n    \"sans\",\n    \"sapristi\",\n    \"sauf\",\n    \"se\",\n    \"sein\",\n    \"seize\",\n    \"selon\",\n    \"semblable\",\n    \"semblaient\",\n    \"semble\",\n    \"semblent\",\n    \"sent\",\n    \"sept\",\n    \"septième\",\n    \"sera\",\n    \"serai\",\n    \"seraient\",\n    \"serais\",\n    \"serait\",\n    \"seras\",\n    \"serez\",\n    \"seriez\",\n    \"serions\",\n    \"serons\",\n    \"seront\",\n    \"ses\",\n    \"seul\",\n    \"seule\",\n    \"seulement\",\n    \"si\",\n    \"sien\",\n    \"sienne\",\n    \"siennes\",\n    \"siens\",\n    \"sinon\",\n    \"six\",\n    \"sixième\",\n    \"soi\",\n    \"soi-même\",\n    \"soient\",\n    \"sois\",\n    \"soit\",\n    \"soixante\",\n    \"sommes\",\n    \"son\",\n    \"sont\",\n    \"sous\",\n    \"souvent\",\n    \"soyez\",\n    \"soyons\",\n    \"specifique\",\n    \"specifiques\",\n    \"speculatif\",\n    \"stop\",\n    \"strictement\",\n    \"subtiles\",\n    \"suffisant\",\n    \"suffisante\",\n    \"suffit\",\n    \"suis\",\n    \"suit\",\n    \"suivant\",\n    \"suivante\",\n    \"suivantes\",\n    \"suivants\",\n    \"suivre\",\n    \"sujet\",\n    \"superpose\",\n    \"sur\",\n    \"surtout\",\n    \"t\",\n    \"ta\",\n    \"tac\",\n    \"tandis\",\n    \"tant\",\n    \"tardive\",\n    \"te\",\n    \"tel\",\n    \"telle\",\n    \"tellement\",\n    \"telles\",\n    \"tels\",\n    \"tenant\",\n    \"tend\",\n    \"tenir\",\n    \"tente\",\n    \"tes\",\n    \"tic\",\n    \"tien\",\n    \"tienne\",\n    \"tiennes\",\n    \"tiens\",\n    \"toc\",\n    \"toi\",\n    \"toi-même\",\n    \"ton\",\n    \"touchant\",\n    \"toujours\",\n    \"tous\",\n    \"tout\",\n    \"toute\",\n    \"toutefois\",\n    \"toutes\",\n    \"treize\",\n    \"trente\",\n    \"tres\",\n    \"trois\",\n    \"troisième\",\n    \"troisièmement\",\n    \"trop\",\n    \"très\",\n    \"tsoin\",\n    \"tsouin\",\n    \"tu\",\n    \"té\",\n    \"u\",\n    \"un\",\n    \"une\",\n    \"unes\",\n    \"uniformement\",\n    \"unique\",\n    \"uniques\",\n    \"uns\",\n    \"v\",\n    \"va\",\n    \"vais\",\n    \"valeur\",\n    \"vas\",\n    \"vers\",\n    \"via\",\n    \"vif\",\n    \"vifs\",\n    \"vingt\",\n    \"vivat\",\n    \"vive\",\n    \"vives\",\n    \"vlan\",\n    \"voici\",\n    \"voie\",\n    \"voient\",\n    \"voilà\",\n    \"vont\",\n    \"vos\",\n    \"votre\",\n    \"vous\",\n    \"vous-mêmes\",\n    \"vu\",\n    \"vé\",\n    \"vôtre\",\n    \"vôtres\",\n    \"w\",\n    \"x\",\n    \"y\",\n    \"z\",\n    \"zut\",\n    \"à\",\n    \"â\",\n    \"ça\",\n    \"ès\",\n    \"étaient\",\n    \"étais\",\n    \"était\",\n    \"étant\",\n    \"état\",\n    \"étiez\",\n    \"étions\",\n    \"été\",\n    \"étée\",\n    \"étées\",\n    \"étés\",\n    \"êtes\",\n    \"être\",\n    \"ô\",\n];\n"
  },
  {
    "path": "src/stopwords/guj.rs",
    "content": "// Sonic\n//\n// Fast, lightweight and schema-less search backend\n// Copyright: 2019, Valerian Saliou <valerian@valeriansaliou.name>\n// License: Mozilla Public License v2.0 (MPL v2.0)\n\npub static STOPWORDS_GUJ: &[&str] = &[\n    \"અંગે\",\n    \"અંદર\",\n    \"અથવા\",\n    \"અને\",\n    \"અમને\",\n    \"અમારું\",\n    \"અમે\",\n    \"અહીં\",\n    \"આ\",\n    \"આગળ\",\n    \"આથી\",\n    \"આનું\",\n    \"આને\",\n    \"આપણને\",\n    \"આપણું\",\n    \"આપણે\",\n    \"આપી\",\n    \"આર\",\n    \"આવી\",\n    \"આવે\",\n    \"ઉપર\",\n    \"ઉભા\",\n    \"ઊંચે\",\n    \"ઊભું\",\n    \"એ\",\n    \"એક\",\n    \"એન\",\n    \"એના\",\n    \"એનાં\",\n    \"એની\",\n    \"એનું\",\n    \"એને\",\n    \"એનો\",\n    \"એમ\",\n    \"એવા\",\n    \"એવાં\",\n    \"એવી\",\n    \"એવું\",\n    \"એવો\",\n    \"ઓછું\",\n    \"કંઈક\",\n    \"કઈ\",\n    \"કયું\",\n    \"કયો\",\n    \"કરતાં\",\n    \"કરવું\",\n    \"કરી\",\n    \"કરીએ\",\n    \"કરું\",\n    \"કરે\",\n    \"કરેલું\",\n    \"કર્યા\",\n    \"કર્યાં\",\n    \"કર્યું\",\n    \"કર્યો\",\n    \"કાંઈ\",\n    \"કે\",\n    \"કેટલું\",\n    \"કેમ\",\n    \"કેવી\",\n    \"કેવું\",\n    \"કોઈ\",\n    \"કોઈક\",\n    \"કોણ\",\n    \"કોણે\",\n    \"કોને\",\n    \"ક્યાં\",\n    \"ક્યારે\",\n    \"ખૂબ\",\n    \"ગઈ\",\n    \"ગયા\",\n    \"ગયાં\",\n    \"ગયું\",\n    \"ગયો\",\n    \"ઘણું\",\n    \"છ\",\n    \"છતાં\",\n    \"છીએ\",\n    \"છું\",\n    \"છે\",\n    \"છેક\",\n    \"છો\",\n    \"જ\",\n    \"જાય\",\n    \"જી\",\n    \"જે\",\n    \"જેટલું\",\n    \"જેને\",\n    \"જેમ\",\n    \"જેવી\",\n    \"જેવું\",\n    \"જેવો\",\n    \"જો\",\n    \"જોઈએ\",\n    \"જ્યાં\",\n    \"જ્યારે\",\n    \"ઝાઝું\",\n    \"તને\",\n    \"તમને\",\n    \"તમારું\",\n    \"તમે\",\n    \"તા\",\n    \"તારાથી\",\n    \"તારામાં\",\n    \"તારું\",\n    \"તું\",\n    \"તે\",\n    \"તેં\",\n    \"તેઓ\",\n    \"તેણે\",\n    \"તેથી\",\n    \"તેના\",\n    \"તેની\",\n    \"તેનું\",\n    \"તેને\",\n    \"તેમ\",\n    \"તેમનું\",\n    \"તેમને\",\n    \"તેવી\",\n    \"તેવું\",\n    \"તો\",\n    \"ત્યાં\",\n    \"ત્યારે\",\n    \"થઇ\",\n    \"થઈ\",\n    \"થઈએ\",\n    \"થતા\",\n    \"થતાં\",\n    \"થતી\",\n    \"થતું\",\n    \"થતો\",\n    \"થયા\",\n    \"થયાં\",\n    \"થયું\",\n    \"થયેલું\",\n    \"થયો\",\n    \"થવું\",\n    \"થાઉં\",\n    \"થાઓ\",\n    \"થાય\",\n    \"થી\",\n    \"થોડું\",\n    \"દરેક\",\n    \"ન\",\n    \"નં\",\n    \"નં.\",\n    \"નથી\",\n    \"નહિ\",\n    \"નહી\",\n    \"નહીં\",\n    \"ના\",\n    \"ની\",\n    \"નીચે\",\n    \"નું\",\n    \"ને\",\n    \"નો\",\n    \"પછી\",\n    \"પણ\",\n    \"પર\",\n    \"પરંતુ\",\n    \"પહેલાં\",\n    \"પાછળ\",\n    \"પાસે\",\n    \"પોતાનું\",\n    \"પ્રત્યેક\",\n    \"ફક્ત\",\n    \"ફરી\",\n    \"ફરીથી\",\n    \"બંને\",\n    \"બધા\",\n    \"બધું\",\n    \"બની\",\n    \"બહાર\",\n    \"બહુ\",\n    \"બાદ\",\n    \"બે\",\n    \"મને\",\n    \"મા\",\n    \"માં\",\n    \"માટે\",\n    \"માત્ર\",\n    \"મારું\",\n    \"મી\",\n    \"મૂકવું\",\n    \"મૂકી\",\n    \"મૂક્યા\",\n    \"મૂક્યાં\",\n    \"મૂક્યું\",\n    \"મેં\",\n    \"રહી\",\n    \"રહે\",\n    \"રહેવું\",\n    \"રહ્યા\",\n    \"રહ્યાં\",\n    \"રહ્યો\",\n    \"રીતે\",\n    \"રૂ.\",\n    \"રૂા\",\n    \"લેતા\",\n    \"લેતું\",\n    \"લેવા\",\n    \"વગેરે\",\n    \"વધુ\",\n    \"શકે\",\n    \"શા\",\n    \"શું\",\n    \"સરખું\",\n    \"સામે\",\n    \"સુધી\",\n    \"હતા\",\n    \"હતાં\",\n    \"હતી\",\n    \"હતું\",\n    \"હવે\",\n    \"હશે\",\n    \"હશો\",\n    \"હા\",\n    \"હું\",\n    \"હો\",\n    \"હોઈ\",\n    \"હોઈશ\",\n    \"હોઈશું\",\n    \"હોય\",\n    \"હોવા\",\n];\n"
  },
  {
    "path": "src/stopwords/heb.rs",
    "content": "// Sonic\n//\n// Fast, lightweight and schema-less search backend\n// Copyright: 2019, Valerian Saliou <valerian@valeriansaliou.name>\n// License: Mozilla Public License v2.0 (MPL v2.0)\n\npub static STOPWORDS_HEB: &[&str] = &[\n    \"אבל\",\n    \"או\",\n    \"אולי\",\n    \"אותה\",\n    \"אותו\",\n    \"אותי\",\n    \"אותך\",\n    \"אותם\",\n    \"אותן\",\n    \"אותנו\",\n    \"אז\",\n    \"אחר\",\n    \"אחרות\",\n    \"אחרי\",\n    \"אחריכן\",\n    \"אחרים\",\n    \"אחרת\",\n    \"אי\",\n    \"איזה\",\n    \"איך\",\n    \"אין\",\n    \"איפה\",\n    \"איתה\",\n    \"איתו\",\n    \"איתי\",\n    \"איתך\",\n    \"איתכם\",\n    \"איתכן\",\n    \"איתם\",\n    \"איתן\",\n    \"איתנו\",\n    \"אך\",\n    \"אל\",\n    \"אלה\",\n    \"אלו\",\n    \"אם\",\n    \"אנחנו\",\n    \"אני\",\n    \"אס\",\n    \"אף\",\n    \"אצל\",\n    \"אשר\",\n    \"את\",\n    \"אתה\",\n    \"אתכם\",\n    \"אתכן\",\n    \"אתם\",\n    \"אתן\",\n    \"באיזומידה\",\n    \"באמצע\",\n    \"באמצעות\",\n    \"בגלל\",\n    \"בין\",\n    \"בלי\",\n    \"במידה\",\n    \"במקוםשבו\",\n    \"ברם\",\n    \"בשביל\",\n    \"בשעהש\",\n    \"בתוך\",\n    \"גם\",\n    \"דרך\",\n    \"הוא\",\n    \"היא\",\n    \"היה\",\n    \"היכן\",\n    \"היתה\",\n    \"היתי\",\n    \"הם\",\n    \"הן\",\n    \"הנה\",\n    \"הסיבהשבגללה\",\n    \"הרי\",\n    \"ואילו\",\n    \"ואת\",\n    \"זאת\",\n    \"זה\",\n    \"זות\",\n    \"יהיה\",\n    \"יוכל\",\n    \"יוכלו\",\n    \"יותרמדי\",\n    \"יכול\",\n    \"יכולה\",\n    \"יכולות\",\n    \"יכולים\",\n    \"יכל\",\n    \"יכלה\",\n    \"יכלו\",\n    \"יש\",\n    \"כאן\",\n    \"כאשר\",\n    \"כולם\",\n    \"כולן\",\n    \"כזה\",\n    \"כי\",\n    \"כיצד\",\n    \"כך\",\n    \"ככה\",\n    \"כל\",\n    \"כלל\",\n    \"כמו\",\n    \"כן\",\n    \"כפי\",\n    \"כש\",\n    \"לא\",\n    \"לאו\",\n    \"לאיזותכלית\",\n    \"לאן\",\n    \"לבין\",\n    \"לה\",\n    \"להיות\",\n    \"להם\",\n    \"להן\",\n    \"לו\",\n    \"לי\",\n    \"לכם\",\n    \"לכן\",\n    \"למה\",\n    \"למטה\",\n    \"למעלה\",\n    \"למקוםשבו\",\n    \"למרות\",\n    \"לנו\",\n    \"לעבר\",\n    \"לעיכן\",\n    \"לפיכך\",\n    \"לפני\",\n    \"מאד\",\n    \"מאחורי\",\n    \"מאיזוסיבה\",\n    \"מאין\",\n    \"מאיפה\",\n    \"מבלי\",\n    \"מבעד\",\n    \"מדוע\",\n    \"מה\",\n    \"מהיכן\",\n    \"מול\",\n    \"מחוץ\",\n    \"מי\",\n    \"מכאן\",\n    \"מכיוון\",\n    \"מלבד\",\n    \"מן\",\n    \"מנין\",\n    \"מסוגל\",\n    \"מעט\",\n    \"מעטים\",\n    \"מעל\",\n    \"מצד\",\n    \"מקוםבו\",\n    \"מתחת\",\n    \"מתי\",\n    \"נגד\",\n    \"נגר\",\n    \"נו\",\n    \"עד\",\n    \"עז\",\n    \"על\",\n    \"עלי\",\n    \"עליה\",\n    \"עליהם\",\n    \"עליהן\",\n    \"עליו\",\n    \"עליך\",\n    \"עליכם\",\n    \"עלינו\",\n    \"עם\",\n    \"עצמה\",\n    \"עצמהם\",\n    \"עצמהן\",\n    \"עצמו\",\n    \"עצמי\",\n    \"עצמם\",\n    \"עצמן\",\n    \"עצמנו\",\n    \"פה\",\n    \"רק\",\n    \"שוב\",\n    \"של\",\n    \"שלה\",\n    \"שלהם\",\n    \"שלהן\",\n    \"שלו\",\n    \"שלי\",\n    \"שלך\",\n    \"שלכה\",\n    \"שלכם\",\n    \"שלכן\",\n    \"שלנו\",\n    \"שם\",\n    \"תהיה\",\n    \"תחת\",\n];\n"
  },
  {
    "path": "src/stopwords/hin.rs",
    "content": "// Sonic\n//\n// Fast, lightweight and schema-less search backend\n// Copyright: 2019, Valerian Saliou <valerian@valeriansaliou.name>\n// License: Mozilla Public License v2.0 (MPL v2.0)\n\npub static STOPWORDS_HIN: &[&str] = &[\n    \"अंदर\",\n    \"अत\",\n    \"अदि\",\n    \"अप\",\n    \"अपना\",\n    \"अपनि\",\n    \"अपनी\",\n    \"अपने\",\n    \"अभि\",\n    \"अभी\",\n    \"आदि\",\n    \"आप\",\n    \"इंहिं\",\n    \"इंहें\",\n    \"इंहों\",\n    \"इतयादि\",\n    \"इत्यादि\",\n    \"इन\",\n    \"इनका\",\n    \"इन्हीं\",\n    \"इन्हें\",\n    \"इन्हों\",\n    \"इस\",\n    \"इसका\",\n    \"इसकि\",\n    \"इसकी\",\n    \"इसके\",\n    \"इसमें\",\n    \"इसि\",\n    \"इसी\",\n    \"इसे\",\n    \"उंहिं\",\n    \"उंहें\",\n    \"उंहों\",\n    \"उन\",\n    \"उनका\",\n    \"उनकि\",\n    \"उनकी\",\n    \"उनके\",\n    \"उनको\",\n    \"उन्हीं\",\n    \"उन्हें\",\n    \"उन्हों\",\n    \"उस\",\n    \"उसके\",\n    \"उसि\",\n    \"उसी\",\n    \"उसे\",\n    \"एक\",\n    \"एवं\",\n    \"एस\",\n    \"एसे\",\n    \"ऐसे\",\n    \"ओर\",\n    \"और\",\n    \"कइ\",\n    \"कई\",\n    \"कर\",\n    \"करता\",\n    \"करते\",\n    \"करना\",\n    \"करने\",\n    \"करें\",\n    \"कहते\",\n    \"कहा\",\n    \"का\",\n    \"काफि\",\n    \"काफ़ी\",\n    \"कि\",\n    \"किंहें\",\n    \"किंहों\",\n    \"कितना\",\n    \"किन्हें\",\n    \"किन्हों\",\n    \"किया\",\n    \"किर\",\n    \"किस\",\n    \"किसि\",\n    \"किसी\",\n    \"किसे\",\n    \"की\",\n    \"कुछ\",\n    \"कुल\",\n    \"के\",\n    \"को\",\n    \"कोइ\",\n    \"कोई\",\n    \"कोन\",\n    \"कोनसा\",\n    \"कौन\",\n    \"कौनसा\",\n    \"गया\",\n    \"घर\",\n    \"जब\",\n    \"जहाँ\",\n    \"जहां\",\n    \"जा\",\n    \"जिंहें\",\n    \"जिंहों\",\n    \"जितना\",\n    \"जिधर\",\n    \"जिन\",\n    \"जिन्हें\",\n    \"जिन्हों\",\n    \"जिस\",\n    \"जिसे\",\n    \"जीधर\",\n    \"जेसा\",\n    \"जेसे\",\n    \"जैसा\",\n    \"जैसे\",\n    \"जो\",\n    \"तक\",\n    \"तब\",\n    \"तरह\",\n    \"तिंहें\",\n    \"तिंहों\",\n    \"तिन\",\n    \"तिन्हें\",\n    \"तिन्हों\",\n    \"तिस\",\n    \"तिसे\",\n    \"तो\",\n    \"था\",\n    \"थि\",\n    \"थी\",\n    \"थे\",\n    \"दबारा\",\n    \"दवारा\",\n    \"दिया\",\n    \"दुसरा\",\n    \"दुसरे\",\n    \"दूसरे\",\n    \"दो\",\n    \"द्वारा\",\n    \"न\",\n    \"नहिं\",\n    \"नहीं\",\n    \"ना\",\n    \"निचे\",\n    \"निहायत\",\n    \"नीचे\",\n    \"ने\",\n    \"पर\",\n    \"पहले\",\n    \"पुरा\",\n    \"पूरा\",\n    \"पे\",\n    \"फिर\",\n    \"बनि\",\n    \"बनी\",\n    \"बहि\",\n    \"बही\",\n    \"बहुत\",\n    \"बाद\",\n    \"बाला\",\n    \"बिलकुल\",\n    \"भि\",\n    \"भितर\",\n    \"भी\",\n    \"भीतर\",\n    \"मगर\",\n    \"मानो\",\n    \"मे\",\n    \"में\",\n    \"यदि\",\n    \"यह\",\n    \"यहाँ\",\n    \"यहां\",\n    \"यहि\",\n    \"यही\",\n    \"या\",\n    \"यिह\",\n    \"ये\",\n    \"रखें\",\n    \"रवासा\",\n    \"रहा\",\n    \"रहे\",\n    \"ऱ्वासा\",\n    \"लिए\",\n    \"लिये\",\n    \"लेकिन\",\n    \"व\",\n    \"वगेरह\",\n    \"वरग\",\n    \"वर्ग\",\n    \"वह\",\n    \"वहाँ\",\n    \"वहां\",\n    \"वहिं\",\n    \"वहीं\",\n    \"वाले\",\n    \"वुह\",\n    \"वे\",\n    \"वग़ैरह\",\n    \"संग\",\n    \"सकता\",\n    \"सकते\",\n    \"सबसे\",\n    \"सभि\",\n    \"सभी\",\n    \"साथ\",\n    \"साबुत\",\n    \"साभ\",\n    \"सारा\",\n    \"से\",\n    \"सो\",\n    \"हि\",\n    \"ही\",\n    \"हुअ\",\n    \"हुआ\",\n    \"हुइ\",\n    \"हुई\",\n    \"हुए\",\n    \"हे\",\n    \"हें\",\n    \"है\",\n    \"हैं\",\n    \"हो\",\n    \"होता\",\n    \"होति\",\n    \"होती\",\n    \"होते\",\n    \"होना\",\n    \"होने\",\n];\n"
  },
  {
    "path": "src/stopwords/hrv.rs",
    "content": "// Sonic\n//\n// Fast, lightweight and schema-less search backend\n// Copyright: 2019, Valerian Saliou <valerian@valeriansaliou.name>\n// License: Mozilla Public License v2.0 (MPL v2.0)\n\npub static STOPWORDS_HRV: &[&str] = &[\n    \"a\", \"ako\", \"ali\", \"bi\", \"bih\", \"bila\", \"bili\", \"bilo\", \"bio\", \"bismo\", \"biste\", \"biti\",\n    \"bumo\", \"da\", \"do\", \"duž\", \"ga\", \"hoće\", \"hoćemo\", \"hoćete\", \"hoćeš\", \"hoću\", \"i\", \"iako\",\n    \"ih\", \"ili\", \"iz\", \"ja\", \"je\", \"jedna\", \"jedne\", \"jedno\", \"jer\", \"jesam\", \"jesi\", \"jesmo\",\n    \"jest\", \"jeste\", \"jesu\", \"jim\", \"joj\", \"još\", \"ju\", \"kada\", \"kako\", \"kao\", \"koja\", \"koje\",\n    \"koji\", \"kojima\", \"koju\", \"kroz\", \"li\", \"me\", \"mene\", \"meni\", \"mi\", \"mimo\", \"moj\", \"moja\",\n    \"moje\", \"mu\", \"na\", \"nad\", \"nakon\", \"nam\", \"nama\", \"nas\", \"naš\", \"naša\", \"naše\", \"našeg\", \"ne\",\n    \"nego\", \"neka\", \"neki\", \"nekog\", \"neku\", \"nema\", \"netko\", \"neće\", \"nećemo\", \"nećete\", \"nećeš\",\n    \"neću\", \"nešto\", \"ni\", \"nije\", \"nikoga\", \"nikoje\", \"nikoju\", \"nisam\", \"nisi\", \"nismo\", \"niste\",\n    \"nisu\", \"njega\", \"njegov\", \"njegova\", \"njegovo\", \"njemu\", \"njezin\", \"njezina\", \"njezino\",\n    \"njih\", \"njihov\", \"njihova\", \"njihovo\", \"njim\", \"njima\", \"njoj\", \"nju\", \"no\", \"o\", \"od\",\n    \"odmah\", \"on\", \"ona\", \"oni\", \"ono\", \"ova\", \"pa\", \"pak\", \"po\", \"pod\", \"pored\", \"prije\", \"s\",\n    \"sa\", \"sam\", \"samo\", \"se\", \"sebe\", \"sebi\", \"si\", \"smo\", \"ste\", \"su\", \"sve\", \"svi\", \"svog\",\n    \"svoj\", \"svoja\", \"svoje\", \"svom\", \"ta\", \"tada\", \"taj\", \"tako\", \"te\", \"tebe\", \"tebi\", \"ti\",\n    \"to\", \"toj\", \"tome\", \"tu\", \"tvoj\", \"tvoja\", \"tvoje\", \"u\", \"uz\", \"vam\", \"vama\", \"vas\", \"vaš\",\n    \"vaša\", \"vaše\", \"već\", \"vi\", \"vrlo\", \"za\", \"zar\", \"će\", \"ćemo\", \"ćete\", \"ćeš\", \"ću\", \"što\",\n];\n"
  },
  {
    "path": "src/stopwords/hun.rs",
    "content": "// Sonic\n//\n// Fast, lightweight and schema-less search backend\n// Copyright: 2019, Valerian Saliou <valerian@valeriansaliou.name>\n// License: Mozilla Public License v2.0 (MPL v2.0)\n\npub static STOPWORDS_HUN: &[&str] = &[\n    \"a\",\n    \"abba\",\n    \"abban\",\n    \"abbã³l\",\n    \"abból\",\n    \"addig\",\n    \"ahhoz\",\n    \"ahogy\",\n    \"ahol\",\n    \"aki\",\n    \"akik\",\n    \"akkor\",\n    \"akár\",\n    \"akã¡r\",\n    \"alapján\",\n    \"alapjã¡n\",\n    \"alatt\",\n    \"alatta\",\n    \"alattad\",\n    \"alattam\",\n    \"alattatok\",\n    \"alattuk\",\n    \"alattunk\",\n    \"alá\",\n    \"alád\",\n    \"alájuk\",\n    \"alám\",\n    \"alánk\",\n    \"alátok\",\n    \"alã¡\",\n    \"alã¡d\",\n    \"alã¡juk\",\n    \"alã¡m\",\n    \"alã¡nk\",\n    \"alã¡tok\",\n    \"alã³l\",\n    \"alã³la\",\n    \"alã³lad\",\n    \"alã³lam\",\n    \"alã³latok\",\n    \"alã³luk\",\n    \"alã³lunk\",\n    \"alól\",\n    \"alóla\",\n    \"alólad\",\n    \"alólam\",\n    \"alólatok\",\n    \"alóluk\",\n    \"alólunk\",\n    \"amely\",\n    \"amelybol\",\n    \"amelyek\",\n    \"amelyekben\",\n    \"amelyeket\",\n    \"amelyet\",\n    \"amelyik\",\n    \"amelynek\",\n    \"ami\",\n    \"amikor\",\n    \"amit\",\n    \"amolyan\",\n    \"amott\",\n    \"amã\\u{AD}g\",\n    \"amíg\",\n    \"annak\",\n    \"annál\",\n    \"annã¡l\",\n    \"arra\",\n    \"arrã³l\",\n    \"arról\",\n    \"attã³l\",\n    \"attól\",\n    \"az\",\n    \"aznap\",\n    \"azok\",\n    \"azokat\",\n    \"azokba\",\n    \"azokban\",\n    \"azokbã³l\",\n    \"azokból\",\n    \"azokhoz\",\n    \"azokig\",\n    \"azokkal\",\n    \"azokká\",\n    \"azokkã¡\",\n    \"azoknak\",\n    \"azoknál\",\n    \"azoknã¡l\",\n    \"azokon\",\n    \"azokra\",\n    \"azokrã³l\",\n    \"azokról\",\n    \"azoktã³l\",\n    \"azoktól\",\n    \"azokã©rt\",\n    \"azokért\",\n    \"azon\",\n    \"azonban\",\n    \"azonnal\",\n    \"azt\",\n    \"aztán\",\n    \"aztã¡n\",\n    \"azután\",\n    \"azzal\",\n    \"azzá\",\n    \"azzã¡\",\n    \"azã©rt\",\n    \"azért\",\n    \"bal\",\n    \"balra\",\n    \"ban\",\n    \"be\",\n    \"belã©\",\n    \"belã©d\",\n    \"belã©jã¼k\",\n    \"belã©m\",\n    \"belã©nk\",\n    \"belã©tek\",\n    \"belã¼l\",\n    \"belå‘le\",\n    \"belå‘led\",\n    \"belå‘lem\",\n    \"belå‘letek\",\n    \"belå‘lã¼k\",\n    \"belå‘lã¼nk\",\n    \"belé\",\n    \"beléd\",\n    \"beléjük\",\n    \"belém\",\n    \"belénk\",\n    \"belétek\",\n    \"belül\",\n    \"belőle\",\n    \"belőled\",\n    \"belőlem\",\n    \"belőletek\",\n    \"belőlük\",\n    \"belőlünk\",\n    \"ben\",\n    \"benne\",\n    \"benned\",\n    \"bennem\",\n    \"bennetek\",\n    \"bennã¼k\",\n    \"bennã¼nk\",\n    \"bennük\",\n    \"bennünk\",\n    \"bár\",\n    \"bárcsak\",\n    \"bármilyen\",\n    \"bã¡r\",\n    \"bã¡rcsak\",\n    \"bã¡rmilyen\",\n    \"bãºcsãº\",\n    \"búcsú\",\n    \"cikk\",\n    \"cikkek\",\n    \"cikkeket\",\n    \"csak\",\n    \"csakhogy\",\n    \"csupán\",\n    \"csupã¡n\",\n    \"de\",\n    \"dehogy\",\n    \"e\",\n    \"ebbe\",\n    \"ebben\",\n    \"ebbå‘l\",\n    \"ebből\",\n    \"eddig\",\n    \"egy\",\n    \"egyebek\",\n    \"egyebet\",\n    \"egyedã¼l\",\n    \"egyedül\",\n    \"egyelå‘re\",\n    \"egyelőre\",\n    \"egyes\",\n    \"egyet\",\n    \"egyetlen\",\n    \"egyik\",\n    \"egymás\",\n    \"egymã¡s\",\n    \"egyre\",\n    \"egyszerre\",\n    \"egyã©b\",\n    \"egyã¼tt\",\n    \"egyéb\",\n    \"együtt\",\n    \"egã©sz\",\n    \"egã©szen\",\n    \"egész\",\n    \"egészen\",\n    \"ehhez\",\n    \"ekkor\",\n    \"el\",\n    \"eleinte\",\n    \"ellen\",\n    \"ellenes\",\n    \"elleni\",\n    \"ellenã©re\",\n    \"ellenére\",\n    \"elmondta\",\n    \"elså‘\",\n    \"elså‘k\",\n    \"elså‘sorban\",\n    \"elså‘t\",\n    \"elsõ\",\n    \"első\",\n    \"elsők\",\n    \"elsősorban\",\n    \"elsőt\",\n    \"elã©\",\n    \"elã©d\",\n    \"elã©g\",\n    \"elã©jã¼k\",\n    \"elã©m\",\n    \"elã©nk\",\n    \"elã©tek\",\n    \"elå‘bb\",\n    \"elå‘l\",\n    \"elå‘le\",\n    \"elå‘led\",\n    \"elå‘lem\",\n    \"elå‘letek\",\n    \"elå‘lã¼k\",\n    \"elå‘lã¼nk\",\n    \"elå‘szã¶r\",\n    \"elå‘tt\",\n    \"elå‘tte\",\n    \"elå‘tted\",\n    \"elå‘ttem\",\n    \"elå‘ttetek\",\n    \"elå‘ttã¼k\",\n    \"elå‘ttã¼nk\",\n    \"elå‘zå‘\",\n    \"elé\",\n    \"eléd\",\n    \"elég\",\n    \"eléjük\",\n    \"elém\",\n    \"elénk\",\n    \"elétek\",\n    \"elõ\",\n    \"elõször\",\n    \"elõtt\",\n    \"elő\",\n    \"előbb\",\n    \"elől\",\n    \"előle\",\n    \"előled\",\n    \"előlem\",\n    \"előletek\",\n    \"előlük\",\n    \"előlünk\",\n    \"először\",\n    \"előtt\",\n    \"előtte\",\n    \"előtted\",\n    \"előttem\",\n    \"előttetek\",\n    \"előttük\",\n    \"előttünk\",\n    \"előző\",\n    \"emilyen\",\n    \"engem\",\n    \"ennek\",\n    \"ennyi\",\n    \"ennã©l\",\n    \"ennél\",\n    \"enyã©m\",\n    \"enyém\",\n    \"erre\",\n    \"errå‘l\",\n    \"erről\",\n    \"esetben\",\n    \"ettå‘l\",\n    \"ettől\",\n    \"ez\",\n    \"ezek\",\n    \"ezekbe\",\n    \"ezekben\",\n    \"ezekbå‘l\",\n    \"ezekből\",\n    \"ezeken\",\n    \"ezeket\",\n    \"ezekhez\",\n    \"ezekig\",\n    \"ezekkel\",\n    \"ezekkã©\",\n    \"ezekké\",\n    \"ezeknek\",\n    \"ezeknã©l\",\n    \"ezeknél\",\n    \"ezekre\",\n    \"ezekrå‘l\",\n    \"ezekről\",\n    \"ezektå‘l\",\n    \"ezektől\",\n    \"ezekã©rt\",\n    \"ezekért\",\n    \"ezen\",\n    \"ezentãºl\",\n    \"ezentúl\",\n    \"ezer\",\n    \"ezret\",\n    \"ezt\",\n    \"ezután\",\n    \"ezutã¡n\",\n    \"ezzel\",\n    \"ezzã©\",\n    \"ezzé\",\n    \"ezã©rt\",\n    \"ezért\",\n    \"fel\",\n    \"fele\",\n    \"felek\",\n    \"felet\",\n    \"felett\",\n    \"felã©\",\n    \"felé\",\n    \"fent\",\n    \"fenti\",\n    \"fã©l\",\n    \"fã¶lã©\",\n    \"fél\",\n    \"fölé\",\n    \"gyakran\",\n    \"ha\",\n    \"hallã³\",\n    \"halló\",\n    \"hamar\",\n    \"hanem\",\n    \"harmadik\",\n    \"harmadikat\",\n    \"harminc\",\n    \"hat\",\n    \"hatodik\",\n    \"hatodikat\",\n    \"hatot\",\n    \"hatvan\",\n    \"helyett\",\n    \"hetedik\",\n    \"hetediket\",\n    \"hetet\",\n    \"hetven\",\n    \"hirtelen\",\n    \"hiszen\",\n    \"hiába\",\n    \"hiã¡ba\",\n    \"hogy\",\n    \"hogyan\",\n    \"hol\",\n    \"holnap\",\n    \"holnapot\",\n    \"honnan\",\n    \"hova\",\n    \"hozzá\",\n    \"hozzád\",\n    \"hozzájuk\",\n    \"hozzám\",\n    \"hozzánk\",\n    \"hozzátok\",\n    \"hozzã¡\",\n    \"hozzã¡d\",\n    \"hozzã¡juk\",\n    \"hozzã¡m\",\n    \"hozzã¡nk\",\n    \"hozzã¡tok\",\n    \"hurrá\",\n    \"hurrã¡\",\n    \"huszadik\",\n    \"hány\",\n    \"hányszor\",\n    \"hármat\",\n    \"három\",\n    \"hát\",\n    \"hátha\",\n    \"hátulsó\",\n    \"hã¡ny\",\n    \"hã¡nyszor\",\n    \"hã¡rmat\",\n    \"hã¡rom\",\n    \"hã¡t\",\n    \"hã¡tha\",\n    \"hã¡tulsã³\",\n    \"hã©t\",\n    \"hãºsz\",\n    \"hét\",\n    \"húsz\",\n    \"ide\",\n    \"ide-ð¾da\",\n    \"ide-оda\",\n    \"idã©n\",\n    \"idén\",\n    \"igazán\",\n    \"igazã¡n\",\n    \"igen\",\n    \"ill\",\n    \"ill.\",\n    \"illetve\",\n    \"ilyen\",\n    \"ilyenkor\",\n    \"immár\",\n    \"immã¡r\",\n    \"inkább\",\n    \"inkã¡bb\",\n    \"is\",\n    \"ismã©t\",\n    \"ismét\",\n    \"ison\",\n    \"itt\",\n    \"jelenleg\",\n    \"jobban\",\n    \"jobbra\",\n    \"jã³\",\n    \"jã³l\",\n    \"jã³lesik\",\n    \"jã³val\",\n    \"jã¶vå‘re\",\n    \"jó\",\n    \"jól\",\n    \"jólesik\",\n    \"jóval\",\n    \"jövőre\",\n    \"kell\",\n    \"kellene\",\n    \"kellett\",\n    \"kelljen\",\n    \"keressünk\",\n    \"keresztül\",\n    \"ketten\",\n    \"kettå‘\",\n    \"kettå‘t\",\n    \"kettő\",\n    \"kettőt\",\n    \"kevã©s\",\n    \"kevés\",\n    \"ki\",\n    \"kiben\",\n    \"kibå‘l\",\n    \"kiből\",\n    \"kicsit\",\n    \"kicsoda\",\n    \"kihez\",\n    \"kik\",\n    \"kikbe\",\n    \"kikben\",\n    \"kikbå‘l\",\n    \"kikből\",\n    \"kiken\",\n    \"kiket\",\n    \"kikhez\",\n    \"kikkel\",\n    \"kikkã©\",\n    \"kikké\",\n    \"kiknek\",\n    \"kiknã©l\",\n    \"kiknél\",\n    \"kikre\",\n    \"kikrå‘l\",\n    \"kikről\",\n    \"kiktå‘l\",\n    \"kiktől\",\n    \"kikã©rt\",\n    \"kikért\",\n    \"kilenc\",\n    \"kilencedik\",\n    \"kilencediket\",\n    \"kilencet\",\n    \"kilencven\",\n    \"kin\",\n    \"kinek\",\n    \"kinã©l\",\n    \"kinél\",\n    \"kire\",\n    \"kirå‘l\",\n    \"kiről\",\n    \"kit\",\n    \"kitå‘l\",\n    \"kitől\",\n    \"kivel\",\n    \"kivã©\",\n    \"kivé\",\n    \"kiã©\",\n    \"kiã©rt\",\n    \"kié\",\n    \"kiért\",\n    \"korábban\",\n    \"korã¡bban\",\n    \"kã©pest\",\n    \"kã©rem\",\n    \"kã©rlek\",\n    \"kã©sz\",\n    \"kã©så‘\",\n    \"kã©så‘bb\",\n    \"kã©så‘n\",\n    \"kã©t\",\n    \"kã©tszer\",\n    \"kã¶rã¼l\",\n    \"kã¶szã¶nhetå‘en\",\n    \"kã¶szã¶nã¶m\",\n    \"kã¶zben\",\n    \"kã¶zel\",\n    \"kã¶zepesen\",\n    \"kã¶zepã©n\",\n    \"kã¶zã©\",\n    \"kã¶zã¶tt\",\n    \"kã¶zã¼l\",\n    \"kã¼lã¶n\",\n    \"kã¼lã¶nben\",\n    \"kã¼lã¶nbã¶zå‘\",\n    \"kã¼lã¶nbã¶zå‘bb\",\n    \"kã¼lã¶nbã¶zå‘ek\",\n    \"képest\",\n    \"kérem\",\n    \"kérlek\",\n    \"kész\",\n    \"késő\",\n    \"később\",\n    \"későn\",\n    \"két\",\n    \"kétszer\",\n    \"kívül\",\n    \"körül\",\n    \"köszönhetően\",\n    \"köszönöm\",\n    \"közben\",\n    \"közel\",\n    \"közepesen\",\n    \"közepén\",\n    \"közé\",\n    \"között\",\n    \"közül\",\n    \"külön\",\n    \"különben\",\n    \"különböző\",\n    \"különbözőbb\",\n    \"különbözőek\",\n    \"lassan\",\n    \"le\",\n    \"legalább\",\n    \"legalã¡bb\",\n    \"legyen\",\n    \"lehet\",\n    \"lehetetlen\",\n    \"lehetett\",\n    \"lehetå‘leg\",\n    \"lehetå‘sã©g\",\n    \"lehetőleg\",\n    \"lehetőség\",\n    \"lenne\",\n    \"lenni\",\n    \"lennã©k\",\n    \"lennã©nek\",\n    \"lennék\",\n    \"lennének\",\n    \"lesz\",\n    \"leszek\",\n    \"lesznek\",\n    \"leszã¼nk\",\n    \"leszünk\",\n    \"lett\",\n    \"lettek\",\n    \"lettem\",\n    \"lettã¼nk\",\n    \"lettünk\",\n    \"lã©vå‘\",\n    \"lévő\",\n    \"ma\",\n    \"maga\",\n    \"magad\",\n    \"magam\",\n    \"magatokat\",\n    \"magukat\",\n    \"magunkat\",\n    \"magát\",\n    \"magã¡t\",\n    \"mai\",\n    \"majd\",\n    \"majdnem\",\n    \"manapság\",\n    \"manapsã¡g\",\n    \"meg\",\n    \"megcsinál\",\n    \"megcsinálnak\",\n    \"megcsinã¡l\",\n    \"megcsinã¡lnak\",\n    \"megint\",\n    \"megvan\",\n    \"mellett\",\n    \"mellette\",\n    \"melletted\",\n    \"mellettem\",\n    \"mellettetek\",\n    \"mellettã¼k\",\n    \"mellettã¼nk\",\n    \"mellettük\",\n    \"mellettünk\",\n    \"mellã©\",\n    \"mellã©d\",\n    \"mellã©jã¼k\",\n    \"mellã©m\",\n    \"mellã©nk\",\n    \"mellã©tek\",\n    \"mellå‘l\",\n    \"mellå‘le\",\n    \"mellå‘led\",\n    \"mellå‘lem\",\n    \"mellå‘letek\",\n    \"mellå‘lã¼k\",\n    \"mellå‘lã¼nk\",\n    \"mellé\",\n    \"melléd\",\n    \"melléjük\",\n    \"mellém\",\n    \"mellénk\",\n    \"mellétek\",\n    \"mellől\",\n    \"mellőle\",\n    \"mellőled\",\n    \"mellőlem\",\n    \"mellőletek\",\n    \"mellőlük\",\n    \"mellőlünk\",\n    \"mely\",\n    \"melyek\",\n    \"melyik\",\n    \"mennyi\",\n    \"mert\",\n    \"mi\",\n    \"miatt\",\n    \"miatta\",\n    \"miattad\",\n    \"miattam\",\n    \"miattatok\",\n    \"miattuk\",\n    \"miattunk\",\n    \"mibe\",\n    \"miben\",\n    \"mibå‘l\",\n    \"miből\",\n    \"mihez\",\n    \"mik\",\n    \"mikbe\",\n    \"mikben\",\n    \"mikbå‘l\",\n    \"mikből\",\n    \"miken\",\n    \"miket\",\n    \"mikhez\",\n    \"mikkel\",\n    \"mikkã©\",\n    \"mikké\",\n    \"miknek\",\n    \"miknã©l\",\n    \"miknél\",\n    \"mikor\",\n    \"mikre\",\n    \"mikrå‘l\",\n    \"mikről\",\n    \"miktå‘l\",\n    \"miktől\",\n    \"mikã©rt\",\n    \"mikért\",\n    \"milyen\",\n    \"min\",\n    \"mind\",\n    \"mindegyik\",\n    \"mindegyiket\",\n    \"minden\",\n    \"mindenesetre\",\n    \"mindenki\",\n    \"mindent\",\n    \"mindenã¼tt\",\n    \"mindenütt\",\n    \"mindig\",\n    \"mindketten\",\n    \"minek\",\n    \"minket\",\n    \"mint\",\n    \"mintha\",\n    \"minã©l\",\n    \"minél\",\n    \"mire\",\n    \"mirå‘l\",\n    \"miről\",\n    \"mit\",\n    \"mitå‘l\",\n    \"mitől\",\n    \"mivel\",\n    \"mivã©\",\n    \"mivé\",\n    \"miã©rt\",\n    \"miért\",\n    \"mondta\",\n    \"most\",\n    \"mostanáig\",\n    \"mostanã¡ig\",\n    \"már\",\n    \"más\",\n    \"másik\",\n    \"másikat\",\n    \"másnap\",\n    \"második\",\n    \"másodszor\",\n    \"mások\",\n    \"másokat\",\n    \"mást\",\n    \"mã¡r\",\n    \"mã¡s\",\n    \"mã¡sik\",\n    \"mã¡sikat\",\n    \"mã¡snap\",\n    \"mã¡sodik\",\n    \"mã¡sodszor\",\n    \"mã¡sok\",\n    \"mã¡sokat\",\n    \"mã¡st\",\n    \"mã©g\",\n    \"mã©gis\",\n    \"mã\\u{AD}g\",\n    \"mã¶gã©\",\n    \"mã¶gã©d\",\n    \"mã¶gã©jã¼k\",\n    \"mã¶gã©m\",\n    \"mã¶gã©nk\",\n    \"mã¶gã©tek\",\n    \"mã¶gã¶tt\",\n    \"mã¶gã¶tte\",\n    \"mã¶gã¶tted\",\n    \"mã¶gã¶ttem\",\n    \"mã¶gã¶ttetek\",\n    \"mã¶gã¶ttã¼k\",\n    \"mã¶gã¶ttã¼nk\",\n    \"mã¶gã¼l\",\n    \"mã¶gã¼le\",\n    \"mã¶gã¼led\",\n    \"mã¶gã¼lem\",\n    \"mã¶gã¼letek\",\n    \"mã¶gã¼lã¼k\",\n    \"mã¶gã¼lã¼nk\",\n    \"mãºltkor\",\n    \"mãºlva\",\n    \"még\",\n    \"mégis\",\n    \"míg\",\n    \"mögé\",\n    \"mögéd\",\n    \"mögéjük\",\n    \"mögém\",\n    \"mögénk\",\n    \"mögétek\",\n    \"mögött\",\n    \"mögötte\",\n    \"mögötted\",\n    \"mögöttem\",\n    \"mögöttetek\",\n    \"mögöttük\",\n    \"mögöttünk\",\n    \"mögül\",\n    \"mögüle\",\n    \"mögüled\",\n    \"mögülem\",\n    \"mögületek\",\n    \"mögülük\",\n    \"mögülünk\",\n    \"múltkor\",\n    \"múlva\",\n    \"na\",\n    \"nagy\",\n    \"nagyobb\",\n    \"nagyon\",\n    \"naponta\",\n    \"napot\",\n    \"ne\",\n    \"negyedik\",\n    \"negyediket\",\n    \"negyven\",\n    \"neked\",\n    \"nekem\",\n    \"neki\",\n    \"nekik\",\n    \"nektek\",\n    \"nekã¼nk\",\n    \"nekünk\",\n    \"nem\",\n    \"nemcsak\",\n    \"nemrã©g\",\n    \"nemrég\",\n    \"nincs\",\n    \"nyolc\",\n    \"nyolcadik\",\n    \"nyolcadikat\",\n    \"nyolcat\",\n    \"nyolcvan\",\n    \"nála\",\n    \"nálad\",\n    \"nálam\",\n    \"nálatok\",\n    \"náluk\",\n    \"nálunk\",\n    \"nã¡la\",\n    \"nã¡lad\",\n    \"nã¡lam\",\n    \"nã¡latok\",\n    \"nã¡luk\",\n    \"nã¡lunk\",\n    \"nã©gy\",\n    \"nã©gyet\",\n    \"nã©ha\",\n    \"nã©hã¡ny\",\n    \"nã©lkã¼l\",\n    \"négy\",\n    \"négyet\",\n    \"néha\",\n    \"néhány\",\n    \"nélkül\",\n    \"o\",\n    \"oda\",\n    \"ok\",\n    \"olyan\",\n    \"onnan\",\n    \"ott\",\n    \"pedig\",\n    \"persze\",\n    \"pár\",\n    \"pã¡r\",\n    \"pã©ldã¡ul\",\n    \"például\",\n    \"rajta\",\n    \"rajtad\",\n    \"rajtam\",\n    \"rajtatok\",\n    \"rajtuk\",\n    \"rajtunk\",\n    \"rendben\",\n    \"rosszul\",\n    \"rá\",\n    \"rád\",\n    \"rájuk\",\n    \"rám\",\n    \"ránk\",\n    \"rátok\",\n    \"rã¡\",\n    \"rã¡d\",\n    \"rã¡juk\",\n    \"rã¡m\",\n    \"rã¡nk\",\n    \"rã¡tok\",\n    \"rã©gen\",\n    \"rã©gã³ta\",\n    \"rã©szã©re\",\n    \"rã³la\",\n    \"rã³lad\",\n    \"rã³lam\",\n    \"rã³latok\",\n    \"rã³luk\",\n    \"rã³lunk\",\n    \"rã¶gtã¶n\",\n    \"régen\",\n    \"régóta\",\n    \"részére\",\n    \"róla\",\n    \"rólad\",\n    \"rólam\",\n    \"rólatok\",\n    \"róluk\",\n    \"rólunk\",\n    \"rögtön\",\n    \"s\",\n    \"saját\",\n    \"se\",\n    \"sem\",\n    \"semmi\",\n    \"semmilyen\",\n    \"semmisã©g\",\n    \"semmiség\",\n    \"senki\",\n    \"soha\",\n    \"sok\",\n    \"sokan\",\n    \"sokat\",\n    \"sokkal\",\n    \"sokszor\",\n    \"sokáig\",\n    \"sokã¡ig\",\n    \"során\",\n    \"sorã¡n\",\n    \"stb.\",\n    \"szemben\",\n    \"szerbusz\",\n    \"szerint\",\n    \"szerinte\",\n    \"szerinted\",\n    \"szerintem\",\n    \"szerintetek\",\n    \"szerintã¼k\",\n    \"szerintã¼nk\",\n    \"szerintük\",\n    \"szerintünk\",\n    \"szervusz\",\n    \"szinte\",\n    \"számára\",\n    \"száz\",\n    \"századik\",\n    \"százat\",\n    \"szã¡mã¡ra\",\n    \"szã¡z\",\n    \"szã¡zadik\",\n    \"szã¡zat\",\n    \"szã©pen\",\n    \"szã\\u{AD}ves\",\n    \"szã\\u{AD}vesen\",\n    \"szã\\u{AD}veskedjã©k\",\n    \"szépen\",\n    \"szét\",\n    \"szíves\",\n    \"szívesen\",\n    \"szíveskedjék\",\n    \"så‘t\",\n    \"sőt\",\n    \"talán\",\n    \"talã¡n\",\n    \"tavaly\",\n    \"te\",\n    \"tegnap\",\n    \"tegnapelå‘tt\",\n    \"tegnapelőtt\",\n    \"tehát\",\n    \"tehã¡t\",\n    \"tele\",\n    \"teljes\",\n    \"tessã©k\",\n    \"tessék\",\n    \"ti\",\n    \"tied\",\n    \"titeket\",\n    \"tizedik\",\n    \"tizediket\",\n    \"tizenegy\",\n    \"tizenegyedik\",\n    \"tizenhat\",\n    \"tizenhárom\",\n    \"tizenhã¡rom\",\n    \"tizenhã©t\",\n    \"tizenhét\",\n    \"tizenkettedik\",\n    \"tizenkettå‘\",\n    \"tizenkettő\",\n    \"tizenkilenc\",\n    \"tizenkã©t\",\n    \"tizenkét\",\n    \"tizennyolc\",\n    \"tizennã©gy\",\n    \"tizennégy\",\n    \"tizenã¶t\",\n    \"tizenöt\",\n    \"tizet\",\n    \"tovább\",\n    \"további\",\n    \"továbbá\",\n    \"tovã¡bb\",\n    \"tovã¡bbi\",\n    \"távol\",\n    \"tã¡vol\",\n    \"tã©ged\",\n    \"tã©nyleg\",\n    \"tã\\u{AD}z\",\n    \"tã¶bb\",\n    \"tã¶bbi\",\n    \"tã¶bbszã¶r\",\n    \"tãºl\",\n    \"tå‘le\",\n    \"tå‘led\",\n    \"tå‘lem\",\n    \"tå‘letek\",\n    \"tå‘lã¼k\",\n    \"tå‘lã¼nk\",\n    \"téged\",\n    \"tényleg\",\n    \"tíz\",\n    \"több\",\n    \"többi\",\n    \"többször\",\n    \"túl\",\n    \"tőle\",\n    \"tőled\",\n    \"tőlem\",\n    \"tőletek\",\n    \"tőlük\",\n    \"tőlünk\",\n    \"ugyanakkor\",\n    \"ugyanez\",\n    \"ugyanis\",\n    \"ugye\",\n    \"urak\",\n    \"uram\",\n    \"urat\",\n    \"utoljára\",\n    \"utoljã¡ra\",\n    \"utolsã³\",\n    \"utolsó\",\n    \"után\",\n    \"utána\",\n    \"utã¡n\",\n    \"vagy\",\n    \"vagyis\",\n    \"vagyok\",\n    \"vagytok\",\n    \"vagyunk\",\n    \"vajon\",\n    \"valahol\",\n    \"valaki\",\n    \"valakit\",\n    \"valamelyik\",\n    \"valami\",\n    \"valamint\",\n    \"való\",\n    \"van\",\n    \"vannak\",\n    \"vele\",\n    \"veled\",\n    \"velem\",\n    \"veletek\",\n    \"velã¼k\",\n    \"velã¼nk\",\n    \"velük\",\n    \"velünk\",\n    \"vissza\",\n    \"viszlát\",\n    \"viszlã¡t\",\n    \"viszont\",\n    \"viszontlátásra\",\n    \"viszontlã¡tã¡sra\",\n    \"volna\",\n    \"volnának\",\n    \"volnã¡nak\",\n    \"volnã©k\",\n    \"volnék\",\n    \"volt\",\n    \"voltak\",\n    \"voltam\",\n    \"voltunk\",\n    \"vã©gre\",\n    \"vã©gã©n\",\n    \"vã©gã¼l\",\n    \"végre\",\n    \"végén\",\n    \"végül\",\n    \"által\",\n    \"általában\",\n    \"ám\",\n    \"át\",\n    \"ã¡ltal\",\n    \"ã¡ltalã¡ban\",\n    \"ã¡m\",\n    \"ã¡t\",\n    \"ã©ljen\",\n    \"ã©n\",\n    \"ã©rte\",\n    \"ã©rted\",\n    \"ã©rtem\",\n    \"ã©rtetek\",\n    \"ã©rtã¼k\",\n    \"ã©rtã¼nk\",\n    \"ã©s\",\n    \"ã©v\",\n    \"ã©vben\",\n    \"ã©ve\",\n    \"ã©vek\",\n    \"ã©ves\",\n    \"ã©vi\",\n    \"ã©vvel\",\n    \"ã\\u{AD}gy\",\n    \"ã³ta\",\n    \"ã¶n\",\n    \"ã¶nbe\",\n    \"ã¶nben\",\n    \"ã¶nbå‘l\",\n    \"ã¶nhã¶z\",\n    \"ã¶nnek\",\n    \"ã¶nnel\",\n    \"ã¶nnã©l\",\n    \"ã¶nre\",\n    \"ã¶nrå‘l\",\n    \"ã¶nt\",\n    \"ã¶ntå‘l\",\n    \"ã¶nã©rt\",\n    \"ã¶nã¶k\",\n    \"ã¶nã¶kbe\",\n    \"ã¶nã¶kben\",\n    \"ã¶nã¶kbå‘l\",\n    \"ã¶nã¶ket\",\n    \"ã¶nã¶khã¶z\",\n    \"ã¶nã¶kkel\",\n    \"ã¶nã¶knek\",\n    \"ã¶nã¶knã©l\",\n    \"ã¶nã¶kre\",\n    \"ã¶nã¶krå‘l\",\n    \"ã¶nã¶ktå‘l\",\n    \"ã¶nã¶kã©rt\",\n    \"ã¶nã¶kã¶n\",\n    \"ã¶nã¶n\",\n    \"ã¶t\",\n    \"ã¶tven\",\n    \"ã¶tã¶dik\",\n    \"ã¶tã¶diket\",\n    \"ã¶tã¶t\",\n    \"ãºgy\",\n    \"ãºgyis\",\n    \"ãºgynevezett\",\n    \"ãºjra\",\n    \"ãºr\",\n    \"å‘\",\n    \"å‘k\",\n    \"å‘ket\",\n    \"å‘t\",\n    \"éljen\",\n    \"én\",\n    \"éppen\",\n    \"érte\",\n    \"érted\",\n    \"értem\",\n    \"értetek\",\n    \"értük\",\n    \"értünk\",\n    \"és\",\n    \"év\",\n    \"évben\",\n    \"éve\",\n    \"évek\",\n    \"éves\",\n    \"évi\",\n    \"évvel\",\n    \"így\",\n    \"óta\",\n    \"õ\",\n    \"õk\",\n    \"õket\",\n    \"ön\",\n    \"önbe\",\n    \"önben\",\n    \"önből\",\n    \"önhöz\",\n    \"önnek\",\n    \"önnel\",\n    \"önnél\",\n    \"önre\",\n    \"önről\",\n    \"önt\",\n    \"öntől\",\n    \"önért\",\n    \"önök\",\n    \"önökbe\",\n    \"önökben\",\n    \"önökből\",\n    \"önöket\",\n    \"önökhöz\",\n    \"önökkel\",\n    \"önöknek\",\n    \"önöknél\",\n    \"önökre\",\n    \"önökről\",\n    \"önöktől\",\n    \"önökért\",\n    \"önökön\",\n    \"önön\",\n    \"össze\",\n    \"öt\",\n    \"ötven\",\n    \"ötödik\",\n    \"ötödiket\",\n    \"ötöt\",\n    \"úgy\",\n    \"úgyis\",\n    \"úgynevezett\",\n    \"új\",\n    \"újabb\",\n    \"újra\",\n    \"úr\",\n    \"ő\",\n    \"ők\",\n    \"őket\",\n    \"őt\",\n];\n"
  },
  {
    "path": "src/stopwords/hye.rs",
    "content": "// Sonic\n//\n// Fast, lightweight and schema-less search backend\n// Copyright: 2022, Valerian Saliou <valerian@valeriansaliou.name>\n// License: Mozilla Public License v2.0 (MPL v2.0)\n\npub static STOPWORDS_HYE: &[&str] = &[\n    \"այդ\",\n    \"այլ\",\n    \"այն\",\n    \"այս\",\n    \"դու\",\n    \"դուք\",\n    \"եմ\",\n    \"են\",\n    \"ենք\",\n    \"ես\",\n    \"եք\",\n    \"է\",\n    \"էի\",\n    \"էին\",\n    \"էինք\",\n    \"էիր\",\n    \"էիք\",\n    \"էր\",\n    \"ըստ\",\n    \"թ\",\n    \"ի\",\n    \"ին\",\n    \"իսկ\",\n    \"իր\",\n    \"կամ\",\n    \"համար\",\n    \"հետ\",\n    \"հետո\",\n    \"մենք\",\n    \"մեջ\",\n    \"մի\",\n    \"ն\",\n    \"նա\",\n    \"նաև\",\n    \"նրա\",\n    \"նրանք\",\n    \"որ\",\n    \"որը\",\n    \"որոնք\",\n    \"որպես\",\n    \"ու\",\n    \"ում\",\n    \"պիտի\",\n    \"վրա\",\n    \"և\",\n];\n"
  },
  {
    "path": "src/stopwords/ind.rs",
    "content": "// Sonic\n//\n// Fast, lightweight and schema-less search backend\n// Copyright: 2019, Valerian Saliou <valerian@valeriansaliou.name>\n// License: Mozilla Public License v2.0 (MPL v2.0)\n\npub static STOPWORDS_IND: &[&str] = &[\n    \"ada\",\n    \"adalah\",\n    \"adanya\",\n    \"adapun\",\n    \"agak\",\n    \"agaknya\",\n    \"agar\",\n    \"akan\",\n    \"akankah\",\n    \"akhir\",\n    \"akhiri\",\n    \"akhirnya\",\n    \"aku\",\n    \"akulah\",\n    \"amat\",\n    \"amatlah\",\n    \"anda\",\n    \"andalah\",\n    \"antar\",\n    \"antara\",\n    \"antaranya\",\n    \"apa\",\n    \"apaan\",\n    \"apabila\",\n    \"apakah\",\n    \"apalagi\",\n    \"apatah\",\n    \"artinya\",\n    \"asal\",\n    \"asalkan\",\n    \"atas\",\n    \"atau\",\n    \"ataukah\",\n    \"ataupun\",\n    \"awal\",\n    \"awalnya\",\n    \"bagai\",\n    \"bagaikan\",\n    \"bagaimana\",\n    \"bagaimanakah\",\n    \"bagaimanapun\",\n    \"bagi\",\n    \"bagian\",\n    \"bahkan\",\n    \"bahwa\",\n    \"bahwasanya\",\n    \"baik\",\n    \"bakal\",\n    \"bakalan\",\n    \"balik\",\n    \"banyak\",\n    \"bapak\",\n    \"baru\",\n    \"bawah\",\n    \"beberapa\",\n    \"begini\",\n    \"beginian\",\n    \"beginikah\",\n    \"beginilah\",\n    \"begitu\",\n    \"begitukah\",\n    \"begitulah\",\n    \"begitupun\",\n    \"bekerja\",\n    \"belakang\",\n    \"belakangan\",\n    \"belum\",\n    \"belumlah\",\n    \"benar\",\n    \"benarkah\",\n    \"benarlah\",\n    \"berada\",\n    \"berakhir\",\n    \"berakhirlah\",\n    \"berakhirnya\",\n    \"berapa\",\n    \"berapakah\",\n    \"berapalah\",\n    \"berapapun\",\n    \"berarti\",\n    \"berawal\",\n    \"berbagai\",\n    \"berdatangan\",\n    \"beri\",\n    \"berikan\",\n    \"berikut\",\n    \"berikutnya\",\n    \"berjumlah\",\n    \"berkali-kali\",\n    \"berkata\",\n    \"berkehendak\",\n    \"berkeinginan\",\n    \"berkenaan\",\n    \"berlainan\",\n    \"berlalu\",\n    \"berlangsung\",\n    \"berlebihan\",\n    \"bermacam\",\n    \"bermacam-macam\",\n    \"bermaksud\",\n    \"bermula\",\n    \"bersama\",\n    \"bersama-sama\",\n    \"bersiap\",\n    \"bersiap-siap\",\n    \"bertanya\",\n    \"bertanya-tanya\",\n    \"berturut\",\n    \"berturut-turut\",\n    \"bertutur\",\n    \"berujar\",\n    \"berupa\",\n    \"besar\",\n    \"betul\",\n    \"betulkah\",\n    \"biasa\",\n    \"biasanya\",\n    \"bila\",\n    \"bilakah\",\n    \"bisa\",\n    \"bisakah\",\n    \"boleh\",\n    \"bolehkah\",\n    \"bolehlah\",\n    \"buat\",\n    \"bukan\",\n    \"bukankah\",\n    \"bukanlah\",\n    \"bukannya\",\n    \"bulan\",\n    \"bung\",\n    \"cara\",\n    \"caranya\",\n    \"cukup\",\n    \"cukupkah\",\n    \"cukuplah\",\n    \"cuma\",\n    \"dahulu\",\n    \"dalam\",\n    \"dan\",\n    \"dapat\",\n    \"dari\",\n    \"daripada\",\n    \"datang\",\n    \"dekat\",\n    \"demi\",\n    \"demikian\",\n    \"demikianlah\",\n    \"dengan\",\n    \"depan\",\n    \"di\",\n    \"dia\",\n    \"diakhiri\",\n    \"diakhirinya\",\n    \"dialah\",\n    \"diantara\",\n    \"diantaranya\",\n    \"diberi\",\n    \"diberikan\",\n    \"diberikannya\",\n    \"dibuat\",\n    \"dibuatnya\",\n    \"didapat\",\n    \"didatangkan\",\n    \"digunakan\",\n    \"diibaratkan\",\n    \"diibaratkannya\",\n    \"diingat\",\n    \"diingatkan\",\n    \"diinginkan\",\n    \"dijawab\",\n    \"dijelaskan\",\n    \"dijelaskannya\",\n    \"dikarenakan\",\n    \"dikatakan\",\n    \"dikatakannya\",\n    \"dikerjakan\",\n    \"diketahui\",\n    \"diketahuinya\",\n    \"dikira\",\n    \"dilakukan\",\n    \"dilalui\",\n    \"dilihat\",\n    \"dimaksud\",\n    \"dimaksudkan\",\n    \"dimaksudkannya\",\n    \"dimaksudnya\",\n    \"diminta\",\n    \"dimintai\",\n    \"dimisalkan\",\n    \"dimulai\",\n    \"dimulailah\",\n    \"dimulainya\",\n    \"dimungkinkan\",\n    \"dini\",\n    \"dipastikan\",\n    \"diperbuat\",\n    \"diperbuatnya\",\n    \"dipergunakan\",\n    \"diperkirakan\",\n    \"diperlihatkan\",\n    \"diperlukan\",\n    \"diperlukannya\",\n    \"dipersoalkan\",\n    \"dipertanyakan\",\n    \"dipunyai\",\n    \"diri\",\n    \"dirinya\",\n    \"disampaikan\",\n    \"disebut\",\n    \"disebutkan\",\n    \"disebutkannya\",\n    \"disini\",\n    \"disinilah\",\n    \"ditambahkan\",\n    \"ditandaskan\",\n    \"ditanya\",\n    \"ditanyai\",\n    \"ditanyakan\",\n    \"ditegaskan\",\n    \"ditujukan\",\n    \"ditunjuk\",\n    \"ditunjuki\",\n    \"ditunjukkan\",\n    \"ditunjukkannya\",\n    \"ditunjuknya\",\n    \"dituturkan\",\n    \"dituturkannya\",\n    \"diucapkan\",\n    \"diucapkannya\",\n    \"diungkapkan\",\n    \"dong\",\n    \"dua\",\n    \"dulu\",\n    \"empat\",\n    \"enggak\",\n    \"enggaknya\",\n    \"entah\",\n    \"entahlah\",\n    \"guna\",\n    \"gunakan\",\n    \"hal\",\n    \"hampir\",\n    \"hanya\",\n    \"hanyalah\",\n    \"hari\",\n    \"harus\",\n    \"haruslah\",\n    \"harusnya\",\n    \"hendak\",\n    \"hendaklah\",\n    \"hendaknya\",\n    \"hingga\",\n    \"ia\",\n    \"ialah\",\n    \"ibarat\",\n    \"ibaratkan\",\n    \"ibaratnya\",\n    \"ibu\",\n    \"ikut\",\n    \"ingat\",\n    \"ingat-ingat\",\n    \"ingin\",\n    \"inginkah\",\n    \"inginkan\",\n    \"ini\",\n    \"inikah\",\n    \"inilah\",\n    \"itu\",\n    \"itukah\",\n    \"itulah\",\n    \"jadi\",\n    \"jadilah\",\n    \"jadinya\",\n    \"jangan\",\n    \"jangankan\",\n    \"janganlah\",\n    \"jauh\",\n    \"jawab\",\n    \"jawaban\",\n    \"jawabnya\",\n    \"jelas\",\n    \"jelaskan\",\n    \"jelaslah\",\n    \"jelasnya\",\n    \"jika\",\n    \"jikalau\",\n    \"juga\",\n    \"jumlah\",\n    \"jumlahnya\",\n    \"justru\",\n    \"kala\",\n    \"kalau\",\n    \"kalaulah\",\n    \"kalaupun\",\n    \"kalian\",\n    \"kami\",\n    \"kamilah\",\n    \"kamu\",\n    \"kamulah\",\n    \"kan\",\n    \"kapan\",\n    \"kapankah\",\n    \"kapanpun\",\n    \"karena\",\n    \"karenanya\",\n    \"kasus\",\n    \"kata\",\n    \"katakan\",\n    \"katakanlah\",\n    \"katanya\",\n    \"ke\",\n    \"keadaan\",\n    \"kebetulan\",\n    \"kecil\",\n    \"kedua\",\n    \"keduanya\",\n    \"keinginan\",\n    \"kelamaan\",\n    \"kelihatan\",\n    \"kelihatannya\",\n    \"kelima\",\n    \"keluar\",\n    \"kembali\",\n    \"kemudian\",\n    \"kemungkinan\",\n    \"kemungkinannya\",\n    \"kenapa\",\n    \"kepada\",\n    \"kepadanya\",\n    \"kesampaian\",\n    \"keseluruhan\",\n    \"keseluruhannya\",\n    \"keterlaluan\",\n    \"ketika\",\n    \"khususnya\",\n    \"kini\",\n    \"kinilah\",\n    \"kira\",\n    \"kira-kira\",\n    \"kiranya\",\n    \"kita\",\n    \"kitalah\",\n    \"kok\",\n    \"kurang\",\n    \"lagi\",\n    \"lagian\",\n    \"lah\",\n    \"lain\",\n    \"lainnya\",\n    \"lalu\",\n    \"lama\",\n    \"lamanya\",\n    \"lanjut\",\n    \"lanjutnya\",\n    \"lebih\",\n    \"lewat\",\n    \"lima\",\n    \"luar\",\n    \"macam\",\n    \"maka\",\n    \"makanya\",\n    \"makin\",\n    \"malah\",\n    \"malahan\",\n    \"mampu\",\n    \"mampukah\",\n    \"mana\",\n    \"manakala\",\n    \"manalagi\",\n    \"masa\",\n    \"masalah\",\n    \"masalahnya\",\n    \"masih\",\n    \"masihkah\",\n    \"masing\",\n    \"masing-masing\",\n    \"mau\",\n    \"maupun\",\n    \"melainkan\",\n    \"melakukan\",\n    \"melalui\",\n    \"melihat\",\n    \"melihatnya\",\n    \"memang\",\n    \"memastikan\",\n    \"memberi\",\n    \"memberikan\",\n    \"membuat\",\n    \"memerlukan\",\n    \"memihak\",\n    \"meminta\",\n    \"memintakan\",\n    \"memisalkan\",\n    \"memperbuat\",\n    \"mempergunakan\",\n    \"memperkirakan\",\n    \"memperlihatkan\",\n    \"mempersiapkan\",\n    \"mempersoalkan\",\n    \"mempertanyakan\",\n    \"mempunyai\",\n    \"memulai\",\n    \"memungkinkan\",\n    \"menaiki\",\n    \"menambahkan\",\n    \"menandaskan\",\n    \"menanti\",\n    \"menanti-nanti\",\n    \"menantikan\",\n    \"menanya\",\n    \"menanyai\",\n    \"menanyakan\",\n    \"mendapat\",\n    \"mendapatkan\",\n    \"mendatang\",\n    \"mendatangi\",\n    \"mendatangkan\",\n    \"menegaskan\",\n    \"mengakhiri\",\n    \"mengapa\",\n    \"mengatakan\",\n    \"mengatakannya\",\n    \"mengenai\",\n    \"mengerjakan\",\n    \"mengetahui\",\n    \"menggunakan\",\n    \"menghendaki\",\n    \"mengibaratkan\",\n    \"mengibaratkannya\",\n    \"mengingat\",\n    \"mengingatkan\",\n    \"menginginkan\",\n    \"mengira\",\n    \"mengucapkan\",\n    \"mengucapkannya\",\n    \"mengungkapkan\",\n    \"menjadi\",\n    \"menjawab\",\n    \"menjelaskan\",\n    \"menuju\",\n    \"menunjuk\",\n    \"menunjuki\",\n    \"menunjukkan\",\n    \"menunjuknya\",\n    \"menurut\",\n    \"menuturkan\",\n    \"menyampaikan\",\n    \"menyangkut\",\n    \"menyatakan\",\n    \"menyebutkan\",\n    \"menyeluruh\",\n    \"menyiapkan\",\n    \"merasa\",\n    \"mereka\",\n    \"merekalah\",\n    \"merupakan\",\n    \"meski\",\n    \"meskipun\",\n    \"meyakini\",\n    \"meyakinkan\",\n    \"minta\",\n    \"mirip\",\n    \"misal\",\n    \"misalkan\",\n    \"misalnya\",\n    \"mula\",\n    \"mulai\",\n    \"mulailah\",\n    \"mulanya\",\n    \"mungkin\",\n    \"mungkinkah\",\n    \"nah\",\n    \"naik\",\n    \"namun\",\n    \"nanti\",\n    \"nantinya\",\n    \"nyaris\",\n    \"nyatanya\",\n    \"oleh\",\n    \"olehnya\",\n    \"pada\",\n    \"padahal\",\n    \"padanya\",\n    \"pak\",\n    \"paling\",\n    \"panjang\",\n    \"pantas\",\n    \"para\",\n    \"pasti\",\n    \"pastilah\",\n    \"penting\",\n    \"pentingnya\",\n    \"per\",\n    \"percuma\",\n    \"perlu\",\n    \"perlukah\",\n    \"perlunya\",\n    \"pernah\",\n    \"persoalan\",\n    \"pertama\",\n    \"pertama-tama\",\n    \"pertanyaan\",\n    \"pertanyakan\",\n    \"pihak\",\n    \"pihaknya\",\n    \"pukul\",\n    \"pula\",\n    \"pun\",\n    \"punya\",\n    \"rasa\",\n    \"rasanya\",\n    \"rata\",\n    \"rupanya\",\n    \"saat\",\n    \"saatnya\",\n    \"saja\",\n    \"sajalah\",\n    \"saling\",\n    \"sama\",\n    \"sama-sama\",\n    \"sambil\",\n    \"sampai\",\n    \"sampai-sampai\",\n    \"sampaikan\",\n    \"sana\",\n    \"sangat\",\n    \"sangatlah\",\n    \"satu\",\n    \"saya\",\n    \"sayalah\",\n    \"se\",\n    \"sebab\",\n    \"sebabnya\",\n    \"sebagai\",\n    \"sebagaimana\",\n    \"sebagainya\",\n    \"sebagian\",\n    \"sebaik\",\n    \"sebaik-baiknya\",\n    \"sebaiknya\",\n    \"sebaliknya\",\n    \"sebanyak\",\n    \"sebegini\",\n    \"sebegitu\",\n    \"sebelum\",\n    \"sebelumnya\",\n    \"sebenarnya\",\n    \"seberapa\",\n    \"sebesar\",\n    \"sebetulnya\",\n    \"sebisanya\",\n    \"sebuah\",\n    \"sebut\",\n    \"sebutlah\",\n    \"sebutnya\",\n    \"secara\",\n    \"secukupnya\",\n    \"sedang\",\n    \"sedangkan\",\n    \"sedemikian\",\n    \"sedikit\",\n    \"sedikitnya\",\n    \"seenaknya\",\n    \"segala\",\n    \"segalanya\",\n    \"segera\",\n    \"seharusnya\",\n    \"sehingga\",\n    \"seingat\",\n    \"sejak\",\n    \"sejauh\",\n    \"sejenak\",\n    \"sejumlah\",\n    \"sekadar\",\n    \"sekadarnya\",\n    \"sekali\",\n    \"sekali-kali\",\n    \"sekalian\",\n    \"sekaligus\",\n    \"sekalipun\",\n    \"sekarang\",\n    \"sekecil\",\n    \"seketika\",\n    \"sekiranya\",\n    \"sekitar\",\n    \"sekitarnya\",\n    \"sekurang-kurangnya\",\n    \"sekurangnya\",\n    \"sela\",\n    \"selagi\",\n    \"selain\",\n    \"selaku\",\n    \"selalu\",\n    \"selama\",\n    \"selama-lamanya\",\n    \"selamanya\",\n    \"selanjutnya\",\n    \"seluruh\",\n    \"seluruhnya\",\n    \"semacam\",\n    \"semakin\",\n    \"semampu\",\n    \"semampunya\",\n    \"semasa\",\n    \"semasih\",\n    \"semata\",\n    \"semata-mata\",\n    \"semaunya\",\n    \"sementara\",\n    \"semisal\",\n    \"semisalnya\",\n    \"sempat\",\n    \"semua\",\n    \"semuanya\",\n    \"semula\",\n    \"sendiri\",\n    \"sendirian\",\n    \"sendirinya\",\n    \"seolah\",\n    \"seolah-olah\",\n    \"seorang\",\n    \"sepanjang\",\n    \"sepantasnya\",\n    \"sepantasnyalah\",\n    \"seperlunya\",\n    \"seperti\",\n    \"sepertinya\",\n    \"sepihak\",\n    \"sering\",\n    \"seringnya\",\n    \"serta\",\n    \"serupa\",\n    \"sesaat\",\n    \"sesama\",\n    \"sesampai\",\n    \"sesegera\",\n    \"sesekali\",\n    \"seseorang\",\n    \"sesuatu\",\n    \"sesuatunya\",\n    \"sesudah\",\n    \"sesudahnya\",\n    \"setelah\",\n    \"setempat\",\n    \"setengah\",\n    \"seterusnya\",\n    \"setiap\",\n    \"setiba\",\n    \"setibanya\",\n    \"setidak-tidaknya\",\n    \"setidaknya\",\n    \"setinggi\",\n    \"seusai\",\n    \"sewaktu\",\n    \"siap\",\n    \"siapa\",\n    \"siapakah\",\n    \"siapapun\",\n    \"sini\",\n    \"sinilah\",\n    \"soal\",\n    \"soalnya\",\n    \"suatu\",\n    \"sudah\",\n    \"sudahkah\",\n    \"sudahlah\",\n    \"supaya\",\n    \"tadi\",\n    \"tadinya\",\n    \"tahu\",\n    \"tahun\",\n    \"tak\",\n    \"tambah\",\n    \"tambahnya\",\n    \"tampak\",\n    \"tampaknya\",\n    \"tandas\",\n    \"tandasnya\",\n    \"tanpa\",\n    \"tanya\",\n    \"tanyakan\",\n    \"tanyanya\",\n    \"tapi\",\n    \"tegas\",\n    \"tegasnya\",\n    \"telah\",\n    \"tempat\",\n    \"tengah\",\n    \"tentang\",\n    \"tentu\",\n    \"tentulah\",\n    \"tentunya\",\n    \"tepat\",\n    \"terakhir\",\n    \"terasa\",\n    \"terbanyak\",\n    \"terdahulu\",\n    \"terdapat\",\n    \"terdiri\",\n    \"terhadap\",\n    \"terhadapnya\",\n    \"teringat\",\n    \"teringat-ingat\",\n    \"terjadi\",\n    \"terjadilah\",\n    \"terjadinya\",\n    \"terkira\",\n    \"terlalu\",\n    \"terlebih\",\n    \"terlihat\",\n    \"termasuk\",\n    \"ternyata\",\n    \"tersampaikan\",\n    \"tersebut\",\n    \"tersebutlah\",\n    \"tertentu\",\n    \"tertuju\",\n    \"terus\",\n    \"terutama\",\n    \"tetap\",\n    \"tetapi\",\n    \"tiap\",\n    \"tiba\",\n    \"tiba-tiba\",\n    \"tidak\",\n    \"tidakkah\",\n    \"tidaklah\",\n    \"tiga\",\n    \"tinggi\",\n    \"toh\",\n    \"tunjuk\",\n    \"turut\",\n    \"tutur\",\n    \"tuturnya\",\n    \"ucap\",\n    \"ucapnya\",\n    \"ujar\",\n    \"ujarnya\",\n    \"umum\",\n    \"umumnya\",\n    \"ungkap\",\n    \"ungkapnya\",\n    \"untuk\",\n    \"usah\",\n    \"usai\",\n    \"waduh\",\n    \"wah\",\n    \"wahai\",\n    \"waktu\",\n    \"waktunya\",\n    \"walau\",\n    \"walaupun\",\n    \"wong\",\n    \"yaitu\",\n    \"yakin\",\n    \"yakni\",\n    \"yang\",\n];\n"
  },
  {
    "path": "src/stopwords/ita.rs",
    "content": "// Sonic\n//\n// Fast, lightweight and schema-less search backend\n// Copyright: 2019, Valerian Saliou <valerian@valeriansaliou.name>\n// License: Mozilla Public License v2.0 (MPL v2.0)\n\npub static STOPWORDS_ITA: &[&str] = &[\n    \"a\",\n    \"abbastanza\",\n    \"abbia\",\n    \"abbiamo\",\n    \"abbiano\",\n    \"abbiate\",\n    \"accidenti\",\n    \"ad\",\n    \"adesso\",\n    \"affinche\",\n    \"agl\",\n    \"agli\",\n    \"ahime\",\n    \"ahimã¨\",\n    \"ahimè\",\n    \"ai\",\n    \"al\",\n    \"alcuna\",\n    \"alcuni\",\n    \"alcuno\",\n    \"all\",\n    \"alla\",\n    \"alle\",\n    \"allo\",\n    \"allora\",\n    \"altre\",\n    \"altri\",\n    \"altrimenti\",\n    \"altro\",\n    \"altrove\",\n    \"altrui\",\n    \"anche\",\n    \"ancora\",\n    \"anni\",\n    \"anno\",\n    \"ansa\",\n    \"anticipo\",\n    \"assai\",\n    \"attesa\",\n    \"attraverso\",\n    \"avanti\",\n    \"avemmo\",\n    \"avendo\",\n    \"avente\",\n    \"aver\",\n    \"avere\",\n    \"averlo\",\n    \"avesse\",\n    \"avessero\",\n    \"avessi\",\n    \"avessimo\",\n    \"aveste\",\n    \"avesti\",\n    \"avete\",\n    \"aveva\",\n    \"avevamo\",\n    \"avevano\",\n    \"avevate\",\n    \"avevi\",\n    \"avevo\",\n    \"avrai\",\n    \"avranno\",\n    \"avrebbe\",\n    \"avrebbero\",\n    \"avrei\",\n    \"avremmo\",\n    \"avremo\",\n    \"avreste\",\n    \"avresti\",\n    \"avrete\",\n    \"avrà\",\n    \"avrò\",\n    \"avuta\",\n    \"avute\",\n    \"avuti\",\n    \"avuto\",\n    \"basta\",\n    \"ben\",\n    \"bene\",\n    \"benissimo\",\n    \"berlusconi\",\n    \"brava\",\n    \"bravo\",\n    \"buono\",\n    \"c\",\n    \"casa\",\n    \"caso\",\n    \"cento\",\n    \"certa\",\n    \"certe\",\n    \"certi\",\n    \"certo\",\n    \"che\",\n    \"chi\",\n    \"chicchessia\",\n    \"chiunque\",\n    \"ci\",\n    \"ciascuna\",\n    \"ciascuno\",\n    \"cima\",\n    \"cinque\",\n    \"cio\",\n    \"cioe\",\n    \"cioã¨\",\n    \"cioè\",\n    \"circa\",\n    \"citta\",\n    \"città\",\n    \"cittã\",\n    \"ciã²\",\n    \"ciò\",\n    \"co\",\n    \"codesta\",\n    \"codesti\",\n    \"codesto\",\n    \"cogli\",\n    \"coi\",\n    \"col\",\n    \"colei\",\n    \"coll\",\n    \"coloro\",\n    \"colui\",\n    \"come\",\n    \"cominci\",\n    \"comprare\",\n    \"comunque\",\n    \"con\",\n    \"concernente\",\n    \"conciliarsi\",\n    \"conclusione\",\n    \"consecutivi\",\n    \"consecutivo\",\n    \"consiglio\",\n    \"contro\",\n    \"cortesia\",\n    \"cos\",\n    \"cosa\",\n    \"cosi\",\n    \"cosã¬\",\n    \"così\",\n    \"cui\",\n    \"d\",\n    \"da\",\n    \"dagl\",\n    \"dagli\",\n    \"dai\",\n    \"dal\",\n    \"dall\",\n    \"dalla\",\n    \"dalle\",\n    \"dallo\",\n    \"dappertutto\",\n    \"davanti\",\n    \"degl\",\n    \"degli\",\n    \"dei\",\n    \"del\",\n    \"dell\",\n    \"della\",\n    \"delle\",\n    \"dello\",\n    \"dentro\",\n    \"detto\",\n    \"deve\",\n    \"devo\",\n    \"di\",\n    \"dice\",\n    \"dietro\",\n    \"dire\",\n    \"dirimpetto\",\n    \"diventa\",\n    \"diventare\",\n    \"diventato\",\n    \"dopo\",\n    \"doppio\",\n    \"dov\",\n    \"dove\",\n    \"dovra\",\n    \"dovrà\",\n    \"dovrã\",\n    \"dovunque\",\n    \"due\",\n    \"dunque\",\n    \"durante\",\n    \"e\",\n    \"ebbe\",\n    \"ebbero\",\n    \"ebbi\",\n    \"ecc\",\n    \"ecco\",\n    \"ed\",\n    \"effettivamente\",\n    \"egli\",\n    \"ella\",\n    \"entrambi\",\n    \"eppure\",\n    \"era\",\n    \"erano\",\n    \"eravamo\",\n    \"eravate\",\n    \"eri\",\n    \"ero\",\n    \"esempio\",\n    \"esse\",\n    \"essendo\",\n    \"esser\",\n    \"essere\",\n    \"essi\",\n    \"ex\",\n    \"fa\",\n    \"faccia\",\n    \"facciamo\",\n    \"facciano\",\n    \"facciate\",\n    \"faccio\",\n    \"facemmo\",\n    \"facendo\",\n    \"facesse\",\n    \"facessero\",\n    \"facessi\",\n    \"facessimo\",\n    \"faceste\",\n    \"facesti\",\n    \"faceva\",\n    \"facevamo\",\n    \"facevano\",\n    \"facevate\",\n    \"facevi\",\n    \"facevo\",\n    \"fai\",\n    \"fanno\",\n    \"farai\",\n    \"faranno\",\n    \"fare\",\n    \"farebbe\",\n    \"farebbero\",\n    \"farei\",\n    \"faremmo\",\n    \"faremo\",\n    \"fareste\",\n    \"faresti\",\n    \"farete\",\n    \"farà\",\n    \"farò\",\n    \"fatto\",\n    \"favore\",\n    \"fece\",\n    \"fecero\",\n    \"feci\",\n    \"fin\",\n    \"finalmente\",\n    \"finche\",\n    \"fine\",\n    \"fino\",\n    \"forse\",\n    \"forza\",\n    \"fosse\",\n    \"fossero\",\n    \"fossi\",\n    \"fossimo\",\n    \"foste\",\n    \"fosti\",\n    \"fra\",\n    \"frattempo\",\n    \"fu\",\n    \"fui\",\n    \"fummo\",\n    \"fuori\",\n    \"furono\",\n    \"futuro\",\n    \"generale\",\n    \"gente\",\n    \"gia\",\n    \"giacche\",\n    \"giorni\",\n    \"giorno\",\n    \"giu\",\n    \"già\",\n    \"giã\",\n    \"gli\",\n    \"gliela\",\n    \"gliele\",\n    \"glieli\",\n    \"glielo\",\n    \"gliene\",\n    \"governo\",\n    \"grande\",\n    \"grazie\",\n    \"gruppo\",\n    \"ha\",\n    \"haha\",\n    \"hai\",\n    \"hanno\",\n    \"ho\",\n    \"i\",\n    \"ie\",\n    \"ieri\",\n    \"il\",\n    \"improvviso\",\n    \"in\",\n    \"inc\",\n    \"indietro\",\n    \"infatti\",\n    \"inoltre\",\n    \"insieme\",\n    \"intanto\",\n    \"intorno\",\n    \"invece\",\n    \"io\",\n    \"l\",\n    \"la\",\n    \"lasciato\",\n    \"lato\",\n    \"lavoro\",\n    \"le\",\n    \"lei\",\n    \"li\",\n    \"lo\",\n    \"lontano\",\n    \"loro\",\n    \"lui\",\n    \"lungo\",\n    \"luogo\",\n    \"là\",\n    \"lã\",\n    \"ma\",\n    \"macche\",\n    \"magari\",\n    \"maggior\",\n    \"mai\",\n    \"male\",\n    \"malgrado\",\n    \"malissimo\",\n    \"mancanza\",\n    \"marche\",\n    \"me\",\n    \"medesimo\",\n    \"mediante\",\n    \"meglio\",\n    \"meno\",\n    \"mentre\",\n    \"mesi\",\n    \"mezzo\",\n    \"mi\",\n    \"mia\",\n    \"mie\",\n    \"miei\",\n    \"mila\",\n    \"miliardi\",\n    \"milioni\",\n    \"minimi\",\n    \"ministro\",\n    \"mio\",\n    \"modo\",\n    \"molta\",\n    \"molti\",\n    \"moltissimo\",\n    \"molto\",\n    \"momento\",\n    \"mondo\",\n    \"mosto\",\n    \"nazionale\",\n    \"ne\",\n    \"negl\",\n    \"negli\",\n    \"nei\",\n    \"nel\",\n    \"nell\",\n    \"nella\",\n    \"nelle\",\n    \"nello\",\n    \"nemmeno\",\n    \"neppure\",\n    \"nessun\",\n    \"nessuna\",\n    \"nessuno\",\n    \"niente\",\n    \"no\",\n    \"noi\",\n    \"nome\",\n    \"non\",\n    \"nondimeno\",\n    \"nonostante\",\n    \"nonsia\",\n    \"nostra\",\n    \"nostre\",\n    \"nostri\",\n    \"nostro\",\n    \"novanta\",\n    \"nove\",\n    \"nulla\",\n    \"nuovi\",\n    \"nuovo\",\n    \"o\",\n    \"od\",\n    \"oggi\",\n    \"ogni\",\n    \"ognuna\",\n    \"ognuno\",\n    \"oltre\",\n    \"oppure\",\n    \"ora\",\n    \"ore\",\n    \"osi\",\n    \"ossia\",\n    \"ottanta\",\n    \"otto\",\n    \"paese\",\n    \"parecchi\",\n    \"parecchie\",\n    \"parecchio\",\n    \"parte\",\n    \"partendo\",\n    \"peccato\",\n    \"peggio\",\n    \"per\",\n    \"perche\",\n    \"perchã¨\",\n    \"perchè\",\n    \"perché\",\n    \"percio\",\n    \"perciã²\",\n    \"perciò\",\n    \"perfino\",\n    \"pero\",\n    \"persino\",\n    \"persone\",\n    \"perã²\",\n    \"però\",\n    \"piedi\",\n    \"pieno\",\n    \"piglia\",\n    \"piu\",\n    \"piuttosto\",\n    \"piã¹\",\n    \"più\",\n    \"po\",\n    \"pochissimo\",\n    \"poco\",\n    \"poi\",\n    \"poiche\",\n    \"possa\",\n    \"possedere\",\n    \"posteriore\",\n    \"posto\",\n    \"potrebbe\",\n    \"preferibilmente\",\n    \"presa\",\n    \"press\",\n    \"prima\",\n    \"primo\",\n    \"principalmente\",\n    \"probabilmente\",\n    \"promesso\",\n    \"proprio\",\n    \"puo\",\n    \"pure\",\n    \"purtroppo\",\n    \"puã²\",\n    \"può\",\n    \"qua\",\n    \"qualche\",\n    \"qualcosa\",\n    \"qualcuna\",\n    \"qualcuno\",\n    \"quale\",\n    \"quali\",\n    \"qualunque\",\n    \"quando\",\n    \"quanta\",\n    \"quante\",\n    \"quanti\",\n    \"quanto\",\n    \"quantunque\",\n    \"quarto\",\n    \"quasi\",\n    \"quattro\",\n    \"quel\",\n    \"quella\",\n    \"quelle\",\n    \"quelli\",\n    \"quello\",\n    \"quest\",\n    \"questa\",\n    \"queste\",\n    \"questi\",\n    \"questo\",\n    \"qui\",\n    \"quindi\",\n    \"quinto\",\n    \"realmente\",\n    \"recente\",\n    \"recentemente\",\n    \"registrazione\",\n    \"relativo\",\n    \"riecco\",\n    \"rispetto\",\n    \"salvo\",\n    \"sara\",\n    \"sarai\",\n    \"saranno\",\n    \"sarebbe\",\n    \"sarebbero\",\n    \"sarei\",\n    \"saremmo\",\n    \"saremo\",\n    \"sareste\",\n    \"saresti\",\n    \"sarete\",\n    \"sarà\",\n    \"sarã\",\n    \"sarò\",\n    \"scola\",\n    \"scopo\",\n    \"scorso\",\n    \"se\",\n    \"secondo\",\n    \"seguente\",\n    \"seguito\",\n    \"sei\",\n    \"sembra\",\n    \"sembrare\",\n    \"sembrato\",\n    \"sembrava\",\n    \"sembri\",\n    \"sempre\",\n    \"senza\",\n    \"sette\",\n    \"si\",\n    \"sia\",\n    \"siamo\",\n    \"siano\",\n    \"siate\",\n    \"siete\",\n    \"sig\",\n    \"solito\",\n    \"solo\",\n    \"soltanto\",\n    \"sono\",\n    \"sopra\",\n    \"soprattutto\",\n    \"sotto\",\n    \"spesso\",\n    \"srl\",\n    \"sta\",\n    \"stai\",\n    \"stando\",\n    \"stanno\",\n    \"starai\",\n    \"staranno\",\n    \"starebbe\",\n    \"starebbero\",\n    \"starei\",\n    \"staremmo\",\n    \"staremo\",\n    \"stareste\",\n    \"staresti\",\n    \"starete\",\n    \"starà\",\n    \"starò\",\n    \"stata\",\n    \"state\",\n    \"stati\",\n    \"stato\",\n    \"stava\",\n    \"stavamo\",\n    \"stavano\",\n    \"stavate\",\n    \"stavi\",\n    \"stavo\",\n    \"stemmo\",\n    \"stessa\",\n    \"stesse\",\n    \"stessero\",\n    \"stessi\",\n    \"stessimo\",\n    \"stesso\",\n    \"steste\",\n    \"stesti\",\n    \"stette\",\n    \"stettero\",\n    \"stetti\",\n    \"stia\",\n    \"stiamo\",\n    \"stiano\",\n    \"stiate\",\n    \"sto\",\n    \"su\",\n    \"sua\",\n    \"subito\",\n    \"successivamente\",\n    \"successivo\",\n    \"sue\",\n    \"sugl\",\n    \"sugli\",\n    \"sui\",\n    \"sul\",\n    \"sull\",\n    \"sulla\",\n    \"sulle\",\n    \"sullo\",\n    \"suo\",\n    \"suoi\",\n    \"tale\",\n    \"tali\",\n    \"talvolta\",\n    \"tanto\",\n    \"te\",\n    \"tempo\",\n    \"terzo\",\n    \"th\",\n    \"ti\",\n    \"titolo\",\n    \"torino\",\n    \"tra\",\n    \"tranne\",\n    \"tre\",\n    \"trenta\",\n    \"triplo\",\n    \"troppo\",\n    \"trovato\",\n    \"tu\",\n    \"tua\",\n    \"tue\",\n    \"tuo\",\n    \"tuoi\",\n    \"tutta\",\n    \"tuttavia\",\n    \"tutte\",\n    \"tutti\",\n    \"tutto\",\n    \"uguali\",\n    \"ulteriore\",\n    \"ultimo\",\n    \"un\",\n    \"una\",\n    \"uno\",\n    \"uomo\",\n    \"va\",\n    \"vai\",\n    \"vale\",\n    \"vari\",\n    \"varia\",\n    \"varie\",\n    \"vario\",\n    \"verso\",\n    \"vi\",\n    \"via\",\n    \"vicino\",\n    \"visto\",\n    \"vita\",\n    \"voi\",\n    \"volta\",\n    \"volte\",\n    \"vostra\",\n    \"vostre\",\n    \"vostri\",\n    \"vostro\",\n    \"ã¨\",\n    \"è\",\n];\n"
  },
  {
    "path": "src/stopwords/jav.rs",
    "content": "// Sonic\n//\n// Fast, lightweight and schema-less search backend\n// Copyright: 2019, Valerian Saliou <valerian@valeriansaliou.name>\n// License: Mozilla Public License v2.0 (MPL v2.0)\n\n// Notice: we do not have stopwords for this language yet.\npub static STOPWORDS_JAV: &[&str] = &[];\n"
  },
  {
    "path": "src/stopwords/jpn.rs",
    "content": "// Sonic\n//\n// Fast, lightweight and schema-less search backend\n// Copyright: 2019, Valerian Saliou <valerian@valeriansaliou.name>\n// License: Mozilla Public License v2.0 (MPL v2.0)\n\npub static STOPWORDS_JPN: &[&str] = &[\n    \"あそこ\",\n    \"あっ\",\n    \"あの\",\n    \"あのかた\",\n    \"あの人\",\n    \"あり\",\n    \"あります\",\n    \"ある\",\n    \"あれ\",\n    \"い\",\n    \"いう\",\n    \"います\",\n    \"いる\",\n    \"う\",\n    \"うち\",\n    \"え\",\n    \"お\",\n    \"および\",\n    \"おり\",\n    \"おります\",\n    \"か\",\n    \"かつて\",\n    \"から\",\n    \"が\",\n    \"き\",\n    \"ここ\",\n    \"こちら\",\n    \"こと\",\n    \"この\",\n    \"これ\",\n    \"これら\",\n    \"さ\",\n    \"さらに\",\n    \"し\",\n    \"しかし\",\n    \"する\",\n    \"ず\",\n    \"せ\",\n    \"せる\",\n    \"そこ\",\n    \"そして\",\n    \"その\",\n    \"その他\",\n    \"その後\",\n    \"それ\",\n    \"それぞれ\",\n    \"それで\",\n    \"た\",\n    \"ただし\",\n    \"たち\",\n    \"ため\",\n    \"たり\",\n    \"だ\",\n    \"だっ\",\n    \"だれ\",\n    \"つ\",\n    \"て\",\n    \"で\",\n    \"でき\",\n    \"できる\",\n    \"です\",\n    \"では\",\n    \"でも\",\n    \"と\",\n    \"という\",\n    \"といった\",\n    \"とき\",\n    \"ところ\",\n    \"として\",\n    \"とともに\",\n    \"とも\",\n    \"と共に\",\n    \"どこ\",\n    \"どの\",\n    \"な\",\n    \"ない\",\n    \"なお\",\n    \"なかっ\",\n    \"ながら\",\n    \"なく\",\n    \"なっ\",\n    \"など\",\n    \"なに\",\n    \"なら\",\n    \"なり\",\n    \"なる\",\n    \"なん\",\n    \"に\",\n    \"において\",\n    \"における\",\n    \"について\",\n    \"にて\",\n    \"によって\",\n    \"により\",\n    \"による\",\n    \"に対して\",\n    \"に対する\",\n    \"に関する\",\n    \"の\",\n    \"ので\",\n    \"のみ\",\n    \"は\",\n    \"ば\",\n    \"へ\",\n    \"ほか\",\n    \"ほとんど\",\n    \"ほど\",\n    \"ます\",\n    \"また\",\n    \"または\",\n    \"まで\",\n    \"も\",\n    \"もの\",\n    \"ものの\",\n    \"や\",\n    \"よう\",\n    \"より\",\n    \"ら\",\n    \"られ\",\n    \"られる\",\n    \"れ\",\n    \"れる\",\n    \"を\",\n    \"ん\",\n    \"何\",\n    \"及び\",\n    \"彼\",\n    \"彼女\",\n    \"我々\",\n    \"特に\",\n    \"私\",\n    \"私達\",\n    \"貴方\",\n    \"貴方方\",\n];\n"
  },
  {
    "path": "src/stopwords/kan.rs",
    "content": "// Sonic\n//\n// Fast, lightweight and schema-less search backend\n// Copyright: 2019, Valerian Saliou <valerian@valeriansaliou.name>\n// License: Mozilla Public License v2.0 (MPL v2.0)\n\n// Notice: we do not have stopwords for this language yet.\npub static STOPWORDS_KAN: &[&str] = &[\n    \"ಆ\",\n    \"ಈ\",\n    \"ಅಥವಾ\",\n    \"ಮತ್ತು\",\n    \"ಆದರೆ\",\n    \"ಎಂದು\",\n    \"ಅವರ\",\n    \"ಎಂಬ\",\n    \"ಅವರು\",\n    \"ಬಗ್ಗೆ\",\n    \"ಇದೆ\",\n    \"ಇದು\",\n    \"ಮೂಲಕ\",\n    \"ಅದು\",\n    \"ಮೇಲೆ\",\n    \"ಈಗ\",\n    \"ಹಾಗೂ\",\n    \"ಹೆಚ್ಚು\",\n    \"ಅವರಿಗೆ\",\n    \"ತಮ್ಮ\",\n    \"ಮಾಡಿ\",\n    \"ನಮ್ಮ\",\n    \"ಮಾತ್ರ\",\n    \"ದೊಡ್ಡ\",\n    \"ಅದೇ\",\n    \"ಕೂಡ\",\n    \"ಯಾವುದೇ\",\n    \"ಯಾವ\",\n    \"ಆಗ\",\n    \"ತುಂಬಾ\",\n    \"ನಾವು\",\n    \"ದಿನ\",\n    \"ಬೇರೆ\",\n    \"ಅವರನ್ನು\",\n    \"ಎಲ್ಲಾ\",\n    \"ನೀವು\",\n    \"ಸಾಕಷ್ಟು\",\n    \"ಕನ್ನಡ\",\n    \"ಹೊಸ\",\n    \"ಮುಂದೆ\",\n    \"ಹೇಗೆ\",\n    \"ನಂತರ\",\n    \"ಇಲ್ಲಿ\",\n    \"ಕೆಲಸ\",\n    \"ಬಳಿಕ\",\n    \"ಒಳ್ಳೆಯ\",\n    \"ಹಾಗಾಗಿ\",\n    \"ಜನ\",\n    \"ಅದನ್ನು\",\n    \"ಬಂದ\",\n    \"ಕಾರಣ\",\n    \"ಅವಕಾಶ\",\n    \"ವರ್ಷ\",\n    \"ನಿಮ್ಮ\",\n    \"ಇತ್ತು\",\n    \"ಹೇಳಿ\",\n    \"ಮಾಡಿದ\",\n    \"ಅದಕ್ಕೆ\",\n    \"ಆಗಿ\",\n    \"ಎಂಬುದು\",\n    \"ಅಂತ\",\n    \"ಕೆಲವು\",\n    \"ಮೊದಲು\",\n    \"ಬಂದು\",\n    \"ಇದೇ\",\n    \"ನೋಡಿ\",\n    \"ಕೇವಲ\",\n    \"ಎರಡು\",\n    \"ಇನ್ನು\",\n    \"ಅಷ್ಟೇ\",\n    \"ಎಷ್ಟು\",\n    \"ಮಾಡಬೇಕು\",\n    \"ಹೀಗೆ\",\n    \"ಕುರಿತು\",\n    \"ಎಂದರೆ\",\n    \"ಇನ್ನೂ\",\n    \"ಮತ್ತೆ\",\n    \"ಏನು\",\n    \"ಮುಂದಿನ\",\n    \"ಮಾಡುವ\",\n    \"ವೇಳೆ\",\n    \"ಜೊತೆಗೆ\",\n];\n"
  },
  {
    "path": "src/stopwords/kat.rs",
    "content": "// Sonic\n//\n// Fast, lightweight and schema-less search backend\n// Copyright: 2019, Valerian Saliou <valerian@valeriansaliou.name>\n// License: Mozilla Public License v2.0 (MPL v2.0)\n\npub static STOPWORDS_KAT: &[&str] = &[\n    \"ა.შ.\",\n    \"აგერ\",\n    \"აგრეთვე\",\n    \"ალბათ\",\n    \"ამაზე\",\n    \"ამას\",\n    \"ამასთან\",\n    \"ამასთანავე\",\n    \"ამგვარად\",\n    \"ამდენად\",\n    \"ამით\",\n    \"ამის\",\n    \"ამისთვის\",\n    \"ამიტომ\",\n    \"ამიტომაც\",\n    \"ამჟამად\",\n    \"ამჯერად\",\n    \"ან\",\n    \"ანუ\",\n    \"არ\",\n    \"არა\",\n    \"არადა\",\n    \"არათუ\",\n    \"არამარტო\",\n    \"არამედ\",\n    \"არამხოლოდ\",\n    \"არანაკლებ\",\n    \"არასოდეს\",\n    \"არაუადრეს\",\n    \"არაუგვიანეს\",\n    \"არაუმეტეს\",\n    \"არსად\",\n    \"არსაიდან\",\n    \"არც\",\n    \"არცერთ\",\n    \"ასევე\",\n    \"ასეც\",\n    \"აქამდე\",\n    \"აღარ\",\n    \"აღარც\",\n    \"ბოლოს\",\n    \"ბოლოსკენ\",\n    \"გამო\",\n    \"გამუდმებით\",\n    \"განსაკუთრებით\",\n    \"გარდა\",\n    \"გარეშე\",\n    \"და\",\n    \"დასასრულს\",\n    \"დასაწყისში\",\n    \"დროულად\",\n    \"ე.ი.\",\n    \"ე.წ.\",\n    \"ეგებ\",\n    \"ერთადერთი\",\n    \"ერთადერთმა\",\n    \"ერთ-ერთი\",\n    \"ერთხელ\",\n    \"ესოდე\",\n    \"ვერ\",\n    \"ვითომ\",\n    \"ვინაიდან\",\n    \"ვინძლო\",\n    \"ვისაც\",\n    \"ზემოაღნიშნულმა\",\n    \"ზოგჯერ\",\n    \"თავად\",\n    \"თავადაც\",\n    \"თავადვე\",\n    \"თავდაპირველად\",\n    \"თავიდანვე\",\n    \"თავის მხრივ\",\n    \"თან\",\n    \"თანაც\",\n    \"თანახმადაც\",\n    \"თანდათან\",\n    \"თვით\",\n    \"თვითონ\",\n    \"თვითონაც\",\n    \"თვითონვე\",\n    \"თითოეულმა\",\n    \"თითქოს\",\n    \"თუ\",\n    \"თუკი\",\n    \"თუმცა\",\n    \"თუმცაღა\",\n    \"თუნდაც\",\n    \"იმავდროულად\",\n    \"იმავე\",\n    \"იმან\",\n    \"იმას\",\n    \"იმდენად\",\n    \"იმთავითვე\",\n    \"იმით\",\n    \"იმის\",\n    \"იმისთვის\",\n    \"იმიტომ\",\n    \"ისევე\",\n    \"ისეთი\",\n    \"ისეც\",\n    \"იშვიათად\",\n    \"კერძოდ\",\n    \"კვლავ\",\n    \"კი\",\n    \"კიდევ\",\n    \"მაგალითად\",\n    \"მაგან\",\n    \"მაგას\",\n    \"მაგით\",\n    \"მაგის\",\n    \"მაგრამ\",\n    \"მათი\",\n    \"მაინც\",\n    \"მანამ\",\n    \"მანამდე\",\n    \"მართალია\",\n    \"მარტო\",\n    \"მაშასადამე\",\n    \"მაშინ\",\n    \"მაშინვე\",\n    \"მერე\",\n    \"მეტად\",\n    \"მთელი\",\n    \"მიერ\",\n    \"მით\",\n    \"მიმართ\",\n    \"მისივე\",\n    \"მსგავსი\",\n    \"მხოლოდ\",\n    \"ნაწილობრივ\",\n    \"ნეტავ\",\n    \"ნეტავი\",\n    \"ნუ\",\n    \"ნურასოდეს\",\n    \"ნურც\",\n    \"ნუღარ\",\n    \"ნუღარც\",\n    \"ოდენ\",\n    \"ოდესღაც\",\n    \"ოღონდ\",\n    \"პირველი\",\n    \"პირიქით\",\n    \"პრინციპში\",\n    \"რადგან\",\n    \"რადგანაც\",\n    \"რათა\",\n    \"რაკი\",\n    \"რამდენად\",\n    \"რამდენადაც\",\n    \"რამეთუ\",\n    \"რამენაირად\",\n    \"რამეფრად\",\n    \"რანაირადაც\",\n    \"რასაკვირველია\",\n    \"რასაც\",\n    \"რაღაც\",\n    \"რაც\",\n    \"რითაც\",\n    \"რისთვისაც\",\n    \"როგორადაც\",\n    \"როგორიც\",\n    \"როგორიცაა\",\n    \"როგორღაც\",\n    \"როგორც\",\n    \"როდესაც\",\n    \"როდესღაც\",\n    \"რომ\",\n    \"რომელიმე\",\n    \"რომელიც\",\n    \"რომელსაც\",\n    \"რომლებიც\",\n    \"რომლითაც\",\n    \"რომლის\",\n    \"როცა\",\n    \"საბოლოოდ\",\n    \"სადაც\",\n    \"სადღაც\",\n    \"საერთოდ\",\n    \"სათანადოდ\",\n    \"საიდანაც\",\n    \"სამომავლოდ\",\n    \"სანამ\",\n    \"სანამდე\",\n    \"სრულად\",\n    \"სულ\",\n    \"სწორედ\",\n    \"სხვადასხვა\",\n    \"სხვები\",\n    \"უკვე\",\n    \"უნდა\",\n    \"უსათუოდ\",\n    \"უფრო\",\n    \"უცებ\",\n    \"უცნაურად\",\n    \"ფაქტობრივად\",\n    \"ყველა\",\n    \"ყოველგვარი\",\n    \"ყოველთვის\",\n    \"ყოველი\",\n    \"ყოველივე\",\n    \"შედარებით\",\n    \"შედეგად\",\n    \"შემდგომ\",\n    \"შემდგომში\",\n    \"შემდეგ\",\n    \"შესახებ\",\n    \"შორის\",\n    \"ჩვეულებრივ\",\n    \"წინააღმდეგ\",\n    \"წინაშე\",\n    \"ხან\",\n    \"ხოლმე\",\n    \"ხოლო\",\n    \"ხშირად\",\n    \"ჯერაც\",\n    \"ჯერჯერობით\",\n    \"ამის გარდა\",\n    \"ამის გარეშე\",\n    \"ამის მიუხედავად\",\n    \"ამასთან ერთად\",\n    \"ამის მიხედვით\",\n    \"ამის ნაცვლად\",\n    \"ამის პასუხად\",\n    \"ამასთან შედარებით\",\n    \"ამბობს, რომ\",\n    \"ამ დროს\",\n    \"ამ თემაზე\",\n    \"ამ მიზნით\",\n    \"ამის საპირისპიროდ\",\n    \"ამის გამო\",\n    \"ამ მხრივ\",\n    \"ამის უარსაყოფად\",\n    \"ამის შედეგად\",\n    \"ამ შემთხვევაში\",\n    \"ამავე დროს\",\n    \"ამას გარდა\",\n    \"ამასთან დაკავშირებით\",\n    \"ამის შემდეგ\",\n    \"ამის შესაბამისად\",\n    \"ამის შესახებ\",\n    \"ამისგან განსხვავებით\",\n    \"არა მარტო\",\n    \"არა მხოლოდ\",\n    \"არა უადრეს\",\n    \"არა უგვიანეს\",\n    \"არც ერთი\",\n    \"არც კი\",\n    \"არც მეორე\",\n    \"ასე ვთქვათ\",\n    \"ასე მაგალითად\",\n    \"ასე რომ\",\n    \"ასე შემდეგ\",\n    \"ასევე განიხილავს\",\n    \"აქედან გამომდინარე\",\n    \"აქედან დასკვნა\",\n    \"აღნიშნა რომ\",\n    \"აღნიშნულთან დაკავშირებით\",\n    \"აცხადებს რომ\",\n    \"ბოლო ერთი\",\n    \"ბოლო პერიოდში\",\n    \"ბოლო წლებში\",\n    \"გამოთქვა იმედი\",\n    \"განაცხადა, რომ\",\n    \"განმარტა, რომ\",\n    \"გარდა ამისა\",\n    \"გარშემო არსებული\",\n    \"და სხვ.\",\n    \"და სხვა\",\n    \"დაადასტურა, რომ\",\n    \"ეგრეთ წოდებული\",\n    \"ეგრეთ წოდებულმა\",\n    \"ერთი თვალსაზრისით\",\n    \"ერთი მხრივ\",\n    \"ერთის მხრივ\",\n    \"ეს კი\",\n    \"ესე იგი\",\n    \"ვიდრე არ\",\n    \"თავიდან ბოლომდე\",\n    \"თუ რამდენად\",\n    \"თუ როგორ\",\n    \"იგივეა რაც\",\n    \"იმ შემთხვევაში\",\n    \"იმაზე მეტი\",\n    \"იმაზე, რომ\",\n    \"იმას, რომ\",\n    \"იმასთან დაკავშირებით\",\n    \"იმდენად რამდენადაც\",\n    \"იმედი გამოთქვა\",\n    \"იმის გამო\",\n    \"იმის თაობაზე\",\n    \"იმის საწინააღმდეგოდ\",\n    \"იმისათვის, რომ\",\n    \"იმისთვის, რათა\",\n    \"იმისთვის, რომ\",\n    \"იმიტომ, რომ\",\n    \"ის, რომელიც\",\n    \"ისე როგორც\",\n    \"ისე, რომ\",\n    \"ისევე როგორც\",\n    \"ისეთი როგორიც\",\n    \"იქიდან გამომდინარე\",\n    \"კიდევ ერთხელ\",\n    \"მაგრამ თუ\",\n    \"მათ შორის\",\n    \"მათი ვარაუდით\",\n    \"მანამ, სანამ\",\n    \"მას შემდეგ\",\n    \"მაშინ, როცა\",\n    \"მაშინაც კი\",\n    \"მეორე მხრივ\",\n    \"მეორეც ერთი\",\n    \"მერე მეორე\",\n    \"მით უფრო\",\n    \"მიიჩნევს, რომ\",\n    \"მისი განმარტებით\",\n    \"მისი თქმით\",\n    \"მისივე თქმით\",\n    \"მიუხედავად ამისა\",\n    \"ნურც კი\",\n    \"პირველ რიგში\",\n    \"რა დროსაც\",\n    \"რა მიზეზითაც\",\n    \"რაც შეეხება\",\n    \"რაც შეიძლება\",\n    \"რის გამოც\",\n    \"რის საფუძველზედაც\",\n    \"რის საფუძველზეც\",\n    \"რის შედეგადაც\",\n    \"რის შემდეგაც\",\n    \"როგორც კი\",\n    \"რომ არა\",\n    \"რომ თუ\",\n    \"რომელთა გამოც\",\n    \"რომლის თანახმად\",\n    \"რომლის თანახმადაც\",\n    \"რომლის მიხედვითაც\",\n    \"რომლის შესახებ\",\n    \"საკითხთან დაკავშირებით\",\n    \"სულ მცირე\",\n    \"სულ ცოტა\",\n    \"სხვა კუთხით\",\n    \"სხვა მხრივ\",\n    \"სხვა რამ\",\n    \"სხვათა შორის\",\n    \"უფრო მეტიც\",\n    \"ყოველივე ეს\",\n    \"შემდეგ უკვე\",\n    \"ჩვენი განცხადებით\",\n    \"ჯერ ერთი\",\n    \"ჯერ კიდევ\",\n    \"ამ ბოლო დროს\",\n    \"ამა თუ იმ\",\n    \"ასე თუ ისე\",\n    \"აქედან ჩანს, რომ\",\n    \"ბოლოს და ბოლოს\",\n    \"გამომდინარე იქიდან, რომ\",\n    \"და ასე შემდეგ\",\n    \"ვინაიდან და რადგანაც\",\n    \"თუ რის საფუძველზე\",\n    \"იმის გათვალისწინებით, რომ\",\n    \"იმის გამო, რომ\",\n    \"იმის ნაცვლად, რომ\",\n    \"ისევ და ისევ\",\n    \"იქვე აღნიშნა, რომ\",\n    \"იქიდან გამომდინარე, რომ\",\n    \"კიდევ და კიდევ\",\n    \"მაინც და მაინც\",\n    \"მას შემდეგ, რაც\",\n    \"მიუხედავად იმისა, თუ\",\n    \"მიუხედავად იმისა, რომ\",\n    \"როგორც უკვე ითქვა\",\n    \"როდის და რატომ\",\n    \"უფრო და უფრო\",\n];\n"
  },
  {
    "path": "src/stopwords/khm.rs",
    "content": "// Sonic\n//\n// Fast, lightweight and schema-less search backend\n// Copyright: 2019, Valerian Saliou <valerian@valeriansaliou.name>\n// License: Mozilla Public License v2.0 (MPL v2.0)\n\npub static STOPWORDS_KHM: &[&str] = &[\n    \"ៗ\",\n    \"។ល។\",\n    \"៚\",\n    \"។\",\n    \"៕\",\n    \"៖\",\n    \"៙\",\n    \"០\",\n    \"១\",\n    \"២\",\n    \"៣\",\n    \"៤\",\n    \"៥\",\n    \"៦\",\n    \"៧\",\n    \"៨\",\n    \"៩\",\n    \"៛\",\n    \"នេះ\",\n    \"នោះ\",\n    \"ខ្ញុំ\",\n    \"អ្នក\",\n    \"គាត់\",\n    \"នាង\",\n    \"ពួក\",\n    \"យើង\",\n    \"ពួកគេ\",\n    \"លោក\",\n    \"អ្វី\",\n    \"បាន\",\n    \"ការ\",\n    \"នៅ\",\n    \"និង\",\n    \"ដែល\",\n    \"មាន\",\n    \"ជា\",\n    \"ថា\",\n    \"ក្នុង\",\n    \"របស់\",\n    \"ពី\",\n    \"មួយ\",\n    \"នឹង\",\n    \"ឲ្យ\",\n    \"មិន\",\n    \"ទៅ\",\n    \"តែ\",\n    \"ត្រូវ\",\n    \"ដោយ\",\n    \"ហើយ\",\n    \"ឆ្នាំ\",\n    \"ពេល\",\n    \"គេ\",\n    \"ប្រទេស\",\n    \"អាច\",\n    \"គឺ\",\n    \"ក្រុម\",\n    \"ធ្វើ\",\n    \"ក៏\",\n    \"លើ\",\n    \"នៃ\",\n    \"ដើម្បី\",\n    \"មក\",\n    \"ទី\",\n    \"តាម\",\n    \"ទេ\",\n    \"ដល់\",\n    \"វា\",\n    \"ដែរ\",\n    \"ខ្លួន\",\n    \"សម្រាប់\",\n    \"ក្រុមហ៊ុន\",\n    \"ថ្ងៃ\",\n    \"ចំនួន\",\n    \"កម្ពុជា\",\n    \"ឡើង\",\n    \"ទៀត\",\n    \"ទាំង\",\n    \"បើ\",\n    \"និយាយ\",\n    \"ទទួល\",\n    \"ដ៏\",\n    \"ច្រើន\",\n    \"ផង\",\n    \"ដឹង\",\n    \"ជាមួយ\",\n    \"គ្នា\",\n    \"ខែ\",\n    \"នាក់\",\n    \"កំពុង\",\n    \"យ៉ាង\",\n    \"តម្លៃ\",\n    \"ប្រកួត\",\n    \"ក្រុង\",\n    \"តំបន់\",\n    \"ភាព\",\n    \"យក\",\n    \"ជាង\",\n    \"ចូល\",\n    \"នូវ\",\n    \"កាលពី\",\n    \"ណា\",\n    \"បន្ត\",\n    \"ជាតិ\",\n    \"រូប\",\n    \"មនុស្ស\",\n    \"កាល\",\n    \"ចំពោះ\",\n    \"ដូច\",\n    \"ខណៈ\",\n    \"វិញ\",\n    \"មុន\",\n    \"ភ្នំពេញ\",\n    \"លើក\",\n    \"ល្អ\",\n    \"ខាង\",\n    \"ដុល្លារ\",\n    \"ឃើញ\",\n    \"បញ្ហា\",\n    \"ប្រើ\",\n    \"ចាប់\",\n    \"ទឹក\",\n    \"តើ\",\n    \"ប្រាក់\",\n    \"ធំ\",\n    \"ខ្មែរ\",\n    \"ចេញ\",\n    \"ខេត្ត\",\n    \"ផ្នែក\",\n    \"ថ្មី\",\n    \"បង្ហាញ\",\n    \"ស៊ី\",\n    \"អាមេរិក\",\n    \"គឺជា\",\n    \"លក់\",\n    \"ចង់\",\n    \"ដាក់\",\n    \"ម្នាក់\",\n    \"រួម\",\n    \"រថយន្ត\",\n    \"ផ្លូវ\",\n    \"ភាគរយ\",\n    \"កើន\",\n    \"ជួយ\",\n    \"ពីរ\",\n    \"លាន\",\n    \"ផ្តល់\",\n    \"រដ្ឋ\",\n    \"ខ្លាំង\",\n    \"ជាច្រើន\",\n    \"ទីក្រុង\",\n    \"ជន\",\n    \"កីឡា\",\n    \"ក្រោយ\",\n    \"ប្រាប់\",\n    \"រដ្ឋាភិបាល\",\n    \"កាន់\",\n    \"ការងារ\",\n    \"រក\",\n    \"ព្រោះ\",\n    \"រឿង\",\n    \"ប៉ុន្តែ\",\n    \"ឡើយ\",\n    \"មុខ\",\n    \"ថ្លែង\",\n    \"ធ្វើឲ្យ\",\n    \"បី\",\n    \"នាំ\",\n    \"ច្បាប់\",\n    \"ដី\",\n    \"ដូចជា\",\n    \"កម\",\n    \"ផ្ទះ\",\n    \"បញ្ជាក់\",\n    \"ចុះ\",\n    \"បំផុត\",\n    \"ចិត្ត\",\n    \"បែប\",\n    \"ចិន\",\n    \"កីឡាករ\",\n    \"កញ្ញា\",\n    \"គម្រោង\",\n    \"បង្កើត\",\n    \"នា\",\n    \"សារ\",\n    \"សេដ្ឋកិច្ច\",\n    \"ធនាគារ\",\n    \"អស់\",\n    \"ភាគ\",\n    \"កូន\",\n    \"ប្រធាន\",\n    \"ផ្សារ\",\n    \"ខ្ពស់\",\n    \"គ្មាន\",\n    \"ណាស់\",\n    \"សម្រេច\",\n    \"គួរ\",\n    \"គ្រប់\",\n    \"ប្រជាជន\",\n    \"បន្ថែម\",\n    \"រយៈ\",\n    \"ខ្លះ\",\n    \"បទ\",\n    \"ទិញ\",\n    \"ទើប\",\n    \"វិនិយោគ\",\n    \"មានការ\",\n    \"លេខ\",\n    \"ថៃ\",\n    \"មើល\",\n    \"បុរស\",\n    \"យុវជន\",\n    \"ស្រី\",\n    \"នយោបាយ\",\n    \"កន្លែង\",\n    \"គិត\",\n    \"បើក\",\n    \"ដូច្នេះ\",\n    \"រូបថត\",\n    \"វាយ\",\n    \"ប្រភេទ\",\n    \"សំខាន់\",\n    \"បន្ទាប់ពី\",\n    \"កម្មវិធី\",\n    \"រយៈពេល\",\n    \"ផលិត\",\n    \"ឈ្នះ\",\n    \"ពិភពលោក\",\n    \"ភ្ញៀវ\",\n    \"ដោយសារ\",\n    \"ស្រុក\",\n    \"អាយុ\",\n    \"ចំណាយ\",\n    \"អំពី\",\n    \"ហ៊ុន\",\n    \"សិក្សា\",\n];\n"
  },
  {
    "path": "src/stopwords/kor.rs",
    "content": "// Sonic\n//\n// Fast, lightweight and schema-less search backend\n// Copyright: 2019, Valerian Saliou <valerian@valeriansaliou.name>\n// License: Mozilla Public License v2.0 (MPL v2.0)\n\npub static STOPWORDS_KOR: &[&str] = &[\n    \"!\",\n    \"\\\"\",\n    \"$\",\n    \"%\",\n    \"&\",\n    \"'\",\n    \"(\",\n    \")\",\n    \"*\",\n    \"+\",\n    \",\",\n    \"-\",\n    \".\",\n    \"...\",\n    \"0\",\n    \"1\",\n    \"2\",\n    \"3\",\n    \"4\",\n    \"5\",\n    \"6\",\n    \"7\",\n    \"8\",\n    \"9\",\n    \";\",\n    \"<\",\n    \"=\",\n    \">\",\n    \"?\",\n    \"@\",\n    \"\\\\\",\n    \"^\",\n    \"_\",\n    \"`\",\n    \"|\",\n    \"~\",\n    \"·\",\n    \"—\",\n    \"——\",\n    \"‘\",\n    \"’\",\n    \"“\",\n    \"”\",\n    \"…\",\n    \"、\",\n    \"。\",\n    \"〈\",\n    \"〉\",\n    \"《\",\n    \"》\",\n    \"가\",\n    \"가까스로\",\n    \"가령\",\n    \"각\",\n    \"각각\",\n    \"각자\",\n    \"각종\",\n    \"갖고말하자면\",\n    \"같다\",\n    \"같이\",\n    \"개의치않고\",\n    \"거니와\",\n    \"거바\",\n    \"거의\",\n    \"것\",\n    \"것과 같이\",\n    \"것들\",\n    \"게다가\",\n    \"게우다\",\n    \"겨우\",\n    \"견지에서\",\n    \"결과에 이르다\",\n    \"결국\",\n    \"결론을 낼 수 있다\",\n    \"겸사겸사\",\n    \"고려하면\",\n    \"고로\",\n    \"곧\",\n    \"공동으로\",\n    \"과\",\n    \"과연\",\n    \"관계가 있다\",\n    \"관계없이\",\n    \"관련이 있다\",\n    \"관하여\",\n    \"관한\",\n    \"관해서는\",\n    \"구\",\n    \"구체적으로\",\n    \"구토하다\",\n    \"그\",\n    \"그들\",\n    \"그때\",\n    \"그래\",\n    \"그래도\",\n    \"그래서\",\n    \"그러나\",\n    \"그러니\",\n    \"그러니까\",\n    \"그러면\",\n    \"그러므로\",\n    \"그러한즉\",\n    \"그런 까닭에\",\n    \"그런데\",\n    \"그런즉\",\n    \"그럼\",\n    \"그럼에도 불구하고\",\n    \"그렇게 함으로써\",\n    \"그렇지\",\n    \"그렇지 않다면\",\n    \"그렇지 않으면\",\n    \"그렇지만\",\n    \"그렇지않으면\",\n    \"그리고\",\n    \"그리하여\",\n    \"그만이다\",\n    \"그에 따르는\",\n    \"그위에\",\n    \"그저\",\n    \"그중에서\",\n    \"그치지 않다\",\n    \"근거로\",\n    \"근거하여\",\n    \"기대여\",\n    \"기점으로\",\n    \"기준으로\",\n    \"기타\",\n    \"까닭으로\",\n    \"까악\",\n    \"까지\",\n    \"까지 미치다\",\n    \"까지도\",\n    \"꽈당\",\n    \"끙끙\",\n    \"끼익\",\n    \"나\",\n    \"나머지는\",\n    \"남들\",\n    \"남짓\",\n    \"너\",\n    \"너희\",\n    \"너희들\",\n    \"네\",\n    \"넷\",\n    \"년\",\n    \"논하지 않다\",\n    \"놀라다\",\n    \"누가 알겠는가\",\n    \"누구\",\n    \"다른\",\n    \"다른 방면으로\",\n    \"다만\",\n    \"다섯\",\n    \"다소\",\n    \"다수\",\n    \"다시 말하자면\",\n    \"다시말하면\",\n    \"다음\",\n    \"다음에\",\n    \"다음으로\",\n    \"단지\",\n    \"답다\",\n    \"당신\",\n    \"당장\",\n    \"대로 하다\",\n    \"대하면\",\n    \"대하여\",\n    \"대해 말하자면\",\n    \"대해서\",\n    \"댕그\",\n    \"더구나\",\n    \"더군다나\",\n    \"더라도\",\n    \"더불어\",\n    \"더욱더\",\n    \"더욱이는\",\n    \"도달하다\",\n    \"도착하다\",\n    \"동시에\",\n    \"동안\",\n    \"된바에야\",\n    \"된이상\",\n    \"두번째로\",\n    \"둘\",\n    \"둥둥\",\n    \"뒤따라\",\n    \"뒤이어\",\n    \"든간에\",\n    \"들\",\n    \"등\",\n    \"등등\",\n    \"딩동\",\n    \"따라\",\n    \"따라서\",\n    \"따위\",\n    \"따지지 않다\",\n    \"딱\",\n    \"때\",\n    \"때가 되어\",\n    \"때문에\",\n    \"또\",\n    \"또한\",\n    \"뚝뚝\",\n    \"라 해도\",\n    \"령\",\n    \"로\",\n    \"로 인하여\",\n    \"로부터\",\n    \"로써\",\n    \"륙\",\n    \"를\",\n    \"마음대로\",\n    \"마저\",\n    \"마저도\",\n    \"마치\",\n    \"막론하고\",\n    \"만 못하다\",\n    \"만약\",\n    \"만약에\",\n    \"만은 아니다\",\n    \"만이 아니다\",\n    \"만일\",\n    \"만큼\",\n    \"말하자면\",\n    \"말할것도 없고\",\n    \"매\",\n    \"매번\",\n    \"메쓰겁다\",\n    \"몇\",\n    \"모\",\n    \"모두\",\n    \"무렵\",\n    \"무릎쓰고\",\n    \"무슨\",\n    \"무엇\",\n    \"무엇때문에\",\n    \"물론\",\n    \"및\",\n    \"바꾸어말하면\",\n    \"바꾸어말하자면\",\n    \"바꾸어서 말하면\",\n    \"바꾸어서 한다면\",\n    \"바꿔 말하면\",\n    \"바로\",\n    \"바와같이\",\n    \"밖에 안된다\",\n    \"반대로\",\n    \"반대로 말하자면\",\n    \"반드시\",\n    \"버금\",\n    \"보는데서\",\n    \"보다더\",\n    \"보드득\",\n    \"본대로\",\n    \"봐\",\n    \"봐라\",\n    \"부류의 사람들\",\n    \"부터\",\n    \"불구하고\",\n    \"불문하고\",\n    \"붕붕\",\n    \"비걱거리다\",\n    \"비교적\",\n    \"비길수 없다\",\n    \"비로소\",\n    \"비록\",\n    \"비슷하다\",\n    \"비추어 보아\",\n    \"비하면\",\n    \"뿐만 아니라\",\n    \"뿐만아니라\",\n    \"뿐이다\",\n    \"삐걱\",\n    \"삐걱거리다\",\n    \"사\",\n    \"삼\",\n    \"상대적으로 말하자면\",\n    \"생각한대로\",\n    \"설령\",\n    \"설마\",\n    \"설사\",\n    \"셋\",\n    \"소생\",\n    \"소인\",\n    \"솨\",\n    \"쉿\",\n    \"습니까\",\n    \"습니다\",\n    \"시각\",\n    \"시간\",\n    \"시작하여\",\n    \"시초에\",\n    \"시키다\",\n    \"실로\",\n    \"심지어\",\n    \"아\",\n    \"아니\",\n    \"아니나다를가\",\n    \"아니라면\",\n    \"아니면\",\n    \"아니었다면\",\n    \"아래윗\",\n    \"아무거나\",\n    \"아무도\",\n    \"아야\",\n    \"아울러\",\n    \"아이\",\n    \"아이고\",\n    \"아이구\",\n    \"아이야\",\n    \"아이쿠\",\n    \"아하\",\n    \"아홉\",\n    \"안 그러면\",\n    \"않기 위하여\",\n    \"않기 위해서\",\n    \"알 수 있다\",\n    \"알았어\",\n    \"앗\",\n    \"앞에서\",\n    \"앞의것\",\n    \"야\",\n    \"약간\",\n    \"양자\",\n    \"어\",\n    \"어기여차\",\n    \"어느\",\n    \"어느 년도\",\n    \"어느것\",\n    \"어느곳\",\n    \"어느때\",\n    \"어느쪽\",\n    \"어느해\",\n    \"어디\",\n    \"어때\",\n    \"어떠한\",\n    \"어떤\",\n    \"어떤것\",\n    \"어떤것들\",\n    \"어떻게\",\n    \"어떻해\",\n    \"어이\",\n    \"어째서\",\n    \"어쨋든\",\n    \"어쩔수 없다\",\n    \"어찌\",\n    \"어찌됏든\",\n    \"어찌됏어\",\n    \"어찌하든지\",\n    \"어찌하여\",\n    \"언제\",\n    \"언젠가\",\n    \"얼마\",\n    \"얼마 안 되는 것\",\n    \"얼마간\",\n    \"얼마나\",\n    \"얼마든지\",\n    \"얼마만큼\",\n    \"얼마큼\",\n    \"엉엉\",\n    \"에\",\n    \"에 가서\",\n    \"에 달려 있다\",\n    \"에 대해\",\n    \"에 있다\",\n    \"에 한하다\",\n    \"에게\",\n    \"에서\",\n    \"여\",\n    \"여기\",\n    \"여덟\",\n    \"여러분\",\n    \"여보시오\",\n    \"여부\",\n    \"여섯\",\n    \"여전히\",\n    \"여차\",\n    \"연관되다\",\n    \"연이서\",\n    \"영\",\n    \"영차\",\n    \"옆사람\",\n    \"예\",\n    \"예를 들면\",\n    \"예를 들자면\",\n    \"예컨대\",\n    \"예하면\",\n    \"오\",\n    \"오로지\",\n    \"오르다\",\n    \"오자마자\",\n    \"오직\",\n    \"오호\",\n    \"오히려\",\n    \"와\",\n    \"와 같은 사람들\",\n    \"와르르\",\n    \"와아\",\n    \"왜\",\n    \"왜냐하면\",\n    \"외에도\",\n    \"요만큼\",\n    \"요만한 것\",\n    \"요만한걸\",\n    \"요컨대\",\n    \"우르르\",\n    \"우리\",\n    \"우리들\",\n    \"우선\",\n    \"우에 종합한것과같이\",\n    \"운운\",\n    \"월\",\n    \"위에서 서술한바와같이\",\n    \"위하여\",\n    \"위해서\",\n    \"윙윙\",\n    \"육\",\n    \"으로\",\n    \"으로 인하여\",\n    \"으로서\",\n    \"으로써\",\n    \"을\",\n    \"응\",\n    \"응당\",\n    \"의\",\n    \"의거하여\",\n    \"의지하여\",\n    \"의해\",\n    \"의해되다\",\n    \"의해서\",\n    \"이\",\n    \"이 되다\",\n    \"이 때문에\",\n    \"이 밖에\",\n    \"이 외에\",\n    \"이 정도의\",\n    \"이것\",\n    \"이곳\",\n    \"이때\",\n    \"이라면\",\n    \"이래\",\n    \"이러이러하다\",\n    \"이러한\",\n    \"이런\",\n    \"이럴정도로\",\n    \"이렇게 많은 것\",\n    \"이렇게되면\",\n    \"이렇게말하자면\",\n    \"이렇구나\",\n    \"이로 인하여\",\n    \"이르기까지\",\n    \"이리하여\",\n    \"이만큼\",\n    \"이번\",\n    \"이봐\",\n    \"이상\",\n    \"이어서\",\n    \"이었다\",\n    \"이와 같다\",\n    \"이와 같은\",\n    \"이와 반대로\",\n    \"이와같다면\",\n    \"이외에도\",\n    \"이용하여\",\n    \"이유만으로\",\n    \"이젠\",\n    \"이지만\",\n    \"이쪽\",\n    \"이천구\",\n    \"이천육\",\n    \"이천칠\",\n    \"이천팔\",\n    \"인 듯하다\",\n    \"인젠\",\n    \"일\",\n    \"일것이다\",\n    \"일곱\",\n    \"일단\",\n    \"일때\",\n    \"일반적으로\",\n    \"일지라도\",\n    \"임에 틀림없다\",\n    \"입각하여\",\n    \"입장에서\",\n    \"잇따라\",\n    \"있다\",\n    \"자\",\n    \"자기\",\n    \"자기집\",\n    \"자마자\",\n    \"자신\",\n    \"잠깐\",\n    \"잠시\",\n    \"저\",\n    \"저것\",\n    \"저것만큼\",\n    \"저기\",\n    \"저쪽\",\n    \"저희\",\n    \"전부\",\n    \"전자\",\n    \"전후\",\n    \"점에서 보아\",\n    \"정도에 이르다\",\n    \"제\",\n    \"제각기\",\n    \"제외하고\",\n    \"조금\",\n    \"조차\",\n    \"조차도\",\n    \"졸졸\",\n    \"좀\",\n    \"좋아\",\n    \"좍좍\",\n    \"주룩주룩\",\n    \"주저하지 않고\",\n    \"줄은 몰랏다\",\n    \"줄은모른다\",\n    \"중에서\",\n    \"중의하나\",\n    \"즈음하여\",\n    \"즉\",\n    \"즉시\",\n    \"지든지\",\n    \"지만\",\n    \"지말고\",\n    \"진짜로\",\n    \"쪽으로\",\n    \"차라리\",\n    \"참\",\n    \"참나\",\n    \"첫번째로\",\n    \"쳇\",\n    \"총적으로\",\n    \"총적으로 말하면\",\n    \"총적으로 보면\",\n    \"칠\",\n    \"콸콸\",\n    \"쾅쾅\",\n    \"쿵\",\n    \"타다\",\n    \"타인\",\n    \"탕탕\",\n    \"토하다\",\n    \"통하여\",\n    \"툭\",\n    \"퉤\",\n    \"틈타\",\n    \"팍\",\n    \"팔\",\n    \"퍽\",\n    \"펄렁\",\n    \"하\",\n    \"하게될것이다\",\n    \"하게하다\",\n    \"하겠는가\",\n    \"하고 있다\",\n    \"하고있었다\",\n    \"하곤하였다\",\n    \"하구나\",\n    \"하기 때문에\",\n    \"하기 위하여\",\n    \"하기는한데\",\n    \"하기만 하면\",\n    \"하기보다는\",\n    \"하기에\",\n    \"하나\",\n    \"하느니\",\n    \"하는 김에\",\n    \"하는 편이 낫다\",\n    \"하는것도\",\n    \"하는것만 못하다\",\n    \"하는것이 낫다\",\n    \"하는바\",\n    \"하더라도\",\n    \"하도다\",\n    \"하도록시키다\",\n    \"하도록하다\",\n    \"하든지\",\n    \"하려고하다\",\n    \"하마터면\",\n    \"하면 할수록\",\n    \"하면된다\",\n    \"하면서\",\n    \"하물며\",\n    \"하여금\",\n    \"하여야\",\n    \"하자마자\",\n    \"하지 않는다면\",\n    \"하지 않도록\",\n    \"하지마\",\n    \"하지마라\",\n    \"하지만\",\n    \"하하\",\n    \"한 까닭에\",\n    \"한 이유는\",\n    \"한 후\",\n    \"한다면\",\n    \"한다면 몰라도\",\n    \"한데\",\n    \"한마디\",\n    \"한적이있다\",\n    \"한켠으로는\",\n    \"한항목\",\n    \"할 따름이다\",\n    \"할 생각이다\",\n    \"할 줄 안다\",\n    \"할 지경이다\",\n    \"할 힘이 있다\",\n    \"할때\",\n    \"할만하다\",\n    \"할망정\",\n    \"할뿐\",\n    \"할수있다\",\n    \"할수있어\",\n    \"할줄알다\",\n    \"할지라도\",\n    \"할지언정\",\n    \"함께\",\n    \"해도된다\",\n    \"해도좋다\",\n    \"해봐요\",\n    \"해서는 안된다\",\n    \"해야한다\",\n    \"해요\",\n    \"했어요\",\n    \"향하다\",\n    \"향하여\",\n    \"향해서\",\n    \"허\",\n    \"허걱\",\n    \"허허\",\n    \"헉\",\n    \"헉헉\",\n    \"헐떡헐떡\",\n    \"형식으로 쓰여\",\n    \"혹시\",\n    \"혹은\",\n    \"혼자\",\n    \"훨씬\",\n    \"휘익\",\n    \"휴\",\n    \"흐흐\",\n    \"흥\",\n    \"힘입어\",\n    \"︿\",\n    \"！\",\n    \"＃\",\n    \"＄\",\n    \"％\",\n    \"＆\",\n    \"（\",\n    \"）\",\n    \"＊\",\n    \"＋\",\n    \"，\",\n    \"０\",\n    \"１\",\n    \"２\",\n    \"３\",\n    \"４\",\n    \"５\",\n    \"６\",\n    \"７\",\n    \"８\",\n    \"９\",\n    \"：\",\n    \"；\",\n    \"＜\",\n    \"＞\",\n    \"？\",\n    \"＠\",\n    \"［\",\n    \"］\",\n    \"｛\",\n    \"｜\",\n    \"｝\",\n    \"～\",\n    \"￥\",\n];\n"
  },
  {
    "path": "src/stopwords/lat.rs",
    "content": "// Sonic\n//\n// Fast, lightweight and schema-less search backend\n// Copyright: 2019, Valerian Saliou <valerian@valeriansaliou.name>\n// License: Mozilla Public License v2.0 (MPL v2.0)\n\n// Notice: we do not have stopwords for this language yet.\npub static STOPWORDS_LAT: &[&str] = &[\n    \"a\", \"ab\", \"ac\", \"ad\", \"at\", \"atque\", \"aut\", \"autem\", \"cum\", \"de\", \"dum\", \"e\", \"erant\", \"erat\",\n    \"est\", \"et\", \"etiam\", \"ex\", \"haec\", \"hic\", \"hoc\", \"in\", \"ita\", \"me\", \"nec\", \"neque\", \"non\",\n    \"per\", \"qua\", \"quae\", \"quam\", \"qui\", \"quibus\", \"quidem\", \"quo\", \"quod\", \"re\", \"rebus\", \"rem\",\n    \"res\", \"sed\", \"si\", \"sic\", \"sunt\", \"tamen\", \"tandem\", \"te\", \"ut\", \"vel\",\n];\n"
  },
  {
    "path": "src/stopwords/lav.rs",
    "content": "// Sonic\n//\n// Fast, lightweight and schema-less search backend\n// Copyright: 2019, Valerian Saliou <valerian@valeriansaliou.name>\n// License: Mozilla Public License v2.0 (MPL v2.0)\n\npub static STOPWORDS_LAV: &[&str] = &[\n    \"aiz\",\n    \"ap\",\n    \"apakš\",\n    \"apakšpus\",\n    \"ar\",\n    \"arī\",\n    \"augšpus\",\n    \"bet\",\n    \"bez\",\n    \"bija\",\n    \"biji\",\n    \"biju\",\n    \"bijām\",\n    \"bijāt\",\n    \"būs\",\n    \"būsi\",\n    \"būsiet\",\n    \"būsim\",\n    \"būt\",\n    \"būšu\",\n    \"caur\",\n    \"diemžēl\",\n    \"diezin\",\n    \"droši\",\n    \"dēļ\",\n    \"esam\",\n    \"esat\",\n    \"esi\",\n    \"esmu\",\n    \"gan\",\n    \"gar\",\n    \"iekam\",\n    \"iekams\",\n    \"iekām\",\n    \"iekāms\",\n    \"iekš\",\n    \"iekšpus\",\n    \"ik\",\n    \"ir\",\n    \"it\",\n    \"itin\",\n    \"iz\",\n    \"ja\",\n    \"jau\",\n    \"jeb\",\n    \"jebšu\",\n    \"jel\",\n    \"jo\",\n    \"jā\",\n    \"ka\",\n    \"kamēr\",\n    \"kaut\",\n    \"kolīdz\",\n    \"kopš\",\n    \"kā\",\n    \"kļuva\",\n    \"kļuvi\",\n    \"kļuvu\",\n    \"kļuvām\",\n    \"kļuvāt\",\n    \"kļūs\",\n    \"kļūsi\",\n    \"kļūsiet\",\n    \"kļūsim\",\n    \"kļūst\",\n    \"kļūstam\",\n    \"kļūstat\",\n    \"kļūsti\",\n    \"kļūstu\",\n    \"kļūt\",\n    \"kļūšu\",\n    \"labad\",\n    \"lai\",\n    \"lejpus\",\n    \"līdz\",\n    \"līdzko\",\n    \"ne\",\n    \"nebūt\",\n    \"nedz\",\n    \"nekā\",\n    \"nevis\",\n    \"nezin\",\n    \"no\",\n    \"nu\",\n    \"nē\",\n    \"otrpus\",\n    \"pa\",\n    \"par\",\n    \"pat\",\n    \"pie\",\n    \"pirms\",\n    \"pret\",\n    \"priekš\",\n    \"pār\",\n    \"pēc\",\n    \"starp\",\n    \"tad\",\n    \"tak\",\n    \"tapi\",\n    \"taps\",\n    \"tapsi\",\n    \"tapsiet\",\n    \"tapsim\",\n    \"tapt\",\n    \"tapāt\",\n    \"tapšu\",\n    \"taču\",\n    \"te\",\n    \"tiec\",\n    \"tiek\",\n    \"tiekam\",\n    \"tiekat\",\n    \"tieku\",\n    \"tik\",\n    \"tika\",\n    \"tikai\",\n    \"tiki\",\n    \"tikko\",\n    \"tiklab\",\n    \"tiklīdz\",\n    \"tiks\",\n    \"tiksiet\",\n    \"tiksim\",\n    \"tikt\",\n    \"tiku\",\n    \"tikvien\",\n    \"tikām\",\n    \"tikāt\",\n    \"tikšu\",\n    \"tomēr\",\n    \"topat\",\n    \"turpretim\",\n    \"turpretī\",\n    \"tā\",\n    \"tādēļ\",\n    \"tālab\",\n    \"tāpēc\",\n    \"un\",\n    \"uz\",\n    \"vai\",\n    \"var\",\n    \"varat\",\n    \"varēja\",\n    \"varēji\",\n    \"varēju\",\n    \"varējām\",\n    \"varējāt\",\n    \"varēs\",\n    \"varēsi\",\n    \"varēsiet\",\n    \"varēsim\",\n    \"varēt\",\n    \"varēšu\",\n    \"vien\",\n    \"virs\",\n    \"virspus\",\n    \"vis\",\n    \"viņpus\",\n    \"zem\",\n    \"ārpus\",\n    \"šaipus\",\n];\n"
  },
  {
    "path": "src/stopwords/lit.rs",
    "content": "// Sonic\n//\n// Fast, lightweight and schema-less search backend\n// Copyright: 2019, Valerian Saliou <valerian@valeriansaliou.name>\n// License: Mozilla Public License v2.0 (MPL v2.0)\n\npub static STOPWORDS_LIT: &[&str] = &[\n    \"abi\",\n    \"abidvi\",\n    \"abiejose\",\n    \"abiejuose\",\n    \"abiejø\",\n    \"abiem\",\n    \"abigaliai\",\n    \"abipus\",\n    \"abu\",\n    \"abudu\",\n    \"ai\",\n    \"ana\",\n    \"anaiptol\",\n    \"anaisiais\",\n    \"anajai\",\n    \"anajam\",\n    \"anajame\",\n    \"anapus\",\n    \"anas\",\n    \"anasai\",\n    \"anasis\",\n    \"anei\",\n    \"aniedvi\",\n    \"anieji\",\n    \"aniesiems\",\n    \"anoji\",\n    \"anojo\",\n    \"anojoje\",\n    \"anokia\",\n    \"anoks\",\n    \"anosiomis\",\n    \"anosioms\",\n    \"anosios\",\n    \"anosiose\",\n    \"anot\",\n    \"ant\",\n    \"antai\",\n    \"anuodu\",\n    \"anuoju\",\n    \"anuosiuose\",\n    \"anuosius\",\n    \"anàja\",\n    \"anàjà\",\n    \"anàjá\",\n    \"anàsias\",\n    \"anøjø\",\n    \"apie\",\n    \"aplink\",\n    \"ar\",\n    \"arba\",\n    \"argi\",\n    \"arti\",\n    \"aukðèiau\",\n    \"að\",\n    \"be\",\n    \"bei\",\n    \"beje\",\n    \"bemaþ\",\n    \"bent\",\n    \"bet\",\n    \"betgi\",\n    \"beveik\",\n    \"dar\",\n    \"dargi\",\n    \"daugmaþ\",\n    \"deja\",\n    \"dëka\",\n    \"dël\",\n    \"dëlei\",\n    \"dëlto\",\n    \"ech\",\n    \"et\",\n    \"gal\",\n    \"galbût\",\n    \"galgi\",\n    \"gan\",\n    \"gana\",\n    \"gi\",\n    \"greta\",\n    \"idant\",\n    \"iki\",\n    \"ir\",\n    \"irgi\",\n    \"it\",\n    \"itin\",\n    \"ið\",\n    \"iðilgai\",\n    \"iðvis\",\n    \"jaisiais\",\n    \"jajai\",\n    \"jajam\",\n    \"jajame\",\n    \"jei\",\n    \"jeigu\",\n    \"ji\",\n    \"jiedu\",\n    \"jiedvi\",\n    \"jieji\",\n    \"jiesiems\",\n    \"jinai\",\n    \"jis\",\n    \"jisai\",\n    \"jog\",\n    \"joji\",\n    \"jojo\",\n    \"jojoje\",\n    \"jokia\",\n    \"joks\",\n    \"josiomis\",\n    \"josioms\",\n    \"josios\",\n    \"josiose\",\n    \"judu\",\n    \"judvi\",\n    \"juk\",\n    \"jumis\",\n    \"jums\",\n    \"jumyse\",\n    \"juodu\",\n    \"juoju\",\n    \"juosiuose\",\n    \"juosius\",\n    \"jus\",\n    \"jàja\",\n    \"jàjà\",\n    \"jàsias\",\n    \"jájá\",\n    \"jøjø\",\n    \"jûs\",\n    \"jûsiðkis\",\n    \"jûsiðkë\",\n    \"jûsø\",\n    \"kad\",\n    \"kada\",\n    \"kadangi\",\n    \"kai\",\n    \"kaip\",\n    \"kaipgi\",\n    \"kas\",\n    \"katra\",\n    \"katras\",\n    \"katriedvi\",\n    \"katruodu\",\n    \"kaþin\",\n    \"kaþkas\",\n    \"kaþkatra\",\n    \"kaþkatras\",\n    \"kaþkokia\",\n    \"kaþkoks\",\n    \"kaþkuri\",\n    \"kaþkuris\",\n    \"kiaurai\",\n    \"kiek\",\n    \"kiekvienas\",\n    \"kieno\",\n    \"kita\",\n    \"kitas\",\n    \"kitokia\",\n    \"kitoks\",\n    \"kodël\",\n    \"kokia\",\n    \"koks\",\n    \"kol\",\n    \"kolei\",\n    \"kone\",\n    \"kuomet\",\n    \"kur\",\n    \"kurgi\",\n    \"kuri\",\n    \"kuriedvi\",\n    \"kuris\",\n    \"kuriuodu\",\n    \"lai\",\n    \"lig\",\n    \"ligi\",\n    \"link\",\n    \"lyg\",\n    \"man\",\n    \"manaisiais\",\n    \"manajai\",\n    \"manajam\",\n    \"manajame\",\n    \"manas\",\n    \"manasai\",\n    \"manasis\",\n    \"mane\",\n    \"manieji\",\n    \"maniesiems\",\n    \"manim\",\n    \"manimi\",\n    \"maniðkis\",\n    \"maniðkë\",\n    \"mano\",\n    \"manoji\",\n    \"manojo\",\n    \"manojoje\",\n    \"manosiomis\",\n    \"manosioms\",\n    \"manosios\",\n    \"manosiose\",\n    \"manuoju\",\n    \"manuosiuose\",\n    \"manuosius\",\n    \"manyje\",\n    \"manàja\",\n    \"manàjà\",\n    \"manàjá\",\n    \"manàsias\",\n    \"manæs\",\n    \"manøjø\",\n    \"mat\",\n    \"maþdaug\",\n    \"maþne\",\n    \"mes\",\n    \"mudu\",\n    \"mudvi\",\n    \"mumis\",\n    \"mums\",\n    \"mumyse\",\n    \"mus\",\n    \"mûsiðkis\",\n    \"mûsiðkë\",\n    \"mûsø\",\n    \"na\",\n    \"nagi\",\n    \"ne\",\n    \"nebe\",\n    \"nebent\",\n    \"negi\",\n    \"negu\",\n    \"nei\",\n    \"nejau\",\n    \"nejaugi\",\n    \"nekaip\",\n    \"nelyginant\",\n    \"nes\",\n    \"net\",\n    \"netgi\",\n    \"netoli\",\n    \"neva\",\n    \"nors\",\n    \"nuo\",\n    \"në\",\n    \"o\",\n    \"ogi\",\n    \"oi\",\n    \"paeiliui\",\n    \"pagal\",\n    \"pakeliui\",\n    \"palaipsniui\",\n    \"palei\",\n    \"pas\",\n    \"pasak\",\n    \"paskos\",\n    \"paskui\",\n    \"paskum\",\n    \"pat\",\n    \"pati\",\n    \"patiems\",\n    \"paties\",\n    \"pats\",\n    \"patys\",\n    \"patá\",\n    \"paèiais\",\n    \"paèiam\",\n    \"paèiame\",\n    \"paèiu\",\n    \"paèiuose\",\n    \"paèius\",\n    \"paèiø\",\n    \"per\",\n    \"pernelyg\",\n    \"pirm\",\n    \"pirma\",\n    \"pirmiau\",\n    \"po\",\n    \"prie\",\n    \"prieð\",\n    \"prieðais\",\n    \"pro\",\n    \"pusiau\",\n    \"rasi\",\n    \"rodos\",\n    \"sau\",\n    \"savaisiais\",\n    \"savajai\",\n    \"savajam\",\n    \"savajame\",\n    \"savas\",\n    \"savasai\",\n    \"savasis\",\n    \"save\",\n    \"savieji\",\n    \"saviesiems\",\n    \"savimi\",\n    \"saviðkis\",\n    \"saviðkë\",\n    \"savo\",\n    \"savoji\",\n    \"savojo\",\n    \"savojoje\",\n    \"savosiomis\",\n    \"savosioms\",\n    \"savosios\",\n    \"savosiose\",\n    \"savuoju\",\n    \"savuosiuose\",\n    \"savuosius\",\n    \"savyje\",\n    \"savàja\",\n    \"savàjà\",\n    \"savàjá\",\n    \"savàsias\",\n    \"savæs\",\n    \"savøjø\",\n    \"skersai\",\n    \"skradþiai\",\n    \"staèiai\",\n    \"su\",\n    \"sulig\",\n    \"ta\",\n    \"tad\",\n    \"tai\",\n    \"taigi\",\n    \"taip\",\n    \"taipogi\",\n    \"taisiais\",\n    \"tajai\",\n    \"tajam\",\n    \"tajame\",\n    \"tamsta\",\n    \"tarp\",\n    \"tarsi\",\n    \"tartum\",\n    \"tarytum\",\n    \"tas\",\n    \"tasai\",\n    \"tau\",\n    \"tavaisiais\",\n    \"tavajai\",\n    \"tavajam\",\n    \"tavajame\",\n    \"tavas\",\n    \"tavasai\",\n    \"tavasis\",\n    \"tave\",\n    \"tavieji\",\n    \"taviesiems\",\n    \"tavimi\",\n    \"taviðkis\",\n    \"taviðkë\",\n    \"tavo\",\n    \"tavoji\",\n    \"tavojo\",\n    \"tavojoje\",\n    \"tavosiomis\",\n    \"tavosioms\",\n    \"tavosios\",\n    \"tavosiose\",\n    \"tavuoju\",\n    \"tavuosiuose\",\n    \"tavuosius\",\n    \"tavyje\",\n    \"tavàja\",\n    \"tavàjà\",\n    \"tavàjá\",\n    \"tavàsias\",\n    \"tavæs\",\n    \"tavøjø\",\n    \"taèiau\",\n    \"te\",\n    \"tegu\",\n    \"tegul\",\n    \"tiedvi\",\n    \"tieji\",\n    \"ties\",\n    \"tiesiems\",\n    \"tiesiog\",\n    \"tik\",\n    \"tikriausiai\",\n    \"tiktai\",\n    \"toji\",\n    \"tojo\",\n    \"tojoje\",\n    \"tokia\",\n    \"toks\",\n    \"tol\",\n    \"tolei\",\n    \"toliau\",\n    \"tosiomis\",\n    \"tosioms\",\n    \"tosios\",\n    \"tosiose\",\n    \"tu\",\n    \"tuodu\",\n    \"tuoju\",\n    \"tuosiuose\",\n    \"tuosius\",\n    \"turbût\",\n    \"tàja\",\n    \"tàjà\",\n    \"tàjá\",\n    \"tàsias\",\n    \"tøjø\",\n    \"tûlas\",\n    \"uþ\",\n    \"uþtat\",\n    \"uþvis\",\n    \"va\",\n    \"vai\",\n    \"viduj\",\n    \"vidury\",\n    \"vien\",\n    \"vienas\",\n    \"vienokia\",\n    \"vienoks\",\n    \"vietoj\",\n    \"virð\",\n    \"virðuj\",\n    \"virðum\",\n    \"vis\",\n    \"vis dëlto\",\n    \"visa\",\n    \"visas\",\n    \"visgi\",\n    \"visokia\",\n    \"visoks\",\n    \"vos\",\n    \"vël\",\n    \"vëlgi\",\n    \"ypaè\",\n    \"á\",\n    \"ákypai\",\n    \"ástriþai\",\n    \"ðalia\",\n    \"ðe\",\n    \"ði\",\n    \"ðiaisiais\",\n    \"ðiajai\",\n    \"ðiajam\",\n    \"ðiajame\",\n    \"ðiapus\",\n    \"ðiedvi\",\n    \"ðieji\",\n    \"ðiesiems\",\n    \"ðioji\",\n    \"ðiojo\",\n    \"ðiojoje\",\n    \"ðiokia\",\n    \"ðioks\",\n    \"ðiosiomis\",\n    \"ðiosioms\",\n    \"ðiosios\",\n    \"ðiosiose\",\n    \"ðis\",\n    \"ðisai\",\n    \"ðit\",\n    \"ðita\",\n    \"ðitas\",\n    \"ðitiedvi\",\n    \"ðitokia\",\n    \"ðitoks\",\n    \"ðituodu\",\n    \"ðiuodu\",\n    \"ðiuoju\",\n    \"ðiuosiuose\",\n    \"ðiuosius\",\n    \"ðiàja\",\n    \"ðiàjà\",\n    \"ðiàsias\",\n    \"ðiøjø\",\n    \"ðtai\",\n    \"ðájá\",\n    \"þemiau\",\n];\n"
  },
  {
    "path": "src/stopwords/mal.rs",
    "content": "// Sonic\n//\n// Fast, lightweight and schema-less search backend\n// Copyright: 2019, Valerian Saliou <valerian@valeriansaliou.name>\n// License: Mozilla Public License v2.0 (MPL v2.0)\n\npub static STOPWORDS_MAL: &[&str] = &[\n    \"കാണാന്‍\",\n    \"നിന്ന്\",\n    \"കുറഞ്ഞ\",\n    \"മുഴുവന്\",\n    \"കൂടാതെ\",\n    \"ആദ്യം\",\n    \"ഈ\",\n    \"കൂടുതല്‍\",\n    \"താങ്കള്‍\",\n    \"എന്നാല്\",\n    \"അതിനു\",\n    \"ശേഷം\",\n    \"ചെയ്യുന്നു\",\n    \"ഇവിടത്തെ\",\n    \"വേണ്ടി\",\n    \"ഏറ്റവും\",\n    \"ഇതില്\",\n    \"വേണ്ടിയും\",\n    \"ആണ്\",\n    \"സ്ഥിതിചെയ്യുന്നു\",\n    \"സ്ഥിതി\",\n    \"സ്ഥിതിചെയ്യുന്ന\",\n    \"ചെയ്യണം\",\n    \"നമ്മുടെ\",\n    \"ഇപ്പോള്\",\n    \"ഒരു\",\n    \"തന്റെ\",\n    \"ചെയ്യുന്ന\",\n    \"എന്ന\",\n    \"ചെയ്യുന്നത്\",\n    \"ഉണ്ട്\",\n    \"മുന്‍പ്\",\n    \"മുമ്പ്\",\n    \"കൂടെ\",\n    \"ചേര്‍ത്തു\",\n    \"ഇപ്രകാരം\",\n    \"എന്നിവയുടെ\",\n    \"കഴിയും\",\n    \"എന്നീ\",\n    \"ഇതാണ്\",\n    \"വളരെ\",\n    \"കാരണം\",\n    \"ഇവിടത്തെ\",\n    \"എപ്പോഴും\",\n    \"കൊണ്ട്\",\n    \"നല്ല\",\n    \"ധാരാളം\",\n    \"എപ്പോഴും\",\n    \"ഇവ\",\n    \"കാരണം\",\n    \"ഇതു\",\n    \"മാത്രമല്ല\",\n    \"മറ്റു\",\n    \"എന്നിവ\",\n    \"കൂടിയാണ്\",\n    \"ഇടയില്\",\n    \"ഇല്ല\",\n    \"എന്നാണ്\",\n    \"എന്നു\",\n    \"കുറച്ച്\",\n    \"അതായത്\",\n    \"എന്തെന്നാല്\",\n    \"എന്നറിയപ്പെടുന്നു\",\n    \"കിടക്കുന്ന\",\n    \"പോയാല്\",\n    \"ഇത്\",\n    \"എല്ലാ\",\n    \"വേണ്ടി\",\n    \"ഇവിടെ\",\n    \"വരുന്നു\",\n    \"പോലുള്ള\",\n    \"വലിയ\",\n    \"പറഞ്ഞ്\",\n    \"ഇതിനെ\",\n    \"കൊടുത്തിട്ടും\",\n    \"എന്ന്\",\n    \"വേണം\",\n    \"ഒരുപോലെ\",\n    \"ഒരു പോലെ\",\n    \"കാര്യമാണ്\",\n    \"കഴിയുന്നു\",\n    \"വളരെ\",\n    \"അധികം\",\n    \"വളരെ അധികം\",\n    \"വളരെയധികം\",\n    \"പോയി\",\n    \"ഉണ്ടാകുന്നുണ്ട്\",\n    \"പക്ഷേ\",\n    \"അതേ\",\n    \"കൊണ്ട്\",\n    \"ഏത്\",\n    \"നിന്നും\",\n    \"എത്താന്‍\",\n    \"അടുത്ത്\",\n    \"ആയി\",\n    \"എന്നു പറയുന്നു\",\n    \"ഇപ്പോൾ\",\n    \"ഏകദേശം\",\n    \"എന്നുപറയുന്നു\",\n    \"കാണാൻ\",\n    \"ആ\",\n    \"വിവിധ\",\n    \"ഇതിന്റെ\",\n    \"നിന്നു\",\n    \"ഇതിന്\",\n    \"അടുത്ത\",\n    \"അടുത്തുള്ള\",\n    \"പല\",\n    \"പ്രധാന\",\n    \"നിലനിൽക്കുന്ന\",\n    \"നിലനിൽക്കുന്നത്\",\n    \"മുതലായവ\",\n    \"മുതലായവക്ക്\",\n    \"വേണ്ട\",\n    \"പ്രാധാന്യം\",\n];\n"
  },
  {
    "path": "src/stopwords/mar.rs",
    "content": "// Sonic\n//\n// Fast, lightweight and schema-less search backend\n// Copyright: 2019, Valerian Saliou <valerian@valeriansaliou.name>\n// License: Mozilla Public License v2.0 (MPL v2.0)\n\npub static STOPWORDS_MAR: &[&str] = &[\n    \"अधिक\",\n    \"अनेक\",\n    \"अशी\",\n    \"असलयाचे\",\n    \"असलेल्या\",\n    \"असा\",\n    \"असून\",\n    \"असे\",\n    \"आज\",\n    \"आणि\",\n    \"आता\",\n    \"आपल्या\",\n    \"आला\",\n    \"आली\",\n    \"आले\",\n    \"आहे\",\n    \"आहेत\",\n    \"एक\",\n    \"एका\",\n    \"कमी\",\n    \"करणयात\",\n    \"करून\",\n    \"का\",\n    \"काम\",\n    \"काय\",\n    \"काही\",\n    \"किवा\",\n    \"की\",\n    \"केला\",\n    \"केली\",\n    \"केले\",\n    \"कोटी\",\n    \"गेल्या\",\n    \"घेऊन\",\n    \"जात\",\n    \"झाला\",\n    \"झाली\",\n    \"झाले\",\n    \"झालेल्या\",\n    \"टा\",\n    \"डॉ\",\n    \"तर\",\n    \"तरी\",\n    \"तसेच\",\n    \"ता\",\n    \"ती\",\n    \"तीन\",\n    \"ते\",\n    \"तो\",\n    \"त्या\",\n    \"त्याचा\",\n    \"त्याची\",\n    \"त्याच्या\",\n    \"त्याना\",\n    \"त्यानी\",\n    \"त्यामुळे\",\n    \"त्री\",\n    \"दिली\",\n    \"दोन\",\n    \"न\",\n    \"नाही\",\n    \"निर्ण्य\",\n    \"पण\",\n    \"पम\",\n    \"परयतन\",\n    \"पाटील\",\n    \"म\",\n    \"मात्र\",\n    \"माहिती\",\n    \"मी\",\n    \"मुबी\",\n    \"म्हणजे\",\n    \"म्हणाले\",\n    \"म्हणून\",\n    \"या\",\n    \"याचा\",\n    \"याची\",\n    \"याच्या\",\n    \"याना\",\n    \"यानी\",\n    \"येणार\",\n    \"येत\",\n    \"येथील\",\n    \"येथे\",\n    \"लाख\",\n    \"व\",\n    \"व्यकत\",\n    \"सर्व\",\n    \"सागित्ले\",\n    \"सुरू\",\n    \"हजार\",\n    \"हा\",\n    \"ही\",\n    \"हे\",\n    \"होणार\",\n    \"होत\",\n    \"होता\",\n    \"होती\",\n    \"होते\",\n];\n"
  },
  {
    "path": "src/stopwords/mkd.rs",
    "content": "// Sonic\n//\n// Fast, lightweight and schema-less search backend\n// Copyright: 2019, Valerian Saliou <valerian@valeriansaliou.name>\n// License: Mozilla Public License v2.0 (MPL v2.0)\n\n// Notice: we do not have stopwords for this language yet.\npub static STOPWORDS_MKD: &[&str] = &[];\n"
  },
  {
    "path": "src/stopwords/mod.rs",
    "content": "// Sonic\n//\n// Fast, lightweight and schema-less search backend\n// Copyright: 2019, Valerian Saliou <valerian@valeriansaliou.name>\n// License: Mozilla Public License v2.0 (MPL v2.0)\n\n// All stopwords are sourced from: https://github.com/stopwords-iso\n// Last update: 7th March 2019\n\npub mod afr;\npub mod aka;\npub mod amh;\npub mod ara;\npub mod aze;\npub mod bel;\npub mod ben;\npub mod bul;\npub mod cat;\npub mod ces;\npub mod cmn;\npub mod dan;\npub mod deu;\npub mod ell;\npub mod eng;\npub mod epo;\npub mod est;\npub mod fin;\npub mod fra;\npub mod guj;\npub mod heb;\npub mod hin;\npub mod hrv;\npub mod hun;\npub mod hye;\npub mod ind;\npub mod ita;\npub mod jav;\npub mod jpn;\npub mod kan;\npub mod kat;\npub mod khm;\npub mod kor;\npub mod lat;\npub mod lav;\npub mod lit;\npub mod mal;\npub mod mar;\npub mod mkd;\npub mod mya;\npub mod nep;\npub mod nld;\npub mod nob;\npub mod ori;\npub mod pan;\npub mod pes;\npub mod pol;\npub mod por;\npub mod ron;\npub mod rus;\npub mod sin;\npub mod slk;\npub mod slv;\npub mod sna;\npub mod spa;\npub mod srp;\npub mod swe;\npub mod tam;\npub mod tel;\npub mod tgl;\npub mod tha;\npub mod tuk;\npub mod tur;\npub mod ukr;\npub mod urd;\npub mod uzb;\npub mod vie;\npub mod yid;\npub mod zul;\n"
  },
  {
    "path": "src/stopwords/mya.rs",
    "content": "// Sonic\n//\n// Fast, lightweight and schema-less search backend\n// Copyright: 2019, Valerian Saliou <valerian@valeriansaliou.name>\n// License: Mozilla Public License v2.0 (MPL v2.0)\n\npub static STOPWORDS_MYA: &[&str] = &[\n    \"အပေါ်\",\n    \"အနက်\",\n    \"အမြဲတမ်း\",\n    \"အတွင်းတွင်\",\n    \"မကြာမီ\",\n    \"မတိုင်မီ\",\n    \"ဒါ့အပြင်\",\n    \"အောက်မှာ\",\n    \"အထဲမှာ\",\n    \"ဘယ်တော့မျှ\",\n    \"မကြာခဏ\",\n    \"တော်တော်လေး\",\n    \"စဉ်တွင်\",\n    \"နှင့်အတူ\",\n    \"နှင့်\",\n    \"နှင့်တကွ\",\n    \"ကျွန်တော်\",\n    \"ကျွန်မ\",\n    \"ငါ\",\n    \"ကျုပ်\",\n    \"ကျွနု်ပ်\",\n    \"ကျနော်\",\n    \"ကျမ\",\n    \"သူ\",\n    \"သူမ\",\n    \"ထိုဟာ\",\n    \"ထိုအရာ\",\n    \"ဤအရာ\",\n    \"ထို\",\n    \"၄င်း\",\n    \"ကျွန်တော်တို့\",\n    \"ကျွန်မတို့\",\n    \"ငါတို့\",\n    \"ကျုပ်တို့\",\n    \"ကျွနု်ပ်တို့\",\n    \"ကျနော်တို့\",\n    \"ကျမတို့\",\n    \"သင်\",\n    \"သင်တို့\",\n    \"နင်တို့\",\n    \"မင်း\",\n    \"မင်းတို့\",\n    \"သူတို့\",\n    \"ကျွန်တော်အား\",\n    \"ကျွန်တော်ကို\",\n    \"ကျွန်မကို\",\n    \"ငါကို\",\n    \"ကျုပ်ကို\",\n    \"ကျွနု်ပ်ကို\",\n    \"သူ့ကို\",\n    \"သူမကို\",\n    \"ထိုအရာကို\",\n    \"သင့်ကို\",\n    \"သင်တို့ကို\",\n    \"နင်တို့ကို\",\n    \"မင်းကို\",\n    \"မင်းတို့ကို\",\n    \"ငါတို့ကို\",\n    \"ကျုပ်တို့ကို\",\n    \"ကျွနု်ပ်တို့ကို\",\n    \"မိမိကိုယ်တိုင်\",\n    \"မိမိဘာသာ\",\n    \"မင်းကိုယ်တိုင်\",\n    \"မင်းဘာသာ\",\n    \"မင်းတို့ကိုယ်တိုင်\",\n    \"မင်းတို့ဘာသာ\",\n    \"သူကိုယ်တိုင်\",\n    \"ကိုယ်တိုင်\",\n    \"သူမကိုယ်တိုင်\",\n    \"သူ့ဘာသာ\",\n    \"သူ့ကိုယ်ကို\",\n    \"ကိုယ့်ကိုယ်ကို\",\n    \"မိမိကိုယ်ကို\",\n    \"၄င်းပင်\",\n    \"ထိုအရာပင်\",\n    \"သည့်\",\n    \"မည့်\",\n    \"တဲ့\",\n    \"ကျွနု်ပ်၏\",\n    \"ကျွန်တော်၏\",\n    \"ကျွန်မ၏\",\n    \"ကျနော်၏\",\n    \"ကျမ၏\",\n    \"သူ၏\",\n    \"သူမ၏\",\n    \"ထိုအရာ၏\",\n    \"ထိုဟာ၏\",\n    \"ကျွနု်ပ်တို့၏\",\n    \"ငါတို့၏\",\n    \"ကျွန်တော်တို့၏\",\n    \"ကျွန်မတို့၏\",\n    \"ကျနော်တို့၏\",\n    \"ကျမတို့၏\",\n    \"သင်၏\",\n    \"သင်တို့၏\",\n    \"မင်း၏\",\n    \"မင်းတို့၏\",\n    \"သူတို့၏\",\n    \"ကျွန်တော့်ဟာ\",\n    \"ကျွန်မဟာ\",\n    \"ကျနော်၏ဟာ\",\n    \"ကျမ၏ဟာ\",\n    \"ကျမဟာ\",\n    \"ကျနော်ဟာ\",\n    \"သူဟာ\",\n    \"သူမဟာ\",\n    \"သူ့ဟာ\",\n    \"ကျွနု်ပ်တို့ဟာ\",\n    \"ကျွန်တော်တို့ဟာ\",\n    \"ကျွန်မတို့ဟာ\",\n    \"သင်တို့ဟာ\",\n    \"မင်းတို့ဟာ\",\n    \"သူတို့ဟာ\",\n    \"သူမတို့ဟာ\",\n    \"ဤအရာ\",\n    \"ဟောဒါ\",\n    \"ဟောဒီ\",\n    \"ဟောဒီဟာ\",\n    \"ဒီဟာ\",\n    \"ဒါ\",\n    \"ထိုအရာ\",\n    \"၄င်းအရာ\",\n    \"ယင်းအရာ\",\n    \"အဲဒါ\",\n    \"ဟိုဟာ\",\n    \"အချို့\",\n    \"တစ်ခုခု\",\n    \"အဘယ်မဆို\",\n    \"ဘယ်အရာမဆို\",\n    \"အဘယ်မည်သော\",\n    \"အကြင်\",\n    \"အရာရာတိုင်း\",\n    \"စိုးစဉ်မျှ\",\n    \"စိုးစဉ်းမျှ\",\n    \"ဘယ်လောက်မဆို\",\n    \"တစ်စုံတစ်ရာ\",\n    \"တစုံတရာ\",\n    \"အလျဉ်းမဟုတ်\",\n    \"မည်သည့်နည်းနှင့်မျှမဟုတ်\",\n    \"အလျဉ်းမရှိသော\",\n    \"အခြားဖြစ်သော\",\n    \"အခြားသော\",\n    \"အခြားတစ်ခု\",\n    \"အခြားတစ်ယောက်\",\n    \"အားလုံး\",\n    \"အရာရာတိုင်း\",\n    \"အကုန်လုံး\",\n    \"အလုံးစုံ\",\n    \"အရာခပ်သိမ်း\",\n    \"တစ်ခုစီ\",\n    \"အသီးသီး\",\n    \"တစ်ဦးဦး\",\n    \"တစ်ခုခု\",\n    \"ကိုယ်စီကိုယ်ငှ\",\n    \"ကိုယ်စီ\",\n    \"တစ်ဦးစီ\",\n    \"တစ်ယောက်စီ\",\n    \"တစ်ခုစီ\",\n    \"အကုန်\",\n    \"အပြည့်အစုံ\",\n    \"လုံးလုံး\",\n    \"နှစ်ခုလုံး\",\n    \"နှစ်ယောက်လုံး\",\n    \"နှစ်ဘက်လုံး\",\n    \"တစ်စုံတစ်ရာ\",\n    \"တစ်စုံတစ်ခု\",\n    \"တစုံတခု\",\n    \"တစ်စုံတစ်ယောက်\",\n    \"တစုံတယောက်\",\n    \"တစ်ယောက်ယောက်\",\n    \"မည်သူမဆို\",\n    \"ဘာမျှမရှိ\",\n    \"ဘာမှမရှိ\",\n    \"အဘယ်အရာမျှမရှိ\",\n    \"လူတိုင်း\",\n    \"လူတကာ\",\n    \"နှင့်\",\n    \"ပြီးလျှင်\",\n    \"၄င်းနောက်\",\n    \"သို့မဟုတ်\",\n    \"သို့တည်းမဟုတ်\",\n    \"သို့မဟုတ်လျှင်\",\n    \"ဒါမှမဟုတ်\",\n    \"ဖြစ်စေ\",\n    \"သို့စေကာမူ\",\n    \"ဒါပေမယ့်\",\n    \"ဒါပေမဲ့\",\n    \"မှတစ်ပါး\",\n    \"မှလွဲလျှင်\",\n    \"အဘယ်ကြောင့်ဆိုသော်\",\n    \"သောကြောင့်\",\n    \"သဖြင့်\",\n    \"၍\",\n    \"သည့်အတွက်ကြောင့်\",\n    \"လျှင်\",\n    \"ပါက\",\n    \"အကယ်၍\",\n    \"သော်ငြားလည်း\",\n    \"စေကာမူ\",\n    \"နည်းတူ\",\n    \"ပေမယ့်\",\n    \"ပေမဲ့\",\n    \"ထိုနည်းတူစွာ\",\n    \"ထိုနည်းတူ\",\n    \"ကဲ့သို့\",\n    \"သကဲ့သို့\",\n    \"ယင်းကဲ့သို့\",\n    \"ထိုကဲ့သို့\",\n    \"နှင့်စပ်လျဉ်း၍\",\n    \"ဤမျှ\",\n    \"ဤမျှလောက်\",\n    \"ဤကဲ့သို့\",\n    \"အခုလောက်ထိ\",\n    \"ဒါကတော့\",\n    \"အဘယ်ကဲ့သလို့\",\n    \"မည်ကဲ့သို့\",\n    \"မည်သည့်နည်းနှင့်\",\n    \"မည်သည့်နည်းဖြင့်\",\n    \"မည်သည့်နည့်နှင့်မဆို\",\n    \"မည်သည့်နည်းဖြင့်မဆို\",\n    \"မည်သို့\",\n    \"ဘယ်လိုလဲ\",\n    \"သို့ပေတည့်\",\n    \"သို့ပေမည့်\",\n    \"ဘယ်နည်းနှင့်\",\n    \"မည်ရွေ့မည်မျှ\",\n    \"အဘယ်မျှလောက်\",\n    \"ဘယ်လောက်\",\n    \"မည်သူ\",\n    \"ဘယ်သူ\",\n    \"မည်သည့်အကြောင်းကြောင့်\",\n    \"ဘာအတွက်ကြောင့်\",\n    \"အဘယ်ကြောင့်\",\n    \"မည်သည့်အတွက်ကြောင့်\",\n    \"ဘာကြောင့်\",\n    \"ဘာအတွက်နဲ့လဲ\",\n    \"မည်သည်\",\n    \"ဘာလဲ\",\n    \"အဘယ်အရာနည်း\",\n    \"မည်သည့်အရပ်မှာ\",\n    \"ဘယ်နေရာတွင်\",\n    \"မည်သည့်နေရာတွင်\",\n    \"မည်သည့်နေရာသို့\",\n    \"ဘယ်နေရာသို့\",\n    \"ဘယ်နေရာမှာ\",\n    \"ဘယ်သူ၏\",\n    \"မည်သည့်အရာ၏\",\n    \"မည်သည့်အခါ\",\n    \"ဘယ်အချိန်\",\n    \"ဘယ်အခါ\",\n    \"မည်သည့်အချိန်\",\n    \"ဘယ်တော့\",\n    \"မည်သူကို\",\n    \"မည်သူက\",\n    \"ဘယ်သူ့ကို\",\n    \"မည်သူမည်ဝါ\",\n    \"မည်သည့်အရာ\",\n    \"ဘယ်အရာ\",\n    \"မည်သို့ပင်ဖြစ်စေ\",\n    \"ဘယ်လိုပဲဖြစ်ဖြစ်\",\n    \"မည်ရွေ့မည်မျှဖြစ်စေ\",\n    \"မည်သည့်နည်းနှင့်မဆို\",\n    \"ဘယ်နည်းနဲ့ဖြစ်ဖြစ်\",\n    \"မည်သူမဆို\",\n    \"ဘယ်သူမဆို\",\n    \"အဘယ်သူမဆို\",\n    \"မည်သည့်အရာမဆို\",\n    \"ဘာဖြစ်ဖြစ်\",\n    \"မည်သည့်အရာဖြစ်ဖြစ်\",\n    \"မည်သည့်အရပ်၌မဆို\",\n    \"မည်သည့်နေရာမဆို\",\n    \"ဘယ်အခါမဆို\",\n    \"ဘယ်အချိန်မဆို\",\n    \"ဘယ်အခါဖြစ်ဖြစ်\",\n    \"အချိန်အခါမရွေး\",\n];\n"
  },
  {
    "path": "src/stopwords/nep.rs",
    "content": "// Sonic\n//\n// Fast, lightweight and schema-less search backend\n// Copyright: 2019, Valerian Saliou <valerian@valeriansaliou.name>\n// License: Mozilla Public License v2.0 (MPL v2.0)\n\npub static STOPWORDS_NEP: &[&str] = &[\n    \"छ\",\n    \"र\",\n    \"पनि\",\n    \"छन्\",\n    \"लागि\",\n    \"भएको\",\n    \"गरेको\",\n    \"भने\",\n    \"गर्न\",\n    \"गर्ने\",\n    \"हो\",\n    \"तथा\",\n    \"यो\",\n    \"रहेको\",\n    \"उनले\",\n    \"थियो\",\n    \"हुने\",\n    \"गरेका\",\n    \"थिए\",\n    \"गर्दै\",\n    \"तर\",\n    \"नै\",\n    \"को\",\n    \"मा\",\n    \"हुन्\",\n    \"भन्ने\",\n    \"हुन\",\n    \"गरी\",\n    \"त\",\n    \"हुन्छ\",\n    \"अब\",\n    \"के\",\n    \"रहेका\",\n    \"गरेर\",\n    \"छैन\",\n    \"दिए\",\n    \"भए\",\n    \"यस\",\n    \"ले\",\n    \"गर्नु\",\n    \"औं\",\n    \"सो\",\n    \"त्यो\",\n    \"कि\",\n    \"जुन\",\n    \"यी\",\n    \"का\",\n    \"गरि\",\n    \"ती\",\n    \"न\",\n    \"छु\",\n    \"छौं\",\n    \"लाई\",\n    \"नि\",\n    \"उप\",\n    \"अक्सर\",\n    \"आदि\",\n    \"कसरी\",\n    \"क्रमशः\",\n    \"चाले\",\n    \"अगाडी\",\n    \"अझै\",\n    \"अनुसार\",\n    \"अन्तर्गत\",\n    \"अन्य\",\n    \"अन्यत्र\",\n    \"अन्यथा\",\n    \"अरु\",\n    \"अरुलाई\",\n    \"अर्को\",\n    \"अर्थात\",\n    \"अर्थात्\",\n    \"अलग\",\n    \"आए\",\n    \"आजको\",\n    \"ओठ\",\n    \"आत्म\",\n    \"आफू\",\n    \"आफूलाई\",\n    \"आफ्नै\",\n    \"आफ्नो\",\n    \"आयो\",\n    \"उदाहरण\",\n    \"उनको\",\n    \"उहालाई\",\n    \"एउटै\",\n    \"एक\",\n    \"एकदम\",\n    \"कतै\",\n    \"कम से कम\",\n    \"कसै\",\n    \"कसैले\",\n    \"कहाँबाट\",\n    \"कहिलेकाहीं\",\n    \"का\",\n    \"किन\",\n    \"किनभने\",\n    \"कुनै\",\n    \"कुरा\",\n    \"कृपया\",\n    \"केही\",\n    \"कोही\",\n    \"गए\",\n    \"गरौं\",\n    \"गर्छ\",\n    \"गर्छु\",\n    \"गर्नुपर्छ\",\n    \"गयौ\",\n    \"गैर\",\n    \"चार\",\n    \"चाहनुहुन्छ\",\n    \"चाहन्छु\",\n    \"चाहिए\",\n    \"छू\",\n    \"जताततै\",\n    \"जब\",\n    \"जबकि\",\n    \"जसको\",\n    \"जसबाट\",\n    \"जसमा\",\n    \"जसलाई\",\n    \"जसले\",\n    \"जस्तै\",\n    \"जस्तो\",\n    \"जस्तोसुकै\",\n    \"जहाँ\",\n    \"जान\",\n    \"जाहिर\",\n    \"जे\",\n    \"जो\",\n    \"ठीक\",\n    \"तत्काल\",\n    \"तदनुसार\",\n    \"तपाईको\",\n    \"तपाई\",\n    \"पर्याप्त\",\n    \"पहिले\",\n    \"पहिलो\",\n    \"पहिल्यै\",\n    \"पाँच\",\n    \"पाँचौं\",\n    \"तल\",\n    \"तापनी\",\n    \"तिनी\",\n    \"तिनीहरू\",\n    \"तिनीहरुको\",\n    \"तिनिहरुलाई\",\n    \"तिमी\",\n    \"तिर\",\n    \"तीन\",\n    \"तुरुन्तै\",\n    \"तेस्रो\",\n    \"तेस्कारण\",\n    \"पूर्व\",\n    \"प्रति\",\n    \"प्रतेक\",\n    \"प्लस\",\n    \"फेरी\",\n    \"बने\",\n    \"त्सपछि\",\n    \"त्सैले\",\n    \"त्यहाँ\",\n    \"थिएन\",\n    \"दिनुभएको\",\n    \"दिनुहुन्छ\",\n    \"दुई\",\n    \"देखि\",\n    \"बरु\",\n    \"बारे\",\n    \"बाहिर\",\n    \"देखिन्छ\",\n    \"देखियो\",\n    \"देखे\",\n    \"देखेको\",\n    \"देखेर\",\n    \"दोस्रो\",\n    \"धेरै\",\n    \"नजिकै\",\n    \"नत्र\",\n    \"नयाँ\",\n    \"निम्ति\",\n    \"बाहेक\",\n    \"बीच\",\n    \"बीचमा\",\n    \"भन\",\n    \"निम्न\",\n    \"निम्नानुसार\",\n    \"निर्दिष्ट\",\n    \"नौ\",\n    \"पक्का\",\n    \"पक्कै\",\n    \"पछि\",\n    \"पछिल्लो\",\n    \"पटक\",\n    \"पर्छ\",\n    \"पर्थ्यो\",\n    \"भन्छन्\",\n    \"भन्\",\n    \"भन्छु\",\n    \"भन्दा\",\n    \"भन्नुभयो\",\n    \"भर\",\n    \"भित्र\",\n    \"भित्री\",\n    \"म\",\n    \"मलाई\",\n    \"मात्र\",\n    \"माथि\",\n    \"मुख्य\",\n    \"मेरो\",\n    \"यति\",\n    \"यथोचित\",\n    \"यदि\",\n    \"यद्यपि\",\n    \"यसको\",\n    \"यसपछि\",\n    \"यसबाहेक\",\n    \"यसरी\",\n    \"यसो\",\n    \"यस्तो\",\n    \"यहाँ\",\n    \"यहाँसम्म\",\n    \"या\",\n    \"रही\",\n    \"राखे\",\n    \"राख्छ\",\n    \"राम्रो\",\n    \"रूप\",\n    \"लगभग\",\n    \"वरीपरी\",\n    \"वास्तवमा\",\n    \"बिरुद्ध\",\n    \"बिशेष\",\n    \"सायद\",\n    \"शायद\",\n    \"संग\",\n    \"संगै\",\n    \"सक्छ\",\n    \"सट्टा\",\n    \"सधै\",\n    \"सबै\",\n    \"सबैलाई\",\n    \"समय\",\n    \"सम्भव\",\n    \"सम्म\",\n    \"सही\",\n    \"साँच्चै\",\n    \"सात\",\n    \"साथ\",\n    \"साथै\",\n    \"सारा\",\n    \"सोही\",\n    \"स्पष्ट\",\n    \"हरे\",\n    \"हरेक\",\n];\n"
  },
  {
    "path": "src/stopwords/nld.rs",
    "content": "// Sonic\n//\n// Fast, lightweight and schema-less search backend\n// Copyright: 2019, Valerian Saliou <valerian@valeriansaliou.name>\n// License: Mozilla Public License v2.0 (MPL v2.0)\n\npub static STOPWORDS_NLD: &[&str] = &[\n    \"aan\",\n    \"aangaande\",\n    \"aangezien\",\n    \"achte\",\n    \"achter\",\n    \"achterna\",\n    \"af\",\n    \"afgelopen\",\n    \"al\",\n    \"aldaar\",\n    \"aldus\",\n    \"alhoewel\",\n    \"alias\",\n    \"alle\",\n    \"allebei\",\n    \"alleen\",\n    \"alles\",\n    \"als\",\n    \"alsnog\",\n    \"altijd\",\n    \"altoos\",\n    \"ander\",\n    \"andere\",\n    \"anders\",\n    \"anderszins\",\n    \"beetje\",\n    \"behalve\",\n    \"behoudens\",\n    \"beide\",\n    \"beiden\",\n    \"ben\",\n    \"beneden\",\n    \"bent\",\n    \"bepaald\",\n    \"betreffende\",\n    \"bij\",\n    \"bijna\",\n    \"bijv\",\n    \"binnen\",\n    \"binnenin\",\n    \"blijkbaar\",\n    \"blijken\",\n    \"boven\",\n    \"bovenal\",\n    \"bovendien\",\n    \"bovengenoemd\",\n    \"bovenstaand\",\n    \"bovenvermeld\",\n    \"buiten\",\n    \"bv\",\n    \"daar\",\n    \"daardoor\",\n    \"daarheen\",\n    \"daarin\",\n    \"daarna\",\n    \"daarnet\",\n    \"daarom\",\n    \"daarop\",\n    \"daaruit\",\n    \"daarvanlangs\",\n    \"dan\",\n    \"dat\",\n    \"de\",\n    \"deden\",\n    \"deed\",\n    \"der\",\n    \"derde\",\n    \"derhalve\",\n    \"dertig\",\n    \"deze\",\n    \"dhr\",\n    \"die\",\n    \"dikwijls\",\n    \"dit\",\n    \"doch\",\n    \"doe\",\n    \"doen\",\n    \"doet\",\n    \"door\",\n    \"doorgaand\",\n    \"drie\",\n    \"duizend\",\n    \"dus\",\n    \"echter\",\n    \"een\",\n    \"eens\",\n    \"eer\",\n    \"eerdat\",\n    \"eerder\",\n    \"eerlang\",\n    \"eerst\",\n    \"eerste\",\n    \"eigen\",\n    \"eigenlijk\",\n    \"elk\",\n    \"elke\",\n    \"en\",\n    \"enig\",\n    \"enige\",\n    \"enigszins\",\n    \"enkel\",\n    \"er\",\n    \"erdoor\",\n    \"erg\",\n    \"ergens\",\n    \"etc\",\n    \"etcetera\",\n    \"even\",\n    \"eveneens\",\n    \"evenwel\",\n    \"gauw\",\n    \"ge\",\n    \"gedurende\",\n    \"geen\",\n    \"gehad\",\n    \"gekund\",\n    \"geleden\",\n    \"gelijk\",\n    \"gemoeten\",\n    \"gemogen\",\n    \"genoeg\",\n    \"geweest\",\n    \"gewoon\",\n    \"gewoonweg\",\n    \"haar\",\n    \"haarzelf\",\n    \"had\",\n    \"hadden\",\n    \"hare\",\n    \"heb\",\n    \"hebben\",\n    \"hebt\",\n    \"hedden\",\n    \"heeft\",\n    \"heel\",\n    \"hem\",\n    \"hemzelf\",\n    \"hen\",\n    \"het\",\n    \"hetzelfde\",\n    \"hier\",\n    \"hierbeneden\",\n    \"hierboven\",\n    \"hierin\",\n    \"hierna\",\n    \"hierom\",\n    \"hij\",\n    \"hijzelf\",\n    \"hoe\",\n    \"hoewel\",\n    \"honderd\",\n    \"hun\",\n    \"hunne\",\n    \"ieder\",\n    \"iedere\",\n    \"iedereen\",\n    \"iemand\",\n    \"iets\",\n    \"ik\",\n    \"ikzelf\",\n    \"in\",\n    \"inderdaad\",\n    \"inmiddels\",\n    \"intussen\",\n    \"inzake\",\n    \"is\",\n    \"ja\",\n    \"je\",\n    \"jezelf\",\n    \"jij\",\n    \"jijzelf\",\n    \"jou\",\n    \"jouw\",\n    \"jouwe\",\n    \"juist\",\n    \"jullie\",\n    \"kan\",\n    \"klaar\",\n    \"kon\",\n    \"konden\",\n    \"krachtens\",\n    \"kun\",\n    \"kunnen\",\n    \"kunt\",\n    \"laatst\",\n    \"later\",\n    \"liever\",\n    \"lijken\",\n    \"lijkt\",\n    \"maak\",\n    \"maakt\",\n    \"maakte\",\n    \"maakten\",\n    \"maar\",\n    \"mag\",\n    \"maken\",\n    \"me\",\n    \"meer\",\n    \"meest\",\n    \"meestal\",\n    \"men\",\n    \"met\",\n    \"mevr\",\n    \"mezelf\",\n    \"mij\",\n    \"mijn\",\n    \"mijnent\",\n    \"mijner\",\n    \"mijzelf\",\n    \"minder\",\n    \"miss\",\n    \"misschien\",\n    \"missen\",\n    \"mits\",\n    \"mocht\",\n    \"mochten\",\n    \"moest\",\n    \"moesten\",\n    \"moet\",\n    \"moeten\",\n    \"mogen\",\n    \"mr\",\n    \"mrs\",\n    \"mw\",\n    \"na\",\n    \"naar\",\n    \"nadat\",\n    \"nam\",\n    \"namelijk\",\n    \"nee\",\n    \"neem\",\n    \"negen\",\n    \"nemen\",\n    \"nergens\",\n    \"net\",\n    \"niemand\",\n    \"niet\",\n    \"niets\",\n    \"niks\",\n    \"noch\",\n    \"nochtans\",\n    \"nog\",\n    \"nogal\",\n    \"nooit\",\n    \"nu\",\n    \"nv\",\n    \"of\",\n    \"ofschoon\",\n    \"om\",\n    \"omdat\",\n    \"omhoog\",\n    \"omlaag\",\n    \"omstreeks\",\n    \"omtrent\",\n    \"omver\",\n    \"ondanks\",\n    \"onder\",\n    \"ondertussen\",\n    \"ongeveer\",\n    \"ons\",\n    \"onszelf\",\n    \"onze\",\n    \"onzeker\",\n    \"ooit\",\n    \"ook\",\n    \"op\",\n    \"opnieuw\",\n    \"opzij\",\n    \"over\",\n    \"overal\",\n    \"overeind\",\n    \"overige\",\n    \"overigens\",\n    \"paar\",\n    \"pas\",\n    \"per\",\n    \"precies\",\n    \"recent\",\n    \"redelijk\",\n    \"reeds\",\n    \"rond\",\n    \"rondom\",\n    \"samen\",\n    \"sedert\",\n    \"sinds\",\n    \"sindsdien\",\n    \"slechts\",\n    \"sommige\",\n    \"spoedig\",\n    \"steeds\",\n    \"tamelijk\",\n    \"te\",\n    \"tegen\",\n    \"tegenover\",\n    \"tenzij\",\n    \"terwijl\",\n    \"thans\",\n    \"tien\",\n    \"tiende\",\n    \"tijdens\",\n    \"tja\",\n    \"toch\",\n    \"toe\",\n    \"toen\",\n    \"toenmaals\",\n    \"toenmalig\",\n    \"tot\",\n    \"totdat\",\n    \"tussen\",\n    \"twee\",\n    \"tweede\",\n    \"u\",\n    \"uit\",\n    \"uitgezonderd\",\n    \"uw\",\n    \"vaak\",\n    \"vaakwat\",\n    \"van\",\n    \"vanaf\",\n    \"vandaan\",\n    \"vanuit\",\n    \"vanwege\",\n    \"veel\",\n    \"veeleer\",\n    \"veertig\",\n    \"verder\",\n    \"verscheidene\",\n    \"verschillende\",\n    \"vervolgens\",\n    \"via\",\n    \"vier\",\n    \"vierde\",\n    \"vijf\",\n    \"vijfde\",\n    \"vijftig\",\n    \"vol\",\n    \"volgend\",\n    \"volgens\",\n    \"voor\",\n    \"vooraf\",\n    \"vooral\",\n    \"vooralsnog\",\n    \"voorbij\",\n    \"voordat\",\n    \"voordezen\",\n    \"voordien\",\n    \"voorheen\",\n    \"voorop\",\n    \"voorts\",\n    \"vooruit\",\n    \"vrij\",\n    \"vroeg\",\n    \"waar\",\n    \"waarom\",\n    \"waarschijnlijk\",\n    \"wanneer\",\n    \"want\",\n    \"waren\",\n    \"was\",\n    \"wat\",\n    \"we\",\n    \"wederom\",\n    \"weer\",\n    \"weg\",\n    \"wegens\",\n    \"weinig\",\n    \"wel\",\n    \"weldra\",\n    \"welk\",\n    \"welke\",\n    \"werd\",\n    \"werden\",\n    \"werder\",\n    \"wezen\",\n    \"whatever\",\n    \"wie\",\n    \"wiens\",\n    \"wier\",\n    \"wij\",\n    \"wijzelf\",\n    \"wil\",\n    \"wilden\",\n    \"willen\",\n    \"word\",\n    \"worden\",\n    \"wordt\",\n    \"zal\",\n    \"ze\",\n    \"zei\",\n    \"zeker\",\n    \"zelf\",\n    \"zelfde\",\n    \"zelfs\",\n    \"zes\",\n    \"zeven\",\n    \"zich\",\n    \"zichzelf\",\n    \"zij\",\n    \"zijn\",\n    \"zijne\",\n    \"zijzelf\",\n    \"zo\",\n    \"zoals\",\n    \"zodat\",\n    \"zodra\",\n    \"zonder\",\n    \"zou\",\n    \"zouden\",\n    \"zowat\",\n    \"zulk\",\n    \"zulke\",\n    \"zullen\",\n    \"zult\",\n];\n"
  },
  {
    "path": "src/stopwords/nob.rs",
    "content": "// Sonic\n//\n// Fast, lightweight and schema-less search backend\n// Copyright: 2019, Valerian Saliou <valerian@valeriansaliou.name>\n// License: Mozilla Public License v2.0 (MPL v2.0)\n\npub static STOPWORDS_NOB: &[&str] = &[\n    \"og\",\n    \"i\",\n    \"jeg\",\n    \"det\",\n    \"at\",\n    \"en\",\n    \"et\",\n    \"den\",\n    \"til\",\n    \"er\",\n    \"som\",\n    \"på\",\n    \"de\",\n    \"med\",\n    \"han\",\n    \"av\",\n    \"ikke\",\n    \"ikkje\",\n    \"der\",\n    \"så\",\n    \"var\",\n    \"meg\",\n    \"seg\",\n    \"men\",\n    \"ett\",\n    \"har\",\n    \"om\",\n    \"vi\",\n    \"min\",\n    \"mitt\",\n    \"ha\",\n    \"hadde\",\n    \"hun\",\n    \"nå\",\n    \"over\",\n    \"da\",\n    \"ved\",\n    \"fra\",\n    \"du\",\n    \"ut\",\n    \"sin\",\n    \"dem\",\n    \"oss\",\n    \"opp\",\n    \"man\",\n    \"kan\",\n    \"hans\",\n    \"hvor\",\n    \"eller\",\n    \"hva\",\n    \"skal\",\n    \"selv\",\n    \"sjøl\",\n    \"her\",\n    \"alle\",\n    \"vil\",\n    \"bli\",\n    \"ble\",\n    \"blei\",\n    \"blitt\",\n    \"kunne\",\n    \"inn\",\n    \"når\",\n    \"være\",\n    \"kom\",\n    \"noen\",\n    \"noe\",\n    \"ville\",\n    \"dere\",\n    \"som\",\n    \"deres\",\n    \"kun\",\n    \"ja\",\n    \"etter\",\n    \"ned\",\n    \"skulle\",\n    \"denne\",\n    \"for\",\n    \"deg\",\n    \"si\",\n    \"sine\",\n    \"sitt\",\n    \"mot\",\n    \"å\",\n    \"meget\",\n    \"hvorfor\",\n    \"dette\",\n    \"disse\",\n    \"uten\",\n    \"hvordan\",\n    \"ingen\",\n    \"din\",\n    \"ditt\",\n    \"blir\",\n    \"samme\",\n    \"hvilken\",\n    \"hvilke\",\n    \"sånn\",\n    \"inni\",\n    \"mellom\",\n    \"vår\",\n    \"hver\",\n    \"hvem\",\n    \"vors\",\n    \"hvis\",\n    \"både\",\n    \"bare\",\n    \"enn\",\n    \"fordi\",\n    \"før\",\n    \"mange\",\n    \"også\",\n    \"slik\",\n    \"vært\",\n    \"være\",\n    \"båe\",\n    \"begge\",\n    \"siden\",\n    \"dykk\",\n    \"dykkar\",\n    \"dei\",\n    \"deira\",\n    \"deires\",\n    \"deim\",\n    \"di\",\n    \"då\",\n    \"eg\",\n    \"ein\",\n    \"eit\",\n    \"eitt\",\n    \"elles\",\n    \"honom\",\n    \"hjå\",\n    \"ho\",\n    \"hoe\",\n    \"henne\",\n    \"hennar\",\n    \"hennes\",\n    \"hoss\",\n    \"hossen\",\n    \"ikkje\",\n    \"ingi\",\n    \"inkje\",\n    \"korleis\",\n    \"korso\",\n    \"kva\",\n    \"kvar\",\n    \"kvarhelst\",\n    \"kven\",\n    \"kvi\",\n    \"kvifor\",\n    \"me\",\n    \"medan\",\n    \"mi\",\n    \"mine\",\n    \"mykje\",\n    \"no\",\n    \"nokon\",\n    \"noka\",\n    \"nokor\",\n    \"noko\",\n    \"nokre\",\n    \"si\",\n    \"sia\",\n    \"sidan\",\n    \"so\",\n    \"somt\",\n    \"somme\",\n    \"um\",\n    \"upp\",\n    \"vere\",\n    \"vore\",\n    \"verte\",\n    \"vort\",\n    \"varte\",\n    \"vart\",\n];\n"
  },
  {
    "path": "src/stopwords/ori.rs",
    "content": "// Sonic\n//\n// Fast, lightweight and schema-less search backend\n// Copyright: 2019, Valerian Saliou <valerian@valeriansaliou.name>\n// License: Mozilla Public License v2.0 (MPL v2.0)\n\n// Notice: we do not have stopwords for this language yet.\npub static STOPWORDS_ORI: &[&str] = &[];\n"
  },
  {
    "path": "src/stopwords/pan.rs",
    "content": "// Sonic\n//\n// Fast, lightweight and schema-less search backend\n// Copyright: 2019, Valerian Saliou <valerian@valeriansaliou.name>\n// License: Mozilla Public License v2.0 (MPL v2.0)\n\npub static STOPWORDS_PAN: &[&str] = &[\n    \"ਦੇ\",\n    \"0\",\n    \"ਵਿੱਚ\",\n    \"ਦਾ\",\n    \"ਅਤੇ\",\n    \"ਦੀ\",\n    \"ਇੱਕ\",\n    \"ਨੂੰ\",\n    \"ਹੈ\",\n    \"ਤੋਂ\",\n    \"ਇਸ\",\n    \"ਇਹ\",\n    \"ਨੇ\",\n    \"ਤੇ\",\n    \"ਨਾਲ\",\n    \"1\",\n    \"ਲਈ\",\n    \"ਵੀ\",\n    \"ਸੀ\",\n    \"ਵਿਚ\",\n    \"ਕਿ\",\n    \"ਜੋ\",\n    \"ਉਹ\",\n    \"ਉਸ\",\n    \"ਹਨ\",\n    \"ਜਾਂਦਾ\",\n    \"ਕੀਤਾ\",\n    \"2\",\n    \"ਗਿਆ\",\n    \"ਹੀ\",\n    \"ਕੇ\",\n    \"ਜਾਂ\",\n    \"ਦੀਆਂ\",\n    \"ਜਿਸ\",\n    \"ਕਰਨ\",\n    \"ਹੋ\",\n    \"ਕਰ\",\n    \"ਆਪਣੇ\",\n    \"ਕੀਤੀ\",\n    \"ਤੌਰ\",\n    \"ਬਾਅਦ\",\n    \"ਨਹੀਂ\",\n    \"ਭਾਰਤੀ\",\n    \"ਪਿੰਡ\",\n    \"3\",\n    \"ਸਿੰਘ\",\n    \"ਉੱਤੇ\",\n    \"ਸਾਲ\",\n    \"।\",\n    \"ਪੰਜਾਬ\",\n    \"ਸਭ\",\n    \"ਭਾਰਤ\",\n    \"ਉਨ੍ਹਾਂ\",\n    \"ਹੁੰਦਾ\",\n    \"ਤੱਕ\",\n    \"ਇਕ\",\n    \"ਹੋਇਆ\",\n    \"ਜਨਮ\",\n    \"ਬਹੁਤ\",\n    \"ਪਰ\",\n    \"ਦੁਆਰਾ\",\n    \"ਰੂਪ\",\n    \"4\",\n    \"ਹੋਰ\",\n    \"ਕੰਮ\",\n    \"ਆਪਣੀ\",\n    \"ਤਾਂ\",\n    \"ਸਮੇਂ\",\n    \"ਪੰਜਾਬੀ\",\n    \"ਗਈ\",\n    \"ਦਿੱਤਾ\",\n    \"ਦੋ\",\n    \"ਕਿਸੇ\",\n    \"ਕਈ\",\n    \"ਜਾ\",\n    \"ਵਾਲੇ\",\n    \"ਸ਼ੁਰੂ\",\n    \"5\",\n    \"ਉਸਨੇ\",\n    \"ਕਿਹਾ\",\n    \"ਹੋਣ\",\n    \"ਲੋਕ\",\n    \"ਜਾਂਦੀ\",\n    \"ਵਿੱਚੋਂ\",\n    \"ਨਾਮ\",\n    \"ਜਦੋਂ\",\n    \"ਪਹਿਲਾਂ\",\n    \"ਕਰਦਾ\",\n    \"ਹੁੰਦੀ\",\n    \"ਹੋਏ\",\n    \"ਸਨ\",\n    \"ਵਜੋਂ\",\n    \"ਰਾਜ\",\n    \"ਮੁੱਖ\",\n    \"ਕਰਦੇ\",\n    \"ਕੁਝ\",\n    \"ਸਾਰੇ\",\n    \"ਹੁੰਦੇ\",\n    \"ਸ਼ਹਿਰ\",\n    \"ਭਾਸ਼ਾ\",\n    \"6\",\n    \"ਹੋਈ\",\n    \"ਅਨੁਸਾਰ\",\n    \"ਸਕਦਾ\",\n    \"ਆਮ\",\n    \"ਵੱਖ\",\n    \"ਕੋਈ\",\n    \"ਵਾਰ\",\n    \"ਗਏ\",\n    \"ਖੇਤਰ\",\n    \"ਜੀ\",\n    \"ਕਾਰਨ\",\n    \"ਕਰਕੇ\",\n    \"ਜਿਵੇਂ\",\n    \"ਜ਼ਿਲ੍ਹੇ\",\n    \"ਲੋਕਾਂ\",\n    \"ਚ\",\n    \"ਸਾਹਿਤ\",\n    \"ਸਦੀ\",\n    \"ਬਾਰੇ\",\n    \"ਜਾਂਦੇ\",\n    \"ਵਾਲਾ\",\n    \"ਜਾਣ\",\n    \"ਪਹਿਲੀ\",\n    \"ਪ੍ਰਾਪਤ\",\n    \"ਰਿਹਾ\",\n    \"ਵਾਲੀ\",\n    \"ਨਾਂ\",\n    \"ਦੌਰਾਨ\",\n    \"ਤਰ੍ਹਾਂ\",\n    \"7\",\n    \"ਯੂਨੀਵਰਸਿਟੀ\",\n    \"ਨਾ\",\n    \"ਏ\",\n    \"ਤਿੰਨ\",\n    \"ਇਨ੍ਹਾਂ\",\n    \"ਗੁਰੂ\",\n    \"ਇਸਨੂੰ\",\n    \"ਇਹਨਾਂ\",\n    \"ਪਿਤਾ\",\n    \"ਲਿਆ\",\n    \"ਸ਼ਾਮਲ\",\n    \"ਸ਼ਬਦ\",\n    \"ਅੰਗਰੇਜ਼ੀ\",\n    \"ਉਸਨੂੰ\",\n    \"ਉਹਨਾਂ\",\n    \"8\",\n    \"ਸਥਿਤ\",\n    \"ਫਿਰ\",\n    \"ਜੀਵਨ\",\n    \"ਸਕੂਲ\",\n    \"ਹੁਣ\",\n    \"ਦਿਨ\",\n    \"ਕੀਤੇ\",\n    \"ਆਦਿ\",\n    \"ਵੱਧ\",\n    \"ਲੈ\",\n    \"ਘਰ\",\n    \"ਵੱਲ\",\n    \"ਦੇਸ਼\",\n    \"ਵਲੋਂ\",\n    \"ਬਣ\",\n    \"ਵੀਂ\",\n    \"ਫਿਲਮ\",\n    \"ਉਮਰ\",\n    \"ਬਲਾਕ\",\n    \"ਰਹੇ\",\n    \"10\",\n    \"ਸਾਹਿਬ\",\n    \"ਕਰਦੀ\",\n    \"ਹਰ\",\n    \"ਪੈਦਾ\",\n    \"ਘੱਟ\",\n    \"9\",\n    \"ਲੇਖਕ\",\n    \"ਹਿੱਸਾ\",\n    \"ਫ਼ਿਲਮ\",\n    \"ਮੌਤ\",\n    \"ਜਿੱਥੇ\",\n    \"ਵੱਡਾ\",\n    \"ਵਿਖੇ\",\n    \"ਆਪਣਾ\",\n    \"ਪਹਿਲਾ\",\n    \"ਵਰਤੋਂ\",\n    \"ਆਪ\",\n    \"ਕਰਨਾ\",\n    \"ਵਿਆਹ\",\n    \"ਰਹੀ\",\n    \"ਰਾਹੀਂ\",\n    \"ਦਿੱਤੀ\",\n    \"ਉਸਦੇ\",\n    \"ਪਰਿਵਾਰ\",\n    \"ਆ\",\n    \"ਦੂਜੇ\",\n    \"ਅਮਰੀਕਾ\",\n    \"ਮੰਨਿਆ\",\n    \"ਇਸਦੇ\",\n    \"ਈ\",\n    \"ਕਾਲਜ\",\n    \"ਸਰਕਾਰ\",\n    \"ਇੱਥੇ\",\n    \"ਪਾਕਿਸਤਾਨ\",\n    \"ਸ਼ਾਮਿਲ\",\n    \"ਵਿਗਿਆਨ\",\n    \"ਉਸਦੀ\",\n    \"ਪੇਸ਼\",\n    \"ਕਿਉਂਕਿ\",\n    \"ਪਹਿਲੇ\",\n    \"ਧਰਮ\",\n    \"ਮਸ਼ਹੂਰ\",\n    \"ਅੰਦਰ\",\n    \"ਵਿਚੋਂ\",\n    \"ਜਿਨ੍ਹਾਂ\",\n    \"ਜਾਣਿਆ\",\n    \"ਪਾਣੀ\",\n    \"ਇਲਾਵਾ\",\n    \"ਅਰਥ\",\n    \"ਚਾਰ\",\n    \"ਪ੍ਰਸਿੱਧ\",\n    \"ਨਾਵਲ\",\n    \"ਵੱਡੇ\",\n    \"ਵੱਲੋਂ\",\n    \"ਕਹਾਣੀ\",\n    \"ਵਿਸ਼ਵ\",\n    \"ਮੂਲ\",\n    \"ਅਮਰੀਕੀ\",\n    \"ਸਥਾਨ\",\n    \"ਇਤਿਹਾਸ\",\n    \"ਕੁੱਝ\",\n    \"ਵਿਕਾਸ\",\n    \"ਉੱਤਰ\",\n    \"ਸਿੱਖਿਆ\",\n    \"ਹਿੰਦੀ\",\n    \"ਪ੍ਰਮੁੱਖ\",\n    \"ਰਚਨਾ\",\n    \"ਬਣਾਇਆ\",\n    \"ਵਿਸ਼ੇਸ਼\",\n    \"ਡਾ\",\n    \"ਉੱਪਰ\",\n    \"ਪੱਛਮੀ\",\n    \"ਦੇਣ\",\n    \"ਇਸਦਾ\",\n    \"ਸਕਦੇ\",\n    \"ਰੱਖਿਆ\",\n    \"ਕਵੀ\",\n    \"ਦਿੱਲੀ\",\n    \"ਵੱਡੀ\",\n    \"ਭੂਮਿਕਾ\",\n    \"ਸਮਾਜ\",\n    \"ਕਾਵਿ\",\n    \"ਕੀ\",\n    \"ਕੋਲ\",\n    \"ਦ\",\n    \"ਗੱਲ\",\n    \"ਸੰਸਾਰ\",\n    \"ਭਾਗ\",\n    \"ਆਈ\",\n    \"ਦੱਖਣ\",\n    \"ਅੱਜ\",\n    \"ਸਿੱਖ\",\n    \"ਕਹਿੰਦੇ\",\n    \"ਸੰਗੀਤ\",\n    \"ਕਿਲੋਮੀਟਰ\",\n    \"ਜਿਹਨਾਂ\",\n    \"ਸਭਾ\",\n    \"ਜਿਸਦਾ\",\n    \"ਜਨਵਰੀ\",\n    \"ਕਵਿਤਾ\",\n    \"ਮੈਂਬਰ\",\n    \"ਲਿਖਿਆ\",\n    \"ਮਾਂ\",\n    \"ਕਲਾ\",\n    \"ਪੰਜ\",\n    \"ਥਾਂ\",\n    \"ਹੇਠ\",\n    \"ਜਿਆਦਾ\",\n    \"ਵਰਤਿਆ\",\n    \"ਮਾਰਚ\",\n    \"ਡੀ\",\n    \"ਅਕਤੂਬਰ\",\n    \"ਤਕ\",\n    \"ਨਾਟਕ\",\n    \"ਬੀ\",\n    \"ਖਾਸ\",\n    \"ਇਸੇ\",\n    \"ਆਧੁਨਿਕ\",\n    \"ਅਗਸਤ\",\n    \"ਤਿਆਰ\",\n    \"ਮਾਤਾ\",\n    \"ਬਣਾਉਣ\",\n    \"ਨਵੰਬਰ\",\n    \"ਵਿਅਕਤੀ\",\n    \"ਦੱਖਣੀ\",\n    \"ਦਸੰਬਰ\",\n    \"ਆਫ\",\n    \"ਗੀਤ\",\n    \"ਗਿਣਤੀ\",\n    \"ਕਾਲ\",\n    \"ਖੋਜ\",\n    \"ਸਾਲਾਂ\",\n    \"ਪੂਰੀ\",\n    \"ਸਮਾਂ\",\n    \"ਜ਼ਿਆਦਾ\",\n    \"ਇਸਦੀ\",\n    \"ਸਕਦੀ\",\n    \"ਵਿਚਕਾਰ\",\n    \"ਰਾਜਧਾਨੀ\",\n    \"ਉਸਦਾ\",\n    \"ਜੁਲਾਈ\",\n    \"ਜੂਨ\",\n    \"ਅਧੀਨ\",\n    \"ਸਥਾਪਨਾ\",\n    \"ਸੇਵਾ\",\n    \"ਭਾਵ\",\n    \"ਵਰਗ\",\n    \"ਛੋਟੇ\",\n    \"ਦਿੰਦਾ\",\n    \"ਸਮਾਜਿਕ\",\n    \"ਹੁੰਦੀਆਂ\",\n    \"ਟੀਮ\",\n    \"ਔਰਤਾਂ\",\n    \"ਅਕਸਰ\",\n    \"ਪ੍ਰਕਾਸ਼ਿਤ\",\n    \"ਉਰਦੂ\",\n    \"ਰੰਗ\",\n    \"ਪਾਰਟੀ\",\n    \"ਬਣਾ\",\n    \"ਪ੍ਰਭਾਵ\",\n    \"ਸ਼ੁਰੂਆਤ\",\n    \"ਲਗਭਗ\",\n    \"ਮਈ\",\n    \"ਸਿਰਫ\",\n    \"ਨੇੜੇ\",\n    \"ਜਿਸਨੂੰ\",\n    \"ਹਾਲਾਂਕਿ\",\n    \"ਦੂਰ\",\n    \"ਸਤੰਬਰ\",\n    \"ਕਿਤਾਬ\",\n    \"ਕਦੇ\",\n    \"ਉੱਤਰੀ\",\n    \"ਪ੍ਰਕਾਰ\",\n    \"ਇਸਨੇ\",\n    \"ਪ੍ਰਦੇਸ਼\",\n    \"ਅੱਗੇ\",\n    \"ਸੰਯੁਕਤ\",\n    \"ਪੜ੍ਹਾਈ\",\n    \"ਵਧੇਰੇ\",\n    \"ਨਾਲ਼\",\n    \"ਮਨੁੱਖ\",\n    \"ਬਾਕੀ\",\n    \"ਪ੍ਰਧਾਨ\",\n    \"ਦੂਜੀ\",\n    \"ਕੁੱਲ\",\n    \"ਆਫ਼\",\n    \"ਅਧਿਐਨ\",\n    \"ਰਾਸ਼ਟਰੀ\",\n    \"ਪੁੱਤਰ\",\n    \"ਅੰਤਰਰਾਸ਼ਟਰੀ\",\n    \"ਧਰਤੀ\",\n    \"ਕੇਂਦਰ\",\n    \"ਦੇਸ਼ਾਂ\",\n    \"ਮੱਧ\",\n    \"ਜ਼ਿਲ੍ਹਾ\",\n    \"ਸਾਰੀਆਂ\",\n    \"ਪੱਧਰ\",\n    \"ਹੋਵੇ\",\n    \"ਜੇ\",\n    \"ਭਾਈ\",\n    \"ਰਹਿਣ\",\n    \"ਪੁਰਸਕਾਰ\",\n    \"ਸਭਿਆਚਾਰ\",\n    \"ਪਤਾ\",\n    \"ਪਾਸੇ\",\n    \"ਨਵੇਂ\",\n    \"ਕੰਪਨੀ\",\n    \"ਬਾਹਰ\",\n    \"ਵੇਲੇ\",\n    \"ਸੰਨ\",\n    \"ਪੂਰਬੀ\",\n    \"ਵਿਚਾਰ\",\n    \"ਕਾਰਜ\",\n    \"ਪੀ\",\n    \"ਮਹੱਤਵਪੂਰਨ\",\n    \"ਦੁਨੀਆਂ\",\n    \"ਧਾਰਮਿਕ\",\n    \"ਮਨੁੱਖੀ\",\n    \"ਸਮੂਹ\",\n    \"ਅਜਿਹੇ\",\n    \"ਲਾਲ\",\n    \"ਦੂਜਾ\",\n    \"ਭਰਾ\",\n    \"ਸ੍ਰੀ\",\n    \"ਅੰਤ\",\n    \"ਜਾਂਦੀਆਂ\",\n    \"ਸ਼ਾਹ\",\n    \"ਰਹਿੰਦੇ\",\n    \"ਮਹਾਨ\",\n    \"ਚੀਨ\",\n    \"ਮੀਟਰ\",\n    \"ਵਰਗੇ\",\n    \"ਨਾਲੋਂ\",\n    \"ਹਾਸਲ\",\n    \"ਕਿਸਮ\",\n    \"ਅਜਿਹਾ\",\n    \"ਬਣਿਆ\",\n    \"ਭਰ\",\n    \"ਛੱਡ\",\n    \"ਲੈਣ\",\n    \"ਹਿੱਸੇ\",\n    \"ਟੀ\",\n    \"ਲਿਖੇ\",\n    \"ਮਿਲ\",\n    \"ਮੌਜੂਦ\",\n    \"ਦਿੱਤੇ\",\n    \"ਵਾਸਤੇ\",\n    \"ਵਾਲੀਆਂ\",\n    \"ਵਧੀਆ\",\n    \"ਰੂਸੀ\",\n    \"ਜਾਰੀ\",\n    \"ਸਰਕਾਰੀ\",\n    \"ਡਿਗਰੀ\",\n    \"ਪੱਛਮ\",\n    \"ਲੜਾਈ\",\n    \"ਭਾਸ਼ਾਵਾਂ\",\n    \"ਰਾਜਾ\",\n    \"ਜਲੰਧਰ\",\n    \"ਹਿੰਦੂ\",\n    \"ਔਰਤ\",\n    \"ਜੰਗ\",\n    \"ਬਾਬਾ\",\n    \"ਬੱਚਿਆਂ\",\n    \"ਮੰਤਰੀ\",\n    \"ਪਟਿਆਲਾ\",\n    \"ਵਾਂਗ\",\n    \"ਆਉਣ\",\n    \"ਭਾਵੇਂ\",\n    \"ਕੇਵਲ\",\n    \"ਐਸ\",\n    \"ਪ੍ਰਾਚੀਨ\",\n    \"ਰਹਿੰਦਾ\",\n    \"ਬੋਲੀ\",\n    \"ਅਵਾਰਡ\",\n    \"ਨਗਰ\",\n    \"ਖੇਡਾਂ\",\n    \"ਫਿਲਮਾਂ\",\n    \"ਬੱਚੇ\",\n    \"ਕੌਰ\",\n    \"ਤੋ\",\n    \"ਪ੍ਰਤੀ\",\n    \"ਕੁਆਂਟਮ\",\n    \"ਅਬਾਦੀ\",\n    \"ਪੁਸਤਕ\",\n    \"ਐਮ\",\n    \"ਰਾਮ\",\n    \"ਖੇਤਰਾਂ\",\n    \"ਫਰਵਰੀ\",\n    \"ਕ੍ਰਿਕਟ\",\n    \"ਪੈਂਦਾ\",\n    \"ਇਤਿਹਾਸਕ\",\n    \"ਲੱਗ\",\n    \"ਬ੍ਰਿਟਿਸ਼\",\n    \"ਆਇਆ\",\n    \"ਮਿਲਦਾ\",\n];\n"
  },
  {
    "path": "src/stopwords/pes.rs",
    "content": "// Sonic\n//\n// Fast, lightweight and schema-less search backend\n// Copyright: 2019, Valerian Saliou <valerian@valeriansaliou.name>\n// License: Mozilla Public License v2.0 (MPL v2.0)\n\npub static STOPWORDS_PES: &[&str] = &[\n    \"!\",\n    \",\",\n    \".\",\n    \":\",\n    \";\",\n    \"،\",\n    \"؛\",\n    \"؟\",\n    \"آباد\",\n    \"آره\",\n    \"آری\",\n    \"آمد\",\n    \"آمده\",\n    \"آن\",\n    \"آنان\",\n    \"آنجا\",\n    \"آنطور\",\n    \"آنقدر\",\n    \"آنكه\",\n    \"آنها\",\n    \"آنچه\",\n    \"آنکه\",\n    \"آورد\",\n    \"آورده\",\n    \"آيد\",\n    \"آی\",\n    \"آیا\",\n    \"آیند\",\n    \"اتفاقا\",\n    \"اثرِ\",\n    \"احتراما\",\n    \"احتمالا\",\n    \"اخیر\",\n    \"اری\",\n    \"از\",\n    \"ازجمله\",\n    \"اساسا\",\n    \"است\",\n    \"استفاد\",\n    \"استفاده\",\n    \"اش\",\n    \"اشکارا\",\n    \"اصلا\",\n    \"اصولا\",\n    \"اعلام\",\n    \"اغلب\",\n    \"اكنون\",\n    \"الان\",\n    \"البته\",\n    \"البتّه\",\n    \"ام\",\n    \"اما\",\n    \"امروز\",\n    \"امروزه\",\n    \"امسال\",\n    \"امشب\",\n    \"امور\",\n    \"ان\",\n    \"انجام\",\n    \"اند\",\n    \"انشاالله\",\n    \"انصافا\",\n    \"انطور\",\n    \"انقدر\",\n    \"انها\",\n    \"انچنان\",\n    \"انکه\",\n    \"انگار\",\n    \"او\",\n    \"اول\",\n    \"اولا\",\n    \"اي\",\n    \"ايشان\",\n    \"ايم\",\n    \"اين\",\n    \"اينكه\",\n    \"اکثرا\",\n    \"اکنون\",\n    \"اگر\",\n    \"ای\",\n    \"ایا\",\n    \"اید\",\n    \"ایشان\",\n    \"ایم\",\n    \"این\",\n    \"اینجا\",\n    \"ایند\",\n    \"اینطور\",\n    \"اینقدر\",\n    \"اینها\",\n    \"اینچنین\",\n    \"اینک\",\n    \"اینکه\",\n    \"اینگونه\",\n    \"با\",\n    \"بار\",\n    \"بارة\",\n    \"باره\",\n    \"بارها\",\n    \"باز\",\n    \"بازهم\",\n    \"باش\",\n    \"باشد\",\n    \"باشم\",\n    \"باشند\",\n    \"باشيم\",\n    \"باشی\",\n    \"باشید\",\n    \"باشیم\",\n    \"بالا\",\n    \"بالاخره\",\n    \"بالایِ\",\n    \"بالطبع\",\n    \"بايد\",\n    \"باید\",\n    \"بتوان\",\n    \"بتواند\",\n    \"بتوانی\",\n    \"بتوانیم\",\n    \"بخش\",\n    \"بخشی\",\n    \"بخواه\",\n    \"بخواهد\",\n    \"بخواهم\",\n    \"بخواهند\",\n    \"بخواهی\",\n    \"بخواهید\",\n    \"بخواهیم\",\n    \"بد\",\n    \"بدون\",\n    \"بر\",\n    \"برابر\",\n    \"برابرِ\",\n    \"براحتی\",\n    \"براساس\",\n    \"براستی\",\n    \"براي\",\n    \"برای\",\n    \"برایِ\",\n    \"برخوردار\",\n    \"برخي\",\n    \"برخی\",\n    \"برداري\",\n    \"برعکس\",\n    \"بروز\",\n    \"بزرگ\",\n    \"بزودی\",\n    \"بسا\",\n    \"بسيار\",\n    \"بسياري\",\n    \"بسیار\",\n    \"بسیاری\",\n    \"بطور\",\n    \"بعد\",\n    \"بعدا\",\n    \"بعدها\",\n    \"بعری\",\n    \"بعضا\",\n    \"بعضي\",\n    \"بلافاصله\",\n    \"بلكه\",\n    \"بله\",\n    \"بلکه\",\n    \"بلی\",\n    \"بنابراين\",\n    \"بنابراین\",\n    \"بندي\",\n    \"به\",\n    \"بهتر\",\n    \"بهترين\",\n    \"بود\",\n    \"بودم\",\n    \"بودن\",\n    \"بودند\",\n    \"بوده\",\n    \"بودی\",\n    \"بودید\",\n    \"بودیم\",\n    \"بویژه\",\n    \"بي\",\n    \"بيست\",\n    \"بيش\",\n    \"بيشتر\",\n    \"بيشتري\",\n    \"بين\",\n    \"بکن\",\n    \"بکند\",\n    \"بکنم\",\n    \"بکنند\",\n    \"بکنی\",\n    \"بکنید\",\n    \"بکنیم\",\n    \"بگو\",\n    \"بگوید\",\n    \"بگویم\",\n    \"بگویند\",\n    \"بگویی\",\n    \"بگویید\",\n    \"بگوییم\",\n    \"بگیر\",\n    \"بگیرد\",\n    \"بگیرم\",\n    \"بگیرند\",\n    \"بگیری\",\n    \"بگیرید\",\n    \"بگیریم\",\n    \"بی\",\n    \"بیا\",\n    \"بیاب\",\n    \"بیابد\",\n    \"بیابم\",\n    \"بیابند\",\n    \"بیابی\",\n    \"بیابید\",\n    \"بیابیم\",\n    \"بیاور\",\n    \"بیاورد\",\n    \"بیاورم\",\n    \"بیاورند\",\n    \"بیاوری\",\n    \"بیاورید\",\n    \"بیاوریم\",\n    \"بیاید\",\n    \"بیایم\",\n    \"بیایند\",\n    \"بیایی\",\n    \"بیایید\",\n    \"بیاییم\",\n    \"بیرون\",\n    \"بیرونِ\",\n    \"بیش\",\n    \"بیشتر\",\n    \"بیشتری\",\n    \"بین\",\n    \"ت\",\n    \"تا\",\n    \"تازه\",\n    \"تاكنون\",\n    \"تان\",\n    \"تاکنون\",\n    \"تحت\",\n    \"تر\",\n    \"تر  براساس\",\n    \"ترين\",\n    \"تقریبا\",\n    \"تلویحا\",\n    \"تمام\",\n    \"تماما\",\n    \"تمامي\",\n    \"تنها\",\n    \"تو\",\n    \"تواند\",\n    \"توانست\",\n    \"توانستم\",\n    \"توانستن\",\n    \"توانستند\",\n    \"توانسته\",\n    \"توانستی\",\n    \"توانستیم\",\n    \"توانم\",\n    \"توانند\",\n    \"توانی\",\n    \"توانید\",\n    \"توانیم\",\n    \"توسط\",\n    \"تولِ\",\n    \"تویِ\",\n    \"ثانیا\",\n    \"جا\",\n    \"جاي\",\n    \"جايي\",\n    \"جای\",\n    \"جدا\",\n    \"جديد\",\n    \"جدید\",\n    \"جريان\",\n    \"جریان\",\n    \"جز\",\n    \"جلوگيري\",\n    \"جلویِ\",\n    \"جمعا\",\n    \"جناح\",\n    \"جهت\",\n    \"حاضر\",\n    \"حال\",\n    \"حالا\",\n    \"حتما\",\n    \"حتي\",\n    \"حتی\",\n    \"حداکثر\",\n    \"حدودا\",\n    \"حدودِ\",\n    \"حق\",\n    \"خارجِ\",\n    \"خب\",\n    \"خدمات\",\n    \"خصوصا\",\n    \"خلاصه\",\n    \"خواست\",\n    \"خواستم\",\n    \"خواستن\",\n    \"خواستند\",\n    \"خواسته\",\n    \"خواستی\",\n    \"خواستید\",\n    \"خواستیم\",\n    \"خواهد\",\n    \"خواهم\",\n    \"خواهند\",\n    \"خواهيم\",\n    \"خواهی\",\n    \"خواهید\",\n    \"خواهیم\",\n    \"خوب\",\n    \"خود\",\n    \"خودت\",\n    \"خودتان\",\n    \"خودش\",\n    \"خودشان\",\n    \"خودم\",\n    \"خودمان\",\n    \"خوشبختانه\",\n    \"خويش\",\n    \"خویش\",\n    \"خویشتن\",\n    \"خیاه\",\n    \"خیر\",\n    \"خیلی\",\n    \"داد\",\n    \"دادم\",\n    \"دادن\",\n    \"دادند\",\n    \"داده\",\n    \"دادی\",\n    \"دادید\",\n    \"دادیم\",\n    \"دار\",\n    \"دارد\",\n    \"دارم\",\n    \"دارند\",\n    \"داريم\",\n    \"داری\",\n    \"دارید\",\n    \"داریم\",\n    \"داشت\",\n    \"داشتم\",\n    \"داشتن\",\n    \"داشتند\",\n    \"داشته\",\n    \"داشتی\",\n    \"داشتید\",\n    \"داشتیم\",\n    \"دانست\",\n    \"دانند\",\n    \"دایم\",\n    \"دایما\",\n    \"در\",\n    \"درباره\",\n    \"درمجموع\",\n    \"درون\",\n    \"دریغ\",\n    \"دقیقا\",\n    \"دنبالِ\",\n    \"ده\",\n    \"دهد\",\n    \"دهم\",\n    \"دهند\",\n    \"دهی\",\n    \"دهید\",\n    \"دهیم\",\n    \"دو\",\n    \"دوباره\",\n    \"دوم\",\n    \"ديده\",\n    \"ديروز\",\n    \"ديگر\",\n    \"ديگران\",\n    \"ديگري\",\n    \"دیر\",\n    \"دیروز\",\n    \"دیگر\",\n    \"دیگران\",\n    \"دیگری\",\n    \"را\",\n    \"راحت\",\n    \"راسا\",\n    \"راستی\",\n    \"راه\",\n    \"رسما\",\n    \"رسید\",\n    \"رفت\",\n    \"رفته\",\n    \"رو\",\n    \"روب\",\n    \"روز\",\n    \"روزانه\",\n    \"روزهاي\",\n    \"روي\",\n    \"روی\",\n    \"رویِ\",\n    \"ريزي\",\n    \"زمان\",\n    \"زمانی\",\n    \"زمینه\",\n    \"زود\",\n    \"زياد\",\n    \"زير\",\n    \"زيرا\",\n    \"زیر\",\n    \"زیرِ\",\n    \"سابق\",\n    \"ساخته\",\n    \"سازي\",\n    \"سالانه\",\n    \"سالیانه\",\n    \"سایر\",\n    \"سراسر\",\n    \"سرانجام\",\n    \"سریعا\",\n    \"سریِ\",\n    \"سعي\",\n    \"سمتِ\",\n    \"سوم\",\n    \"سوي\",\n    \"سوی\",\n    \"سویِ\",\n    \"سپس\",\n    \"شان\",\n    \"شايد\",\n    \"شاید\",\n    \"شخصا\",\n    \"شد\",\n    \"شدم\",\n    \"شدن\",\n    \"شدند\",\n    \"شده\",\n    \"شدی\",\n    \"شدید\",\n    \"شدیدا\",\n    \"شدیم\",\n    \"شش\",\n    \"شش  نداشته\",\n    \"شما\",\n    \"شناسي\",\n    \"شود\",\n    \"شوم\",\n    \"شوند\",\n    \"شونده\",\n    \"شوی\",\n    \"شوید\",\n    \"شویم\",\n    \"صرفا\",\n    \"صورت\",\n    \"ضدِّ\",\n    \"ضدِّ\",\n    \"ضمن\",\n    \"طبعا\",\n    \"طبقِ\",\n    \"طبیعتا\",\n    \"طرف\",\n    \"طريق\",\n    \"طریق\",\n    \"طور\",\n    \"طي\",\n    \"طی\",\n    \"ظاهرا\",\n    \"عدم\",\n    \"عقبِ\",\n    \"علّتِ\",\n    \"علیه\",\n    \"عمدا\",\n    \"عمدتا\",\n    \"عمل\",\n    \"عملا\",\n    \"عنوان\",\n    \"عنوانِ\",\n    \"غالبا\",\n    \"غير\",\n    \"غیر\",\n    \"فردا\",\n    \"فعلا\",\n    \"فقط\",\n    \"فكر\",\n    \"فوق\",\n    \"قابل\",\n    \"قبل\",\n    \"قبلا\",\n    \"قدری\",\n    \"قصدِ\",\n    \"قطعا\",\n    \"كرد\",\n    \"كردم\",\n    \"كردن\",\n    \"كردند\",\n    \"كرده\",\n    \"كسي\",\n    \"كل\",\n    \"كمتر\",\n    \"كند\",\n    \"كنم\",\n    \"كنند\",\n    \"كنيد\",\n    \"كنيم\",\n    \"كه\",\n    \"لااقل\",\n    \"لطفا\",\n    \"لطفاً\",\n    \"ما\",\n    \"مان\",\n    \"مانند\",\n    \"مانندِ\",\n    \"مبادا\",\n    \"متاسفانه\",\n    \"متعاقبا\",\n    \"مثل\",\n    \"مثلا\",\n    \"مثلِ\",\n    \"مجانی\",\n    \"مجددا\",\n    \"مجموعا\",\n    \"مختلف\",\n    \"مدام\",\n    \"مدت\",\n    \"مدّتی\",\n    \"مردم\",\n    \"مرسی\",\n    \"مستقیما\",\n    \"مسلما\",\n    \"مطمینا\",\n    \"معمولا\",\n    \"مقابل\",\n    \"ممکن\",\n    \"من\",\n    \"موارد\",\n    \"مورد\",\n    \"موقتا\",\n    \"مي\",\n    \"ميليارد\",\n    \"ميليون\",\n    \"مگر\",\n    \"می\",\n    \"می شود\",\n    \"میان\",\n    \"می‌رسد\",\n    \"می‌رود\",\n    \"می‌شود\",\n    \"می‌کنیم\",\n    \"ناشي\",\n    \"نام\",\n    \"ناگاه\",\n    \"ناگهان\",\n    \"ناگهانی\",\n    \"نبايد\",\n    \"نباید\",\n    \"نبود\",\n    \"نخست\",\n    \"نخستين\",\n    \"نخواهد\",\n    \"نخواهم\",\n    \"نخواهند\",\n    \"نخواهی\",\n    \"نخواهید\",\n    \"نخواهیم\",\n    \"ندارد\",\n    \"ندارم\",\n    \"ندارند\",\n    \"نداری\",\n    \"ندارید\",\n    \"نداریم\",\n    \"نداشت\",\n    \"نداشتم\",\n    \"نداشتند\",\n    \"نداشته\",\n    \"نداشتی\",\n    \"نداشتید\",\n    \"نداشتیم\",\n    \"نزديك\",\n    \"نزدِ\",\n    \"نزدیکِ\",\n    \"نسبتا\",\n    \"نشان\",\n    \"نشده\",\n    \"نظير\",\n    \"نظیر\",\n    \"نكرده\",\n    \"نمايد\",\n    \"نمي\",\n    \"نمی\",\n    \"نمی‌شود\",\n    \"نه\",\n    \"نهایتا\",\n    \"نوع\",\n    \"نوعي\",\n    \"نوعی\",\n    \"نيز\",\n    \"نيست\",\n    \"نگاه\",\n    \"نیز\",\n    \"نیست\",\n    \"ها\",\n    \"هاي\",\n    \"هايي\",\n    \"های\",\n    \"هایی\",\n    \"هبچ\",\n    \"هر\",\n    \"هرچه\",\n    \"هرگز\",\n    \"هزار\",\n    \"هست\",\n    \"هستم\",\n    \"هستند\",\n    \"هستيم\",\n    \"هستی\",\n    \"هستید\",\n    \"هستیم\",\n    \"هفت\",\n    \"هم\",\n    \"همان\",\n    \"همه\",\n    \"همواره\",\n    \"همين\",\n    \"همچنان\",\n    \"همچنين\",\n    \"همچنین\",\n    \"همچون\",\n    \"همیشه\",\n    \"همین\",\n    \"هنوز\",\n    \"هنگام\",\n    \"هنگامِ\",\n    \"هنگامی\",\n    \"هيچ\",\n    \"هیچ\",\n    \"هیچگاه\",\n    \"و\",\n    \"واقعا\",\n    \"واقعی\",\n    \"وجود\",\n    \"وسطِ\",\n    \"وضع\",\n    \"وقتي\",\n    \"وقتی\",\n    \"وقتیکه\",\n    \"ولی\",\n    \"وي\",\n    \"وگو\",\n    \"وی\",\n    \"ویژه\",\n    \"يا\",\n    \"يابد\",\n    \"يك\",\n    \"يكديگر\",\n    \"يكي\",\n    \"ّه\",\n    \"٪\",\n    \"پارسال\",\n    \"پاعینِ\",\n    \"پس\",\n    \"پنج\",\n    \"پيش\",\n    \"پیدا\",\n    \"پیش\",\n    \"پیشاپیش\",\n    \"پیشتر\",\n    \"پیشِ\",\n    \"چرا\",\n    \"چطور\",\n    \"چقدر\",\n    \"چنان\",\n    \"چنانچه\",\n    \"چنانکه\",\n    \"چند\",\n    \"چندین\",\n    \"چنين\",\n    \"چنین\",\n    \"چه\",\n    \"چهار\",\n    \"چو\",\n    \"چون\",\n    \"چيزي\",\n    \"چگونه\",\n    \"چیز\",\n    \"چیزی\",\n    \"چیست\",\n    \"کاش\",\n    \"کامل\",\n    \"کاملا\",\n    \"کتبا\",\n    \"کجا\",\n    \"کجاست\",\n    \"کدام\",\n    \"کرد\",\n    \"کردم\",\n    \"کردن\",\n    \"کردند\",\n    \"کرده\",\n    \"کردی\",\n    \"کردید\",\n    \"کردیم\",\n    \"کس\",\n    \"کسانی\",\n    \"کسی\",\n    \"کل\",\n    \"کلا\",\n    \"کم\",\n    \"کماکان\",\n    \"کمتر\",\n    \"کمتری\",\n    \"کمی\",\n    \"کن\",\n    \"کنار\",\n    \"کنارِ\",\n    \"کند\",\n    \"کنم\",\n    \"کنند\",\n    \"کننده\",\n    \"کنون\",\n    \"کنونی\",\n    \"کنی\",\n    \"کنید\",\n    \"کنیم\",\n    \"که\",\n    \"کو\",\n    \"کَی\",\n    \"کی\",\n    \"گاه\",\n    \"گاهی\",\n    \"گذاري\",\n    \"گذاشته\",\n    \"گذشته\",\n    \"گردد\",\n    \"گرفت\",\n    \"گرفتم\",\n    \"گرفتن\",\n    \"گرفتند\",\n    \"گرفته\",\n    \"گرفتی\",\n    \"گرفتید\",\n    \"گرفتیم\",\n    \"گروهي\",\n    \"گفت\",\n    \"گفتم\",\n    \"گفتن\",\n    \"گفتند\",\n    \"گفته\",\n    \"گفتی\",\n    \"گفتید\",\n    \"گفتیم\",\n    \"گه\",\n    \"گهگاه\",\n    \"گو\",\n    \"گويد\",\n    \"گويند\",\n    \"گویا\",\n    \"گوید\",\n    \"گویم\",\n    \"گویند\",\n    \"گویی\",\n    \"گویید\",\n    \"گوییم\",\n    \"گيرد\",\n    \"گيري\",\n    \"گیرد\",\n    \"گیرم\",\n    \"گیرند\",\n    \"گیری\",\n    \"گیرید\",\n    \"گیریم\",\n    \"ی\",\n    \"یا\",\n    \"یابد\",\n    \"یابم\",\n    \"یابند\",\n    \"یابی\",\n    \"یابید\",\n    \"یابیم\",\n    \"یافت\",\n    \"یافتم\",\n    \"یافتن\",\n    \"یافته\",\n    \"یافتی\",\n    \"یافتید\",\n    \"یافتیم\",\n    \"یعنی\",\n    \"یقینا\",\n    \"یه\",\n    \"یک\",\n    \"یکی\",\n    \"۰\",\n    \"۱\",\n    \"۲\",\n    \"۳\",\n    \"۴\",\n    \"۵\",\n    \"۶\",\n    \"۷\",\n    \"۸\",\n    \"۹\",\n];\n"
  },
  {
    "path": "src/stopwords/pol.rs",
    "content": "// Sonic\n//\n// Fast, lightweight and schema-less search backend\n// Copyright: 2019, Valerian Saliou <valerian@valeriansaliou.name>\n// License: Mozilla Public License v2.0 (MPL v2.0)\n\npub static STOPWORDS_POL: &[&str] = &[\n    \"a\",\n    \"aby\",\n    \"ach\",\n    \"acz\",\n    \"aczkolwiek\",\n    \"aj\",\n    \"albo\",\n    \"ale\",\n    \"ależ\",\n    \"ani\",\n    \"aż\",\n    \"bardziej\",\n    \"bardzo\",\n    \"bez\",\n    \"bo\",\n    \"bowiem\",\n    \"by\",\n    \"byli\",\n    \"bym\",\n    \"bynajmniej\",\n    \"być\",\n    \"był\",\n    \"była\",\n    \"było\",\n    \"były\",\n    \"będzie\",\n    \"będą\",\n    \"cali\",\n    \"cała\",\n    \"cały\",\n    \"chce\",\n    \"choć\",\n    \"ci\",\n    \"ciebie\",\n    \"cię\",\n    \"co\",\n    \"cokolwiek\",\n    \"coraz\",\n    \"coś\",\n    \"czasami\",\n    \"czasem\",\n    \"czemu\",\n    \"czy\",\n    \"czyli\",\n    \"często\",\n    \"daleko\",\n    \"dla\",\n    \"dlaczego\",\n    \"dlatego\",\n    \"do\",\n    \"dobrze\",\n    \"dokąd\",\n    \"dość\",\n    \"dr\",\n    \"dużo\",\n    \"dwa\",\n    \"dwaj\",\n    \"dwie\",\n    \"dwoje\",\n    \"dzisiaj\",\n    \"dziś\",\n    \"gdy\",\n    \"gdyby\",\n    \"gdyż\",\n    \"gdzie\",\n    \"gdziekolwiek\",\n    \"gdzieś\",\n    \"go\",\n    \"godz\",\n    \"hab\",\n    \"i\",\n    \"ich\",\n    \"ii\",\n    \"iii\",\n    \"ile\",\n    \"im\",\n    \"inna\",\n    \"inne\",\n    \"inny\",\n    \"innych\",\n    \"inż\",\n    \"iv\",\n    \"ix\",\n    \"iż\",\n    \"ja\",\n    \"jak\",\n    \"jakaś\",\n    \"jakby\",\n    \"jaki\",\n    \"jakichś\",\n    \"jakie\",\n    \"jakiś\",\n    \"jakiż\",\n    \"jakkolwiek\",\n    \"jako\",\n    \"jakoś\",\n    \"je\",\n    \"jeden\",\n    \"jedna\",\n    \"jednak\",\n    \"jednakże\",\n    \"jedno\",\n    \"jednym\",\n    \"jedynie\",\n    \"jego\",\n    \"jej\",\n    \"jemu\",\n    \"jest\",\n    \"jestem\",\n    \"jeszcze\",\n    \"jeśli\",\n    \"jeżeli\",\n    \"już\",\n    \"ją\",\n    \"każdy\",\n    \"kiedy\",\n    \"kierunku\",\n    \"kilka\",\n    \"kilku\",\n    \"kimś\",\n    \"kto\",\n    \"ktokolwiek\",\n    \"ktoś\",\n    \"która\",\n    \"które\",\n    \"którego\",\n    \"której\",\n    \"który\",\n    \"których\",\n    \"którym\",\n    \"którzy\",\n    \"ku\",\n    \"lat\",\n    \"lecz\",\n    \"lub\",\n    \"ma\",\n    \"mają\",\n    \"mam\",\n    \"mamy\",\n    \"mało\",\n    \"mgr\",\n    \"mi\",\n    \"miał\",\n    \"mimo\",\n    \"między\",\n    \"mnie\",\n    \"mną\",\n    \"mogą\",\n    \"moi\",\n    \"moim\",\n    \"moja\",\n    \"moje\",\n    \"może\",\n    \"możliwe\",\n    \"można\",\n    \"mu\",\n    \"musi\",\n    \"my\",\n    \"mój\",\n    \"na\",\n    \"nad\",\n    \"nam\",\n    \"nami\",\n    \"nas\",\n    \"nasi\",\n    \"nasz\",\n    \"nasza\",\n    \"nasze\",\n    \"naszego\",\n    \"naszych\",\n    \"natomiast\",\n    \"natychmiast\",\n    \"nawet\",\n    \"nic\",\n    \"nich\",\n    \"nie\",\n    \"niech\",\n    \"niego\",\n    \"niej\",\n    \"niemu\",\n    \"nigdy\",\n    \"nim\",\n    \"nimi\",\n    \"nią\",\n    \"niż\",\n    \"no\",\n    \"nowe\",\n    \"np\",\n    \"nr\",\n    \"o\",\n    \"o.o.\",\n    \"obok\",\n    \"od\",\n    \"ok\",\n    \"około\",\n    \"on\",\n    \"ona\",\n    \"one\",\n    \"oni\",\n    \"ono\",\n    \"oraz\",\n    \"oto\",\n    \"owszem\",\n    \"pan\",\n    \"pana\",\n    \"pani\",\n    \"pl\",\n    \"po\",\n    \"pod\",\n    \"podczas\",\n    \"pomimo\",\n    \"ponad\",\n    \"ponieważ\",\n    \"powinien\",\n    \"powinna\",\n    \"powinni\",\n    \"powinno\",\n    \"poza\",\n    \"prawie\",\n    \"prof\",\n    \"przecież\",\n    \"przed\",\n    \"przede\",\n    \"przedtem\",\n    \"przez\",\n    \"przy\",\n    \"raz\",\n    \"razie\",\n    \"roku\",\n    \"również\",\n    \"sam\",\n    \"sama\",\n    \"się\",\n    \"skąd\",\n    \"sobie\",\n    \"sobą\",\n    \"sposób\",\n    \"swoje\",\n    \"są\",\n    \"ta\",\n    \"tak\",\n    \"taka\",\n    \"taki\",\n    \"takich\",\n    \"takie\",\n    \"także\",\n    \"tam\",\n    \"te\",\n    \"tego\",\n    \"tej\",\n    \"tel\",\n    \"temu\",\n    \"ten\",\n    \"teraz\",\n    \"też\",\n    \"to\",\n    \"tobie\",\n    \"tobą\",\n    \"toteż\",\n    \"trzeba\",\n    \"tu\",\n    \"tutaj\",\n    \"twoi\",\n    \"twoim\",\n    \"twoja\",\n    \"twoje\",\n    \"twym\",\n    \"twój\",\n    \"ty\",\n    \"tych\",\n    \"tylko\",\n    \"tym\",\n    \"tys\",\n    \"tzw\",\n    \"tę\",\n    \"u\",\n    \"ul\",\n    \"vi\",\n    \"vii\",\n    \"viii\",\n    \"vol\",\n    \"w\",\n    \"wam\",\n    \"wami\",\n    \"was\",\n    \"wasi\",\n    \"wasz\",\n    \"wasza\",\n    \"wasze\",\n    \"we\",\n    \"według\",\n    \"wie\",\n    \"wiele\",\n    \"wielu\",\n    \"więc\",\n    \"więcej\",\n    \"wszyscy\",\n    \"wszystkich\",\n    \"wszystkie\",\n    \"wszystkim\",\n    \"wszystko\",\n    \"wtedy\",\n    \"www\",\n    \"wy\",\n    \"właśnie\",\n    \"wśród\",\n    \"xi\",\n    \"xii\",\n    \"xiii\",\n    \"xiv\",\n    \"xv\",\n    \"z\",\n    \"za\",\n    \"zapewne\",\n    \"zawsze\",\n    \"zaś\",\n    \"ze\",\n    \"zeznowu\",\n    \"znowu\",\n    \"znów\",\n    \"został\",\n    \"zł\",\n    \"żaden\",\n    \"żadna\",\n    \"żadne\",\n    \"żadnych\",\n    \"że\",\n    \"żeby\",\n];\n"
  },
  {
    "path": "src/stopwords/por.rs",
    "content": "// Sonic\n//\n// Fast, lightweight and schema-less search backend\n// Copyright: 2019, Valerian Saliou <valerian@valeriansaliou.name>\n// License: Mozilla Public License v2.0 (MPL v2.0)\n\npub static STOPWORDS_POR: &[&str] = &[\n    \"a\",\n    \"acerca\",\n    \"adeus\",\n    \"agora\",\n    \"ainda\",\n    \"alem\",\n    \"algmas\",\n    \"algo\",\n    \"algumas\",\n    \"alguns\",\n    \"ali\",\n    \"além\",\n    \"ambas\",\n    \"ambos\",\n    \"ano\",\n    \"anos\",\n    \"antes\",\n    \"ao\",\n    \"aonde\",\n    \"aos\",\n    \"apenas\",\n    \"apoio\",\n    \"apontar\",\n    \"apos\",\n    \"após\",\n    \"aquela\",\n    \"aquelas\",\n    \"aquele\",\n    \"aqueles\",\n    \"aqui\",\n    \"aquilo\",\n    \"as\",\n    \"assim\",\n    \"através\",\n    \"atrás\",\n    \"até\",\n    \"aí\",\n    \"baixo\",\n    \"bastante\",\n    \"bem\",\n    \"boa\",\n    \"boas\",\n    \"bom\",\n    \"bons\",\n    \"breve\",\n    \"cada\",\n    \"caminho\",\n    \"catorze\",\n    \"cedo\",\n    \"cento\",\n    \"certamente\",\n    \"certeza\",\n    \"cima\",\n    \"cinco\",\n    \"coisa\",\n    \"com\",\n    \"como\",\n    \"comprido\",\n    \"conhecido\",\n    \"conselho\",\n    \"contra\",\n    \"contudo\",\n    \"corrente\",\n    \"cuja\",\n    \"cujas\",\n    \"cujo\",\n    \"cujos\",\n    \"custa\",\n    \"cá\",\n    \"da\",\n    \"daquela\",\n    \"daquelas\",\n    \"daquele\",\n    \"daqueles\",\n    \"dar\",\n    \"das\",\n    \"de\",\n    \"debaixo\",\n    \"dela\",\n    \"delas\",\n    \"dele\",\n    \"deles\",\n    \"demais\",\n    \"dentro\",\n    \"depois\",\n    \"desde\",\n    \"desligado\",\n    \"dessa\",\n    \"dessas\",\n    \"desse\",\n    \"desses\",\n    \"desta\",\n    \"destas\",\n    \"deste\",\n    \"destes\",\n    \"deve\",\n    \"devem\",\n    \"deverá\",\n    \"dez\",\n    \"dezanove\",\n    \"dezasseis\",\n    \"dezassete\",\n    \"dezoito\",\n    \"dia\",\n    \"diante\",\n    \"direita\",\n    \"dispoe\",\n    \"dispoem\",\n    \"diversa\",\n    \"diversas\",\n    \"diversos\",\n    \"diz\",\n    \"dizem\",\n    \"dizer\",\n    \"do\",\n    \"dois\",\n    \"dos\",\n    \"doze\",\n    \"duas\",\n    \"durante\",\n    \"dá\",\n    \"dão\",\n    \"dúvida\",\n    \"e\",\n    \"ela\",\n    \"elas\",\n    \"ele\",\n    \"eles\",\n    \"em\",\n    \"embora\",\n    \"enquanto\",\n    \"entao\",\n    \"entre\",\n    \"então\",\n    \"era\",\n    \"eram\",\n    \"essa\",\n    \"essas\",\n    \"esse\",\n    \"esses\",\n    \"esta\",\n    \"estado\",\n    \"estamos\",\n    \"estar\",\n    \"estará\",\n    \"estas\",\n    \"estava\",\n    \"estavam\",\n    \"este\",\n    \"esteja\",\n    \"estejam\",\n    \"estejamos\",\n    \"estes\",\n    \"esteve\",\n    \"estive\",\n    \"estivemos\",\n    \"estiver\",\n    \"estivera\",\n    \"estiveram\",\n    \"estiverem\",\n    \"estivermos\",\n    \"estivesse\",\n    \"estivessem\",\n    \"estiveste\",\n    \"estivestes\",\n    \"estivéramos\",\n    \"estivéssemos\",\n    \"estou\",\n    \"está\",\n    \"estás\",\n    \"estávamos\",\n    \"estão\",\n    \"eu\",\n    \"exemplo\",\n    \"falta\",\n    \"fará\",\n    \"favor\",\n    \"faz\",\n    \"fazeis\",\n    \"fazem\",\n    \"fazemos\",\n    \"fazer\",\n    \"fazes\",\n    \"fazia\",\n    \"faço\",\n    \"fez\",\n    \"fim\",\n    \"final\",\n    \"foi\",\n    \"fomos\",\n    \"for\",\n    \"fora\",\n    \"foram\",\n    \"forem\",\n    \"forma\",\n    \"formos\",\n    \"fosse\",\n    \"fossem\",\n    \"foste\",\n    \"fostes\",\n    \"fui\",\n    \"fôramos\",\n    \"fôssemos\",\n    \"geral\",\n    \"grande\",\n    \"grandes\",\n    \"grupo\",\n    \"ha\",\n    \"haja\",\n    \"hajam\",\n    \"hajamos\",\n    \"havemos\",\n    \"havia\",\n    \"hei\",\n    \"hoje\",\n    \"hora\",\n    \"horas\",\n    \"houve\",\n    \"houvemos\",\n    \"houver\",\n    \"houvera\",\n    \"houveram\",\n    \"houverei\",\n    \"houverem\",\n    \"houveremos\",\n    \"houveria\",\n    \"houveriam\",\n    \"houvermos\",\n    \"houverá\",\n    \"houverão\",\n    \"houveríamos\",\n    \"houvesse\",\n    \"houvessem\",\n    \"houvéramos\",\n    \"houvéssemos\",\n    \"há\",\n    \"hão\",\n    \"iniciar\",\n    \"inicio\",\n    \"ir\",\n    \"irá\",\n    \"isso\",\n    \"ista\",\n    \"iste\",\n    \"isto\",\n    \"já\",\n    \"lado\",\n    \"lhe\",\n    \"lhes\",\n    \"ligado\",\n    \"local\",\n    \"logo\",\n    \"longe\",\n    \"lugar\",\n    \"lá\",\n    \"maior\",\n    \"maioria\",\n    \"maiorias\",\n    \"mais\",\n    \"mal\",\n    \"mas\",\n    \"me\",\n    \"mediante\",\n    \"meio\",\n    \"menor\",\n    \"menos\",\n    \"meses\",\n    \"mesma\",\n    \"mesmas\",\n    \"mesmo\",\n    \"mesmos\",\n    \"meu\",\n    \"meus\",\n    \"mil\",\n    \"minha\",\n    \"minhas\",\n    \"momento\",\n    \"muito\",\n    \"muitos\",\n    \"máximo\",\n    \"mês\",\n    \"na\",\n    \"nada\",\n    \"nao\",\n    \"naquela\",\n    \"naquelas\",\n    \"naquele\",\n    \"naqueles\",\n    \"nas\",\n    \"nem\",\n    \"nenhuma\",\n    \"nessa\",\n    \"nessas\",\n    \"nesse\",\n    \"nesses\",\n    \"nesta\",\n    \"nestas\",\n    \"neste\",\n    \"nestes\",\n    \"no\",\n    \"noite\",\n    \"nome\",\n    \"nos\",\n    \"nossa\",\n    \"nossas\",\n    \"nosso\",\n    \"nossos\",\n    \"nova\",\n    \"novas\",\n    \"nove\",\n    \"novo\",\n    \"novos\",\n    \"num\",\n    \"numa\",\n    \"numas\",\n    \"nunca\",\n    \"nuns\",\n    \"não\",\n    \"nível\",\n    \"nós\",\n    \"número\",\n    \"o\",\n    \"obra\",\n    \"obrigada\",\n    \"obrigado\",\n    \"oitava\",\n    \"oitavo\",\n    \"oito\",\n    \"onde\",\n    \"ontem\",\n    \"onze\",\n    \"os\",\n    \"ou\",\n    \"outra\",\n    \"outras\",\n    \"outro\",\n    \"outros\",\n    \"para\",\n    \"parece\",\n    \"parte\",\n    \"partir\",\n    \"paucas\",\n    \"pegar\",\n    \"pela\",\n    \"pelas\",\n    \"pelo\",\n    \"pelos\",\n    \"perante\",\n    \"perto\",\n    \"pessoas\",\n    \"pode\",\n    \"podem\",\n    \"poder\",\n    \"poderá\",\n    \"podia\",\n    \"pois\",\n    \"ponto\",\n    \"pontos\",\n    \"por\",\n    \"porque\",\n    \"porquê\",\n    \"portanto\",\n    \"posição\",\n    \"possivelmente\",\n    \"posso\",\n    \"possível\",\n    \"pouca\",\n    \"pouco\",\n    \"poucos\",\n    \"povo\",\n    \"primeira\",\n    \"primeiras\",\n    \"primeiro\",\n    \"primeiros\",\n    \"promeiro\",\n    \"propios\",\n    \"proprio\",\n    \"própria\",\n    \"próprias\",\n    \"próprio\",\n    \"próprios\",\n    \"próxima\",\n    \"próximas\",\n    \"próximo\",\n    \"próximos\",\n    \"puderam\",\n    \"pôde\",\n    \"põe\",\n    \"põem\",\n    \"quais\",\n    \"qual\",\n    \"qualquer\",\n    \"quando\",\n    \"quanto\",\n    \"quarta\",\n    \"quarto\",\n    \"quatro\",\n    \"que\",\n    \"quem\",\n    \"quer\",\n    \"quereis\",\n    \"querem\",\n    \"queremas\",\n    \"queres\",\n    \"quero\",\n    \"questão\",\n    \"quieto\",\n    \"quinta\",\n    \"quinto\",\n    \"quinze\",\n    \"quáis\",\n    \"quê\",\n    \"relação\",\n    \"sabe\",\n    \"sabem\",\n    \"saber\",\n    \"se\",\n    \"segunda\",\n    \"segundo\",\n    \"sei\",\n    \"seis\",\n    \"seja\",\n    \"sejam\",\n    \"sejamos\",\n    \"sem\",\n    \"sempre\",\n    \"sendo\",\n    \"ser\",\n    \"serei\",\n    \"seremos\",\n    \"seria\",\n    \"seriam\",\n    \"será\",\n    \"serão\",\n    \"seríamos\",\n    \"sete\",\n    \"seu\",\n    \"seus\",\n    \"sexta\",\n    \"sexto\",\n    \"sim\",\n    \"sistema\",\n    \"sob\",\n    \"sobre\",\n    \"sois\",\n    \"somente\",\n    \"somos\",\n    \"sou\",\n    \"sua\",\n    \"suas\",\n    \"são\",\n    \"sétima\",\n    \"sétimo\",\n    \"só\",\n    \"tal\",\n    \"talvez\",\n    \"tambem\",\n    \"também\",\n    \"tanta\",\n    \"tantas\",\n    \"tanto\",\n    \"tarde\",\n    \"te\",\n    \"tem\",\n    \"temos\",\n    \"tempo\",\n    \"tendes\",\n    \"tenha\",\n    \"tenham\",\n    \"tenhamos\",\n    \"tenho\",\n    \"tens\",\n    \"tentar\",\n    \"tentaram\",\n    \"tente\",\n    \"tentei\",\n    \"ter\",\n    \"terceira\",\n    \"terceiro\",\n    \"terei\",\n    \"teremos\",\n    \"teria\",\n    \"teriam\",\n    \"terá\",\n    \"terão\",\n    \"teríamos\",\n    \"teu\",\n    \"teus\",\n    \"teve\",\n    \"tinha\",\n    \"tinham\",\n    \"tipo\",\n    \"tive\",\n    \"tivemos\",\n    \"tiver\",\n    \"tivera\",\n    \"tiveram\",\n    \"tiverem\",\n    \"tivermos\",\n    \"tivesse\",\n    \"tivessem\",\n    \"tiveste\",\n    \"tivestes\",\n    \"tivéramos\",\n    \"tivéssemos\",\n    \"toda\",\n    \"todas\",\n    \"todo\",\n    \"todos\",\n    \"trabalhar\",\n    \"trabalho\",\n    \"treze\",\n    \"três\",\n    \"tu\",\n    \"tua\",\n    \"tuas\",\n    \"tudo\",\n    \"tão\",\n    \"tém\",\n    \"têm\",\n    \"tínhamos\",\n    \"um\",\n    \"uma\",\n    \"umas\",\n    \"uns\",\n    \"usa\",\n    \"usar\",\n    \"vai\",\n    \"vais\",\n    \"valor\",\n    \"veja\",\n    \"vem\",\n    \"vens\",\n    \"ver\",\n    \"verdade\",\n    \"verdadeiro\",\n    \"vez\",\n    \"vezes\",\n    \"viagem\",\n    \"vindo\",\n    \"vinte\",\n    \"você\",\n    \"vocês\",\n    \"vos\",\n    \"vossa\",\n    \"vossas\",\n    \"vosso\",\n    \"vossos\",\n    \"vários\",\n    \"vão\",\n    \"vêm\",\n    \"vós\",\n    \"zero\",\n    \"à\",\n    \"às\",\n    \"área\",\n    \"é\",\n    \"éramos\",\n    \"és\",\n    \"último\",\n];\n"
  },
  {
    "path": "src/stopwords/ron.rs",
    "content": "// Sonic\n//\n// Fast, lightweight and schema-less search backend\n// Copyright: 2019, Valerian Saliou <valerian@valeriansaliou.name>\n// License: Mozilla Public License v2.0 (MPL v2.0)\n\npub static STOPWORDS_RON: &[&str] = &[\n    \"a\",\n    \"abia\",\n    \"acea\",\n    \"aceasta\",\n    \"această\",\n    \"aceea\",\n    \"aceeasi\",\n    \"acei\",\n    \"aceia\",\n    \"acel\",\n    \"acela\",\n    \"acelasi\",\n    \"acele\",\n    \"acelea\",\n    \"acest\",\n    \"acesta\",\n    \"aceste\",\n    \"acestea\",\n    \"acestei\",\n    \"acestia\",\n    \"acestui\",\n    \"aceşti\",\n    \"aceştia\",\n    \"acolo\",\n    \"acord\",\n    \"acum\",\n    \"adica\",\n    \"ai\",\n    \"aia\",\n    \"aibă\",\n    \"aici\",\n    \"aiurea\",\n    \"al\",\n    \"ala\",\n    \"alaturi\",\n    \"ale\",\n    \"alea\",\n    \"alt\",\n    \"alta\",\n    \"altceva\",\n    \"altcineva\",\n    \"alte\",\n    \"altfel\",\n    \"alti\",\n    \"altii\",\n    \"altul\",\n    \"am\",\n    \"anume\",\n    \"apoi\",\n    \"ar\",\n    \"are\",\n    \"as\",\n    \"asa\",\n    \"asemenea\",\n    \"asta\",\n    \"astazi\",\n    \"astea\",\n    \"astfel\",\n    \"astăzi\",\n    \"asupra\",\n    \"atare\",\n    \"atat\",\n    \"atata\",\n    \"atatea\",\n    \"atatia\",\n    \"ati\",\n    \"atit\",\n    \"atita\",\n    \"atitea\",\n    \"atitia\",\n    \"atunci\",\n    \"au\",\n    \"avea\",\n    \"avem\",\n    \"aveţi\",\n    \"avut\",\n    \"azi\",\n    \"aş\",\n    \"aşadar\",\n    \"aţi\",\n    \"b\",\n    \"ba\",\n    \"bine\",\n    \"bucur\",\n    \"bună\",\n    \"c\",\n    \"ca\",\n    \"cam\",\n    \"cand\",\n    \"capat\",\n    \"care\",\n    \"careia\",\n    \"carora\",\n    \"caruia\",\n    \"cat\",\n    \"catre\",\n    \"caut\",\n    \"ce\",\n    \"cea\",\n    \"ceea\",\n    \"cei\",\n    \"ceilalti\",\n    \"cel\",\n    \"cele\",\n    \"celor\",\n    \"ceva\",\n    \"chiar\",\n    \"ci\",\n    \"cinci\",\n    \"cind\",\n    \"cine\",\n    \"cineva\",\n    \"cit\",\n    \"cita\",\n    \"cite\",\n    \"citeva\",\n    \"citi\",\n    \"citiva\",\n    \"conform\",\n    \"contra\",\n    \"cu\",\n    \"cui\",\n    \"cum\",\n    \"cumva\",\n    \"curând\",\n    \"curînd\",\n    \"când\",\n    \"cât\",\n    \"câte\",\n    \"câtva\",\n    \"câţi\",\n    \"cînd\",\n    \"cît\",\n    \"cîte\",\n    \"cîtva\",\n    \"cîţi\",\n    \"că\",\n    \"căci\",\n    \"cărei\",\n    \"căror\",\n    \"cărui\",\n    \"către\",\n    \"d\",\n    \"da\",\n    \"daca\",\n    \"dacă\",\n    \"dar\",\n    \"dat\",\n    \"datorită\",\n    \"dată\",\n    \"dau\",\n    \"de\",\n    \"deasupra\",\n    \"deci\",\n    \"decit\",\n    \"degraba\",\n    \"deja\",\n    \"deoarece\",\n    \"departe\",\n    \"desi\",\n    \"despre\",\n    \"deşi\",\n    \"din\",\n    \"dinaintea\",\n    \"dintr\",\n    \"dintr-\",\n    \"dintre\",\n    \"doar\",\n    \"doi\",\n    \"doilea\",\n    \"două\",\n    \"drept\",\n    \"dupa\",\n    \"după\",\n    \"dă\",\n    \"e\",\n    \"ea\",\n    \"ei\",\n    \"el\",\n    \"ele\",\n    \"era\",\n    \"eram\",\n    \"este\",\n    \"eu\",\n    \"exact\",\n    \"eşti\",\n    \"f\",\n    \"face\",\n    \"fara\",\n    \"fata\",\n    \"fel\",\n    \"fi\",\n    \"fie\",\n    \"fiecare\",\n    \"fii\",\n    \"fim\",\n    \"fiu\",\n    \"fiţi\",\n    \"foarte\",\n    \"fost\",\n    \"frumos\",\n    \"fără\",\n    \"g\",\n    \"geaba\",\n    \"graţie\",\n    \"h\",\n    \"halbă\",\n    \"i\",\n    \"ia\",\n    \"iar\",\n    \"ieri\",\n    \"ii\",\n    \"il\",\n    \"imi\",\n    \"in\",\n    \"inainte\",\n    \"inapoi\",\n    \"inca\",\n    \"incit\",\n    \"insa\",\n    \"intr\",\n    \"intre\",\n    \"isi\",\n    \"iti\",\n    \"j\",\n    \"k\",\n    \"l\",\n    \"la\",\n    \"le\",\n    \"li\",\n    \"lor\",\n    \"lui\",\n    \"lângă\",\n    \"lîngă\",\n    \"m\",\n    \"ma\",\n    \"mai\",\n    \"mare\",\n    \"mea\",\n    \"mei\",\n    \"mele\",\n    \"mereu\",\n    \"meu\",\n    \"mi\",\n    \"mie\",\n    \"mine\",\n    \"mod\",\n    \"mult\",\n    \"multa\",\n    \"multe\",\n    \"multi\",\n    \"multă\",\n    \"mulţi\",\n    \"mulţumesc\",\n    \"mâine\",\n    \"mîine\",\n    \"mă\",\n    \"n\",\n    \"ne\",\n    \"nevoie\",\n    \"ni\",\n    \"nici\",\n    \"niciodata\",\n    \"nicăieri\",\n    \"nimeni\",\n    \"nimeri\",\n    \"nimic\",\n    \"niste\",\n    \"nişte\",\n    \"noastre\",\n    \"noastră\",\n    \"noi\",\n    \"noroc\",\n    \"nostri\",\n    \"nostru\",\n    \"nou\",\n    \"noua\",\n    \"nouă\",\n    \"noştri\",\n    \"nu\",\n    \"numai\",\n    \"o\",\n    \"opt\",\n    \"or\",\n    \"ori\",\n    \"oricare\",\n    \"orice\",\n    \"oricine\",\n    \"oricum\",\n    \"oricând\",\n    \"oricât\",\n    \"oricînd\",\n    \"oricît\",\n    \"oriunde\",\n    \"p\",\n    \"pai\",\n    \"parca\",\n    \"patra\",\n    \"patru\",\n    \"patrulea\",\n    \"pe\",\n    \"pentru\",\n    \"peste\",\n    \"pic\",\n    \"pina\",\n    \"plus\",\n    \"poate\",\n    \"pot\",\n    \"prea\",\n    \"prima\",\n    \"primul\",\n    \"prin\",\n    \"printr-\",\n    \"putini\",\n    \"puţin\",\n    \"puţina\",\n    \"puţină\",\n    \"până\",\n    \"pînă\",\n    \"r\",\n    \"rog\",\n    \"s\",\n    \"sa\",\n    \"sa-mi\",\n    \"sa-ti\",\n    \"sai\",\n    \"sale\",\n    \"sau\",\n    \"se\",\n    \"si\",\n    \"sint\",\n    \"sintem\",\n    \"spate\",\n    \"spre\",\n    \"sub\",\n    \"sunt\",\n    \"suntem\",\n    \"sunteţi\",\n    \"sus\",\n    \"sută\",\n    \"sînt\",\n    \"sîntem\",\n    \"sînteţi\",\n    \"să\",\n    \"săi\",\n    \"său\",\n    \"t\",\n    \"ta\",\n    \"tale\",\n    \"te\",\n    \"ti\",\n    \"timp\",\n    \"tine\",\n    \"toata\",\n    \"toate\",\n    \"toată\",\n    \"tocmai\",\n    \"tot\",\n    \"toti\",\n    \"totul\",\n    \"totusi\",\n    \"totuşi\",\n    \"toţi\",\n    \"trei\",\n    \"treia\",\n    \"treilea\",\n    \"tu\",\n    \"tuturor\",\n    \"tăi\",\n    \"tău\",\n    \"u\",\n    \"ul\",\n    \"ului\",\n    \"un\",\n    \"una\",\n    \"unde\",\n    \"undeva\",\n    \"unei\",\n    \"uneia\",\n    \"unele\",\n    \"uneori\",\n    \"unii\",\n    \"unor\",\n    \"unora\",\n    \"unu\",\n    \"unui\",\n    \"unuia\",\n    \"unul\",\n    \"v\",\n    \"va\",\n    \"vi\",\n    \"voastre\",\n    \"voastră\",\n    \"voi\",\n    \"vom\",\n    \"vor\",\n    \"vostru\",\n    \"vouă\",\n    \"voştri\",\n    \"vreme\",\n    \"vreo\",\n    \"vreun\",\n    \"vă\",\n    \"x\",\n    \"z\",\n    \"zece\",\n    \"zero\",\n    \"zi\",\n    \"zice\",\n    \"îi\",\n    \"îl\",\n    \"îmi\",\n    \"împotriva\",\n    \"în\",\n    \"înainte\",\n    \"înaintea\",\n    \"încotro\",\n    \"încât\",\n    \"încît\",\n    \"între\",\n    \"întrucât\",\n    \"întrucît\",\n    \"îţi\",\n    \"ăla\",\n    \"ălea\",\n    \"ăsta\",\n    \"ăstea\",\n    \"ăştia\",\n    \"şapte\",\n    \"şase\",\n    \"şi\",\n    \"ştiu\",\n    \"ţi\",\n    \"ţie\",\n];\n"
  },
  {
    "path": "src/stopwords/rus.rs",
    "content": "// Sonic\n//\n// Fast, lightweight and schema-less search backend\n// Copyright: 2019, Valerian Saliou <valerian@valeriansaliou.name>\n// License: Mozilla Public License v2.0 (MPL v2.0)\n\npub static STOPWORDS_RUS: &[&str] = &[\n    \"c\",\n    \"а\",\n    \"алло\",\n    \"без\",\n    \"белый\",\n    \"близко\",\n    \"более\",\n    \"больше\",\n    \"большой\",\n    \"будем\",\n    \"будет\",\n    \"будете\",\n    \"будешь\",\n    \"будто\",\n    \"буду\",\n    \"будут\",\n    \"будь\",\n    \"бы\",\n    \"бывает\",\n    \"бывь\",\n    \"был\",\n    \"была\",\n    \"были\",\n    \"было\",\n    \"быть\",\n    \"в\",\n    \"важная\",\n    \"важное\",\n    \"важные\",\n    \"важный\",\n    \"вам\",\n    \"вами\",\n    \"вас\",\n    \"ваш\",\n    \"ваша\",\n    \"ваше\",\n    \"ваши\",\n    \"вверх\",\n    \"вдали\",\n    \"вдруг\",\n    \"ведь\",\n    \"везде\",\n    \"вернуться\",\n    \"весь\",\n    \"вечер\",\n    \"взгляд\",\n    \"взять\",\n    \"вид\",\n    \"видел\",\n    \"видеть\",\n    \"вместе\",\n    \"вне\",\n    \"вниз\",\n    \"внизу\",\n    \"во\",\n    \"вода\",\n    \"война\",\n    \"вокруг\",\n    \"вон\",\n    \"вообще\",\n    \"вопрос\",\n    \"восемнадцатый\",\n    \"восемнадцать\",\n    \"восемь\",\n    \"восьмой\",\n    \"вот\",\n    \"впрочем\",\n    \"времени\",\n    \"время\",\n    \"все\",\n    \"все еще\",\n    \"всегда\",\n    \"всего\",\n    \"всем\",\n    \"всеми\",\n    \"всему\",\n    \"всех\",\n    \"всею\",\n    \"всю\",\n    \"всюду\",\n    \"вся\",\n    \"всё\",\n    \"второй\",\n    \"вы\",\n    \"выйти\",\n    \"г\",\n    \"где\",\n    \"главный\",\n    \"глаз\",\n    \"говорил\",\n    \"говорит\",\n    \"говорить\",\n    \"год\",\n    \"года\",\n    \"году\",\n    \"голова\",\n    \"голос\",\n    \"город\",\n    \"да\",\n    \"давать\",\n    \"давно\",\n    \"даже\",\n    \"далекий\",\n    \"далеко\",\n    \"дальше\",\n    \"даром\",\n    \"дать\",\n    \"два\",\n    \"двадцатый\",\n    \"двадцать\",\n    \"две\",\n    \"двенадцатый\",\n    \"двенадцать\",\n    \"дверь\",\n    \"двух\",\n    \"девятнадцатый\",\n    \"девятнадцать\",\n    \"девятый\",\n    \"девять\",\n    \"действительно\",\n    \"дел\",\n    \"делал\",\n    \"делать\",\n    \"делаю\",\n    \"дело\",\n    \"день\",\n    \"деньги\",\n    \"десятый\",\n    \"десять\",\n    \"для\",\n    \"до\",\n    \"довольно\",\n    \"долго\",\n    \"должен\",\n    \"должно\",\n    \"должный\",\n    \"дом\",\n    \"дорога\",\n    \"друг\",\n    \"другая\",\n    \"другие\",\n    \"других\",\n    \"друго\",\n    \"другое\",\n    \"другой\",\n    \"думать\",\n    \"душа\",\n    \"е\",\n    \"его\",\n    \"ее\",\n    \"ей\",\n    \"ему\",\n    \"если\",\n    \"есть\",\n    \"еще\",\n    \"ещё\",\n    \"ею\",\n    \"её\",\n    \"ж\",\n    \"ждать\",\n    \"же\",\n    \"жена\",\n    \"женщина\",\n    \"жизнь\",\n    \"жить\",\n    \"за\",\n    \"занят\",\n    \"занята\",\n    \"занято\",\n    \"заняты\",\n    \"затем\",\n    \"зато\",\n    \"зачем\",\n    \"здесь\",\n    \"земля\",\n    \"знать\",\n    \"значит\",\n    \"значить\",\n    \"и\",\n    \"иди\",\n    \"идти\",\n    \"из\",\n    \"или\",\n    \"им\",\n    \"имеет\",\n    \"имел\",\n    \"именно\",\n    \"иметь\",\n    \"ими\",\n    \"имя\",\n    \"иногда\",\n    \"их\",\n    \"к\",\n    \"каждая\",\n    \"каждое\",\n    \"каждые\",\n    \"каждый\",\n    \"кажется\",\n    \"казаться\",\n    \"как\",\n    \"какая\",\n    \"какой\",\n    \"кем\",\n    \"книга\",\n    \"когда\",\n    \"кого\",\n    \"ком\",\n    \"комната\",\n    \"кому\",\n    \"конец\",\n    \"конечно\",\n    \"которая\",\n    \"которого\",\n    \"которой\",\n    \"которые\",\n    \"который\",\n    \"которых\",\n    \"кроме\",\n    \"кругом\",\n    \"кто\",\n    \"куда\",\n    \"лежать\",\n    \"лет\",\n    \"ли\",\n    \"лицо\",\n    \"лишь\",\n    \"лучше\",\n    \"любить\",\n    \"люди\",\n    \"м\",\n    \"маленький\",\n    \"мало\",\n    \"мать\",\n    \"машина\",\n    \"между\",\n    \"меля\",\n    \"менее\",\n    \"меньше\",\n    \"меня\",\n    \"место\",\n    \"миллионов\",\n    \"мимо\",\n    \"минута\",\n    \"мир\",\n    \"мира\",\n    \"мне\",\n    \"много\",\n    \"многочисленная\",\n    \"многочисленное\",\n    \"многочисленные\",\n    \"многочисленный\",\n    \"мной\",\n    \"мною\",\n    \"мог\",\n    \"могу\",\n    \"могут\",\n    \"мож\",\n    \"может\",\n    \"может быть\",\n    \"можно\",\n    \"можхо\",\n    \"мои\",\n    \"мой\",\n    \"мор\",\n    \"москва\",\n    \"мочь\",\n    \"моя\",\n    \"моё\",\n    \"мы\",\n    \"на\",\n    \"наверху\",\n    \"над\",\n    \"надо\",\n    \"назад\",\n    \"наиболее\",\n    \"найти\",\n    \"наконец\",\n    \"нам\",\n    \"нами\",\n    \"народ\",\n    \"нас\",\n    \"начала\",\n    \"начать\",\n    \"наш\",\n    \"наша\",\n    \"наше\",\n    \"наши\",\n    \"не\",\n    \"него\",\n    \"недавно\",\n    \"недалеко\",\n    \"нее\",\n    \"ней\",\n    \"некоторый\",\n    \"нельзя\",\n    \"нем\",\n    \"немного\",\n    \"нему\",\n    \"непрерывно\",\n    \"нередко\",\n    \"несколько\",\n    \"нет\",\n    \"нею\",\n    \"неё\",\n    \"ни\",\n    \"нибудь\",\n    \"ниже\",\n    \"низко\",\n    \"никакой\",\n    \"никогда\",\n    \"никто\",\n    \"никуда\",\n    \"ним\",\n    \"ними\",\n    \"них\",\n    \"ничего\",\n    \"ничто\",\n    \"но\",\n    \"новый\",\n    \"нога\",\n    \"ночь\",\n    \"ну\",\n    \"нужно\",\n    \"нужный\",\n    \"нх\",\n    \"о\",\n    \"об\",\n    \"оба\",\n    \"обычно\",\n    \"один\",\n    \"одиннадцатый\",\n    \"одиннадцать\",\n    \"однажды\",\n    \"однако\",\n    \"одного\",\n    \"одной\",\n    \"оказаться\",\n    \"окно\",\n    \"около\",\n    \"он\",\n    \"она\",\n    \"они\",\n    \"оно\",\n    \"опять\",\n    \"особенно\",\n    \"остаться\",\n    \"от\",\n    \"ответить\",\n    \"отец\",\n    \"откуда\",\n    \"отовсюду\",\n    \"отсюда\",\n    \"очень\",\n    \"первый\",\n    \"перед\",\n    \"писать\",\n    \"плечо\",\n    \"по\",\n    \"под\",\n    \"подойди\",\n    \"подумать\",\n    \"пожалуйста\",\n    \"позже\",\n    \"пойти\",\n    \"пока\",\n    \"пол\",\n    \"получить\",\n    \"помнить\",\n    \"понимать\",\n    \"понять\",\n    \"пор\",\n    \"пора\",\n    \"после\",\n    \"последний\",\n    \"посмотреть\",\n    \"посреди\",\n    \"потом\",\n    \"потому\",\n    \"почему\",\n    \"почти\",\n    \"правда\",\n    \"прекрасно\",\n    \"при\",\n    \"про\",\n    \"просто\",\n    \"против\",\n    \"процентов\",\n    \"путь\",\n    \"пятнадцатый\",\n    \"пятнадцать\",\n    \"пятый\",\n    \"пять\",\n    \"работа\",\n    \"работать\",\n    \"раз\",\n    \"разве\",\n    \"рано\",\n    \"раньше\",\n    \"ребенок\",\n    \"решить\",\n    \"россия\",\n    \"рука\",\n    \"русский\",\n    \"ряд\",\n    \"рядом\",\n    \"с\",\n    \"с кем\",\n    \"сам\",\n    \"сама\",\n    \"сами\",\n    \"самим\",\n    \"самими\",\n    \"самих\",\n    \"само\",\n    \"самого\",\n    \"самой\",\n    \"самом\",\n    \"самому\",\n    \"саму\",\n    \"самый\",\n    \"свет\",\n    \"свое\",\n    \"своего\",\n    \"своей\",\n    \"свои\",\n    \"своих\",\n    \"свой\",\n    \"свою\",\n    \"сделать\",\n    \"сеаой\",\n    \"себе\",\n    \"себя\",\n    \"сегодня\",\n    \"седьмой\",\n    \"сейчас\",\n    \"семнадцатый\",\n    \"семнадцать\",\n    \"семь\",\n    \"сидеть\",\n    \"сила\",\n    \"сих\",\n    \"сказал\",\n    \"сказала\",\n    \"сказать\",\n    \"сколько\",\n    \"слишком\",\n    \"слово\",\n    \"случай\",\n    \"смотреть\",\n    \"сначала\",\n    \"снова\",\n    \"со\",\n    \"собой\",\n    \"собою\",\n    \"советский\",\n    \"совсем\",\n    \"спасибо\",\n    \"спросить\",\n    \"сразу\",\n    \"стал\",\n    \"старый\",\n    \"стать\",\n    \"стол\",\n    \"сторона\",\n    \"стоять\",\n    \"страна\",\n    \"суть\",\n    \"считать\",\n    \"т\",\n    \"та\",\n    \"так\",\n    \"такая\",\n    \"также\",\n    \"таки\",\n    \"такие\",\n    \"такое\",\n    \"такой\",\n    \"там\",\n    \"твои\",\n    \"твой\",\n    \"твоя\",\n    \"твоё\",\n    \"те\",\n    \"тебе\",\n    \"тебя\",\n    \"тем\",\n    \"теми\",\n    \"теперь\",\n    \"тех\",\n    \"то\",\n    \"тобой\",\n    \"тобою\",\n    \"товарищ\",\n    \"тогда\",\n    \"того\",\n    \"тоже\",\n    \"только\",\n    \"том\",\n    \"тому\",\n    \"тот\",\n    \"тою\",\n    \"третий\",\n    \"три\",\n    \"тринадцатый\",\n    \"тринадцать\",\n    \"ту\",\n    \"туда\",\n    \"тут\",\n    \"ты\",\n    \"тысяч\",\n    \"у\",\n    \"увидеть\",\n    \"уж\",\n    \"уже\",\n    \"улица\",\n    \"уметь\",\n    \"утро\",\n    \"хороший\",\n    \"хорошо\",\n    \"хотел бы\",\n    \"хотеть\",\n    \"хоть\",\n    \"хотя\",\n    \"хочешь\",\n    \"час\",\n    \"часто\",\n    \"часть\",\n    \"чаще\",\n    \"чего\",\n    \"человек\",\n    \"чем\",\n    \"чему\",\n    \"через\",\n    \"четвертый\",\n    \"четыре\",\n    \"четырнадцатый\",\n    \"четырнадцать\",\n    \"что\",\n    \"чтоб\",\n    \"чтобы\",\n    \"чуть\",\n    \"шестнадцатый\",\n    \"шестнадцать\",\n    \"шестой\",\n    \"шесть\",\n    \"эта\",\n    \"эти\",\n    \"этим\",\n    \"этими\",\n    \"этих\",\n    \"это\",\n    \"этого\",\n    \"этой\",\n    \"этом\",\n    \"этому\",\n    \"этот\",\n    \"эту\",\n    \"я\",\n    \"являюсь\",\n];\n"
  },
  {
    "path": "src/stopwords/sin.rs",
    "content": "// Sonic\n//\n// Fast, lightweight and schema-less search backend\n// Copyright: 2019, Valerian Saliou <valerian@valeriansaliou.name>\n// License: Mozilla Public License v2.0 (MPL v2.0)\n\n// Notice: we do not have stopwords for this language yet.\npub static STOPWORDS_SIN: &[&str] = &[];\n"
  },
  {
    "path": "src/stopwords/slk.rs",
    "content": "// Sonic\n//\n// Fast, lightweight and schema-less search backend\n// Copyright: 2020, Valerian Saliou <valerian@valeriansaliou.name>\n// License: Mozilla Public License v2.0 (MPL v2.0)\n\npub static STOPWORDS_SLK: &[&str] = &[\n    \"a\",\n    \"aby\",\n    \"aj\",\n    \"ak\",\n    \"akej\",\n    \"akejže\",\n    \"ako\",\n    \"akom\",\n    \"akomže\",\n    \"akou\",\n    \"akouže\",\n    \"akože\",\n    \"aká\",\n    \"akáže\",\n    \"aké\",\n    \"akého\",\n    \"akéhože\",\n    \"akému\",\n    \"akémuže\",\n    \"akéže\",\n    \"akú\",\n    \"akúže\",\n    \"aký\",\n    \"akých\",\n    \"akýchže\",\n    \"akým\",\n    \"akými\",\n    \"akýmiže\",\n    \"akýmže\",\n    \"akýže\",\n    \"ale\",\n    \"alebo\",\n    \"ani\",\n    \"asi\",\n    \"avšak\",\n    \"až\",\n    \"ba\",\n    \"bez\",\n    \"bezo\",\n    \"bol\",\n    \"bola\",\n    \"boli\",\n    \"bolo\",\n    \"bude\",\n    \"budem\",\n    \"budeme\",\n    \"budete\",\n    \"budeš\",\n    \"budú\",\n    \"buď\",\n    \"by\",\n    \"byť\",\n    \"cez\",\n    \"cezo\",\n    \"dnes\",\n    \"do\",\n    \"ešte\",\n    \"ho\",\n    \"hoci\",\n    \"i\",\n    \"iba\",\n    \"ich\",\n    \"im\",\n    \"inej\",\n    \"inom\",\n    \"iná\",\n    \"iné\",\n    \"iného\",\n    \"inému\",\n    \"iní\",\n    \"inú\",\n    \"iný\",\n    \"iných\",\n    \"iným\",\n    \"inými\",\n    \"ja\",\n    \"je\",\n    \"jeho\",\n    \"jej\",\n    \"jemu\",\n    \"ju\",\n    \"k\",\n    \"kam\",\n    \"kamže\",\n    \"každou\",\n    \"každá\",\n    \"každé\",\n    \"každého\",\n    \"každému\",\n    \"každí\",\n    \"každú\",\n    \"každý\",\n    \"každých\",\n    \"každým\",\n    \"každými\",\n    \"kde\",\n    \"kej\",\n    \"kejže\",\n    \"keď\",\n    \"keďže\",\n    \"kie\",\n    \"kieho\",\n    \"kiehože\",\n    \"kiemu\",\n    \"kiemuže\",\n    \"kieže\",\n    \"koho\",\n    \"kom\",\n    \"komu\",\n    \"kou\",\n    \"kouže\",\n    \"kto\",\n    \"ktorej\",\n    \"ktorou\",\n    \"ktorá\",\n    \"ktoré\",\n    \"ktorí\",\n    \"ktorú\",\n    \"ktorý\",\n    \"ktorých\",\n    \"ktorým\",\n    \"ktorými\",\n    \"ku\",\n    \"ká\",\n    \"káže\",\n    \"ké\",\n    \"kéže\",\n    \"kú\",\n    \"kúže\",\n    \"ký\",\n    \"kýho\",\n    \"kýhože\",\n    \"kým\",\n    \"kýmu\",\n    \"kýmuže\",\n    \"kýže\",\n    \"lebo\",\n    \"leda\",\n    \"ledaže\",\n    \"len\",\n    \"ma\",\n    \"majú\",\n    \"mal\",\n    \"mala\",\n    \"mali\",\n    \"mať\",\n    \"medzi\",\n    \"mi\",\n    \"mne\",\n    \"mnou\",\n    \"moja\",\n    \"moje\",\n    \"mojej\",\n    \"mojich\",\n    \"mojim\",\n    \"mojimi\",\n    \"mojou\",\n    \"moju\",\n    \"možno\",\n    \"mu\",\n    \"musia\",\n    \"musieť\",\n    \"musí\",\n    \"musím\",\n    \"musíme\",\n    \"musíte\",\n    \"musíš\",\n    \"my\",\n    \"má\",\n    \"mám\",\n    \"máme\",\n    \"máte\",\n    \"máš\",\n    \"môcť\",\n    \"môj\",\n    \"môjho\",\n    \"môže\",\n    \"môžem\",\n    \"môžeme\",\n    \"môžete\",\n    \"môžeš\",\n    \"môžu\",\n    \"mňa\",\n    \"na\",\n    \"nad\",\n    \"nado\",\n    \"najmä\",\n    \"nami\",\n    \"naša\",\n    \"naše\",\n    \"našej\",\n    \"naši\",\n    \"našich\",\n    \"našim\",\n    \"našimi\",\n    \"našou\",\n    \"ne\",\n    \"nech\",\n    \"neho\",\n    \"nej\",\n    \"nejakej\",\n    \"nejakom\",\n    \"nejakou\",\n    \"nejaká\",\n    \"nejaké\",\n    \"nejakého\",\n    \"nejakému\",\n    \"nejakú\",\n    \"nejaký\",\n    \"nejakých\",\n    \"nejakým\",\n    \"nejakými\",\n    \"nemu\",\n    \"než\",\n    \"nich\",\n    \"nie\",\n    \"niektorej\",\n    \"niektorom\",\n    \"niektorou\",\n    \"niektorá\",\n    \"niektoré\",\n    \"niektorého\",\n    \"niektorému\",\n    \"niektorú\",\n    \"niektorý\",\n    \"niektorých\",\n    \"niektorým\",\n    \"niektorými\",\n    \"nielen\",\n    \"niečo\",\n    \"nim\",\n    \"nimi\",\n    \"nič\",\n    \"ničoho\",\n    \"ničom\",\n    \"ničomu\",\n    \"ničím\",\n    \"no\",\n    \"nám\",\n    \"nás\",\n    \"náš\",\n    \"nášho\",\n    \"ním\",\n    \"o\",\n    \"od\",\n    \"odo\",\n    \"on\",\n    \"ona\",\n    \"oni\",\n    \"ono\",\n    \"ony\",\n    \"oň\",\n    \"oňho\",\n    \"po\",\n    \"pod\",\n    \"podo\",\n    \"podľa\",\n    \"pokiaľ\",\n    \"popod\",\n    \"popri\",\n    \"potom\",\n    \"poza\",\n    \"pre\",\n    \"pred\",\n    \"predo\",\n    \"preto\",\n    \"pretože\",\n    \"prečo\",\n    \"pri\",\n    \"práve\",\n    \"s\",\n    \"sa\",\n    \"seba\",\n    \"sebe\",\n    \"sebou\",\n    \"sem\",\n    \"si\",\n    \"sme\",\n    \"so\",\n    \"som\",\n    \"ste\",\n    \"svoj\",\n    \"svoja\",\n    \"svoje\",\n    \"svojho\",\n    \"svojich\",\n    \"svojim\",\n    \"svojimi\",\n    \"svojou\",\n    \"svoju\",\n    \"svojím\",\n    \"sú\",\n    \"ta\",\n    \"tak\",\n    \"takej\",\n    \"takejto\",\n    \"taká\",\n    \"takáto\",\n    \"také\",\n    \"takého\",\n    \"takéhoto\",\n    \"takému\",\n    \"takémuto\",\n    \"takéto\",\n    \"takí\",\n    \"takú\",\n    \"takúto\",\n    \"taký\",\n    \"takýto\",\n    \"takže\",\n    \"tam\",\n    \"teba\",\n    \"tebe\",\n    \"tebou\",\n    \"teda\",\n    \"tej\",\n    \"tejto\",\n    \"ten\",\n    \"tento\",\n    \"ti\",\n    \"tie\",\n    \"tieto\",\n    \"tiež\",\n    \"to\",\n    \"toho\",\n    \"tohoto\",\n    \"tohto\",\n    \"tom\",\n    \"tomto\",\n    \"tomu\",\n    \"tomuto\",\n    \"toto\",\n    \"tou\",\n    \"touto\",\n    \"tu\",\n    \"tvoj\",\n    \"tvoja\",\n    \"tvoje\",\n    \"tvojej\",\n    \"tvojho\",\n    \"tvoji\",\n    \"tvojich\",\n    \"tvojim\",\n    \"tvojimi\",\n    \"tvojím\",\n    \"ty\",\n    \"tá\",\n    \"táto\",\n    \"tí\",\n    \"títo\",\n    \"tú\",\n    \"túto\",\n    \"tých\",\n    \"tým\",\n    \"tými\",\n    \"týmto\",\n    \"u\",\n    \"už\",\n    \"v\",\n    \"vami\",\n    \"vaša\",\n    \"vaše\",\n    \"vašej\",\n    \"vaši\",\n    \"vašich\",\n    \"vašim\",\n    \"vaším\",\n    \"veď\",\n    \"viac\",\n    \"vo\",\n    \"vy\",\n    \"vám\",\n    \"vás\",\n    \"váš\",\n    \"vášho\",\n    \"však\",\n    \"všetci\",\n    \"všetka\",\n    \"všetko\",\n    \"všetky\",\n    \"všetok\",\n    \"z\",\n    \"za\",\n    \"začo\",\n    \"začože\",\n    \"zo\",\n    \"áno\",\n    \"čej\",\n    \"či\",\n    \"čia\",\n    \"čie\",\n    \"čieho\",\n    \"čiemu\",\n    \"čiu\",\n    \"čo\",\n    \"čoho\",\n    \"čom\",\n    \"čomu\",\n    \"čou\",\n    \"čože\",\n    \"čí\",\n    \"čím\",\n    \"čími\",\n    \"ďalšia\",\n    \"ďalšie\",\n    \"ďalšieho\",\n    \"ďalšiemu\",\n    \"ďalšiu\",\n    \"ďalšom\",\n    \"ďalšou\",\n    \"ďalší\",\n    \"ďalších\",\n    \"ďalším\",\n    \"ďalšími\",\n    \"ňom\",\n    \"ňou\",\n    \"ňu\",\n    \"že\",\n];\n"
  },
  {
    "path": "src/stopwords/slv.rs",
    "content": "// Sonic\n//\n// Fast, lightweight and schema-less search backend\n// Copyright: 2019, Valerian Saliou <valerian@valeriansaliou.name>\n// License: Mozilla Public License v2.0 (MPL v2.0)\n\npub static STOPWORDS_SLV: &[&str] = &[\n    \"a\",\n    \"ali\",\n    \"april\",\n    \"avgust\",\n    \"b\",\n    \"bi\",\n    \"bil\",\n    \"bila\",\n    \"bile\",\n    \"bili\",\n    \"bilo\",\n    \"biti\",\n    \"blizu\",\n    \"bo\",\n    \"bodo\",\n    \"bojo\",\n    \"bolj\",\n    \"bom\",\n    \"bomo\",\n    \"boste\",\n    \"bova\",\n    \"boš\",\n    \"brez\",\n    \"c\",\n    \"cel\",\n    \"cela\",\n    \"celi\",\n    \"celo\",\n    \"d\",\n    \"da\",\n    \"daleč\",\n    \"dan\",\n    \"danes\",\n    \"datum\",\n    \"december\",\n    \"deset\",\n    \"deseta\",\n    \"deseti\",\n    \"deseto\",\n    \"devet\",\n    \"deveta\",\n    \"deveti\",\n    \"deveto\",\n    \"do\",\n    \"dober\",\n    \"dobra\",\n    \"dobri\",\n    \"dobro\",\n    \"dokler\",\n    \"dol\",\n    \"dolg\",\n    \"dolga\",\n    \"dolgi\",\n    \"dovolj\",\n    \"drug\",\n    \"druga\",\n    \"drugi\",\n    \"drugo\",\n    \"dva\",\n    \"dve\",\n    \"e\",\n    \"eden\",\n    \"en\",\n    \"ena\",\n    \"ene\",\n    \"eni\",\n    \"enkrat\",\n    \"eno\",\n    \"etc.\",\n    \"f\",\n    \"februar\",\n    \"g\",\n    \"g.\",\n    \"ga\",\n    \"ga.\",\n    \"gor\",\n    \"gospa\",\n    \"gospod\",\n    \"h\",\n    \"halo\",\n    \"i\",\n    \"idr.\",\n    \"ii\",\n    \"iii\",\n    \"in\",\n    \"iv\",\n    \"ix\",\n    \"iz\",\n    \"j\",\n    \"januar\",\n    \"jaz\",\n    \"je\",\n    \"ji\",\n    \"jih\",\n    \"jim\",\n    \"jo\",\n    \"julij\",\n    \"junij\",\n    \"jutri\",\n    \"k\",\n    \"kadarkoli\",\n    \"kaj\",\n    \"kajti\",\n    \"kako\",\n    \"kakor\",\n    \"kamor\",\n    \"kamorkoli\",\n    \"kar\",\n    \"karkoli\",\n    \"katerikoli\",\n    \"kdaj\",\n    \"kdo\",\n    \"kdorkoli\",\n    \"ker\",\n    \"ki\",\n    \"kje\",\n    \"kjer\",\n    \"kjerkoli\",\n    \"ko\",\n    \"koder\",\n    \"koderkoli\",\n    \"koga\",\n    \"komu\",\n    \"kot\",\n    \"kratek\",\n    \"kratka\",\n    \"kratke\",\n    \"kratki\",\n    \"l\",\n    \"lahka\",\n    \"lahke\",\n    \"lahki\",\n    \"lahko\",\n    \"le\",\n    \"lep\",\n    \"lepa\",\n    \"lepe\",\n    \"lepi\",\n    \"lepo\",\n    \"leto\",\n    \"m\",\n    \"maj\",\n    \"majhen\",\n    \"majhna\",\n    \"majhni\",\n    \"malce\",\n    \"malo\",\n    \"manj\",\n    \"marec\",\n    \"me\",\n    \"med\",\n    \"medtem\",\n    \"mene\",\n    \"mesec\",\n    \"mi\",\n    \"midva\",\n    \"midve\",\n    \"mnogo\",\n    \"moj\",\n    \"moja\",\n    \"moje\",\n    \"mora\",\n    \"morajo\",\n    \"moram\",\n    \"moramo\",\n    \"morate\",\n    \"moraš\",\n    \"morem\",\n    \"mu\",\n    \"n\",\n    \"na\",\n    \"nad\",\n    \"naj\",\n    \"najina\",\n    \"najino\",\n    \"najmanj\",\n    \"naju\",\n    \"največ\",\n    \"nam\",\n    \"narobe\",\n    \"nas\",\n    \"nato\",\n    \"nazaj\",\n    \"naš\",\n    \"naša\",\n    \"naše\",\n    \"ne\",\n    \"nedavno\",\n    \"nedelja\",\n    \"nek\",\n    \"neka\",\n    \"nekaj\",\n    \"nekatere\",\n    \"nekateri\",\n    \"nekatero\",\n    \"nekdo\",\n    \"neke\",\n    \"nekega\",\n    \"neki\",\n    \"nekje\",\n    \"neko\",\n    \"nekoga\",\n    \"nekoč\",\n    \"ni\",\n    \"nikamor\",\n    \"nikdar\",\n    \"nikjer\",\n    \"nikoli\",\n    \"nič\",\n    \"nje\",\n    \"njega\",\n    \"njegov\",\n    \"njegova\",\n    \"njegovo\",\n    \"njej\",\n    \"njemu\",\n    \"njen\",\n    \"njena\",\n    \"njeno\",\n    \"nji\",\n    \"njih\",\n    \"njihov\",\n    \"njihova\",\n    \"njihovo\",\n    \"njiju\",\n    \"njim\",\n    \"njo\",\n    \"njun\",\n    \"njuna\",\n    \"njuno\",\n    \"no\",\n    \"nocoj\",\n    \"november\",\n    \"npr.\",\n    \"o\",\n    \"ob\",\n    \"oba\",\n    \"obe\",\n    \"oboje\",\n    \"od\",\n    \"odprt\",\n    \"odprta\",\n    \"odprti\",\n    \"okoli\",\n    \"oktober\",\n    \"on\",\n    \"onadva\",\n    \"one\",\n    \"oni\",\n    \"onidve\",\n    \"osem\",\n    \"osma\",\n    \"osmi\",\n    \"osmo\",\n    \"oz.\",\n    \"p\",\n    \"pa\",\n    \"pet\",\n    \"peta\",\n    \"petek\",\n    \"peti\",\n    \"peto\",\n    \"po\",\n    \"pod\",\n    \"pogosto\",\n    \"poleg\",\n    \"poln\",\n    \"polna\",\n    \"polni\",\n    \"polno\",\n    \"ponavadi\",\n    \"ponedeljek\",\n    \"ponovno\",\n    \"potem\",\n    \"povsod\",\n    \"pozdravljen\",\n    \"pozdravljeni\",\n    \"prav\",\n    \"prava\",\n    \"prave\",\n    \"pravi\",\n    \"pravo\",\n    \"prazen\",\n    \"prazna\",\n    \"prazno\",\n    \"prbl.\",\n    \"precej\",\n    \"pred\",\n    \"prej\",\n    \"preko\",\n    \"pri\",\n    \"pribl.\",\n    \"približno\",\n    \"primer\",\n    \"pripravljen\",\n    \"pripravljena\",\n    \"pripravljeni\",\n    \"proti\",\n    \"prva\",\n    \"prvi\",\n    \"prvo\",\n    \"r\",\n    \"ravno\",\n    \"redko\",\n    \"res\",\n    \"reč\",\n    \"s\",\n    \"saj\",\n    \"sam\",\n    \"sama\",\n    \"same\",\n    \"sami\",\n    \"samo\",\n    \"se\",\n    \"sebe\",\n    \"sebi\",\n    \"sedaj\",\n    \"sedem\",\n    \"sedma\",\n    \"sedmi\",\n    \"sedmo\",\n    \"sem\",\n    \"september\",\n    \"seveda\",\n    \"si\",\n    \"sicer\",\n    \"skoraj\",\n    \"skozi\",\n    \"slab\",\n    \"smo\",\n    \"so\",\n    \"sobota\",\n    \"spet\",\n    \"sreda\",\n    \"srednja\",\n    \"srednji\",\n    \"sta\",\n    \"ste\",\n    \"stran\",\n    \"stvar\",\n    \"sva\",\n    \"t\",\n    \"ta\",\n    \"tak\",\n    \"taka\",\n    \"take\",\n    \"taki\",\n    \"tako\",\n    \"takoj\",\n    \"tam\",\n    \"te\",\n    \"tebe\",\n    \"tebi\",\n    \"tega\",\n    \"težak\",\n    \"težka\",\n    \"težki\",\n    \"težko\",\n    \"ti\",\n    \"tista\",\n    \"tiste\",\n    \"tisti\",\n    \"tisto\",\n    \"tj.\",\n    \"tja\",\n    \"to\",\n    \"toda\",\n    \"torek\",\n    \"tretja\",\n    \"tretje\",\n    \"tretji\",\n    \"tri\",\n    \"tu\",\n    \"tudi\",\n    \"tukaj\",\n    \"tvoj\",\n    \"tvoja\",\n    \"tvoje\",\n    \"u\",\n    \"v\",\n    \"vaju\",\n    \"vam\",\n    \"vas\",\n    \"vaš\",\n    \"vaša\",\n    \"vaše\",\n    \"ve\",\n    \"vedno\",\n    \"velik\",\n    \"velika\",\n    \"veliki\",\n    \"veliko\",\n    \"vendar\",\n    \"ves\",\n    \"več\",\n    \"vi\",\n    \"vidva\",\n    \"vii\",\n    \"viii\",\n    \"visok\",\n    \"visoka\",\n    \"visoke\",\n    \"visoki\",\n    \"vsa\",\n    \"vsaj\",\n    \"vsak\",\n    \"vsaka\",\n    \"vsakdo\",\n    \"vsake\",\n    \"vsaki\",\n    \"vsakomur\",\n    \"vse\",\n    \"vsega\",\n    \"vsi\",\n    \"vso\",\n    \"včasih\",\n    \"včeraj\",\n    \"x\",\n    \"z\",\n    \"za\",\n    \"zadaj\",\n    \"zadnji\",\n    \"zakaj\",\n    \"zaprta\",\n    \"zaprti\",\n    \"zaprto\",\n    \"zdaj\",\n    \"zelo\",\n    \"zunaj\",\n    \"č\",\n    \"če\",\n    \"često\",\n    \"četrta\",\n    \"četrtek\",\n    \"četrti\",\n    \"četrto\",\n    \"čez\",\n    \"čigav\",\n    \"š\",\n    \"šest\",\n    \"šesta\",\n    \"šesti\",\n    \"šesto\",\n    \"štiri\",\n    \"ž\",\n    \"že\",\n];\n"
  },
  {
    "path": "src/stopwords/sna.rs",
    "content": "// Sonic\n//\n// Fast, lightweight and schema-less search backend\n// Copyright: 2019, Valerian Saliou <valerian@valeriansaliou.name>\n// License: Mozilla Public License v2.0 (MPL v2.0)\n\n// Notice: we do not have stopwords for this language yet.\npub static STOPWORDS_SNA: &[&str] = &[];\n"
  },
  {
    "path": "src/stopwords/spa.rs",
    "content": "// Sonic\n//\n// Fast, lightweight and schema-less search backend\n// Copyright: 2019, Valerian Saliou <valerian@valeriansaliou.name>\n// License: Mozilla Public License v2.0 (MPL v2.0)\n\npub static STOPWORDS_SPA: &[&str] = &[\n    \"0\",\n    \"1\",\n    \"2\",\n    \"3\",\n    \"4\",\n    \"5\",\n    \"6\",\n    \"7\",\n    \"8\",\n    \"9\",\n    \"_\",\n    \"a\",\n    \"actualmente\",\n    \"acuerdo\",\n    \"adelante\",\n    \"ademas\",\n    \"además\",\n    \"adrede\",\n    \"afirmó\",\n    \"agregó\",\n    \"ahi\",\n    \"ahora\",\n    \"ahí\",\n    \"al\",\n    \"algo\",\n    \"alguna\",\n    \"algunas\",\n    \"alguno\",\n    \"algunos\",\n    \"algún\",\n    \"alli\",\n    \"allí\",\n    \"alrededor\",\n    \"ambos\",\n    \"ampleamos\",\n    \"antano\",\n    \"antaño\",\n    \"ante\",\n    \"anterior\",\n    \"antes\",\n    \"apenas\",\n    \"aproximadamente\",\n    \"aquel\",\n    \"aquella\",\n    \"aquellas\",\n    \"aquello\",\n    \"aquellos\",\n    \"aqui\",\n    \"aquél\",\n    \"aquélla\",\n    \"aquéllas\",\n    \"aquéllos\",\n    \"aquí\",\n    \"arriba\",\n    \"arribaabajo\",\n    \"aseguró\",\n    \"asi\",\n    \"así\",\n    \"atras\",\n    \"aun\",\n    \"aunque\",\n    \"ayer\",\n    \"añadió\",\n    \"aún\",\n    \"b\",\n    \"bajo\",\n    \"bastante\",\n    \"bien\",\n    \"breve\",\n    \"buen\",\n    \"buena\",\n    \"buenas\",\n    \"bueno\",\n    \"buenos\",\n    \"c\",\n    \"cada\",\n    \"casi\",\n    \"cerca\",\n    \"cierta\",\n    \"ciertas\",\n    \"cierto\",\n    \"ciertos\",\n    \"cinco\",\n    \"claro\",\n    \"comentó\",\n    \"como\",\n    \"con\",\n    \"conmigo\",\n    \"conocer\",\n    \"conseguimos\",\n    \"conseguir\",\n    \"considera\",\n    \"consideró\",\n    \"consigo\",\n    \"consigue\",\n    \"consiguen\",\n    \"consigues\",\n    \"contigo\",\n    \"contra\",\n    \"cosas\",\n    \"creo\",\n    \"cual\",\n    \"cuales\",\n    \"cualquier\",\n    \"cuando\",\n    \"cuanta\",\n    \"cuantas\",\n    \"cuanto\",\n    \"cuantos\",\n    \"cuatro\",\n    \"cuenta\",\n    \"cuál\",\n    \"cuáles\",\n    \"cuándo\",\n    \"cuánta\",\n    \"cuántas\",\n    \"cuánto\",\n    \"cuántos\",\n    \"cómo\",\n    \"d\",\n    \"da\",\n    \"dado\",\n    \"dan\",\n    \"dar\",\n    \"de\",\n    \"debajo\",\n    \"debe\",\n    \"deben\",\n    \"debido\",\n    \"decir\",\n    \"dejó\",\n    \"del\",\n    \"delante\",\n    \"demasiado\",\n    \"demás\",\n    \"dentro\",\n    \"deprisa\",\n    \"desde\",\n    \"despacio\",\n    \"despues\",\n    \"después\",\n    \"detras\",\n    \"detrás\",\n    \"dia\",\n    \"dias\",\n    \"dice\",\n    \"dicen\",\n    \"dicho\",\n    \"dieron\",\n    \"diferente\",\n    \"diferentes\",\n    \"dijeron\",\n    \"dijo\",\n    \"dio\",\n    \"donde\",\n    \"dos\",\n    \"durante\",\n    \"día\",\n    \"días\",\n    \"dónde\",\n    \"e\",\n    \"ejemplo\",\n    \"el\",\n    \"ella\",\n    \"ellas\",\n    \"ello\",\n    \"ellos\",\n    \"embargo\",\n    \"empleais\",\n    \"emplean\",\n    \"emplear\",\n    \"empleas\",\n    \"empleo\",\n    \"en\",\n    \"encima\",\n    \"encuentra\",\n    \"enfrente\",\n    \"enseguida\",\n    \"entonces\",\n    \"entre\",\n    \"era\",\n    \"erais\",\n    \"eramos\",\n    \"eran\",\n    \"eras\",\n    \"eres\",\n    \"es\",\n    \"esa\",\n    \"esas\",\n    \"ese\",\n    \"eso\",\n    \"esos\",\n    \"esta\",\n    \"estaba\",\n    \"estabais\",\n    \"estaban\",\n    \"estabas\",\n    \"estad\",\n    \"estada\",\n    \"estadas\",\n    \"estado\",\n    \"estados\",\n    \"estais\",\n    \"estamos\",\n    \"estan\",\n    \"estando\",\n    \"estar\",\n    \"estaremos\",\n    \"estará\",\n    \"estarán\",\n    \"estarás\",\n    \"estaré\",\n    \"estaréis\",\n    \"estaría\",\n    \"estaríais\",\n    \"estaríamos\",\n    \"estarían\",\n    \"estarías\",\n    \"estas\",\n    \"este\",\n    \"estemos\",\n    \"esto\",\n    \"estos\",\n    \"estoy\",\n    \"estuve\",\n    \"estuviera\",\n    \"estuvierais\",\n    \"estuvieran\",\n    \"estuvieras\",\n    \"estuvieron\",\n    \"estuviese\",\n    \"estuvieseis\",\n    \"estuviesen\",\n    \"estuvieses\",\n    \"estuvimos\",\n    \"estuviste\",\n    \"estuvisteis\",\n    \"estuviéramos\",\n    \"estuviésemos\",\n    \"estuvo\",\n    \"está\",\n    \"estábamos\",\n    \"estáis\",\n    \"están\",\n    \"estás\",\n    \"esté\",\n    \"estéis\",\n    \"estén\",\n    \"estés\",\n    \"ex\",\n    \"excepto\",\n    \"existe\",\n    \"existen\",\n    \"explicó\",\n    \"expresó\",\n    \"f\",\n    \"fin\",\n    \"final\",\n    \"fue\",\n    \"fuera\",\n    \"fuerais\",\n    \"fueran\",\n    \"fueras\",\n    \"fueron\",\n    \"fuese\",\n    \"fueseis\",\n    \"fuesen\",\n    \"fueses\",\n    \"fui\",\n    \"fuimos\",\n    \"fuiste\",\n    \"fuisteis\",\n    \"fuéramos\",\n    \"fuésemos\",\n    \"g\",\n    \"general\",\n    \"gran\",\n    \"grandes\",\n    \"gueno\",\n    \"h\",\n    \"ha\",\n    \"haber\",\n    \"habia\",\n    \"habida\",\n    \"habidas\",\n    \"habido\",\n    \"habidos\",\n    \"habiendo\",\n    \"habla\",\n    \"hablan\",\n    \"habremos\",\n    \"habrá\",\n    \"habrán\",\n    \"habrás\",\n    \"habré\",\n    \"habréis\",\n    \"habría\",\n    \"habríais\",\n    \"habríamos\",\n    \"habrían\",\n    \"habrías\",\n    \"habéis\",\n    \"había\",\n    \"habíais\",\n    \"habíamos\",\n    \"habían\",\n    \"habías\",\n    \"hace\",\n    \"haceis\",\n    \"hacemos\",\n    \"hacen\",\n    \"hacer\",\n    \"hacerlo\",\n    \"haces\",\n    \"hacia\",\n    \"haciendo\",\n    \"hago\",\n    \"han\",\n    \"has\",\n    \"hasta\",\n    \"hay\",\n    \"haya\",\n    \"hayamos\",\n    \"hayan\",\n    \"hayas\",\n    \"hayáis\",\n    \"he\",\n    \"hecho\",\n    \"hemos\",\n    \"hicieron\",\n    \"hizo\",\n    \"horas\",\n    \"hoy\",\n    \"hube\",\n    \"hubiera\",\n    \"hubierais\",\n    \"hubieran\",\n    \"hubieras\",\n    \"hubieron\",\n    \"hubiese\",\n    \"hubieseis\",\n    \"hubiesen\",\n    \"hubieses\",\n    \"hubimos\",\n    \"hubiste\",\n    \"hubisteis\",\n    \"hubiéramos\",\n    \"hubiésemos\",\n    \"hubo\",\n    \"i\",\n    \"igual\",\n    \"incluso\",\n    \"indicó\",\n    \"informo\",\n    \"informó\",\n    \"intenta\",\n    \"intentais\",\n    \"intentamos\",\n    \"intentan\",\n    \"intentar\",\n    \"intentas\",\n    \"intento\",\n    \"ir\",\n    \"j\",\n    \"junto\",\n    \"k\",\n    \"l\",\n    \"la\",\n    \"lado\",\n    \"largo\",\n    \"las\",\n    \"le\",\n    \"lejos\",\n    \"les\",\n    \"llegó\",\n    \"lleva\",\n    \"llevar\",\n    \"lo\",\n    \"los\",\n    \"luego\",\n    \"lugar\",\n    \"m\",\n    \"mal\",\n    \"manera\",\n    \"manifestó\",\n    \"mas\",\n    \"mayor\",\n    \"me\",\n    \"mediante\",\n    \"medio\",\n    \"mejor\",\n    \"mencionó\",\n    \"menos\",\n    \"menudo\",\n    \"mi\",\n    \"mia\",\n    \"mias\",\n    \"mientras\",\n    \"mio\",\n    \"mios\",\n    \"mis\",\n    \"misma\",\n    \"mismas\",\n    \"mismo\",\n    \"mismos\",\n    \"modo\",\n    \"momento\",\n    \"mucha\",\n    \"muchas\",\n    \"mucho\",\n    \"muchos\",\n    \"muy\",\n    \"más\",\n    \"mí\",\n    \"mía\",\n    \"mías\",\n    \"mío\",\n    \"míos\",\n    \"n\",\n    \"nada\",\n    \"nadie\",\n    \"ni\",\n    \"ninguna\",\n    \"ningunas\",\n    \"ninguno\",\n    \"ningunos\",\n    \"ningún\",\n    \"no\",\n    \"nos\",\n    \"nosotras\",\n    \"nosotros\",\n    \"nuestra\",\n    \"nuestras\",\n    \"nuestro\",\n    \"nuestros\",\n    \"nueva\",\n    \"nuevas\",\n    \"nuevo\",\n    \"nuevos\",\n    \"nunca\",\n    \"o\",\n    \"ocho\",\n    \"os\",\n    \"otra\",\n    \"otras\",\n    \"otro\",\n    \"otros\",\n    \"p\",\n    \"pais\",\n    \"para\",\n    \"parece\",\n    \"parte\",\n    \"partir\",\n    \"pasada\",\n    \"pasado\",\n    \"paìs\",\n    \"peor\",\n    \"pero\",\n    \"pesar\",\n    \"poca\",\n    \"pocas\",\n    \"poco\",\n    \"pocos\",\n    \"podeis\",\n    \"podemos\",\n    \"poder\",\n    \"podria\",\n    \"podriais\",\n    \"podriamos\",\n    \"podrian\",\n    \"podrias\",\n    \"podrá\",\n    \"podrán\",\n    \"podría\",\n    \"podrían\",\n    \"poner\",\n    \"por\",\n    \"por qué\",\n    \"porque\",\n    \"posible\",\n    \"primer\",\n    \"primera\",\n    \"primero\",\n    \"primeros\",\n    \"principalmente\",\n    \"pronto\",\n    \"propia\",\n    \"propias\",\n    \"propio\",\n    \"propios\",\n    \"proximo\",\n    \"próximo\",\n    \"próximos\",\n    \"pudo\",\n    \"pueda\",\n    \"puede\",\n    \"pueden\",\n    \"puedo\",\n    \"pues\",\n    \"q\",\n    \"qeu\",\n    \"que\",\n    \"quedó\",\n    \"queremos\",\n    \"quien\",\n    \"quienes\",\n    \"quiere\",\n    \"quiza\",\n    \"quizas\",\n    \"quizá\",\n    \"quizás\",\n    \"quién\",\n    \"quiénes\",\n    \"qué\",\n    \"r\",\n    \"raras\",\n    \"realizado\",\n    \"realizar\",\n    \"realizó\",\n    \"repente\",\n    \"respecto\",\n    \"s\",\n    \"sabe\",\n    \"sabeis\",\n    \"sabemos\",\n    \"saben\",\n    \"saber\",\n    \"sabes\",\n    \"sal\",\n    \"salvo\",\n    \"se\",\n    \"sea\",\n    \"seamos\",\n    \"sean\",\n    \"seas\",\n    \"segun\",\n    \"segunda\",\n    \"segundo\",\n    \"según\",\n    \"seis\",\n    \"ser\",\n    \"sera\",\n    \"seremos\",\n    \"será\",\n    \"serán\",\n    \"serás\",\n    \"seré\",\n    \"seréis\",\n    \"sería\",\n    \"seríais\",\n    \"seríamos\",\n    \"serían\",\n    \"serías\",\n    \"seáis\",\n    \"señaló\",\n    \"si\",\n    \"sido\",\n    \"siempre\",\n    \"siendo\",\n    \"siete\",\n    \"sigue\",\n    \"siguiente\",\n    \"sin\",\n    \"sino\",\n    \"sobre\",\n    \"sois\",\n    \"sola\",\n    \"solamente\",\n    \"solas\",\n    \"solo\",\n    \"solos\",\n    \"somos\",\n    \"son\",\n    \"soy\",\n    \"soyos\",\n    \"su\",\n    \"supuesto\",\n    \"sus\",\n    \"suya\",\n    \"suyas\",\n    \"suyo\",\n    \"suyos\",\n    \"sé\",\n    \"sí\",\n    \"sólo\",\n    \"t\",\n    \"tal\",\n    \"tambien\",\n    \"también\",\n    \"tampoco\",\n    \"tan\",\n    \"tanto\",\n    \"tarde\",\n    \"te\",\n    \"temprano\",\n    \"tendremos\",\n    \"tendrá\",\n    \"tendrán\",\n    \"tendrás\",\n    \"tendré\",\n    \"tendréis\",\n    \"tendría\",\n    \"tendríais\",\n    \"tendríamos\",\n    \"tendrían\",\n    \"tendrías\",\n    \"tened\",\n    \"teneis\",\n    \"tenemos\",\n    \"tener\",\n    \"tenga\",\n    \"tengamos\",\n    \"tengan\",\n    \"tengas\",\n    \"tengo\",\n    \"tengáis\",\n    \"tenida\",\n    \"tenidas\",\n    \"tenido\",\n    \"tenidos\",\n    \"teniendo\",\n    \"tenéis\",\n    \"tenía\",\n    \"teníais\",\n    \"teníamos\",\n    \"tenían\",\n    \"tenías\",\n    \"tercera\",\n    \"ti\",\n    \"tiempo\",\n    \"tiene\",\n    \"tienen\",\n    \"tienes\",\n    \"toda\",\n    \"todas\",\n    \"todavia\",\n    \"todavía\",\n    \"todo\",\n    \"todos\",\n    \"total\",\n    \"trabaja\",\n    \"trabajais\",\n    \"trabajamos\",\n    \"trabajan\",\n    \"trabajar\",\n    \"trabajas\",\n    \"trabajo\",\n    \"tras\",\n    \"trata\",\n    \"través\",\n    \"tres\",\n    \"tu\",\n    \"tus\",\n    \"tuve\",\n    \"tuviera\",\n    \"tuvierais\",\n    \"tuvieran\",\n    \"tuvieras\",\n    \"tuvieron\",\n    \"tuviese\",\n    \"tuvieseis\",\n    \"tuviesen\",\n    \"tuvieses\",\n    \"tuvimos\",\n    \"tuviste\",\n    \"tuvisteis\",\n    \"tuviéramos\",\n    \"tuviésemos\",\n    \"tuvo\",\n    \"tuya\",\n    \"tuyas\",\n    \"tuyo\",\n    \"tuyos\",\n    \"tú\",\n    \"u\",\n    \"ultimo\",\n    \"un\",\n    \"una\",\n    \"unas\",\n    \"uno\",\n    \"unos\",\n    \"usa\",\n    \"usais\",\n    \"usamos\",\n    \"usan\",\n    \"usar\",\n    \"usas\",\n    \"uso\",\n    \"usted\",\n    \"ustedes\",\n    \"v\",\n    \"va\",\n    \"vais\",\n    \"valor\",\n    \"vamos\",\n    \"van\",\n    \"varias\",\n    \"varios\",\n    \"vaya\",\n    \"veces\",\n    \"ver\",\n    \"verdad\",\n    \"verdadera\",\n    \"verdadero\",\n    \"vez\",\n    \"vosotras\",\n    \"vosotros\",\n    \"voy\",\n    \"vuestra\",\n    \"vuestras\",\n    \"vuestro\",\n    \"vuestros\",\n    \"w\",\n    \"x\",\n    \"y\",\n    \"ya\",\n    \"yo\",\n    \"z\",\n    \"él\",\n    \"éramos\",\n    \"ésa\",\n    \"ésas\",\n    \"ése\",\n    \"ésos\",\n    \"ésta\",\n    \"éstas\",\n    \"éste\",\n    \"éstos\",\n    \"última\",\n    \"últimas\",\n    \"último\",\n    \"últimos\",\n];\n"
  },
  {
    "path": "src/stopwords/srp.rs",
    "content": "// Sonic\n//\n// Fast, lightweight and schema-less search backend\n// Copyright: 2019, Valerian Saliou <valerian@valeriansaliou.name>\n// License: Mozilla Public License v2.0 (MPL v2.0)\n\npub static STOPWORDS_SRP: &[&str] = &[\n    \"a\",\n    \"avaj\",\n    \"ako\",\n    \"al\",\n    \"ali\",\n    \"arh\",\n    \"au\",\n    \"ah\",\n    \"aha\",\n    \"aj\",\n    \"bar\",\n    \"bi\",\n    \"bila\",\n    \"bili\",\n    \"bilo\",\n    \"bismo\",\n    \"biste\",\n    \"bih\",\n    \"bijasmo\",\n    \"bijaste\",\n    \"bijah\",\n    \"bijahu\",\n    \"bijaše\",\n    \"biće\",\n    \"blizu\",\n    \"broj\",\n    \"brr\",\n    \"bude\",\n    \"budimo\",\n    \"budite\",\n    \"budu\",\n    \"budući\",\n    \"bum\",\n    \"buć\",\n    \"vam\",\n    \"vama\",\n    \"vas\",\n    \"vaša\",\n    \"vaše\",\n    \"vašim\",\n    \"vašima\",\n    \"valjda\",\n    \"veoma\",\n    \"verovatno\",\n    \"već\",\n    \"većina\",\n    \"vi\",\n    \"video\",\n    \"više\",\n    \"vrlo\",\n    \"vrh\",\n    \"ga\",\n    \"gde\",\n    \"gic\",\n    \"god\",\n    \"gore\",\n    \"gđekoje\",\n    \"da\",\n    \"dakle\",\n    \"dana\",\n    \"danas\",\n    \"daj\",\n    \"dva\",\n    \"de\",\n    \"deder\",\n    \"delimice\",\n    \"delimično\",\n    \"dem\",\n    \"do\",\n    \"dobar\",\n    \"dobiti\",\n    \"dovečer\",\n    \"dokle\",\n    \"dole\",\n    \"donekle\",\n    \"dosad\",\n    \"doskoro\",\n    \"dotad\",\n    \"dotle\",\n    \"došao\",\n    \"doći\",\n    \"drugamo\",\n    \"drugde\",\n    \"drugi\",\n    \"e\",\n    \"evo\",\n    \"eno\",\n    \"eto\",\n    \"eh\",\n    \"ehe\",\n    \"ej\",\n    \"želela\",\n    \"želele\",\n    \"želeli\",\n    \"želelo\",\n    \"želeh\",\n    \"želeći\",\n    \"želi\",\n    \"za\",\n    \"zaista\",\n    \"zar\",\n    \"zatim\",\n    \"zato\",\n    \"zahvaliti\",\n    \"zašto\",\n    \"zbilja\",\n    \"zimus\",\n    \"znati\",\n    \"zum\",\n    \"i\",\n    \"ide\",\n    \"iz\",\n    \"izvan\",\n    \"izvoli\",\n    \"između\",\n    \"iznad\",\n    \"ikada\",\n    \"ikakav\",\n    \"ikakva\",\n    \"ikakve\",\n    \"ikakvi\",\n    \"ikakvim\",\n    \"ikakvima\",\n    \"ikakvih\",\n    \"ikakvo\",\n    \"ikakvog\",\n    \"ikakvoga\",\n    \"ikakvom\",\n    \"ikakvome\",\n    \"ikakvoj\",\n    \"ili\",\n    \"im\",\n    \"ima\",\n    \"imam\",\n    \"imao\",\n    \"ispod\",\n    \"ih\",\n    \"iju\",\n    \"ići\",\n    \"kad\",\n    \"kada\",\n    \"koga\",\n    \"kojekakav\",\n    \"kojima\",\n    \"koju\",\n    \"krišom\",\n    \"lani\",\n    \"li\",\n    \"mali\",\n    \"manji\",\n    \"me\",\n    \"mene\",\n    \"meni\",\n    \"mi\",\n    \"mimo\",\n    \"misli\",\n    \"mnogo\",\n    \"mogu\",\n    \"mora\",\n    \"morao\",\n    \"moj\",\n    \"moja\",\n    \"moje\",\n    \"moji\",\n    \"moju\",\n    \"moći\",\n    \"mu\",\n    \"na\",\n    \"nad\",\n    \"nakon\",\n    \"nam\",\n    \"nama\",\n    \"nas\",\n    \"naša\",\n    \"naše\",\n    \"našeg\",\n    \"naši\",\n    \"naći\",\n    \"ne\",\n    \"negde\",\n    \"neka\",\n    \"nekad\",\n    \"neke\",\n    \"nekog\",\n    \"neku\",\n    \"nema\",\n    \"nemam\",\n    \"neko\",\n    \"neće\",\n    \"nećemo\",\n    \"nećete\",\n    \"nećeš\",\n    \"neću\",\n    \"ni\",\n    \"nikada\",\n    \"nikoga\",\n    \"nikoje\",\n    \"nikoji\",\n    \"nikoju\",\n    \"nisam\",\n    \"nisi\",\n    \"niste\",\n    \"nisu\",\n    \"ništa\",\n    \"nijedan\",\n    \"no\",\n    \"o\",\n    \"ova\",\n    \"ovako\",\n    \"ovamo\",\n    \"ovaj\",\n    \"ovde\",\n    \"ove\",\n    \"ovim\",\n    \"ovima\",\n    \"ovo\",\n    \"ovoj\",\n    \"od\",\n    \"odmah\",\n    \"oko\",\n    \"okolo\",\n    \"on\",\n    \"onaj\",\n    \"one\",\n    \"onim\",\n    \"onima\",\n    \"onom\",\n    \"onoj\",\n    \"onu\",\n    \"osim\",\n    \"ostali\",\n    \"otišao\",\n    \"pa\",\n    \"pak\",\n    \"pitati\",\n    \"po\",\n    \"povodom\",\n    \"pod\",\n    \"podalje\",\n    \"poželjan\",\n    \"poželjna\",\n    \"poizdalje\",\n    \"poimence\",\n    \"ponekad\",\n    \"popreko\",\n    \"pored\",\n    \"posle\",\n    \"potaman\",\n    \"potrbuške\",\n    \"pouzdano\",\n    \"početak\",\n    \"pojedini\",\n    \"praviti\",\n    \"prvi\",\n    \"preko\",\n    \"prema\",\n    \"prije\",\n    \"put\",\n    \"pljus\",\n    \"radije\",\n    \"s\",\n    \"sa\",\n    \"sav\",\n    \"sada\",\n    \"sam\",\n    \"samo\",\n    \"sasvim\",\n    \"sva\",\n    \"svaki\",\n    \"svi\",\n    \"svim\",\n    \"svog\",\n    \"svom\",\n    \"svoj\",\n    \"svoja\",\n    \"svoje\",\n    \"svoju\",\n    \"svu\",\n    \"svugde\",\n    \"se\",\n    \"sebe\",\n    \"sebi\",\n    \"si\",\n    \"smeti\",\n    \"smo\",\n    \"stvar\",\n    \"stvarno\",\n    \"ste\",\n    \"su\",\n    \"sutra\",\n    \"ta\",\n    \"tačno\",\n    \"tako\",\n    \"takođe\",\n    \"tamo\",\n    \"tvoj\",\n    \"tvoja\",\n    \"tvoje\",\n    \"tvoji\",\n    \"tvoju\",\n    \"te\",\n    \"tebe\",\n    \"tebi\",\n    \"ti\",\n    \"tima\",\n    \"to\",\n    \"tome\",\n    \"toj\",\n    \"tu\",\n    \"u\",\n    \"uvek\",\n    \"uvijek\",\n    \"uz\",\n    \"uza\",\n    \"uzalud\",\n    \"uzduž\",\n    \"uzeti\",\n    \"umalo\",\n    \"unutra\",\n    \"upotrebiti\",\n    \"uprkos\",\n    \"učinio\",\n    \"učiniti\",\n    \"halo\",\n    \"hvala\",\n    \"hej\",\n    \"hm\",\n    \"hop\",\n    \"hoće\",\n    \"hoćemo\",\n    \"hoćete\",\n    \"hoćeš\",\n    \"hoću\",\n    \"htedoste\",\n    \"htedoh\",\n    \"htedoše\",\n    \"htela\",\n    \"htele\",\n    \"hteli\",\n    \"hteo\",\n    \"htejasmo\",\n    \"htejaste\",\n    \"htejahu\",\n    \"hura\",\n    \"često\",\n    \"čijem\",\n    \"čiji\",\n    \"čijim\",\n    \"čijima\",\n    \"šic\",\n    \"štagod\",\n    \"što\",\n    \"štogod\",\n    \"ja\",\n    \"je\",\n    \"jedan\",\n    \"jedini\",\n    \"jedna\",\n    \"jedne\",\n    \"jedni\",\n    \"jedno\",\n    \"jednom\",\n    \"jer\",\n    \"jesam\",\n    \"jesi\",\n    \"jesmo\",\n    \"jesu\",\n    \"jim\",\n    \"joj\",\n    \"ju\",\n    \"juče\",\n    \"njegova\",\n    \"njegovo\",\n    \"njezin\",\n    \"njezina\",\n    \"njezino\",\n    \"njemu\",\n    \"njen\",\n    \"njim\",\n    \"njima\",\n    \"njihova\",\n    \"njihovo\",\n    \"njoj\",\n    \"nju\",\n    \"će\",\n    \"ćemo\",\n    \"ćete\",\n    \"ćeš\",\n    \"ću\",\n];\n"
  },
  {
    "path": "src/stopwords/swe.rs",
    "content": "// Sonic\n//\n// Fast, lightweight and schema-less search backend\n// Copyright: 2019, Valerian Saliou <valerian@valeriansaliou.name>\n// License: Mozilla Public License v2.0 (MPL v2.0)\n\npub static STOPWORDS_SWE: &[&str] = &[\n    \"aderton\",\n    \"adertonde\",\n    \"adjö\",\n    \"aldrig\",\n    \"alla\",\n    \"allas\",\n    \"allt\",\n    \"alltid\",\n    \"alltså\",\n    \"andra\",\n    \"andras\",\n    \"annan\",\n    \"annat\",\n    \"artonde\",\n    \"artonn\",\n    \"att\",\n    \"av\",\n    \"bakom\",\n    \"bara\",\n    \"behöva\",\n    \"behövas\",\n    \"behövde\",\n    \"behövt\",\n    \"beslut\",\n    \"beslutat\",\n    \"beslutit\",\n    \"bland\",\n    \"blev\",\n    \"bli\",\n    \"blir\",\n    \"blivit\",\n    \"bort\",\n    \"borta\",\n    \"bra\",\n    \"bäst\",\n    \"bättre\",\n    \"båda\",\n    \"bådas\",\n    \"dag\",\n    \"dagar\",\n    \"dagarna\",\n    \"dagen\",\n    \"de\",\n    \"del\",\n    \"delen\",\n    \"dem\",\n    \"den\",\n    \"denna\",\n    \"deras\",\n    \"dess\",\n    \"dessa\",\n    \"det\",\n    \"detta\",\n    \"dig\",\n    \"din\",\n    \"dina\",\n    \"dit\",\n    \"ditt\",\n    \"dock\",\n    \"dom\",\n    \"du\",\n    \"där\",\n    \"därför\",\n    \"då\",\n    \"e\",\n    \"efter\",\n    \"eftersom\",\n    \"ej\",\n    \"elfte\",\n    \"eller\",\n    \"elva\",\n    \"emot\",\n    \"en\",\n    \"enkel\",\n    \"enkelt\",\n    \"enkla\",\n    \"enligt\",\n    \"ens\",\n    \"er\",\n    \"era\",\n    \"ers\",\n    \"ert\",\n    \"ett\",\n    \"ettusen\",\n    \"fanns\",\n    \"fem\",\n    \"femte\",\n    \"femtio\",\n    \"femtionde\",\n    \"femton\",\n    \"femtonde\",\n    \"fick\",\n    \"fin\",\n    \"finnas\",\n    \"finns\",\n    \"fjorton\",\n    \"fjortonde\",\n    \"fjärde\",\n    \"fler\",\n    \"flera\",\n    \"flesta\",\n    \"fram\",\n    \"framför\",\n    \"från\",\n    \"fyra\",\n    \"fyrtio\",\n    \"fyrtionde\",\n    \"få\",\n    \"får\",\n    \"fått\",\n    \"följande\",\n    \"för\",\n    \"före\",\n    \"förlåt\",\n    \"förra\",\n    \"första\",\n    \"genast\",\n    \"genom\",\n    \"gick\",\n    \"gjorde\",\n    \"gjort\",\n    \"god\",\n    \"goda\",\n    \"godare\",\n    \"godast\",\n    \"gott\",\n    \"gälla\",\n    \"gäller\",\n    \"gällt\",\n    \"gärna\",\n    \"gå\",\n    \"går\",\n    \"gått\",\n    \"gör\",\n    \"göra\",\n    \"ha\",\n    \"hade\",\n    \"haft\",\n    \"han\",\n    \"hans\",\n    \"har\",\n    \"heller\",\n    \"hellre\",\n    \"helst\",\n    \"helt\",\n    \"henne\",\n    \"hennes\",\n    \"hit\",\n    \"hon\",\n    \"honom\",\n    \"hundra\",\n    \"hundraen\",\n    \"hundraett\",\n    \"hur\",\n    \"här\",\n    \"hög\",\n    \"höger\",\n    \"högre\",\n    \"högst\",\n    \"i\",\n    \"ibland\",\n    \"icke\",\n    \"idag\",\n    \"igen\",\n    \"igår\",\n    \"imorgon\",\n    \"in\",\n    \"inför\",\n    \"inga\",\n    \"ingen\",\n    \"ingenting\",\n    \"inget\",\n    \"innan\",\n    \"inne\",\n    \"inom\",\n    \"inte\",\n    \"inuti\",\n    \"ja\",\n    \"jag\",\n    \"jo\",\n    \"ju\",\n    \"just\",\n    \"jämfört\",\n    \"kan\",\n    \"kanske\",\n    \"knappast\",\n    \"kom\",\n    \"komma\",\n    \"kommer\",\n    \"kommit\",\n    \"kr\",\n    \"kunde\",\n    \"kunna\",\n    \"kunnat\",\n    \"kvar\",\n    \"legat\",\n    \"ligga\",\n    \"ligger\",\n    \"lika\",\n    \"likställd\",\n    \"likställda\",\n    \"lilla\",\n    \"lite\",\n    \"liten\",\n    \"litet\",\n    \"länge\",\n    \"längre\",\n    \"längst\",\n    \"lätt\",\n    \"lättare\",\n    \"lättast\",\n    \"långsam\",\n    \"långsammare\",\n    \"långsammast\",\n    \"långsamt\",\n    \"långt\",\n    \"låt\",\n    \"man\",\n    \"med\",\n    \"mej\",\n    \"mellan\",\n    \"men\",\n    \"mer\",\n    \"mera\",\n    \"mest\",\n    \"mig\",\n    \"min\",\n    \"mina\",\n    \"mindre\",\n    \"minst\",\n    \"mitt\",\n    \"mittemot\",\n    \"mot\",\n    \"mycket\",\n    \"många\",\n    \"måste\",\n    \"möjlig\",\n    \"möjligen\",\n    \"möjligt\",\n    \"möjligtvis\",\n    \"ned\",\n    \"nederst\",\n    \"nedersta\",\n    \"nedre\",\n    \"nej\",\n    \"ner\",\n    \"ni\",\n    \"nio\",\n    \"nionde\",\n    \"nittio\",\n    \"nittionde\",\n    \"nitton\",\n    \"nittonde\",\n    \"nog\",\n    \"noll\",\n    \"nr\",\n    \"nu\",\n    \"nummer\",\n    \"när\",\n    \"nästa\",\n    \"någon\",\n    \"någonting\",\n    \"något\",\n    \"några\",\n    \"nån\",\n    \"nånting\",\n    \"nåt\",\n    \"nödvändig\",\n    \"nödvändiga\",\n    \"nödvändigt\",\n    \"nödvändigtvis\",\n    \"och\",\n    \"också\",\n    \"ofta\",\n    \"oftast\",\n    \"olika\",\n    \"olikt\",\n    \"om\",\n    \"oss\",\n    \"på\",\n    \"rakt\",\n    \"redan\",\n    \"rätt\",\n    \"sa\",\n    \"sade\",\n    \"sagt\",\n    \"samma\",\n    \"sedan\",\n    \"senare\",\n    \"senast\",\n    \"sent\",\n    \"sex\",\n    \"sextio\",\n    \"sextionde\",\n    \"sexton\",\n    \"sextonde\",\n    \"sig\",\n    \"sin\",\n    \"sina\",\n    \"sist\",\n    \"sista\",\n    \"siste\",\n    \"sitt\",\n    \"sitta\",\n    \"sju\",\n    \"sjunde\",\n    \"sjuttio\",\n    \"sjuttionde\",\n    \"sjutton\",\n    \"sjuttonde\",\n    \"själv\",\n    \"sjätte\",\n    \"ska\",\n    \"skall\",\n    \"skulle\",\n    \"slutligen\",\n    \"små\",\n    \"smått\",\n    \"snart\",\n    \"som\",\n    \"stor\",\n    \"stora\",\n    \"stort\",\n    \"större\",\n    \"störst\",\n    \"säga\",\n    \"säger\",\n    \"sämre\",\n    \"sämst\",\n    \"så\",\n    \"sådan\",\n    \"sådana\",\n    \"sådant\",\n    \"ta\",\n    \"tack\",\n    \"tar\",\n    \"tidig\",\n    \"tidigare\",\n    \"tidigast\",\n    \"tidigt\",\n    \"till\",\n    \"tills\",\n    \"tillsammans\",\n    \"tio\",\n    \"tionde\",\n    \"tjugo\",\n    \"tjugoen\",\n    \"tjugoett\",\n    \"tjugonde\",\n    \"tjugotre\",\n    \"tjugotvå\",\n    \"tjungo\",\n    \"tolfte\",\n    \"tolv\",\n    \"tre\",\n    \"tredje\",\n    \"trettio\",\n    \"trettionde\",\n    \"tretton\",\n    \"trettonde\",\n    \"två\",\n    \"tvåhundra\",\n    \"under\",\n    \"upp\",\n    \"ur\",\n    \"ursäkt\",\n    \"ut\",\n    \"utan\",\n    \"utanför\",\n    \"ute\",\n    \"va\",\n    \"vad\",\n    \"var\",\n    \"vara\",\n    \"varför\",\n    \"varifrån\",\n    \"varit\",\n    \"varje\",\n    \"varken\",\n    \"vars\",\n    \"varsågod\",\n    \"vart\",\n    \"vem\",\n    \"vems\",\n    \"verkligen\",\n    \"vi\",\n    \"vid\",\n    \"vidare\",\n    \"viktig\",\n    \"viktigare\",\n    \"viktigast\",\n    \"viktigt\",\n    \"vilka\",\n    \"vilkas\",\n    \"vilken\",\n    \"vilket\",\n    \"vill\",\n    \"väl\",\n    \"vänster\",\n    \"vänstra\",\n    \"värre\",\n    \"vår\",\n    \"våra\",\n    \"vårt\",\n    \"än\",\n    \"ännu\",\n    \"är\",\n    \"även\",\n    \"åt\",\n    \"åtminstone\",\n    \"åtta\",\n    \"åttio\",\n    \"åttionde\",\n    \"åttonde\",\n    \"över\",\n    \"övermorgon\",\n    \"överst\",\n    \"övre\",\n];\n"
  },
  {
    "path": "src/stopwords/tam.rs",
    "content": "// Sonic\n//\n// Fast, lightweight and schema-less search backend\n// Copyright: 2019, Valerian Saliou <valerian@valeriansaliou.name>\n// License: Mozilla Public License v2.0 (MPL v2.0)\n\npub static STOPWORDS_TAM: &[&str] = &[\n    \"ஒரு\",\n    \"என்று\",\n    \"மற்றும்\",\n    \"இந்த\",\n    \"இது\",\n    \"என்ற\",\n    \"கொண்டு\",\n    \"என்பது\",\n    \"பல\",\n    \"ஆகும்\",\n    \"அல்லது\",\n    \"அவர்\",\n    \"நான்\",\n    \"உள்ள\",\n    \"அந்த\",\n    \"இவர்\",\n    \"என\",\n    \"முதல்\",\n    \"என்ன\",\n    \"இருந்து\",\n    \"சில\",\n    \"என்\",\n    \"போன்ற\",\n    \"வேண்டும்\",\n    \"வந்து\",\n    \"இதன்\",\n    \"அது\",\n    \"அவன்\",\n    \"தான்\",\n    \"பலரும்\",\n    \"என்னும்\",\n    \"மேலும்\",\n    \"பின்னர்\",\n    \"கொண்ட\",\n    \"இருக்கும்\",\n    \"தனது\",\n    \"உள்ளது\",\n    \"போது\",\n    \"என்றும்\",\n    \"அதன்\",\n    \"தன்\",\n    \"பிறகு\",\n    \"அவர்கள்\",\n    \"வரை\",\n    \"அவள்\",\n    \"நீ\",\n    \"ஆகிய\",\n    \"இருந்தது\",\n    \"உள்ளன\",\n    \"வந்த\",\n    \"இருந்த\",\n    \"மிகவும்\",\n    \"இங்கு\",\n    \"மீது\",\n    \"ஓர்\",\n    \"இவை\",\n    \"இந்தக்\",\n    \"பற்றி\",\n    \"வரும்\",\n    \"வேறு\",\n    \"இரு\",\n    \"இதில்\",\n    \"போல்\",\n    \"இப்போது\",\n    \"அவரது\",\n    \"மட்டும்\",\n    \"இந்தப்\",\n    \"எனும்\",\n    \"மேல்\",\n    \"பின்\",\n    \"சேர்ந்த\",\n    \"ஆகியோர்\",\n    \"எனக்கு\",\n    \"இன்னும்\",\n    \"அந்தப்\",\n    \"அன்று\",\n    \"ஒரே\",\n    \"மிக\",\n    \"அங்கு\",\n    \"பல்வேறு\",\n    \"விட்டு\",\n    \"பெரும்\",\n    \"அதை\",\n    \"பற்றிய\",\n    \"உன்\",\n    \"அதிக\",\n    \"அந்தக்\",\n    \"பேர்\",\n    \"இதனால்\",\n    \"அவை\",\n    \"அதே\",\n    \"ஏன்\",\n    \"முறை\",\n    \"யார்\",\n    \"என்பதை\",\n    \"எல்லாம்\",\n    \"மட்டுமே\",\n    \"இங்கே\",\n    \"அங்கே\",\n    \"இடம்\",\n    \"இடத்தில்\",\n    \"அதில்\",\n    \"நாம்\",\n    \"அதற்கு\",\n    \"எனவே\",\n    \"பிற\",\n    \"சிறு\",\n    \"மற்ற\",\n    \"விட\",\n    \"எந்த\",\n    \"எனவும்\",\n    \"எனப்படும்\",\n    \"எனினும்\",\n    \"அடுத்த\",\n    \"இதனை\",\n    \"இதை\",\n    \"கொள்ள\",\n    \"இந்தத்\",\n    \"இதற்கு\",\n    \"அதனால்\",\n    \"தவிர\",\n    \"போல\",\n    \"வரையில்\",\n    \"சற்று\",\n    \"எனக்\",\n];\n"
  },
  {
    "path": "src/stopwords/tel.rs",
    "content": "// Sonic\n//\n// Fast, lightweight and schema-less search backend\n// Copyright: 2019, Valerian Saliou <valerian@valeriansaliou.name>\n// License: Mozilla Public License v2.0 (MPL v2.0)\n\n// Notice: we do not have stopwords for this language yet.\npub static STOPWORDS_TEL: &[&str] = &[];\n"
  },
  {
    "path": "src/stopwords/tgl.rs",
    "content": "// Sonic\n//\n// Fast, lightweight and schema-less search backend\n// Copyright: 2022, Valerian Saliou <valerian@valeriansaliou.name>\n// License: Mozilla Public License v2.0 (MPL v2.0)\n\npub static STOPWORDS_TGL: &[&str] = &[\n    \"akin\",\n    \"aking\",\n    \"ako\",\n    \"alin\",\n    \"am\",\n    \"amin\",\n    \"aming\",\n    \"ang\",\n    \"ano\",\n    \"anumang\",\n    \"apat\",\n    \"at\",\n    \"atin\",\n    \"ating\",\n    \"ay\",\n    \"bababa\",\n    \"bago\",\n    \"bakit\",\n    \"bawat\",\n    \"bilang\",\n    \"dahil\",\n    \"dalawa\",\n    \"dapat\",\n    \"din\",\n    \"dito\",\n    \"doon\",\n    \"gagawin\",\n    \"gayunman\",\n    \"ginagawa\",\n    \"ginawa\",\n    \"ginawang\",\n    \"gumawa\",\n    \"gusto\",\n    \"habang\",\n    \"hanggang\",\n    \"hindi\",\n    \"huwag\",\n    \"iba\",\n    \"ibaba\",\n    \"ibabaw\",\n    \"ibig\",\n    \"ikaw\",\n    \"ilagay\",\n    \"ilalim\",\n    \"ilan\",\n    \"inyong\",\n    \"isa\",\n    \"isang\",\n    \"itaas\",\n    \"ito\",\n    \"iyo\",\n    \"iyon\",\n    \"iyong\",\n    \"ka\",\n    \"kahit\",\n    \"kailangan\",\n    \"kailanman\",\n    \"kami\",\n    \"kanila\",\n    \"kanilang\",\n    \"kanino\",\n    \"kanya\",\n    \"kanyang\",\n    \"kapag\",\n    \"kapwa\",\n    \"karamihan\",\n    \"katiyakan\",\n    \"katulad\",\n    \"kaya\",\n    \"kaysa\",\n    \"ko\",\n    \"kong\",\n    \"kulang\",\n    \"kumuha\",\n    \"kung\",\n    \"laban\",\n    \"lahat\",\n    \"lamang\",\n    \"likod\",\n    \"lima\",\n    \"maaari\",\n    \"maaaring\",\n    \"maging\",\n    \"mahusay\",\n    \"makita\",\n    \"marami\",\n    \"marapat\",\n    \"masyado\",\n    \"may\",\n    \"mayroon\",\n    \"mga\",\n    \"minsan\",\n    \"mismo\",\n    \"mula\",\n    \"muli\",\n    \"na\",\n    \"nabanggit\",\n    \"naging\",\n    \"nagkaroon\",\n    \"nais\",\n    \"nakita\",\n    \"namin\",\n    \"napaka\",\n    \"narito\",\n    \"nasaan\",\n    \"ng\",\n    \"ngayon\",\n    \"ni\",\n    \"nila\",\n    \"nilang\",\n    \"nito\",\n    \"niya\",\n    \"niyang\",\n    \"noon\",\n    \"o\",\n    \"pa\",\n    \"paano\",\n    \"pababa\",\n    \"paggawa\",\n    \"pagitan\",\n    \"pagkakaroon\",\n    \"pagkatapos\",\n    \"palabas\",\n    \"pamamagitan\",\n    \"panahon\",\n    \"pangalawa\",\n    \"para\",\n    \"paraan\",\n    \"pareho\",\n    \"pataas\",\n    \"pero\",\n    \"pumunta\",\n    \"pumupunta\",\n    \"sa\",\n    \"saan\",\n    \"sabi\",\n    \"sabihin\",\n    \"sarili\",\n    \"sila\",\n    \"sino\",\n    \"siya\",\n    \"tatlo\",\n    \"tayo\",\n    \"tulad\",\n    \"tungkol\",\n    \"una\",\n    \"walang\",\n];\n"
  },
  {
    "path": "src/stopwords/tha.rs",
    "content": "// Sonic\n//\n// Fast, lightweight and schema-less search backend\n// Copyright: 2019, Valerian Saliou <valerian@valeriansaliou.name>\n// License: Mozilla Public License v2.0 (MPL v2.0)\n\npub static STOPWORDS_THA: &[&str] = &[\n    \"กล่าว\",\n    \"กว่า\",\n    \"กัน\",\n    \"กับ\",\n    \"การ\",\n    \"ก็\",\n    \"ก่อน\",\n    \"ขณะ\",\n    \"ขอ\",\n    \"ของ\",\n    \"ขึ้น\",\n    \"คง\",\n    \"ครั้ง\",\n    \"ความ\",\n    \"คือ\",\n    \"จะ\",\n    \"จัด\",\n    \"จาก\",\n    \"จึง\",\n    \"ช่วง\",\n    \"ซึ่ง\",\n    \"ดัง\",\n    \"ด้วย\",\n    \"ด้าน\",\n    \"ตั้ง\",\n    \"ตั้งแต่\",\n    \"ตาม\",\n    \"ต่อ\",\n    \"ต่าง\",\n    \"ต่างๆ\",\n    \"ต้อง\",\n    \"ถึง\",\n    \"ถูก\",\n    \"ถ้า\",\n    \"ทั้ง\",\n    \"ทั้งนี้\",\n    \"ทาง\",\n    \"ทำ\",\n    \"ทำให้\",\n    \"ที่\",\n    \"ที่สุด\",\n    \"ทุก\",\n    \"นอกจาก\",\n    \"นัก\",\n    \"นั้น\",\n    \"นำ\",\n    \"นี้\",\n    \"น่า\",\n    \"บาง\",\n    \"ผล\",\n    \"ผ่าน\",\n    \"พบ\",\n    \"พร้อม\",\n    \"มา\",\n    \"มาก\",\n    \"มี\",\n    \"ยัง\",\n    \"รวม\",\n    \"ระหว่าง\",\n    \"รับ\",\n    \"ราย\",\n    \"ร่วม\",\n    \"ลง\",\n    \"วัน\",\n    \"ว่า\",\n    \"สำหรับ\",\n    \"สุด\",\n    \"ส่ง\",\n    \"ส่วน\",\n    \"หนึ่ง\",\n    \"หรือ\",\n    \"หลัง\",\n    \"หลังจาก\",\n    \"หลาย\",\n    \"หาก\",\n    \"อยาก\",\n    \"อยู่\",\n    \"อย่าง\",\n    \"ออก\",\n    \"อะไร\",\n    \"อาจ\",\n    \"อีก\",\n    \"เขา\",\n    \"เข้า\",\n    \"เคย\",\n    \"เฉพาะ\",\n    \"เช่น\",\n    \"เดียว\",\n    \"เดียวกัน\",\n    \"เนื่องจาก\",\n    \"เปิด\",\n    \"เปิดเผย\",\n    \"เป็น\",\n    \"เป็นการ\",\n    \"เพราะ\",\n    \"เพื่อ\",\n    \"เมื่อ\",\n    \"เรา\",\n    \"เริ่ม\",\n    \"เลย\",\n    \"เห็น\",\n    \"เอง\",\n    \"แต่\",\n    \"แบบ\",\n    \"แรก\",\n    \"และ\",\n    \"แล้ว\",\n    \"แห่ง\",\n    \"โดย\",\n    \"ใน\",\n    \"ให้\",\n    \"ได้\",\n    \"ไป\",\n    \"ไม่\",\n    \"ไว้\",\n];\n"
  },
  {
    "path": "src/stopwords/tuk.rs",
    "content": "// Sonic\n//\n// Fast, lightweight and schema-less search backend\n// Copyright: 2019, Valerian Saliou <valerian@valeriansaliou.name>\n// License: Mozilla Public License v2.0 (MPL v2.0)\n\n// Notice: we do not have stopwords for this language yet.\npub static STOPWORDS_TUK: &[&str] = &[];\n"
  },
  {
    "path": "src/stopwords/tur.rs",
    "content": "// Sonic\n//\n// Fast, lightweight and schema-less search backend\n// Copyright: 2019, Valerian Saliou <valerian@valeriansaliou.name>\n// License: Mozilla Public License v2.0 (MPL v2.0)\n\npub static STOPWORDS_TUR: &[&str] = &[\n    \"acaba\",\n    \"acep\",\n    \"adamakıllı\",\n    \"adeta\",\n    \"ait\",\n    \"altmýþ\",\n    \"altmış\",\n    \"altý\",\n    \"altı\",\n    \"ama\",\n    \"amma\",\n    \"anca\",\n    \"ancak\",\n    \"arada\",\n    \"artýk\",\n    \"aslında\",\n    \"aynen\",\n    \"ayrıca\",\n    \"az\",\n    \"açıkça\",\n    \"açıkçası\",\n    \"bana\",\n    \"bari\",\n    \"bazen\",\n    \"bazý\",\n    \"bazı\",\n    \"başkası\",\n    \"baţka\",\n    \"belki\",\n    \"ben\",\n    \"benden\",\n    \"beni\",\n    \"benim\",\n    \"beri\",\n    \"beriki\",\n    \"beþ\",\n    \"beş\",\n    \"beţ\",\n    \"bilcümle\",\n    \"bile\",\n    \"bin\",\n    \"binaen\",\n    \"binaenaleyh\",\n    \"bir\",\n    \"biraz\",\n    \"birazdan\",\n    \"birbiri\",\n    \"birden\",\n    \"birdenbire\",\n    \"biri\",\n    \"birice\",\n    \"birileri\",\n    \"birisi\",\n    \"birkaç\",\n    \"birkaçı\",\n    \"birkez\",\n    \"birlikte\",\n    \"birçok\",\n    \"birçoğu\",\n    \"birþey\",\n    \"birþeyi\",\n    \"birşey\",\n    \"birşeyi\",\n    \"birţey\",\n    \"bitevi\",\n    \"biteviye\",\n    \"bittabi\",\n    \"biz\",\n    \"bizatihi\",\n    \"bizce\",\n    \"bizcileyin\",\n    \"bizden\",\n    \"bize\",\n    \"bizi\",\n    \"bizim\",\n    \"bizimki\",\n    \"bizzat\",\n    \"boşuna\",\n    \"bu\",\n    \"buna\",\n    \"bunda\",\n    \"bundan\",\n    \"bunlar\",\n    \"bunları\",\n    \"bunların\",\n    \"bunu\",\n    \"bunun\",\n    \"buracıkta\",\n    \"burada\",\n    \"buradan\",\n    \"burası\",\n    \"böyle\",\n    \"böylece\",\n    \"böylecene\",\n    \"böylelikle\",\n    \"böylemesine\",\n    \"böylesine\",\n    \"büsbütün\",\n    \"bütün\",\n    \"cuk\",\n    \"cümlesi\",\n    \"da\",\n    \"daha\",\n    \"dahi\",\n    \"dahil\",\n    \"dahilen\",\n    \"daima\",\n    \"dair\",\n    \"dayanarak\",\n    \"de\",\n    \"defa\",\n    \"dek\",\n    \"demin\",\n    \"demincek\",\n    \"deminden\",\n    \"denli\",\n    \"derakap\",\n    \"derhal\",\n    \"derken\",\n    \"deđil\",\n    \"değil\",\n    \"değin\",\n    \"diye\",\n    \"diđer\",\n    \"diğer\",\n    \"diğeri\",\n    \"doksan\",\n    \"dokuz\",\n    \"dolayı\",\n    \"dolayısıyla\",\n    \"doğru\",\n    \"dört\",\n    \"edecek\",\n    \"eden\",\n    \"ederek\",\n    \"edilecek\",\n    \"ediliyor\",\n    \"edilmesi\",\n    \"ediyor\",\n    \"elbet\",\n    \"elbette\",\n    \"elli\",\n    \"emme\",\n    \"en\",\n    \"enikonu\",\n    \"epey\",\n    \"epeyce\",\n    \"epeyi\",\n    \"esasen\",\n    \"esnasında\",\n    \"etmesi\",\n    \"etraflı\",\n    \"etraflıca\",\n    \"etti\",\n    \"ettiği\",\n    \"ettiğini\",\n    \"evleviyetle\",\n    \"evvel\",\n    \"evvela\",\n    \"evvelce\",\n    \"evvelden\",\n    \"evvelemirde\",\n    \"evveli\",\n    \"eđer\",\n    \"eğer\",\n    \"fakat\",\n    \"filanca\",\n    \"gah\",\n    \"gayet\",\n    \"gayetle\",\n    \"gayri\",\n    \"gayrı\",\n    \"gelgelelim\",\n    \"gene\",\n    \"gerek\",\n    \"gerçi\",\n    \"geçende\",\n    \"geçenlerde\",\n    \"gibi\",\n    \"gibilerden\",\n    \"gibisinden\",\n    \"gine\",\n    \"göre\",\n    \"gırla\",\n    \"hakeza\",\n    \"halbuki\",\n    \"halen\",\n    \"halihazırda\",\n    \"haliyle\",\n    \"handiyse\",\n    \"hangi\",\n    \"hangisi\",\n    \"hani\",\n    \"hariç\",\n    \"hasebiyle\",\n    \"hasılı\",\n    \"hatta\",\n    \"hele\",\n    \"hem\",\n    \"henüz\",\n    \"hep\",\n    \"hepsi\",\n    \"her\",\n    \"herhangi\",\n    \"herkes\",\n    \"herkesin\",\n    \"hiç\",\n    \"hiçbir\",\n    \"hiçbiri\",\n    \"hoş\",\n    \"hulasaten\",\n    \"iken\",\n    \"iki\",\n    \"ila\",\n    \"ile\",\n    \"ilen\",\n    \"ilgili\",\n    \"ilk\",\n    \"illa\",\n    \"illaki\",\n    \"imdi\",\n    \"indinde\",\n    \"inen\",\n    \"insermi\",\n    \"ise\",\n    \"ister\",\n    \"itibaren\",\n    \"itibariyle\",\n    \"itibarıyla\",\n    \"iyi\",\n    \"iyice\",\n    \"iyicene\",\n    \"için\",\n    \"iş\",\n    \"işte\",\n    \"iţte\",\n    \"kadar\",\n    \"kaffesi\",\n    \"kah\",\n    \"kala\",\n    \"kanýmca\",\n    \"karşın\",\n    \"katrilyon\",\n    \"kaynak\",\n    \"kaçı\",\n    \"kelli\",\n    \"kendi\",\n    \"kendilerine\",\n    \"kendini\",\n    \"kendisi\",\n    \"kendisine\",\n    \"kendisini\",\n    \"kere\",\n    \"kez\",\n    \"keza\",\n    \"kezalik\",\n    \"keşke\",\n    \"keţke\",\n    \"ki\",\n    \"kim\",\n    \"kimden\",\n    \"kime\",\n    \"kimi\",\n    \"kimisi\",\n    \"kimse\",\n    \"kimsecik\",\n    \"kimsecikler\",\n    \"külliyen\",\n    \"kýrk\",\n    \"kýsaca\",\n    \"kırk\",\n    \"kısaca\",\n    \"lakin\",\n    \"leh\",\n    \"lütfen\",\n    \"maada\",\n    \"madem\",\n    \"mademki\",\n    \"mamafih\",\n    \"mebni\",\n    \"međer\",\n    \"meğer\",\n    \"meğerki\",\n    \"meğerse\",\n    \"milyar\",\n    \"milyon\",\n    \"mu\",\n    \"mü\",\n    \"mý\",\n    \"mı\",\n    \"nasýl\",\n    \"nasıl\",\n    \"nasılsa\",\n    \"nazaran\",\n    \"naşi\",\n    \"ne\",\n    \"neden\",\n    \"nedeniyle\",\n    \"nedenle\",\n    \"nedense\",\n    \"nerde\",\n    \"nerden\",\n    \"nerdeyse\",\n    \"nere\",\n    \"nerede\",\n    \"nereden\",\n    \"neredeyse\",\n    \"neresi\",\n    \"nereye\",\n    \"netekim\",\n    \"neye\",\n    \"neyi\",\n    \"neyse\",\n    \"nice\",\n    \"nihayet\",\n    \"nihayetinde\",\n    \"nitekim\",\n    \"niye\",\n    \"niçin\",\n    \"o\",\n    \"olan\",\n    \"olarak\",\n    \"oldu\",\n    \"olduklarını\",\n    \"oldukça\",\n    \"olduğu\",\n    \"olduğunu\",\n    \"olmadı\",\n    \"olmadığı\",\n    \"olmak\",\n    \"olması\",\n    \"olmayan\",\n    \"olmaz\",\n    \"olsa\",\n    \"olsun\",\n    \"olup\",\n    \"olur\",\n    \"olursa\",\n    \"oluyor\",\n    \"on\",\n    \"ona\",\n    \"onca\",\n    \"onculayın\",\n    \"onda\",\n    \"ondan\",\n    \"onlar\",\n    \"onlardan\",\n    \"onlari\",\n    \"onlarýn\",\n    \"onları\",\n    \"onların\",\n    \"onu\",\n    \"onun\",\n    \"oracık\",\n    \"oracıkta\",\n    \"orada\",\n    \"oradan\",\n    \"oranca\",\n    \"oranla\",\n    \"oraya\",\n    \"otuz\",\n    \"oysa\",\n    \"oysaki\",\n    \"pek\",\n    \"pekala\",\n    \"peki\",\n    \"pekçe\",\n    \"peyderpey\",\n    \"rağmen\",\n    \"sadece\",\n    \"sahi\",\n    \"sahiden\",\n    \"sana\",\n    \"sanki\",\n    \"sekiz\",\n    \"seksen\",\n    \"sen\",\n    \"senden\",\n    \"seni\",\n    \"senin\",\n    \"siz\",\n    \"sizden\",\n    \"sizi\",\n    \"sizin\",\n    \"sonra\",\n    \"sonradan\",\n    \"sonraları\",\n    \"sonunda\",\n    \"tabii\",\n    \"tam\",\n    \"tamam\",\n    \"tamamen\",\n    \"tamamıyla\",\n    \"tarafından\",\n    \"tek\",\n    \"trilyon\",\n    \"tüm\",\n    \"var\",\n    \"vardı\",\n    \"vasıtasıyla\",\n    \"ve\",\n    \"velev\",\n    \"velhasıl\",\n    \"velhasılıkelam\",\n    \"veya\",\n    \"veyahut\",\n    \"ya\",\n    \"yahut\",\n    \"yakinen\",\n    \"yakında\",\n    \"yakından\",\n    \"yakınlarda\",\n    \"yalnız\",\n    \"yalnızca\",\n    \"yani\",\n    \"yapacak\",\n    \"yapmak\",\n    \"yaptı\",\n    \"yaptıkları\",\n    \"yaptığı\",\n    \"yaptığını\",\n    \"yapılan\",\n    \"yapılması\",\n    \"yapıyor\",\n    \"yedi\",\n    \"yeniden\",\n    \"yenilerde\",\n    \"yerine\",\n    \"yetmiþ\",\n    \"yetmiş\",\n    \"yetmiţ\",\n    \"yine\",\n    \"yirmi\",\n    \"yok\",\n    \"yoksa\",\n    \"yoluyla\",\n    \"yüz\",\n    \"yüzünden\",\n    \"zarfında\",\n    \"zaten\",\n    \"zati\",\n    \"zira\",\n    \"çabuk\",\n    \"çabukça\",\n    \"çeşitli\",\n    \"çok\",\n    \"çokları\",\n    \"çoklarınca\",\n    \"çokluk\",\n    \"çoklukla\",\n    \"çokça\",\n    \"çoğu\",\n    \"çoğun\",\n    \"çoğunca\",\n    \"çoğunlukla\",\n    \"çünkü\",\n    \"öbür\",\n    \"öbürkü\",\n    \"öbürü\",\n    \"önce\",\n    \"önceden\",\n    \"önceleri\",\n    \"öncelikle\",\n    \"öteki\",\n    \"ötekisi\",\n    \"öyle\",\n    \"öylece\",\n    \"öylelikle\",\n    \"öylemesine\",\n    \"öz\",\n    \"üzere\",\n    \"üç\",\n    \"þey\",\n    \"þeyden\",\n    \"þeyi\",\n    \"þeyler\",\n    \"þu\",\n    \"þuna\",\n    \"þunda\",\n    \"þundan\",\n    \"þunu\",\n    \"şayet\",\n    \"şey\",\n    \"şeyden\",\n    \"şeyi\",\n    \"şeyler\",\n    \"şu\",\n    \"şuna\",\n    \"şuncacık\",\n    \"şunda\",\n    \"şundan\",\n    \"şunlar\",\n    \"şunları\",\n    \"şunu\",\n    \"şunun\",\n    \"şura\",\n    \"şuracık\",\n    \"şuracıkta\",\n    \"şurası\",\n    \"şöyle\",\n    \"ţayet\",\n    \"ţimdi\",\n    \"ţu\",\n    \"ţöyle\",\n];\n"
  },
  {
    "path": "src/stopwords/ukr.rs",
    "content": "// Sonic\n//\n// Fast, lightweight and schema-less search backend\n// Copyright: 2019, Valerian Saliou <valerian@valeriansaliou.name>\n// License: Mozilla Public License v2.0 (MPL v2.0)\n\npub static STOPWORDS_UKR: &[&str] = &[\n    \"але\",\n    \"ви\",\n    \"вона\",\n    \"вони\",\n    \"воно\",\n    \"він\",\n    \"в╡д\",\n    \"з\",\n    \"й\",\n    \"коли\",\n    \"ми\",\n    \"нам\",\n    \"про\",\n    \"та\",\n    \"ти\",\n    \"хоча\",\n    \"це\",\n    \"цей\",\n    \"чи\",\n    \"чого\",\n    \"що\",\n    \"як\",\n    \"яко╞\",\n    \"із\",\n    \"інших\",\n    \"╙\",\n    \"╞х\",\n    \"╡\",\n];\n"
  },
  {
    "path": "src/stopwords/urd.rs",
    "content": "// Sonic\n//\n// Fast, lightweight and schema-less search backend\n// Copyright: 2019, Valerian Saliou <valerian@valeriansaliou.name>\n// License: Mozilla Public License v2.0 (MPL v2.0)\n\npub static STOPWORDS_URD: &[&str] = &[\n    \"آئی\",\n    \"آئے\",\n    \"آج\",\n    \"آخر\",\n    \"آخرکبر\",\n    \"آدهی\",\n    \"آًب\",\n    \"آٹھ\",\n    \"آیب\",\n    \"اة\",\n    \"اخبزت\",\n    \"اختتبم\",\n    \"ادھر\",\n    \"ارد\",\n    \"اردگرد\",\n    \"ارکبى\",\n    \"اش\",\n    \"اضتعوبل\",\n    \"اضتعوبلات\",\n    \"اضطرذ\",\n    \"اضکب\",\n    \"اضکی\",\n    \"اضکے\",\n    \"اطراف\",\n    \"اغیب\",\n    \"افراد\",\n    \"الگ\",\n    \"اور\",\n    \"اوًچب\",\n    \"اوًچبئی\",\n    \"اوًچی\",\n    \"اوًچے\",\n    \"اى\",\n    \"اً\",\n    \"اًذر\",\n    \"اًہیں\",\n    \"اٹھبًب\",\n    \"اپٌب\",\n    \"اپٌے\",\n    \"اچھب\",\n    \"اچھی\",\n    \"اچھے\",\n    \"اکثر\",\n    \"اکٹھب\",\n    \"اکٹھی\",\n    \"اکٹھے\",\n    \"اکیلا\",\n    \"اکیلی\",\n    \"اکیلے\",\n    \"اگرچہ\",\n    \"اہن\",\n    \"ایطے\",\n    \"ایک\",\n    \"ب\",\n    \"ت\",\n    \"تبزٍ\",\n    \"تت\",\n    \"تر\",\n    \"ترتیت\",\n    \"تریي\",\n    \"تعذاد\",\n    \"تن\",\n    \"تو\",\n    \"توبم\",\n    \"توہی\",\n    \"توہیں\",\n    \"تٌہب\",\n    \"تک\",\n    \"تھب\",\n    \"تھوڑا\",\n    \"تھوڑی\",\n    \"تھوڑے\",\n    \"تھی\",\n    \"تھے\",\n    \"تیي\",\n    \"ثب\",\n    \"ثبئیں\",\n    \"ثبترتیت\",\n    \"ثبری\",\n    \"ثبرے\",\n    \"ثبعث\",\n    \"ثبلا\",\n    \"ثبلترتیت\",\n    \"ثبہر\",\n    \"ثدبئے\",\n    \"ثرآں\",\n    \"ثراں\",\n    \"ثرش\",\n    \"ثعذ\",\n    \"ثغیر\",\n    \"ثلٌذ\",\n    \"ثلٌذوثبلا\",\n    \"ثلکہ\",\n    \"ثي\",\n    \"ثٌب\",\n    \"ثٌبرہب\",\n    \"ثٌبرہی\",\n    \"ثٌبرہے\",\n    \"ثٌبًب\",\n    \"ثٌذ\",\n    \"ثٌذکرو\",\n    \"ثٌذکرًب\",\n    \"ثٌذی\",\n    \"ثڑا\",\n    \"ثڑوں\",\n    \"ثڑی\",\n    \"ثڑے\",\n    \"ثھر\",\n    \"ثھرا\",\n    \"ثھراہوا\",\n    \"ثھرپور\",\n    \"ثھی\",\n    \"ثہت\",\n    \"ثہتر\",\n    \"ثہتری\",\n    \"ثہتریي\",\n    \"ثیچ\",\n    \"ج\",\n    \"خب\",\n    \"خبرہب\",\n    \"خبرہی\",\n    \"خبرہے\",\n    \"خبهوظ\",\n    \"خبًب\",\n    \"خبًتب\",\n    \"خبًتی\",\n    \"خبًتے\",\n    \"خبًٌب\",\n    \"خت\",\n    \"ختن\",\n    \"خجکہ\",\n    \"خص\",\n    \"خططرذ\",\n    \"خلذی\",\n    \"خو\",\n    \"خواى\",\n    \"خوًہی\",\n    \"خوکہ\",\n    \"خٌبة\",\n    \"خگہ\",\n    \"خگہوں\",\n    \"خگہیں\",\n    \"خیطب\",\n    \"خیطبکہ\",\n    \"در\",\n    \"درخبت\",\n    \"درخہ\",\n    \"درخے\",\n    \"درزقیقت\",\n    \"درضت\",\n    \"دش\",\n    \"دفعہ\",\n    \"دلچطپ\",\n    \"دلچطپی\",\n    \"دلچطپیبں\",\n    \"دو\",\n    \"دور\",\n    \"دوراى\",\n    \"دوضرا\",\n    \"دوضروں\",\n    \"دوضری\",\n    \"دوضرے\",\n    \"دوًوں\",\n    \"دکھبئیں\",\n    \"دکھبتب\",\n    \"دکھبتی\",\n    \"دکھبتے\",\n    \"دکھبو\",\n    \"دکھبًب\",\n    \"دکھبیب\",\n    \"دی\",\n    \"دیب\",\n    \"دیتب\",\n    \"دیتی\",\n    \"دیتے\",\n    \"دیر\",\n    \"دیٌب\",\n    \"دیکھو\",\n    \"دیکھٌب\",\n    \"دیکھی\",\n    \"دیکھیں\",\n    \"دے\",\n    \"ر\",\n    \"راضتوں\",\n    \"راضتہ\",\n    \"راضتے\",\n    \"رریعہ\",\n    \"رریعے\",\n    \"رکي\",\n    \"رکھ\",\n    \"رکھب\",\n    \"رکھتب\",\n    \"رکھتبہوں\",\n    \"رکھتی\",\n    \"رکھتے\",\n    \"رکھی\",\n    \"رکھے\",\n    \"رہب\",\n    \"رہی\",\n    \"رہے\",\n    \"ز\",\n    \"زبصل\",\n    \"زبضر\",\n    \"زبل\",\n    \"زبلات\",\n    \"زبلیہ\",\n    \"زصوں\",\n    \"زصہ\",\n    \"زصے\",\n    \"زقبئق\",\n    \"زقیتیں\",\n    \"زقیقت\",\n    \"زکن\",\n    \"زکویہ\",\n    \"زیبدٍ\",\n    \"صبف\",\n    \"صسیر\",\n    \"صفر\",\n    \"صورت\",\n    \"صورتسبل\",\n    \"صورتوں\",\n    \"صورتیں\",\n    \"ض\",\n    \"ضبت\",\n    \"ضبتھ\",\n    \"ضبدٍ\",\n    \"ضبرا\",\n    \"ضبرے\",\n    \"ضبل\",\n    \"ضبلوں\",\n    \"ضت\",\n    \"ضرور\",\n    \"ضرورت\",\n    \"ضروری\",\n    \"ضلطلہ\",\n    \"ضوچ\",\n    \"ضوچب\",\n    \"ضوچتب\",\n    \"ضوچتی\",\n    \"ضوچتے\",\n    \"ضوچو\",\n    \"ضوچٌب\",\n    \"ضوچی\",\n    \"ضوچیں\",\n    \"ضکب\",\n    \"ضکتب\",\n    \"ضکتی\",\n    \"ضکتے\",\n    \"ضکٌب\",\n    \"ضکی\",\n    \"ضکے\",\n    \"ضیذھب\",\n    \"ضیذھی\",\n    \"ضیذھے\",\n    \"ضیکٌڈ\",\n    \"ضے\",\n    \"طرف\",\n    \"طریق\",\n    \"طریقوں\",\n    \"طریقہ\",\n    \"طریقے\",\n    \"طور\",\n    \"طورپر\",\n    \"ظبہر\",\n    \"ع\",\n    \"عذد\",\n    \"عظین\",\n    \"علاقوں\",\n    \"علاقہ\",\n    \"علاقے\",\n    \"علاوٍ\",\n    \"عووهی\",\n    \"غبیذ\",\n    \"غخص\",\n    \"غذ\",\n    \"غروع\",\n    \"غروعبت\",\n    \"غے\",\n    \"فرد\",\n    \"فی\",\n    \"ق\",\n    \"قجل\",\n    \"قجیلہ\",\n    \"قطن\",\n    \"لئے\",\n    \"لا\",\n    \"لازهی\",\n    \"لو\",\n    \"لوجب\",\n    \"لوجی\",\n    \"لوجے\",\n    \"لوسبت\",\n    \"لوسہ\",\n    \"لوگ\",\n    \"لوگوں\",\n    \"لڑکپي\",\n    \"لگتب\",\n    \"لگتی\",\n    \"لگتے\",\n    \"لگٌب\",\n    \"لگی\",\n    \"لگیں\",\n    \"لگے\",\n    \"لی\",\n    \"لیب\",\n    \"لیٌب\",\n    \"لیں\",\n    \"لے\",\n    \"ه\",\n    \"هتعلق\",\n    \"هختلف\",\n    \"هسترم\",\n    \"هسترهہ\",\n    \"هسطوش\",\n    \"هسیذ\",\n    \"هطئلہ\",\n    \"هطئلے\",\n    \"هطبئل\",\n    \"هطتعول\",\n    \"هطلق\",\n    \"هعلوم\",\n    \"هػتول\",\n    \"هلا\",\n    \"هوکي\",\n    \"هوکٌبت\",\n    \"هوکٌہ\",\n    \"هٌبضت\",\n    \"هڑا\",\n    \"هڑًب\",\n    \"هڑے\",\n    \"هکول\",\n    \"هگر\",\n    \"هہرثبى\",\n    \"هیرا\",\n    \"هیری\",\n    \"هیرے\",\n    \"هیں\",\n    \"و\",\n    \"وار\",\n    \"والے\",\n    \"وٍ\",\n    \"ًئی\",\n    \"ًئے\",\n    \"ًب\",\n    \"ًبپطٌذ\",\n    \"ًبگسیر\",\n    \"ًطجت\",\n    \"ًقطہ\",\n    \"ًو\",\n    \"ًوخواى\",\n    \"ًکبلٌب\",\n    \"ًکتہ\",\n    \"ًہ\",\n    \"ًہیں\",\n    \"ًیب\",\n    \"ًے\",\n    \"ٓ آش\",\n    \"ٹھیک\",\n    \"پبئے\",\n    \"پبش\",\n    \"پبًب\",\n    \"پبًچ\",\n    \"پر\",\n    \"پراًب\",\n    \"پطٌذ\",\n    \"پل\",\n    \"پورا\",\n    \"پوچھب\",\n    \"پوچھتب\",\n    \"پوچھتی\",\n    \"پوچھتے\",\n    \"پوچھو\",\n    \"پوچھوں\",\n    \"پوچھٌب\",\n    \"پوچھیں\",\n    \"پچھلا\",\n    \"پھر\",\n    \"پہلا\",\n    \"پہلی\",\n    \"پہلےضی\",\n    \"پہلےضے\",\n    \"پہلےضےہی\",\n    \"پیع\",\n    \"چبر\",\n    \"چبہب\",\n    \"چبہٌب\",\n    \"چبہے\",\n    \"چلا\",\n    \"چلو\",\n    \"چلیں\",\n    \"چلے\",\n    \"چکب\",\n    \"چکی\",\n    \"چکیں\",\n    \"چکے\",\n    \"چھوٹب\",\n    \"چھوٹوں\",\n    \"چھوٹی\",\n    \"چھوٹے\",\n    \"چھہ\",\n    \"چیسیں\",\n    \"ڈھوًڈا\",\n    \"ڈھوًڈلیب\",\n    \"ڈھوًڈو\",\n    \"ڈھوًڈًب\",\n    \"ڈھوًڈی\",\n    \"ڈھوًڈیں\",\n    \"ک\",\n    \"کئی\",\n    \"کئے\",\n    \"کب\",\n    \"کبفی\",\n    \"کبم\",\n    \"کت\",\n    \"کجھی\",\n    \"کرا\",\n    \"کرتب\",\n    \"کرتبہوں\",\n    \"کرتی\",\n    \"کرتے\",\n    \"کرتےہو\",\n    \"کررہب\",\n    \"کررہی\",\n    \"کررہے\",\n    \"کرو\",\n    \"کرًب\",\n    \"کریں\",\n    \"کرے\",\n    \"کطی\",\n    \"کل\",\n    \"کن\",\n    \"کوئی\",\n    \"کوتر\",\n    \"کورا\",\n    \"کوروں\",\n    \"کورٍ\",\n    \"کورے\",\n    \"کوطي\",\n    \"کوى\",\n    \"کوًطب\",\n    \"کوًطی\",\n    \"کوًطے\",\n    \"کھولا\",\n    \"کھولو\",\n    \"کھولٌب\",\n    \"کھولی\",\n    \"کھولیں\",\n    \"کھولے\",\n    \"کہ\",\n    \"کہب\",\n    \"کہتب\",\n    \"کہتی\",\n    \"کہتے\",\n    \"کہو\",\n    \"کہوں\",\n    \"کہٌب\",\n    \"کہی\",\n    \"کہیں\",\n    \"کہے\",\n    \"کی\",\n    \"کیب\",\n    \"کیطب\",\n    \"کیطرف\",\n    \"کیطے\",\n    \"کیلئے\",\n    \"کیوًکہ\",\n    \"کیوں\",\n    \"کیے\",\n    \"کے\",\n    \"کےثعذ\",\n    \"کےرریعے\",\n    \"گئی\",\n    \"گئے\",\n    \"گب\",\n    \"گرد\",\n    \"گروٍ\",\n    \"گروپ\",\n    \"گروہوں\",\n    \"گٌتی\",\n    \"گی\",\n    \"گیب\",\n    \"گے\",\n    \"ہر\",\n    \"ہن\",\n    \"ہو\",\n    \"ہوئی\",\n    \"ہوئے\",\n    \"ہوا\",\n    \"ہوبرا\",\n    \"ہوبری\",\n    \"ہوبرے\",\n    \"ہوتب\",\n    \"ہوتی\",\n    \"ہوتے\",\n    \"ہورہب\",\n    \"ہورہی\",\n    \"ہورہے\",\n    \"ہوضکتب\",\n    \"ہوضکتی\",\n    \"ہوضکتے\",\n    \"ہوًب\",\n    \"ہوًی\",\n    \"ہوًے\",\n    \"ہوچکب\",\n    \"ہوچکی\",\n    \"ہوچکے\",\n    \"ہوگئی\",\n    \"ہوگئے\",\n    \"ہوگیب\",\n    \"ہوں\",\n    \"ہی\",\n    \"ہیں\",\n    \"ہے\",\n    \"ی\",\n    \"یقیٌی\",\n    \"یہ\",\n    \"یہبں\",\n];\n"
  },
  {
    "path": "src/stopwords/uzb.rs",
    "content": "// Sonic\n//\n// Fast, lightweight and schema-less search backend\n// Copyright: 2019, Valerian Saliou <valerian@valeriansaliou.name>\n// License: Mozilla Public License v2.0 (MPL v2.0)\n\n// Notice: we do not have stopwords for this language yet.\npub static STOPWORDS_UZB: &[&str] = &[];\n"
  },
  {
    "path": "src/stopwords/vie.rs",
    "content": "// Sonic\n//\n// Fast, lightweight and schema-less search backend\n// Copyright: 2019, Valerian Saliou <valerian@valeriansaliou.name>\n// License: Mozilla Public License v2.0 (MPL v2.0)\n\npub static STOPWORDS_VIE: &[&str] = &[\n    \"a ha\",\n    \"a-lô\",\n    \"ai\",\n    \"ai ai\",\n    \"ai nấy\",\n    \"alô\",\n    \"amen\",\n    \"anh\",\n    \"bao giờ\",\n    \"bao lâu\",\n    \"bao nhiêu\",\n    \"bao nả\",\n    \"bay biến\",\n    \"biết\",\n    \"biết bao\",\n    \"biết bao nhiêu\",\n    \"biết chừng nào\",\n    \"biết mấy\",\n    \"biết đâu\",\n    \"biết đâu chừng\",\n    \"biết đâu đấy\",\n    \"bà\",\n    \"bài\",\n    \"bác\",\n    \"bây bẩy\",\n    \"bây chừ\",\n    \"bây giờ\",\n    \"bây nhiêu\",\n    \"bèn\",\n    \"béng\",\n    \"bông\",\n    \"bạn\",\n    \"bản\",\n    \"bất chợt\",\n    \"bất cứ\",\n    \"bất giác\",\n    \"bất kì\",\n    \"bất kể\",\n    \"bất kỳ\",\n    \"bất luận\",\n    \"bất nhược\",\n    \"bất quá\",\n    \"bất thình lình\",\n    \"bất tử\",\n    \"bất đồ\",\n    \"bấy\",\n    \"bấy chầy\",\n    \"bấy chừ\",\n    \"bấy giờ\",\n    \"bấy lâu\",\n    \"bấy lâu nay\",\n    \"bấy nay\",\n    \"bấy nhiêu\",\n    \"bập bà bập bõm\",\n    \"bập bõm\",\n    \"bắt đầu từ\",\n    \"bằng\",\n    \"bằng không\",\n    \"bằng nấy\",\n    \"bằng ấy\",\n    \"bển\",\n    \"bệt\",\n    \"bị\",\n    \"bỏ mẹ\",\n    \"bỗng\",\n    \"bỗng chốc\",\n    \"bỗng dưng\",\n    \"bỗng không\",\n    \"bỗng nhiên\",\n    \"bỗng đâu\",\n    \"bộ\",\n    \"bội phần\",\n    \"bớ\",\n    \"bởi\",\n    \"bởi chưng\",\n    \"bởi nhưng\",\n    \"bởi thế\",\n    \"bởi vì\",\n    \"bởi vậy\",\n    \"bức\",\n    \"cao\",\n    \"cha\",\n    \"cha chả\",\n    \"chao ôi\",\n    \"chiếc\",\n    \"cho\",\n    \"cho nên\",\n    \"cho tới\",\n    \"cho tới khi\",\n    \"cho đến\",\n    \"cho đến khi\",\n    \"choa\",\n    \"chu cha\",\n    \"chui cha\",\n    \"chung cục\",\n    \"chung qui\",\n    \"chung quy\",\n    \"chung quy lại\",\n    \"chuyện\",\n    \"chành chạnh\",\n    \"chí chết\",\n    \"chính\",\n    \"chính là\",\n    \"chính thị\",\n    \"chùn chùn\",\n    \"chùn chũn\",\n    \"chú\",\n    \"chú mày\",\n    \"chú mình\",\n    \"chúng mình\",\n    \"chúng ta\",\n    \"chúng tôi\",\n    \"chăn chắn\",\n    \"chăng\",\n    \"chưa\",\n    \"chầm chập\",\n    \"chậc\",\n    \"chắc\",\n    \"chắc hẳn\",\n    \"chẳng lẽ\",\n    \"chẳng những\",\n    \"chẳng nữa\",\n    \"chẳng phải\",\n    \"chết nỗi\",\n    \"chết thật\",\n    \"chết tiệt\",\n    \"chỉ\",\n    \"chỉn\",\n    \"chốc chốc\",\n    \"chớ\",\n    \"chớ chi\",\n    \"chợt\",\n    \"chủn\",\n    \"chứ\",\n    \"chứ lị\",\n    \"coi bộ\",\n    \"coi mòi\",\n    \"con\",\n    \"cu cậu\",\n    \"cuốn\",\n    \"cuộc\",\n    \"càng\",\n    \"các\",\n    \"cái\",\n    \"cây\",\n    \"còn\",\n    \"có\",\n    \"có chăng là\",\n    \"có dễ\",\n    \"có thể\",\n    \"có vẻ\",\n    \"cóc khô\",\n    \"cô\",\n    \"cô mình\",\n    \"công nhiên\",\n    \"cùng\",\n    \"cùng cực\",\n    \"cùng nhau\",\n    \"cùng với\",\n    \"căn\",\n    \"căn cắt\",\n    \"cũng\",\n    \"cũng như\",\n    \"cũng vậy\",\n    \"cũng vậy thôi\",\n    \"cơ\",\n    \"cơ chừng\",\n    \"cơ hồ\",\n    \"cơ mà\",\n    \"cơn\",\n    \"cả\",\n    \"cả thảy\",\n    \"cả thể\",\n    \"cảm ơn\",\n    \"cần\",\n    \"cật lực\",\n    \"cật sức\",\n    \"cậu\",\n    \"cổ lai\",\n    \"của\",\n    \"cứ\",\n    \"cứ việc\",\n    \"cực lực\",\n    \"do\",\n    \"do vì\",\n    \"do vậy\",\n    \"do đó\",\n    \"duy\",\n    \"dào\",\n    \"dì\",\n    \"dù cho\",\n    \"dù rằng\",\n    \"dưới\",\n    \"dạ\",\n    \"dần dà\",\n    \"dần dần\",\n    \"dầu sao\",\n    \"dẫu\",\n    \"dẫu sao\",\n    \"dễ sợ\",\n    \"dễ thường\",\n    \"dở chừng\",\n    \"dữ\",\n    \"em\",\n    \"giữa\",\n    \"gì\",\n    \"hay\",\n    \"hoàn toàn\",\n    \"hoặc\",\n    \"hơn\",\n    \"hầu hết\",\n    \"họ\",\n    \"hỏi\",\n    \"khi\",\n    \"khác\",\n    \"không\",\n    \"luôn\",\n    \"là\",\n    \"làm\",\n    \"lên\",\n    \"lúc\",\n    \"lại\",\n    \"lần\",\n    \"lớn\",\n    \"muốn\",\n    \"mà\",\n    \"mình\",\n    \"mỗi\",\n    \"một\",\n    \"một cách\",\n    \"mới\",\n    \"mợ\",\n    \"ngay\",\n    \"ngay cả\",\n    \"ngay khi\",\n    \"ngay lúc\",\n    \"ngay lập tức\",\n    \"ngay tức khắc\",\n    \"ngay từ\",\n    \"nghe chừng\",\n    \"nghe đâu\",\n    \"nghen\",\n    \"nghiễm nhiên\",\n    \"nghỉm\",\n    \"ngoài\",\n    \"ngoài ra\",\n    \"ngoải\",\n    \"ngày\",\n    \"ngày càng\",\n    \"ngày ngày\",\n    \"ngày xưa\",\n    \"ngày xửa\",\n    \"ngôi\",\n    \"ngõ hầu\",\n    \"ngăn ngắt\",\n    \"ngươi\",\n    \"người\",\n    \"ngọn\",\n    \"ngọt\",\n    \"ngộ nhỡ\",\n    \"nh\",\n    \"nhau\",\n    \"nhiên hậu\",\n    \"nhiều\",\n    \"nhiệt liệt\",\n    \"nhung nhăng\",\n    \"nhà\",\n    \"nhân dịp\",\n    \"nhân tiện\",\n    \"nhé\",\n    \"nhón nhén\",\n    \"như\",\n    \"như chơi\",\n    \"như không\",\n    \"như quả\",\n    \"như thể\",\n    \"như tuồng\",\n    \"như vậy\",\n    \"nhưng\",\n    \"nhưng mà\",\n    \"nhược bằng\",\n    \"nhất\",\n    \"nhất loạt\",\n    \"nhất luật\",\n    \"nhất mực\",\n    \"nhất nhất\",\n    \"nhất quyết\",\n    \"nhất sinh\",\n    \"nhất thiết\",\n    \"nhất tâm\",\n    \"nhất tề\",\n    \"nhất đán\",\n    \"nhất định\",\n    \"nhận\",\n    \"nhỉ\",\n    \"nhỡ ra\",\n    \"những\",\n    \"những ai\",\n    \"những như\",\n    \"nào\",\n    \"này\",\n    \"nên\",\n    \"nên chi\",\n    \"nó\",\n    \"nóc\",\n    \"nói\",\n    \"năm\",\n    \"nơi\",\n    \"nấy\",\n    \"nếu\",\n    \"nếu như\",\n    \"nền\",\n    \"nọ\",\n    \"nớ\",\n    \"nức nở\",\n    \"nữa\",\n    \"oai oái\",\n    \"oái\",\n    \"pho\",\n    \"phè\",\n    \"phóc\",\n    \"phót\",\n    \"phăn phắt\",\n    \"phương chi\",\n    \"phải\",\n    \"phải chi\",\n    \"phải chăng\",\n    \"phắt\",\n    \"phỉ phui\",\n    \"phỏng\",\n    \"phỏng như\",\n    \"phốc\",\n    \"phụt\",\n    \"phứt\",\n    \"qua\",\n    \"qua quít\",\n    \"qua quýt\",\n    \"quyết\",\n    \"quyết nhiên\",\n    \"quyển\",\n    \"quá\",\n    \"quá chừng\",\n    \"quá lắm\",\n    \"quá sá\",\n    \"quá thể\",\n    \"quá trời\",\n    \"quá xá\",\n    \"quá đỗi\",\n    \"quá độ\",\n    \"quá ư\",\n    \"quý hồ\",\n    \"quả\",\n    \"quả là\",\n    \"quả tang\",\n    \"quả thật\",\n    \"quả tình\",\n    \"quả vậy\",\n    \"quả đúng\",\n    \"ra\",\n    \"ra phết\",\n    \"ra sao\",\n    \"ra trò\",\n    \"ren rén\",\n    \"riu ríu\",\n    \"riêng\",\n    \"riệt\",\n    \"rày\",\n    \"ráo\",\n    \"ráo trọi\",\n    \"rén\",\n    \"rích\",\n    \"rón rén\",\n    \"rút cục\",\n    \"răng\",\n    \"rất\",\n    \"rằng\",\n    \"rằng là\",\n    \"rốt cuộc\",\n    \"rốt cục\",\n    \"rồi\",\n    \"rứa\",\n    \"sa sả\",\n    \"sao\",\n    \"sau\",\n    \"sau chót\",\n    \"sau cuối\",\n    \"sau cùng\",\n    \"sau đó\",\n    \"so\",\n    \"song le\",\n    \"suýt\",\n    \"sì\",\n    \"sạch\",\n    \"sất\",\n    \"sắp\",\n    \"sẽ\",\n    \"số\",\n    \"số là\",\n    \"sốt sột\",\n    \"sở dĩ\",\n    \"sự\",\n    \"tanh\",\n    \"tha hồ\",\n    \"than ôi\",\n    \"thanh\",\n    \"theo\",\n    \"thi thoảng\",\n    \"thoạt\",\n    \"thoạt nhiên\",\n    \"thoắt\",\n    \"thuần\",\n    \"thà\",\n    \"thà là\",\n    \"thà rằng\",\n    \"thành ra\",\n    \"thành thử\",\n    \"thái quá\",\n    \"tháng\",\n    \"thì\",\n    \"thì thôi\",\n    \"thình lình\",\n    \"thím\",\n    \"thôi\",\n    \"thúng thắng\",\n    \"thương ôi\",\n    \"thường\",\n    \"thảo hèn\",\n    \"thảo nào\",\n    \"thấy\",\n    \"thẩy\",\n    \"thậm\",\n    \"thậm chí\",\n    \"thật lực\",\n    \"thật ra\",\n    \"thật vậy\",\n    \"thế\",\n    \"thế là\",\n    \"thế mà\",\n    \"thế nào\",\n    \"thế nên\",\n    \"thế ra\",\n    \"thế thì\",\n    \"thế à\",\n    \"thếch\",\n    \"thỉnh thoảng\",\n    \"thỏm\",\n    \"thốc\",\n    \"thốc tháo\",\n    \"thốt\",\n    \"thốt nhiên\",\n    \"thộc\",\n    \"thời gian\",\n    \"thục mạng\",\n    \"thửa\",\n    \"thực ra\",\n    \"thực sự\",\n    \"thực vậy\",\n    \"tiếp theo\",\n    \"tiếp đó\",\n    \"tiện thể\",\n    \"toà\",\n    \"toé khói\",\n    \"toẹt\",\n    \"trong\",\n    \"trên\",\n    \"trước\",\n    \"trước kia\",\n    \"trước nay\",\n    \"trước tiên\",\n    \"trước đây\",\n    \"trước đó\",\n    \"trếu tráo\",\n    \"trển\",\n    \"trệt\",\n    \"trệu trạo\",\n    \"trỏng\",\n    \"trời đất ơi\",\n    \"trừ phi\",\n    \"tuy\",\n    \"tuy nhiên\",\n    \"tuy rằng\",\n    \"tuy thế\",\n    \"tuy vậy\",\n    \"tuyệt nhiên\",\n    \"tuần tự\",\n    \"tuốt luốt\",\n    \"tuốt tuồn tuột\",\n    \"tuốt tuột\",\n    \"tà tà\",\n    \"tênh\",\n    \"tít mù\",\n    \"tò te\",\n    \"tôi\",\n    \"tông tốc\",\n    \"tù tì\",\n    \"tăm tắp\",\n    \"tại\",\n    \"tại vì\",\n    \"tấm\",\n    \"tấn\",\n    \"tất cả\",\n    \"tất thảy\",\n    \"tất tần tật\",\n    \"tất tật\",\n    \"tắp\",\n    \"tắp lự\",\n    \"tọt\",\n    \"tỏ ra\",\n    \"tỏ vẻ\",\n    \"tốc tả\",\n    \"tối ư\",\n    \"tột\",\n    \"tớ\",\n    \"tới\",\n    \"tức thì\",\n    \"tức tốc\",\n    \"từ\",\n    \"từng\",\n    \"tự vì\",\n    \"tựu trung\",\n    \"veo\",\n    \"veo veo\",\n    \"việc\",\n    \"vung thiên địa\",\n    \"vung tàn tán\",\n    \"vung tán tàn\",\n    \"và\",\n    \"vào\",\n    \"vâng\",\n    \"vèo\",\n    \"vì\",\n    \"vì chưng\",\n    \"vì thế\",\n    \"vì vậy\",\n    \"ví bằng\",\n    \"ví dù\",\n    \"ví phỏng\",\n    \"ví thử\",\n    \"vô hình trung\",\n    \"vô kể\",\n    \"vô luận\",\n    \"vô vàn\",\n    \"văng tê\",\n    \"vạn nhất\",\n    \"vả chăng\",\n    \"vả lại\",\n    \"vẫn\",\n    \"vậy\",\n    \"vậy là\",\n    \"vậy thì\",\n    \"về\",\n    \"vị tất\",\n    \"vốn dĩ\",\n    \"với\",\n    \"với lại\",\n    \"vở\",\n    \"vụt\",\n    \"vừa\",\n    \"vừa mới\",\n    \"xa xả\",\n    \"xiết bao\",\n    \"xon xón\",\n    \"xoành xoạch\",\n    \"xoét\",\n    \"xoẳn\",\n    \"xoẹt\",\n    \"xuất kì bất ý\",\n    \"xuất kỳ bất ý\",\n    \"xuể\",\n    \"xuống\",\n    \"xăm xúi\",\n    \"xăm xăm\",\n    \"xăm xắm\",\n    \"xềnh xệch\",\n    \"xệp\",\n    \"à\",\n    \"à ơi\",\n    \"ào\",\n    \"á\",\n    \"á à\",\n    \"ái\",\n    \"ái chà\",\n    \"ái dà\",\n    \"áng\",\n    \"âu là\",\n    \"ô hay\",\n    \"ô hô\",\n    \"ô kê\",\n    \"ô kìa\",\n    \"ôi chao\",\n    \"ôi thôi\",\n    \"ông\",\n    \"úi\",\n    \"úi chà\",\n    \"úi dào\",\n    \"ý\",\n    \"ý chừng\",\n    \"ý da\",\n    \"đang\",\n    \"đi\",\n    \"điều\",\n    \"đành đạch\",\n    \"đáng lí\",\n    \"đáng lý\",\n    \"đáng lẽ\",\n    \"đánh đùng\",\n    \"đáo để\",\n    \"đây\",\n    \"đã\",\n    \"đó\",\n    \"được\",\n    \"đại loại\",\n    \"đại nhân\",\n    \"đại phàm\",\n    \"đại để\",\n    \"đến\",\n    \"đến nỗi\",\n    \"đều\",\n    \"để\",\n    \"ơ\",\n    \"ơ hay\",\n    \"ơ kìa\",\n    \"ơi\",\n    \"ư\",\n    \"ạ\",\n    \"ạ ơi\",\n    \"ấy\",\n    \"ầu ơ\",\n    \"ắt\",\n    \"ắt hẳn\",\n    \"ắt là\",\n    \"ối dào\",\n    \"ối giời\",\n    \"ối giời ơi\",\n    \"ồ\",\n    \"ổng\",\n    \"ớ\",\n    \"ờ\",\n    \"ở\",\n    \"ở trên\",\n    \"ủa\",\n    \"ứ hự\",\n    \"ứ ừ\",\n    \"ừ\",\n    \"ử\",\n];\n"
  },
  {
    "path": "src/stopwords/yid.rs",
    "content": "// Sonic\n//\n// Fast, lightweight and schema-less search backend\n// Copyright: 2019, Valerian Saliou <valerian@valeriansaliou.name>\n// License: Mozilla Public License v2.0 (MPL v2.0)\n\n// This is an alias for HEB stopwords, but I may be mistaken there.\npub static STOPWORDS_YID: &[&str] = &[\n    \"אבל\",\n    \"או\",\n    \"אולי\",\n    \"אותה\",\n    \"אותו\",\n    \"אותי\",\n    \"אותך\",\n    \"אותם\",\n    \"אותן\",\n    \"אותנו\",\n    \"אז\",\n    \"אחר\",\n    \"אחרות\",\n    \"אחרי\",\n    \"אחריכן\",\n    \"אחרים\",\n    \"אחרת\",\n    \"אי\",\n    \"איזה\",\n    \"איך\",\n    \"אין\",\n    \"איפה\",\n    \"איתה\",\n    \"איתו\",\n    \"איתי\",\n    \"איתך\",\n    \"איתכם\",\n    \"איתכן\",\n    \"איתם\",\n    \"איתן\",\n    \"איתנו\",\n    \"אך\",\n    \"אל\",\n    \"אלה\",\n    \"אלו\",\n    \"אם\",\n    \"אנחנו\",\n    \"אני\",\n    \"אס\",\n    \"אף\",\n    \"אצל\",\n    \"אשר\",\n    \"את\",\n    \"אתה\",\n    \"אתכם\",\n    \"אתכן\",\n    \"אתם\",\n    \"אתן\",\n    \"באיזומידה\",\n    \"באמצע\",\n    \"באמצעות\",\n    \"בגלל\",\n    \"בין\",\n    \"בלי\",\n    \"במידה\",\n    \"במקוםשבו\",\n    \"ברם\",\n    \"בשביל\",\n    \"בשעהש\",\n    \"בתוך\",\n    \"גם\",\n    \"דרך\",\n    \"הוא\",\n    \"היא\",\n    \"היה\",\n    \"היכן\",\n    \"היתה\",\n    \"היתי\",\n    \"הם\",\n    \"הן\",\n    \"הנה\",\n    \"הסיבהשבגללה\",\n    \"הרי\",\n    \"ואילו\",\n    \"ואת\",\n    \"זאת\",\n    \"זה\",\n    \"זות\",\n    \"יהיה\",\n    \"יוכל\",\n    \"יוכלו\",\n    \"יותרמדי\",\n    \"יכול\",\n    \"יכולה\",\n    \"יכולות\",\n    \"יכולים\",\n    \"יכל\",\n    \"יכלה\",\n    \"יכלו\",\n    \"יש\",\n    \"כאן\",\n    \"כאשר\",\n    \"כולם\",\n    \"כולן\",\n    \"כזה\",\n    \"כי\",\n    \"כיצד\",\n    \"כך\",\n    \"ככה\",\n    \"כל\",\n    \"כלל\",\n    \"כמו\",\n    \"כן\",\n    \"כפי\",\n    \"כש\",\n    \"לא\",\n    \"לאו\",\n    \"לאיזותכלית\",\n    \"לאן\",\n    \"לבין\",\n    \"לה\",\n    \"להיות\",\n    \"להם\",\n    \"להן\",\n    \"לו\",\n    \"לי\",\n    \"לכם\",\n    \"לכן\",\n    \"למה\",\n    \"למטה\",\n    \"למעלה\",\n    \"למקוםשבו\",\n    \"למרות\",\n    \"לנו\",\n    \"לעבר\",\n    \"לעיכן\",\n    \"לפיכך\",\n    \"לפני\",\n    \"מאד\",\n    \"מאחורי\",\n    \"מאיזוסיבה\",\n    \"מאין\",\n    \"מאיפה\",\n    \"מבלי\",\n    \"מבעד\",\n    \"מדוע\",\n    \"מה\",\n    \"מהיכן\",\n    \"מול\",\n    \"מחוץ\",\n    \"מי\",\n    \"מכאן\",\n    \"מכיוון\",\n    \"מלבד\",\n    \"מן\",\n    \"מנין\",\n    \"מסוגל\",\n    \"מעט\",\n    \"מעטים\",\n    \"מעל\",\n    \"מצד\",\n    \"מקוםבו\",\n    \"מתחת\",\n    \"מתי\",\n    \"נגד\",\n    \"נגר\",\n    \"נו\",\n    \"עד\",\n    \"עז\",\n    \"על\",\n    \"עלי\",\n    \"עליה\",\n    \"עליהם\",\n    \"עליהן\",\n    \"עליו\",\n    \"עליך\",\n    \"עליכם\",\n    \"עלינו\",\n    \"עם\",\n    \"עצמה\",\n    \"עצמהם\",\n    \"עצמהן\",\n    \"עצמו\",\n    \"עצמי\",\n    \"עצמם\",\n    \"עצמן\",\n    \"עצמנו\",\n    \"פה\",\n    \"רק\",\n    \"שוב\",\n    \"של\",\n    \"שלה\",\n    \"שלהם\",\n    \"שלהן\",\n    \"שלו\",\n    \"שלי\",\n    \"שלך\",\n    \"שלכה\",\n    \"שלכם\",\n    \"שלכן\",\n    \"שלנו\",\n    \"שם\",\n    \"תהיה\",\n    \"תחת\",\n];\n"
  },
  {
    "path": "src/stopwords/zul.rs",
    "content": "// Sonic\n//\n// Fast, lightweight and schema-less search backend\n// Copyright: 2019, Valerian Saliou <valerian@valeriansaliou.name>\n// License: Mozilla Public License v2.0 (MPL v2.0)\n\npub static STOPWORDS_ZUL: &[&str] = &[\n    \"futhi\",\n    \"kahle\",\n    \"kakhulu\",\n    \"kanye\",\n    \"khona\",\n    \"kodwa\",\n    \"kungani\",\n    \"kusho\",\n    \"la\",\n    \"lakhe\",\n    \"lapho\",\n    \"mina\",\n    \"ngesikhathi\",\n    \"nje\",\n    \"phansi\",\n    \"phezulu\",\n    \"u\",\n    \"ukuba\",\n    \"ukuthi\",\n    \"ukuze\",\n    \"uma\",\n    \"wahamba\",\n    \"wakhe\",\n    \"wami\",\n    \"wase\",\n    \"wathi\",\n    \"yakhe\",\n    \"zakhe\",\n    \"zonke\",\n];\n"
  },
  {
    "path": "src/store/fst.rs",
    "content": "// Sonic\n//\n// Fast, lightweight and schema-less search backend\n// Copyright: 2019, Valerian Saliou <valerian@valeriansaliou.name>\n// License: Mozilla Public License v2.0 (MPL v2.0)\n\nuse fst::automaton::AlwaysMatch;\nuse fst::set::Stream as FSTStream;\nuse fst::{\n    Automaton, Error as FSTError, IntoStreamer, Set as FSTSet, SetBuilder as FSTSetBuilder,\n    Streamer,\n};\nuse fst_levenshtein::Levenshtein;\nuse fst_regex::Regex;\nuse hashbrown::{HashMap, HashSet};\nuse radix::RadixNum;\nuse regex_syntax::escape as regex_escape;\nuse std::collections::VecDeque;\nuse std::fmt;\nuse std::fs::{self, File};\nuse std::io::{self, BufRead, BufReader, BufWriter, Write};\nuse std::iter::FromIterator;\nuse std::path::{Path, PathBuf};\nuse std::str;\nuse std::sync::{Arc, Mutex, RwLock};\nuse std::thread;\nuse std::time::{Duration, SystemTime};\n\nuse super::generic::{\n    StoreGeneric, StoreGenericActionBuilder, StoreGenericBuilder, StoreGenericPool,\n};\nuse super::keyer::StoreKeyerHasher;\nuse crate::lexer::ranges::LexerRegexRange;\nuse crate::APP_CONF;\n\npub struct StoreFSTPool;\npub struct StoreFSTBuilder;\n\npub struct StoreFST {\n    graph: FSTSet,\n    target: StoreFSTKey,\n    pending: StoreFSTPending,\n    last_used: Arc<RwLock<SystemTime>>,\n    last_consolidated: Arc<RwLock<SystemTime>>,\n}\n\n#[derive(Default)]\npub struct StoreFSTPending {\n    pop: Arc<RwLock<HashSet<Vec<u8>>>>,\n    push: Arc<RwLock<HashSet<Vec<u8>>>>,\n}\n\npub struct StoreFSTActionBuilder;\n\npub struct StoreFSTAction {\n    store: StoreFSTBox,\n}\n\n#[derive(PartialEq, Eq, Hash, Clone, Copy)]\npub struct StoreFSTKey {\n    collection_hash: StoreFSTAtom,\n    bucket_hash: StoreFSTAtom,\n}\n\npub struct StoreFSTMisc;\n\n#[derive(Copy, Clone)]\nenum StoreFSTPathMode {\n    Permanent,\n    Temporary,\n    Backup,\n}\n\ntype StoreFSTAtom = u32;\ntype StoreFSTBox = Arc<StoreFST>;\n\nconst WORD_LIMIT_LENGTH: usize = 40;\nconst ATOM_HASH_RADIX: usize = 16;\n\nlazy_static! {\n    pub static ref GRAPH_ACCESS_LOCK: Arc<RwLock<bool>> = Arc::new(RwLock::new(false));\n    static ref GRAPH_ACQUIRE_LOCK: Arc<Mutex<()>> = Arc::new(Mutex::new(()));\n    static ref GRAPH_REBUILD_LOCK: Arc<Mutex<()>> = Arc::new(Mutex::new(()));\n    static ref GRAPH_POOL: Arc<RwLock<HashMap<StoreFSTKey, StoreFSTBox>>> =\n        Arc::new(RwLock::new(HashMap::new()));\n    static ref GRAPH_CONSOLIDATE: Arc<RwLock<HashSet<StoreFSTKey>>> =\n        Arc::new(RwLock::new(HashSet::new()));\n}\n\nimpl StoreFSTPathMode {\n    fn extension(&self) -> &'static str {\n        match self {\n            StoreFSTPathMode::Permanent => \".fst\",\n            StoreFSTPathMode::Temporary => \".fst.tmp\",\n            StoreFSTPathMode::Backup => \".fst.bck\",\n        }\n    }\n}\n\nimpl StoreFSTPool {\n    pub fn count() -> (usize, usize) {\n        (\n            GRAPH_POOL.read().unwrap().len(),\n            GRAPH_CONSOLIDATE.read().unwrap().len(),\n        )\n    }\n\n    pub fn acquire<'a, T: Into<&'a str>>(collection: T, bucket: T) -> Result<StoreFSTBox, ()> {\n        let (collection_str, bucket_str) = (collection.into(), bucket.into());\n\n        let pool_key = StoreFSTKey::from_str(collection_str, bucket_str);\n\n        // Freeze acquire lock, and reference it in context\n        // Notice: this prevents two graphs on the same collection to be opened at the same time.\n        let _acquire = GRAPH_ACQUIRE_LOCK.lock().unwrap();\n\n        // Acquire a thread-safe store pool reference in read mode\n        let graph_pool_read = GRAPH_POOL.read().unwrap();\n\n        if let Some(store_fst) = graph_pool_read.get(&pool_key) {\n            Self::proceed_acquire_cache(\"fst\", collection_str, pool_key, store_fst)\n        } else {\n            info!(\n                \"fst store not in pool for collection: {} <{:x?}> / bucket: {} <{:x?}>, opening it\",\n                collection_str, pool_key.collection_hash, bucket_str, pool_key.bucket_hash\n            );\n\n            // Important: we need to drop the read reference first, to avoid dead-locking \\\n            //   when acquiring the RWLock in write mode in this block.\n            drop(graph_pool_read);\n\n            Self::proceed_acquire_open(\"fst\", collection_str, pool_key, &*GRAPH_POOL)\n        }\n    }\n\n    pub fn janitor() {\n        Self::proceed_janitor(\n            \"fst\",\n            &*GRAPH_POOL,\n            APP_CONF.store.fst.pool.inactive_after,\n            &*GRAPH_ACCESS_LOCK,\n        )\n    }\n\n    pub fn backup(path: &Path) -> Result<(), io::Error> {\n        debug!(\"backing up all fst stores to path: {:?}\", path);\n\n        // Create backup directory (full path)\n        fs::create_dir_all(path)?;\n\n        // Proceed dump action (backup)\n        Self::dump_action(\n            \"backup\",\n            StoreFSTPathMode::Permanent,\n            &*APP_CONF.store.fst.path,\n            path,\n            &Self::backup_item,\n        )\n    }\n\n    pub fn restore(path: &Path) -> Result<(), io::Error> {\n        debug!(\"restoring all fst stores from path: {:?}\", path);\n\n        // Proceed dump action (restore)\n        Self::dump_action(\n            \"restore\",\n            StoreFSTPathMode::Backup,\n            path,\n            &*APP_CONF.store.fst.path,\n            &Self::restore_item,\n        )\n    }\n\n    pub fn consolidate(force: bool) {\n        debug!(\"scanning for fst store pool items to consolidate\");\n\n        // Notice: we do not consolidate all items at each tick, we try to even out multiple \\\n        //   consolidation tasks over time. This lowers the overall HZ of the tasker system for \\\n        //   certain heavy tasks, which is better to spread out consolidation steps over time over \\\n        //   a large number of very active buckets.\n\n        // Acquire rebuild lock, and reference it in context\n        // Notice: this prevents two consolidate operations to be executed at the same time.\n        let _rebuild = GRAPH_REBUILD_LOCK.lock().unwrap();\n\n        // Exit trap: Register is empty? Abort there.\n        if GRAPH_CONSOLIDATE.read().unwrap().is_empty() {\n            info!(\"no fst store pool items to consolidate in register\");\n\n            return;\n        }\n\n        // Step 1: List keys to be consolidated\n        let mut keys_consolidate: Vec<StoreFSTKey> = Vec::new();\n\n        {\n            // Acquire access lock (in blocking write mode), and reference it in context\n            // Notice: this prevents store to be acquired from any context\n            let _access = GRAPH_ACCESS_LOCK.write().unwrap();\n\n            let (graph_pool_read, graph_consolidate_read) = (\n                GRAPH_POOL.read().unwrap(),\n                GRAPH_CONSOLIDATE.read().unwrap(),\n            );\n\n            for key in &*graph_consolidate_read {\n                if let Some(store) = graph_pool_read.get(key) {\n                    // Important: be lenient with system clock going back to a past duration, \\\n                    //   since we may be running in a virtualized environment where clock is not \\\n                    //   guaranteed to be monotonic. This is done to avoid poisoning associated \\\n                    //   mutexes by crashing on unwrap().\n                    let not_consolidated_for = store\n                        .last_consolidated\n                        .read()\n                        .unwrap()\n                        .elapsed()\n                        .unwrap_or_else(|err| {\n                            error!(\n                                \"fst key: {} last consolidated duration clock issue, zeroing: {}\",\n                                key, err\n                            );\n\n                            // Assuming a zero seconds fallback duration\n                            Duration::from_secs(0)\n                        })\n                        .as_secs();\n\n                    if force || not_consolidated_for >= APP_CONF.store.fst.graph.consolidate_after {\n                        info!(\n                            \"fst key: {} not consolidated for: {} seconds, may consolidate\",\n                            key, not_consolidated_for\n                        );\n\n                        keys_consolidate.push(*key);\n                    } else {\n                        debug!(\n                            \"fst key: {} not consolidated for: {} seconds, no consolidate\",\n                            key, not_consolidated_for\n                        );\n                    }\n                }\n            }\n        }\n\n        // Exit trap: Nothing to consolidate yet? Abort there.\n        if keys_consolidate.is_empty() {\n            info!(\"no fst store pool items need to consolidate at the moment\");\n\n            return;\n        }\n\n        // Step 2: Clear keys to be consolidated from register\n        {\n            // Acquire access lock (in blocking write mode), and reference it in context\n            // Notice: this prevents store to be acquired from any context\n            let _access = GRAPH_ACCESS_LOCK.write().unwrap();\n\n            let mut graph_consolidate_write = GRAPH_CONSOLIDATE.write().unwrap();\n\n            for key in &keys_consolidate {\n                graph_consolidate_write.remove(key);\n\n                debug!(\"fst key: {} cleared from consolidate register\", key);\n            }\n        }\n\n        // Step 3: Consolidate FSTs, one-by-one (sequential locking; this avoids global locks)\n        let (mut count_moved, mut count_pushed, mut count_popped) = (0, 0, 0);\n\n        {\n            for key in &keys_consolidate {\n                {\n                    // As we may be renaming the FST file, ensure no consumer out of this is \\\n                    //   trying to access the FST file as it gets processed. This also waits for \\\n                    //   current consumers to finish reading the FST, and prevents any new \\\n                    //   consumer from opening it while we are not done there.\n                    let _access = GRAPH_ACCESS_LOCK.write().unwrap();\n\n                    let do_close = if let Some(store) = GRAPH_POOL.read().unwrap().get(key) {\n                        debug!(\"fst key: {} consolidate started\", key);\n\n                        let consolidate_counts = Self::consolidate_item(store);\n\n                        count_moved += consolidate_counts.1;\n                        count_pushed += consolidate_counts.2;\n                        count_popped += consolidate_counts.3;\n\n                        debug!(\"fst key: {} consolidate complete\", key);\n\n                        // Should close this FST?\n                        consolidate_counts.0\n                    } else {\n                        false\n                    };\n\n                    // Nuke old opened FST?\n                    // Notice: last consolidated date will be bumped to a new date in the future \\\n                    //   when a push or pop operation will be done, thus effectively scheduling \\\n                    //   a consolidation in the future properly.\n                    // Notice: we remove this one early as to release write lock early\n                    if do_close {\n                        GRAPH_POOL.write().unwrap().remove(key);\n                    }\n                }\n\n                // Give a bit of time to other threads before continuing (a consolidate operation \\\n                //   must not block all other threads until it completes); this method tells the \\\n                //   thread scheduler to give a bit of priority to other threads, and get back \\\n                //   to this thread's work when other threads are done. On large setups, this \\\n                //   loop can starve other threads due to the locks used (unfortunately they \\\n                //   are all necessary).\n                thread::yield_now();\n            }\n        }\n\n        info!(\n            \"done scanning for fst store pool items to consolidate (move: {}, push: {}, pop: {})\",\n            count_moved, count_pushed, count_popped\n        );\n    }\n\n    fn dump_action(\n        action: &str,\n        path_mode: StoreFSTPathMode,\n        read_path: &Path,\n        write_path: &Path,\n        fn_item: &dyn Fn(&Path, &Path, &str, &str) -> Result<(), io::Error>,\n    ) -> Result<(), io::Error> {\n        let fst_extension = path_mode.extension();\n        let fst_extension_len = fst_extension.len();\n\n        // Iterate on FST collections\n        for collection in fs::read_dir(read_path)? {\n            let collection = collection?;\n\n            // Actual collection found?\n            if let (Ok(collection_file_type), Some(collection_name)) =\n                (collection.file_type(), collection.file_name().to_str())\n            {\n                if collection_file_type.is_dir() {\n                    debug!(\"fst collection ongoing {}: {}\", action, collection_name);\n\n                    // Create write folder for collection\n                    fs::create_dir_all(write_path.join(collection_name))?;\n\n                    // Iterate on FST collection buckets\n                    for bucket in fs::read_dir(read_path.join(collection_name))? {\n                        let bucket = bucket?;\n\n                        // Actual bucket found?\n                        if let (Ok(bucket_file_type), Some(bucket_file_name)) =\n                            (bucket.file_type(), bucket.file_name().to_str())\n                        {\n                            let bucket_file_name_len = bucket_file_name.len();\n\n                            if bucket_file_type.is_file()\n                                && bucket_file_name_len > fst_extension_len\n                                && bucket_file_name.ends_with(fst_extension)\n                            {\n                                // Acquire bucket name (from full file name)\n                                let bucket_name =\n                                    &bucket_file_name[..(bucket_file_name_len - fst_extension_len)];\n\n                                debug!(\n                                    \"fst bucket ongoing {}: {}/{}\",\n                                    action, collection_name, bucket_name\n                                );\n\n                                fn_item(write_path, &bucket.path(), collection_name, bucket_name)?;\n                            }\n                        }\n                    }\n                }\n            }\n        }\n\n        Ok(())\n    }\n\n    fn backup_item(\n        backup_path: &Path,\n        _origin_path: &Path,\n        collection_name: &str,\n        bucket_name: &str,\n    ) -> Result<(), io::Error> {\n        // Acquire access lock (in blocking write mode), and reference it in context\n        // Notice: this prevents store to be acquired from any context\n        let _access = GRAPH_ACCESS_LOCK.write().unwrap();\n\n        // Generate path to FST backup\n        let fst_backup_path = backup_path.join(collection_name).join(format!(\n            \"{}{}\",\n            bucket_name,\n            StoreFSTPathMode::Backup.extension()\n        ));\n\n        debug!(\n            \"fst bucket: {}/{} backing up to path: {:?}\",\n            collection_name, bucket_name, fst_backup_path\n        );\n\n        // Erase any previously-existing FST backup\n        fs::remove_file(&fst_backup_path).ok();\n\n        // Stream actual FST data to FST backup\n        let backup_fst_file = File::create(&fst_backup_path)?;\n        let mut backup_fst_writer = BufWriter::new(backup_fst_file);\n\n        let mut count_words = 0;\n\n        // Convert names to hashes (as names are hashes encoded as base-16 strings, but we need \\\n        //   them as proper integers)\n        if let (Ok(collection_radix), Ok(bucket_radix)) = (\n            RadixNum::from_str(collection_name, ATOM_HASH_RADIX),\n            RadixNum::from_str(bucket_name, ATOM_HASH_RADIX),\n        ) {\n            if let (Ok(collection_hash), Ok(bucket_hash)) =\n                (collection_radix.as_decimal(), bucket_radix.as_decimal())\n            {\n                let origin_fst = StoreFSTBuilder::open(\n                    collection_hash as StoreFSTAtom,\n                    bucket_hash as StoreFSTAtom,\n                )\n                .map_err(|_| io_error!(\"graph open failure\"))?;\n\n                let mut origin_fst_stream = origin_fst.stream();\n\n                while let Some(word) = origin_fst_stream.next() {\n                    count_words += 1;\n\n                    // Write word, and append a new line\n                    backup_fst_writer.write_all(word)?;\n                    backup_fst_writer.write_all(b\"\\n\")?;\n                }\n\n                info!(\n                    \"fst bucket: {}/{} backed up to path: {:?} ({} words)\",\n                    collection_name, bucket_name, fst_backup_path, count_words\n                );\n            }\n        }\n\n        Ok(())\n    }\n\n    fn restore_item(\n        _backup_path: &Path,\n        origin_path: &Path,\n        collection_name: &str,\n        bucket_name: &str,\n    ) -> Result<(), io::Error> {\n        // Acquire access lock (in blocking write mode), and reference it in context\n        // Notice: this prevents store to be acquired from any context\n        let _access = GRAPH_ACCESS_LOCK.write().unwrap();\n\n        debug!(\n            \"fst bucket: {}/{} restoring from path: {:?}\",\n            collection_name, bucket_name, origin_path\n        );\n\n        // Convert names to hashes (as names are hashes encoded as base-16 strings, but we need \\\n        //   them as proper integers)\n        if let (Ok(collection_radix), Ok(bucket_radix)) = (\n            RadixNum::from_str(collection_name, ATOM_HASH_RADIX),\n            RadixNum::from_str(bucket_name, ATOM_HASH_RADIX),\n        ) {\n            if let (Ok(collection_hash), Ok(bucket_hash)) =\n                (collection_radix.as_decimal(), bucket_radix.as_decimal())\n            {\n                // Force a FST store close\n                StoreFSTBuilder::close(\n                    collection_hash as StoreFSTAtom,\n                    bucket_hash as StoreFSTAtom,\n                );\n\n                // Generate path to FST\n                let fst_path = StoreFSTBuilder::path(\n                    StoreFSTPathMode::Permanent,\n                    collection_hash as StoreFSTAtom,\n                    Some(bucket_hash as StoreFSTAtom),\n                );\n\n                // Remove existing FST data?\n                if fst_path.exists() {\n                    fs::remove_file(&fst_path)?;\n                }\n\n                // Stream backup words to restored FST\n                let fst_writer = BufWriter::new(File::create(&fst_path)?);\n                let fst_backup_reader = BufReader::new(File::open(&origin_path)?);\n\n                let mut fst_builder = FSTSetBuilder::new(fst_writer)\n                    .map_err(|_| io_error!(\"graph restore builder failure\"))?;\n\n                for word in fst_backup_reader.lines() {\n                    let word = word?;\n\n                    fst_builder\n                        .insert(word)\n                        .map_err(|_| io_error!(\"graph restore word insert failure\"))?;\n                }\n\n                fst_builder\n                    .finish()\n                    .map_err(|_| io_error!(\"graph restore finish failure\"))?;\n\n                info!(\n                    \"fst bucket: {}/{} restored to path: {:?} from backup: {:?}\",\n                    collection_name, bucket_name, fst_path, origin_path\n                );\n            }\n        }\n\n        Ok(())\n    }\n\n    fn consolidate_item(store: &StoreFSTBox) -> (bool, usize, usize, usize) {\n        let (mut should_close, mut count_moved, mut count_pushed, mut count_popped) =\n            (false, 0, 0, 0);\n\n        // Acquire write references to pending sets\n        let (mut pending_push_write, mut pending_pop_write) = (\n            store.pending.push.write().unwrap(),\n            store.pending.pop.write().unwrap(),\n        );\n\n        // Do consolidate? (any change committed)\n        // Notice: if both pending sets are empty do not consolidate as there may have been a \\\n        //   push then a pop of this push, nulling out any committed change.\n        if pending_push_write.len() > 0 || pending_pop_write.len() > 0 {\n            // Read old FST (or default to empty FST)\n            if let Ok(old_fst) =\n                StoreFSTBuilder::open(store.target.collection_hash, store.target.bucket_hash)\n            {\n                // Initialize the new FST (temporary)\n                let bucket_tmp_path = StoreFSTBuilder::path(\n                    StoreFSTPathMode::Temporary,\n                    store.target.collection_hash,\n                    Some(store.target.bucket_hash),\n                );\n\n                let bucket_tmp_path_parent = bucket_tmp_path.parent().unwrap();\n\n                if fs::create_dir_all(&bucket_tmp_path_parent).is_ok() {\n                    // Erase any previously-existing temporary FST (eg. process stopped while \\\n                    //   writing the temporary FST); there is no guarantee this succeeds.\n                    fs::remove_file(&bucket_tmp_path).ok();\n\n                    if let Ok(tmp_fst_file) = File::create(&bucket_tmp_path) {\n                        let tmp_fst_writer = BufWriter::new(tmp_fst_file);\n\n                        // Create a builder that can be used to insert new key-value pairs.\n                        if let Ok(mut tmp_fst_builder) = FSTSetBuilder::new(tmp_fst_writer) {\n                            // Convert push keys to an ordered vector\n                            // Notice: we must go from a Vec to a VecDeque as to sort values, \\\n                            //   which is a requirement for FST insertions.\n                            let mut ordered_push_vec: Vec<&[u8]> =\n                                Vec::from_iter(pending_push_write.iter().map(|item| item.as_ref()));\n\n                            ordered_push_vec.sort();\n\n                            let mut ordered_push: VecDeque<&[u8]> =\n                                VecDeque::from_iter(ordered_push_vec);\n\n                            // Append words not in pop list to new FST (ie. old words minus pop \\\n                            //   words)\n                            let mut old_fst_stream = old_fst.stream();\n\n                            'old: while let Some(old_fst_word) = old_fst_stream.next() {\n                                // Append new words from front? (ie. push words)\n                                // Notice: as an FST is ordered, inserts would fail if they are \\\n                                //   committed out-of-order. Thus, the only way to check for \\\n                                //   order is there.\n                                // Notice: a quick check is done before engaging in the loop, to \\\n                                //   prevent any de-optimized jump instruction, as we may call \\\n                                //   this code block a lot on large FSTs, and the loop should not \\\n                                //   be engaged that often on stabilized FSTs (ie. mature FSTs).\n                                if let Some(push_first_ref) = ordered_push.front() {\n                                    // Engage the loop?\n                                    if *push_first_ref <= old_fst_word {\n                                        while let Some(push_front_ref) = ordered_push.front() {\n                                            if *push_front_ref <= old_fst_word {\n                                                // Pop front item and consume it\n                                                // Notice: as we validated previously that there \\\n                                                //   is a front value, this unwrap is safe.\n                                                let push_front = ordered_push.pop_front().unwrap();\n\n                                                if StoreFSTMisc::check_over_limits(\n                                                    tmp_fst_builder.bytes_written() as usize,\n                                                    count_pushed + count_moved,\n                                                ) {\n                                                    // FST cannot accept more items (limits reached)\n                                                    warn!(\"limit reached on new from old in fst\");\n\n                                                    // Important: stop the main loop (limit reached)\n                                                    break 'old;\n                                                }\n\n                                                if let Err(err) = tmp_fst_builder.insert(push_front)\n                                                {\n                                                    // Could not insert word in FST\n                                                    error!(\n                                                        \"failed inserting new from old in fst: {}\",\n                                                        err\n                                                    );\n                                                } else {\n                                                    // Word inserted in FST\n                                                    count_pushed += 1;\n                                                }\n\n                                                // Continue scanning next word (may also come \\\n                                                //   before this FST word in order)\n                                                continue;\n                                            }\n\n                                            // Important: stop loop on next front item (always \\\n                                            //   the same)\n                                            break;\n                                        }\n                                    }\n                                }\n\n                                // Restore old word (if not popped)\n                                if !pending_pop_write.contains(old_fst_word) {\n                                    if StoreFSTMisc::check_over_limits(\n                                        tmp_fst_builder.bytes_written() as usize,\n                                        count_pushed + count_moved,\n                                    ) {\n                                        // FST cannot accept more items (limits reached)\n                                        warn!(\"limit reached on old word in fst\");\n\n                                        // Important: stop the main loop (limit reached)\n                                        break 'old;\n                                    }\n\n                                    if let Err(err) = tmp_fst_builder.insert(old_fst_word) {\n                                        // Could not move word to FST\n                                        error!(\"failed inserting old word in fst: {}\", err);\n                                    } else {\n                                        // Word moved to FST\n                                        count_moved += 1;\n                                    }\n                                } else {\n                                    count_popped += 1;\n                                }\n                            }\n\n                            // Complete FST with last pushed items\n                            // Notice: this is necessary if the FST was empty, or if we have push \\\n                            //   items that come after the last ordered word of the FST.\n                            while let Some(push_front) = ordered_push.pop_front() {\n                                if StoreFSTMisc::check_over_limits(\n                                    tmp_fst_builder.bytes_written() as usize,\n                                    count_pushed + count_moved,\n                                ) {\n                                    // FST cannot accept more items (limits reached)\n                                    warn!(\"limit reached on new word from complete in fst\");\n\n                                    // Important: stop the main loop (limit reached)\n                                    break;\n                                }\n\n                                if let Err(err) = tmp_fst_builder.insert(push_front) {\n                                    // Could not insert word in FST\n                                    error!(\n                                        \"failed inserting new word from complete in fst: {}\",\n                                        err\n                                    );\n                                } else {\n                                    // Word inserted in FST\n                                    count_pushed += 1;\n                                }\n                            }\n\n                            // Finish building new FST\n                            if tmp_fst_builder.finish().is_ok() {\n                                // Should close open store reference to old FST\n                                should_close = true;\n\n                                // Replace old FST with new FST (this nukes the old FST)\n                                // Notice: there is no need to re-open the new FST, as it will be \\\n                                //   automatically opened on its next access.\n                                let bucket_final_path = StoreFSTBuilder::path(\n                                    StoreFSTPathMode::Permanent,\n                                    store.target.collection_hash,\n                                    Some(store.target.bucket_hash),\n                                );\n\n                                // Proceed temporary FST to final FST path rename\n                                if fs::rename(&bucket_tmp_path, &bucket_final_path).is_ok() {\n                                    info!(\"done consolidate fst at path: {:?}\", bucket_final_path);\n                                } else {\n                                    error!(\n                                        \"error consolidating fst at path: {:?}\",\n                                        bucket_final_path\n                                    );\n                                }\n                            } else {\n                                error!(\n                                    \"error finishing building temporary fst at path: {:?}\",\n                                    bucket_tmp_path\n                                );\n                            }\n                        } else {\n                            error!(\n                                \"error starting building temporary fst at path: {:?}\",\n                                bucket_tmp_path\n                            );\n                        }\n                    } else {\n                        error!(\n                            \"error initializing temporary fst at path: {:?}\",\n                            bucket_tmp_path\n                        );\n                    }\n                } else {\n                    error!(\n                        \"error initializing temporary fst directory at path: {:?}\",\n                        bucket_tmp_path_parent\n                    );\n                }\n            } else {\n                error!(\"error opening old fst\");\n            }\n\n            // Reset all pending sets\n            *pending_push_write = HashSet::new();\n            *pending_pop_write = HashSet::new();\n        }\n\n        (should_close, count_moved, count_pushed, count_popped)\n    }\n}\n\nimpl StoreGenericPool<StoreFSTKey, StoreFST, StoreFSTBuilder> for StoreFSTPool {}\n\nimpl StoreFSTBuilder {\n    fn open(collection_hash: StoreFSTAtom, bucket_hash: StoreFSTAtom) -> Result<FSTSet, FSTError> {\n        debug!(\n            \"opening finite-state transducer graph for collection: <{:x?}> and bucket: <{:x?}>\",\n            collection_hash, bucket_hash\n        );\n\n        let collection_bucket_path = Self::path(\n            StoreFSTPathMode::Permanent,\n            collection_hash,\n            Some(bucket_hash),\n        );\n\n        if collection_bucket_path.exists() {\n            // Open graph at path for collection\n            // Notice: this is unsafe, as loaded memory is a memory-mapped file, that cannot be \\\n            //   guaranteed not to be muted while we own a read handle to it. Though, we use \\\n            //   higher-level locking mechanisms on all callers of this method, so we are safe.\n            unsafe { FSTSet::from_path(collection_bucket_path) }\n        } else {\n            // FST does not exist on disk, generate an empty FST for now; until a consolidation \\\n            //   task occurs and populates the on-disk-FST.\n            let empty_iter: Vec<&str> = Vec::new();\n\n            FSTSet::from_iter(empty_iter)\n        }\n    }\n\n    fn close(collection_hash: StoreFSTAtom, bucket_hash: StoreFSTAtom) {\n        debug!(\n            \"closing finite-state transducer graph for collection: <{:x?}> and bucket: <{:x?}>\",\n            collection_hash, bucket_hash\n        );\n\n        let bucket_target = StoreFSTKey::from_atom(collection_hash, bucket_hash);\n\n        GRAPH_POOL.write().unwrap().remove(&bucket_target);\n        GRAPH_CONSOLIDATE.write().unwrap().remove(&bucket_target);\n    }\n\n    fn path(\n        mode: StoreFSTPathMode,\n        collection_hash: StoreFSTAtom,\n        bucket_hash: Option<StoreFSTAtom>,\n    ) -> PathBuf {\n        let mut final_path = APP_CONF\n            .store\n            .fst\n            .path\n            .join(format!(\"{:x?}\", collection_hash));\n\n        if let Some(bucket_hash) = bucket_hash {\n            final_path = final_path.join(format!(\"{:x?}{}\", bucket_hash, mode.extension()));\n        }\n\n        final_path\n    }\n}\n\nimpl StoreGenericBuilder<StoreFSTKey, StoreFST> for StoreFSTBuilder {\n    fn build(pool_key: StoreFSTKey) -> Result<StoreFST, ()> {\n        Self::open(pool_key.collection_hash, pool_key.bucket_hash)\n            .map(|graph| {\n                let now = SystemTime::now();\n\n                StoreFST {\n                    graph,\n                    target: pool_key,\n                    pending: StoreFSTPending::default(),\n                    last_used: Arc::new(RwLock::new(now)),\n                    last_consolidated: Arc::new(RwLock::new(now)),\n                }\n            })\n            .map_err(|err| {\n                error!(\"failed opening fst: {}\", err);\n            })\n    }\n}\n\nimpl StoreFST {\n    pub fn cardinality(&self) -> usize {\n        self.graph.len()\n    }\n\n    pub fn as_stream(&self) -> FSTStream<'_, AlwaysMatch> {\n        self.graph.into_stream()\n    }\n\n    pub fn lookup_begins(&self, word: &str) -> Result<FSTStream<'_, Regex>, ()> {\n        // Notice: this regex maps over an unicode range, for speed reasons at scale. \\\n        //   We found out that the 'match any' syntax ('.*') was super-slow. Using the restrictive \\\n        //   syntax below divided the cost of eg. a search query by 2. The regex below has been \\\n        //   found out to be nearly zero-cost to compile and execute, for whatever reason.\n        // Regex format: '{escaped_word}([{unicode_range}]*)'\n        let mut regex_str = regex_escape(word);\n\n        regex_str.push('(');\n\n        let write_result = LexerRegexRange::from(word)\n            .unwrap_or_default()\n            .write_to(&mut regex_str);\n\n        regex_str.push_str(\"*)\");\n\n        // Regex write failed? (this should not happen)\n        if let Err(err) = write_result {\n            error!(\n                \"could not lookup word in fst via 'begins': {} because regex write failed: {}\",\n                word, err\n            );\n\n            return Err(());\n        }\n\n        // Proceed word lookup\n        debug!(\n            \"looking-up word in fst via 'begins': {} with regex: {}\",\n            word, regex_str\n        );\n\n        if let Ok(regex) = Regex::new(&regex_str) {\n            Ok(self.graph.search(regex).into_stream())\n        } else {\n            Err(())\n        }\n    }\n\n    pub fn lookup_typos(\n        &self,\n        word: &str,\n        max_factor: Option<u32>,\n    ) -> Result<FSTStream<'_, Levenshtein>, ()> {\n        // Allow more typos in word as the word gets longer, up to a maximum limit\n        let mut typo_factor = match word.len() {\n            1 | 2 | 3 => 0,\n            4 | 5 | 6 => 1,\n            7 | 8 | 9 => 2,\n            _ => 3,\n        };\n\n        // Cap typo factor to set maximum?\n        if let Some(max_factor) = max_factor {\n            if typo_factor > max_factor {\n                typo_factor = max_factor;\n            }\n        }\n\n        debug!(\n            \"looking-up word in fst via 'typos': {} with typo factor: {}\",\n            word, typo_factor\n        );\n\n        if let Ok(fuzzy) = Levenshtein::new(word, typo_factor) {\n            Ok(self.graph.search(fuzzy).into_stream())\n        } else {\n            Err(())\n        }\n    }\n\n    pub fn should_consolidate(&self) {\n        // Check if not already scheduled\n        if !GRAPH_CONSOLIDATE.read().unwrap().contains(&self.target) {\n            // Schedule target for next consolidation tick (ie. collection + bucket tuple)\n            GRAPH_CONSOLIDATE.write().unwrap().insert(self.target);\n\n            // Bump 'last consolidated' time, effectively de-bouncing consolidation to a fixed \\\n            //   and predictable tick time in the future.\n            let mut last_consolidated_value = self.last_consolidated.write().unwrap();\n\n            *last_consolidated_value = SystemTime::now();\n\n            // Perform an early drop of the lock (frees up write lock early)\n            drop(last_consolidated_value);\n\n            info!(\"graph consolidation scheduled on pool key: {}\", self.target);\n        } else {\n            debug!(\n                \"graph consolidation already scheduled on pool key: {}\",\n                self.target\n            );\n        }\n    }\n}\n\nimpl StoreGeneric for StoreFST {\n    fn ref_last_used(&self) -> &RwLock<SystemTime> {\n        &self.last_used\n    }\n}\n\nimpl StoreFSTActionBuilder {\n    pub fn access(store: StoreFSTBox) -> StoreFSTAction {\n        Self::build(store)\n    }\n\n    pub fn erase<'a, T: Into<&'a str>>(collection: T, bucket: Option<T>) -> Result<u32, ()> {\n        Self::dispatch_erase(\"fst\", collection, bucket)\n    }\n\n    fn build(store: StoreFSTBox) -> StoreFSTAction {\n        StoreFSTAction { store }\n    }\n}\n\nimpl StoreGenericActionBuilder for StoreFSTActionBuilder {\n    fn proceed_erase_collection(collection_str: &str) -> Result<u32, ()> {\n        let path_mode = StoreFSTPathMode::Permanent;\n\n        let collection_atom = StoreKeyerHasher::to_compact(collection_str);\n        let collection_path = StoreFSTBuilder::path(path_mode, collection_atom, None);\n\n        // Force a FST graph close (on all contained buckets)\n        // Notice: we first need to scan for opened buckets in-memory, as not all FSTs may be \\\n        //   committed to disk; thus some FST stores that exist in-memory may not exist on-disk.\n        let mut bucket_atoms: Vec<StoreFSTAtom> = Vec::new();\n\n        {\n            let graph_pool_read = GRAPH_POOL.read().unwrap();\n\n            for target_key in graph_pool_read.keys() {\n                if target_key.collection_hash == collection_atom {\n                    bucket_atoms.push(target_key.bucket_hash);\n                }\n            }\n        }\n\n        if !bucket_atoms.is_empty() {\n            debug!(\n                \"will force-close {} fst buckets for collection: {}\",\n                bucket_atoms.len(),\n                collection_str\n            );\n\n            let (mut graph_pool_write, mut graph_consolidate_write) = (\n                GRAPH_POOL.write().unwrap(),\n                GRAPH_CONSOLIDATE.write().unwrap(),\n            );\n\n            for bucket_atom in bucket_atoms {\n                debug!(\n                    \"fst bucket graph force close for bucket: {}/<{:x?}>\",\n                    collection_str, bucket_atom\n                );\n\n                let bucket_target = StoreFSTKey::from_atom(collection_atom, bucket_atom);\n\n                graph_pool_write.remove(&bucket_target);\n                graph_consolidate_write.remove(&bucket_target);\n            }\n        }\n\n        // Remove all FSTs on-disk\n        if collection_path.exists() {\n            debug!(\n                \"fst collection store exists, erasing: {}/* at path: {:?}\",\n                collection_str, &collection_path\n            );\n\n            // Remove FST graph storage from filesystem\n            let erase_result = fs::remove_dir_all(&collection_path);\n\n            if erase_result.is_ok() {\n                debug!(\"done with fst collection erasure\");\n\n                Ok(1)\n            } else {\n                Err(())\n            }\n        } else {\n            debug!(\n                \"fst collection store does not exist, consider already erased: {}/* at path: {:?}\",\n                collection_str, &collection_path\n            );\n\n            Ok(0)\n        }\n    }\n\n    fn proceed_erase_bucket(collection_str: &str, bucket_str: &str) -> Result<u32, ()> {\n        debug!(\n            \"sub-erase on fst bucket: {} for collection: {}\",\n            bucket_str, collection_str\n        );\n\n        let (collection_atom, bucket_atom) = (\n            StoreKeyerHasher::to_compact(collection_str),\n            StoreKeyerHasher::to_compact(bucket_str),\n        );\n\n        let bucket_path = StoreFSTBuilder::path(\n            StoreFSTPathMode::Permanent,\n            collection_atom,\n            Some(bucket_atom),\n        );\n\n        // Force a FST graph close\n        StoreFSTBuilder::close(collection_atom, bucket_atom);\n\n        // Remove FST on-disk\n        if bucket_path.exists() {\n            debug!(\n                \"fst bucket graph exists, erasing: {}/{} at path: {:?}\",\n                collection_str, bucket_str, &bucket_path\n            );\n\n            // Remove FST graph storage from filesystem\n            let erase_result = fs::remove_file(&bucket_path);\n\n            if erase_result.is_ok() {\n                debug!(\"done with fst bucket erasure\");\n\n                Ok(1)\n            } else {\n                Err(())\n            }\n        } else {\n            debug!(\n                \"fst bucket graph does not exist, consider already erased: {}/{} at path: {:?}\",\n                collection_str, bucket_str, &bucket_path\n            );\n\n            Ok(0)\n        }\n    }\n}\n\nimpl StoreFSTAction {\n    pub fn push_word(&self, word: &str) -> bool {\n        // Word over limit? (abort, the FST does not perform well over large words)\n        if Self::word_over_limit(word) {\n            return false;\n        }\n\n        let word_bytes = word.as_bytes();\n\n        // Nuke word from 'pop' set? (void a previous un-consolidated commit)\n        if self.store.pending.pop.read().unwrap().contains(word_bytes) {\n            self.store.pending.pop.write().unwrap().remove(word_bytes);\n        }\n\n        // Add word in 'push' set? (only if word is not in FST)\n        // Notice: also check whether FST is over limits or not from there, to avoid stacking \\\n        //   words that could never be consolidated to final FST anyway.\n        let graph_fst = self.store.graph.as_fst();\n\n        if !self.store.graph.contains(&word)\n            && !self.store.pending.push.read().unwrap().contains(word_bytes)\n            && self.store.pending.push.read().unwrap().len() < APP_CONF.store.fst.graph.max_words\n            && !StoreFSTMisc::check_over_limits(graph_fst.size(), graph_fst.len())\n        {\n            self.store\n                .pending\n                .push\n                .write()\n                .unwrap()\n                .insert(word_bytes.to_vec());\n\n            self.store.should_consolidate();\n\n            // Pushed\n            true\n        } else {\n            // Not pushed\n            false\n        }\n    }\n\n    pub fn pop_word(&self, word: &str) -> bool {\n        // Word over limit? (abort, the FST does not perform well over large words)\n        if Self::word_over_limit(word) {\n            return false;\n        }\n\n        let word_bytes = word.as_bytes();\n\n        // Nuke word from 'push' set? (void a previous un-consolidated commit)\n        if self.store.pending.push.read().unwrap().contains(word_bytes) {\n            self.store.pending.push.write().unwrap().remove(word_bytes);\n        }\n\n        // Add word in 'pop' set? (only if word is in FST)\n        if self.store.graph.contains(word_bytes)\n            && !self.store.pending.pop.read().unwrap().contains(word_bytes)\n        {\n            self.store\n                .pending\n                .pop\n                .write()\n                .unwrap()\n                .insert(word_bytes.to_vec());\n\n            self.store.should_consolidate();\n\n            // Popped\n            true\n        } else {\n            // Not popped\n            false\n        }\n    }\n\n    pub fn suggest_words(\n        &self,\n        from_word: &str,\n        limit: usize,\n        max_typo_factor: Option<u32>,\n    ) -> Option<Vec<String>> {\n        // Word over limit? (abort, the FST does not perform well over large words)\n        if Self::word_over_limit(from_word) {\n            return None;\n        }\n\n        let mut found_words = Vec::with_capacity(limit);\n\n        // Try to complete provided word\n        if let Ok(stream) = self.store.lookup_begins(from_word) {\n            debug!(\"looking up for word: {} in 'begins' fst stream\", from_word);\n\n            Self::find_words_stream(stream, &mut found_words, limit);\n        }\n\n        // Try to fuzzy-suggest other words? (eg. correct typos)\n        if found_words.len() < limit {\n            if let Ok(stream) = self.store.lookup_typos(from_word, max_typo_factor) {\n                debug!(\"looking up for word: {} in 'typos' fst stream\", from_word);\n\n                Self::find_words_stream(stream, &mut found_words, limit);\n            }\n        }\n\n        if !found_words.is_empty() {\n            Some(found_words)\n        } else {\n            None\n        }\n    }\n\n    pub fn list_words(&self, limit: usize, offset: usize) -> Result<Vec<String>, ()> {\n        let stream = self.store.as_stream();\n\n        // Enumerate words from FST stream\n        match stream\n            .into_strs()\n            .map(|words| words.into_iter().skip(offset).take(limit).collect())\n        {\n            Err(err) => {\n                debug!(\"conversion of stream failed: {}\", err.to_string());\n                Err(())\n            }\n            Ok(words) => Ok(words),\n        }\n    }\n\n    pub fn count_words(&self) -> usize {\n        self.store.cardinality()\n    }\n\n    fn word_over_limit(word: &str) -> bool {\n        if word.len() > WORD_LIMIT_LENGTH {\n            debug!(\"got over-limit fst word: {}\", word);\n\n            true\n        } else {\n            false\n        }\n    }\n\n    fn find_words_stream<A: Automaton>(\n        mut stream: FSTStream<A>,\n        found_words: &mut Vec<String>,\n        limit: usize,\n    ) {\n        while let Some(word) = stream.next() {\n            if let Ok(word_str) = str::from_utf8(word) {\n                let word_string = word_str.to_string();\n\n                if !found_words.contains(&word_string) {\n                    found_words.push(word_string);\n\n                    // Requested limit reached? Stop there.\n                    if found_words.len() >= limit {\n                        break;\n                    }\n                }\n            }\n        }\n    }\n}\n\nimpl StoreFSTMisc {\n    pub fn count_collection_buckets<'a, T: Into<&'a str>>(collection: T) -> Result<usize, ()> {\n        let mut count = 0;\n\n        let path_mode = StoreFSTPathMode::Permanent;\n\n        let collection_atom = StoreKeyerHasher::to_compact(collection.into());\n        let collection_path = StoreFSTBuilder::path(path_mode, collection_atom, None);\n\n        if collection_path.exists() {\n            // Scan collection directory for contained buckets (count them)\n            if let Ok(entries) = fs::read_dir(&collection_path) {\n                let fst_extension = path_mode.extension();\n                let fst_extension_len = fst_extension.len();\n\n                for entry in entries.flatten() {\n                    if let Some(entry_name) = entry.file_name().to_str() {\n                        let entry_name_len = entry_name.len();\n\n                        // FST file found? This is a bucket.\n                        if entry_name_len > fst_extension_len && entry_name.ends_with(fst_extension)\n                        {\n                            count += 1;\n                        }\n                    }\n                }\n            } else {\n                error!(\"failed reading directory for count: {:?}\", collection_path);\n\n                return Err(());\n            }\n        }\n\n        Ok(count)\n    }\n\n    fn check_over_limits(bytes_count: usize, words_count: usize) -> bool {\n        // Over bytes limit?\n        let max_size = APP_CONF.store.fst.graph.max_size * 1024;\n\n        if bytes_count >= max_size {\n            info!(\n                \"fst has exceeded maximum allowed bytes: {} over limit: {}\",\n                bytes_count, max_size\n            );\n\n            return true;\n        }\n\n        // Over words limit?\n        if words_count >= APP_CONF.store.fst.graph.max_words {\n            info!(\n                \"fst has exceeded maximum allowed words: {} over limit: {}\",\n                words_count, APP_CONF.store.fst.graph.max_words\n            );\n\n            return true;\n        }\n\n        // Not over limit\n        false\n    }\n}\n\nimpl StoreFSTKey {\n    pub fn from_atom(collection_hash: StoreFSTAtom, bucket_hash: StoreFSTAtom) -> StoreFSTKey {\n        StoreFSTKey {\n            collection_hash,\n            bucket_hash,\n        }\n    }\n\n    pub fn from_str(collection_str: &str, bucket_str: &str) -> StoreFSTKey {\n        StoreFSTKey {\n            collection_hash: StoreKeyerHasher::to_compact(collection_str),\n            bucket_hash: StoreKeyerHasher::to_compact(bucket_str),\n        }\n    }\n}\n\nimpl fmt::Display for StoreFSTKey {\n    fn fmt(&self, f: &mut fmt::Formatter) -> fmt::Result {\n        write!(f, \"<{:x?}>/<{:x?}>\", self.collection_hash, self.bucket_hash)\n    }\n}\n\n#[cfg(test)]\nmod tests {\n    use super::*;\n\n    #[test]\n    fn it_acquires_graph() {\n        assert!(StoreFSTPool::acquire(\"c:test:1\", \"b:test:1\").is_ok());\n    }\n\n    #[test]\n    fn it_janitors_graph() {\n        StoreFSTPool::janitor();\n    }\n\n    #[test]\n    fn it_proceeds_primitives() {\n        let store = StoreFSTPool::acquire(\"c:test:2\", \"b:test:2\").unwrap();\n\n        assert!(store.lookup_typos(\"valerien\", None).is_ok());\n    }\n}\n"
  },
  {
    "path": "src/store/generic.rs",
    "content": "// Sonic\n//\n// Fast, lightweight and schema-less search backend\n// Copyright: 2019, Valerian Saliou <valerian@valeriansaliou.name>\n// License: Mozilla Public License v2.0 (MPL v2.0)\n\nuse core::cmp::Eq;\nuse core::hash::Hash;\nuse hashbrown::HashMap;\nuse std::fmt::Display;\nuse std::sync::{Arc, RwLock};\nuse std::time::{Duration, SystemTime};\n\npub trait StoreGeneric {\n    fn ref_last_used(&self) -> &RwLock<SystemTime>;\n}\n\npub trait StoreGenericPool<\n    K: Hash + Eq + Copy + Display,\n    S: StoreGeneric,\n    B: StoreGenericBuilder<K, S>,\n>\n{\n    fn proceed_acquire_cache(\n        kind: &str,\n        collection_str: &str,\n        pool_key: K,\n        store: &Arc<S>,\n    ) -> Result<Arc<S>, ()> {\n        debug!(\n            \"{} store acquired from pool for collection: {} (pool key: {})\",\n            kind, collection_str, pool_key\n        );\n\n        // Bump store last used date (avoids early janitor eviction)\n        let mut last_used_value = store.ref_last_used().write().unwrap();\n\n        *last_used_value = SystemTime::now();\n\n        // Perform an early drop of the lock (frees up write lock early)\n        drop(last_used_value);\n\n        Ok(store.clone())\n    }\n\n    fn proceed_acquire_open(\n        kind: &str,\n        collection_str: &str,\n        pool_key: K,\n        pool: &Arc<RwLock<HashMap<K, Arc<S>>>>,\n    ) -> Result<Arc<S>, ()> {\n        match B::build(pool_key) {\n            Ok(store) => {\n                // Acquire a thread-safe store pool reference in write mode\n                let mut store_pool_write = pool.write().unwrap();\n                let store_box = Arc::new(store);\n\n                store_pool_write.insert(pool_key, store_box.clone());\n\n                debug!(\n                    \"opened and cached {} store in pool for collection: {} (pool key: {})\",\n                    kind, collection_str, pool_key\n                );\n\n                Ok(store_box)\n            }\n            Err(_) => {\n                error!(\n                    \"failed opening {} store for collection: {} (pool key: {})\",\n                    kind, collection_str, pool_key\n                );\n\n                Err(())\n            }\n        }\n    }\n\n    fn proceed_janitor(\n        kind: &str,\n        pool: &Arc<RwLock<HashMap<K, Arc<S>>>>,\n        inactive_after: u64,\n        access_lock: &Arc<RwLock<bool>>,\n    ) {\n        debug!(\"scanning for {} store pool items to janitor\", kind);\n\n        // Acquire access lock (in blocking write mode), and reference it in context\n        // Notice: this prevents store to be acquired from any context\n        let _access = access_lock.write().unwrap();\n\n        let mut removal_register: Vec<K> = Vec::new();\n\n        for (collection_bucket, store) in pool.read().unwrap().iter() {\n            // Important: be lenient with system clock going back to a past duration, since \\\n            //   we may be running in a virtualized environment where clock is not guaranteed \\\n            //   to be monotonic. This is done to avoid poisoning associated mutexes by \\\n            //   crashing on unwrap().\n            let last_used_elapsed = store\n                .ref_last_used()\n                .read()\n                .unwrap()\n                .elapsed()\n                .unwrap_or_else(|err| {\n                    error!(\n                        \"store pool item: {} last used duration clock issue, zeroing: {}\",\n                        collection_bucket, err\n                    );\n\n                    // Assuming a zero seconds fallback duration\n                    Duration::from_secs(0)\n                })\n                .as_secs();\n\n            if last_used_elapsed >= inactive_after {\n                debug!(\n                    \"found expired {} store pool item: {}; elapsed time: {}s\",\n                    kind, collection_bucket, last_used_elapsed\n                );\n\n                // Notice: the bucket value needs to be cloned, as we cannot reference as value \\\n                //   that will outlive referenced value once we remove it from its owner set.\n                removal_register.push(*collection_bucket);\n            } else {\n                debug!(\n                    \"found non-expired {} store pool item: {}; elapsed time: {}s\",\n                    kind, collection_bucket, last_used_elapsed\n                );\n            }\n        }\n\n        if !removal_register.is_empty() {\n            let mut store_pool_write = pool.write().unwrap();\n\n            for collection_bucket in &removal_register {\n                store_pool_write.remove(collection_bucket);\n            }\n        }\n\n        info!(\n            \"done scanning for {} store pool items to janitor, expired {} items, now has {} items\",\n            kind,\n            removal_register.len(),\n            pool.read().unwrap().len()\n        );\n    }\n}\n\npub trait StoreGenericBuilder<K, S> {\n    fn build(pool_key: K) -> Result<S, ()>;\n}\n\npub trait StoreGenericActionBuilder {\n    fn proceed_erase_collection(collection_str: &str) -> Result<u32, ()>;\n\n    fn proceed_erase_bucket(collection_str: &str, bucket_str: &str) -> Result<u32, ()>;\n\n    fn dispatch_erase<'a, T: Into<&'a str>>(\n        kind: &str,\n        collection: T,\n        bucket: Option<T>,\n    ) -> Result<u32, ()> {\n        let collection_str = collection.into();\n\n        info!(\"{} erase requested on collection: {}\", kind, collection_str);\n\n        if let Some(bucket) = bucket {\n            Self::proceed_erase_bucket(collection_str, bucket.into())\n        } else {\n            Self::proceed_erase_collection(collection_str)\n        }\n    }\n}\n"
  },
  {
    "path": "src/store/identifiers.rs",
    "content": "// Sonic\n//\n// Fast, lightweight and schema-less search backend\n// Copyright: 2019, Valerian Saliou <valerian@valeriansaliou.name>\n// License: Mozilla Public License v2.0 (MPL v2.0)\n\nuse std::hash::Hasher;\nuse twox_hash::XxHash32;\n\npub type StoreObjectIID = u32;\npub type StoreObjectOID<'a> = &'a str;\npub type StoreTermHashed = u32;\n\npub struct StoreTermHash;\n\npub enum StoreMetaKey {\n    IIDIncr,\n}\n\npub enum StoreMetaValue {\n    IIDIncr(StoreObjectIID),\n}\n\nimpl StoreMetaKey {\n    pub fn as_u32(&self) -> u32 {\n        match self {\n            StoreMetaKey::IIDIncr => 0,\n        }\n    }\n}\n\nimpl StoreTermHash {\n    pub fn from(term: &str) -> StoreTermHashed {\n        let mut hasher = XxHash32::with_seed(0);\n\n        hasher.write(term.as_bytes());\n\n        hasher.finish() as u32\n    }\n}\n\n#[cfg(test)]\nmod tests {\n    use super::*;\n\n    #[test]\n    fn it_converts_meta_key_to_u32() {\n        assert_eq!(StoreMetaKey::IIDIncr.as_u32(), 0);\n    }\n\n    #[test]\n    fn it_hashes_term() {\n        assert_eq!(StoreTermHash::from(\"hash:1\"), 3637660813);\n        assert_eq!(StoreTermHash::from(\"hash:2\"), 3577985381);\n    }\n}\n"
  },
  {
    "path": "src/store/item.rs",
    "content": "// Sonic\n//\n// Fast, lightweight and schema-less search backend\n// Copyright: 2019, Valerian Saliou <valerian@valeriansaliou.name>\n// License: Mozilla Public License v2.0 (MPL v2.0)\n\npub struct StoreItemBuilder;\n\n#[derive(PartialEq, Debug)]\npub struct StoreItem<'a>(\n    pub StoreItemPart<'a>,\n    pub Option<StoreItemPart<'a>>,\n    pub Option<StoreItemPart<'a>>,\n);\n\n#[derive(Copy, Clone, PartialEq, Debug)]\npub struct StoreItemPart<'a>(&'a str);\n\n// TODO: Change variant names\n#[allow(clippy::enum_variant_names)]\n#[derive(PartialEq, Debug)]\npub enum StoreItemError {\n    InvalidCollection,\n    InvalidBucket,\n    InvalidObject,\n}\n\nconst STORE_ITEM_PART_LEN_MIN: usize = 0;\nconst STORE_ITEM_PART_LEN_MAX: usize = 128;\n\nimpl<'a> StoreItemPart<'a> {\n    pub fn from_str(part: &'a str) -> Result<Self, ()> {\n        let len = part.len();\n\n        if len > STORE_ITEM_PART_LEN_MIN\n            && len <= STORE_ITEM_PART_LEN_MAX\n            && part.chars().all(|character| character.is_ascii())\n        {\n            Ok(StoreItemPart(part))\n        } else {\n            Err(())\n        }\n    }\n\n    pub fn as_str(&self) -> &'a str {\n        self.0\n    }\n}\n\nimpl<'a> From<StoreItemPart<'a>> for &'a str {\n    fn from(part: StoreItemPart<'a>) -> Self {\n        part.as_str()\n    }\n}\n\nimpl StoreItemBuilder {\n    pub fn from_depth_1(collection: &str) -> Result<StoreItem<'_>, StoreItemError> {\n        // Validate & box collection\n        if let Ok(collection_item) = StoreItemPart::from_str(collection) {\n            Ok(StoreItem(collection_item, None, None))\n        } else {\n            Err(StoreItemError::InvalidCollection)\n        }\n    }\n\n    pub fn from_depth_2<'a>(\n        collection: &'a str,\n        bucket: &'a str,\n    ) -> Result<StoreItem<'a>, StoreItemError> {\n        // Validate & box collection + bucket\n        match (\n            StoreItemPart::from_str(collection),\n            StoreItemPart::from_str(bucket),\n        ) {\n            (Ok(collection_item), Ok(bucket_item)) => {\n                Ok(StoreItem(collection_item, Some(bucket_item), None))\n            }\n            (Err(_), _) => Err(StoreItemError::InvalidCollection),\n            (_, Err(_)) => Err(StoreItemError::InvalidBucket),\n        }\n    }\n\n    pub fn from_depth_3<'a>(\n        collection: &'a str,\n        bucket: &'a str,\n        object: &'a str,\n    ) -> Result<StoreItem<'a>, StoreItemError> {\n        // Validate & box collection + bucket + object\n        match (\n            StoreItemPart::from_str(collection),\n            StoreItemPart::from_str(bucket),\n            StoreItemPart::from_str(object),\n        ) {\n            (Ok(collection_item), Ok(bucket_item), Ok(object_item)) => Ok(StoreItem(\n                collection_item,\n                Some(bucket_item),\n                Some(object_item),\n            )),\n            (Err(_), _, _) => Err(StoreItemError::InvalidCollection),\n            (_, Err(_), _) => Err(StoreItemError::InvalidBucket),\n            (_, _, Err(_)) => Err(StoreItemError::InvalidObject),\n        }\n    }\n}\n\n#[cfg(test)]\nmod tests {\n    use super::*;\n\n    #[test]\n    fn it_builds_store_item_depth_1() {\n        assert_eq!(\n            StoreItemBuilder::from_depth_1(\"c:test:1\"),\n            Ok(StoreItem(StoreItemPart(\"c:test:1\"), None, None))\n        );\n        assert_eq!(\n            StoreItemBuilder::from_depth_1(\"\"),\n            Err(StoreItemError::InvalidCollection)\n        );\n    }\n\n    #[test]\n    fn it_builds_store_item_depth_2() {\n        assert_eq!(\n            StoreItemBuilder::from_depth_2(\"c:test:2\", \"b:test:2\"),\n            Ok(StoreItem(\n                StoreItemPart(\"c:test:2\"),\n                Some(StoreItemPart(\"b:test:2\")),\n                None\n            ))\n        );\n        assert_eq!(\n            StoreItemBuilder::from_depth_2(\"\", \"b:test:2\"),\n            Err(StoreItemError::InvalidCollection)\n        );\n        assert_eq!(\n            StoreItemBuilder::from_depth_2(\"c:test:2\", \"\"),\n            Err(StoreItemError::InvalidBucket)\n        );\n    }\n\n    #[test]\n    fn it_builds_store_item_depth_3() {\n        assert_eq!(\n            StoreItemBuilder::from_depth_3(\"c:test:3\", \"b:test:3\", \"o:test:3\"),\n            Ok(StoreItem(\n                StoreItemPart(\"c:test:3\"),\n                Some(StoreItemPart(\"b:test:3\")),\n                Some(StoreItemPart(\"o:test:3\"))\n            ))\n        );\n        assert_eq!(\n            StoreItemBuilder::from_depth_3(\"\", \"b:test:3\", \"o:test:3\"),\n            Err(StoreItemError::InvalidCollection)\n        );\n        assert_eq!(\n            StoreItemBuilder::from_depth_3(\"c:test:3\", \"\", \"o:test:3\"),\n            Err(StoreItemError::InvalidBucket)\n        );\n        assert_eq!(\n            StoreItemBuilder::from_depth_3(\"c:test:3\", \"b:test:3\", \"\"),\n            Err(StoreItemError::InvalidObject)\n        );\n    }\n}\n"
  },
  {
    "path": "src/store/keyer.rs",
    "content": "// Sonic\n//\n// Fast, lightweight and schema-less search backend\n// Copyright: 2019, Valerian Saliou <valerian@valeriansaliou.name>\n// License: Mozilla Public License v2.0 (MPL v2.0)\n\nuse byteorder::{ByteOrder, LittleEndian, ReadBytesExt};\nuse std::fmt;\nuse std::hash::Hasher;\nuse std::io::Cursor;\nuse twox_hash::XxHash32;\n\nuse super::identifiers::*;\n\npub struct StoreKeyerBuilder;\n\npub struct StoreKeyer {\n    key: StoreKeyerKey,\n}\n\npub struct StoreKeyerHasher;\n\nenum StoreKeyerIdx<'a> {\n    MetaToValue(&'a StoreMetaKey),\n    TermToIIDs(StoreTermHashed),\n    OIDToIID(StoreObjectOID<'a>),\n    IIDToOID(StoreObjectIID),\n    IIDToTerms(StoreObjectIID),\n}\n\npub type StoreKeyerKey = [u8; 9];\npub type StoreKeyerPrefix = [u8; 5];\n\nimpl<'a> StoreKeyerIdx<'a> {\n    pub fn to_index(&self) -> u8 {\n        match self {\n            StoreKeyerIdx::MetaToValue(_) => 0,\n            StoreKeyerIdx::TermToIIDs(_) => 1,\n            StoreKeyerIdx::OIDToIID(_) => 2,\n            StoreKeyerIdx::IIDToOID(_) => 3,\n            StoreKeyerIdx::IIDToTerms(_) => 4,\n        }\n    }\n}\n\nimpl StoreKeyerBuilder {\n    pub fn meta_to_value<'a>(bucket: &'a str, meta: &'a StoreMetaKey) -> StoreKeyer {\n        Self::make(StoreKeyerIdx::MetaToValue(meta), bucket)\n    }\n\n    pub fn term_to_iids(bucket: &str, term_hash: StoreTermHashed) -> StoreKeyer {\n        Self::make(StoreKeyerIdx::TermToIIDs(term_hash), bucket)\n    }\n\n    pub fn oid_to_iid<'a>(bucket: &'a str, oid: StoreObjectOID<'a>) -> StoreKeyer {\n        Self::make(StoreKeyerIdx::OIDToIID(oid), bucket)\n    }\n\n    pub fn iid_to_oid(bucket: &str, iid: StoreObjectIID) -> StoreKeyer {\n        Self::make(StoreKeyerIdx::IIDToOID(iid), bucket)\n    }\n\n    pub fn iid_to_terms(bucket: &str, iid: StoreObjectIID) -> StoreKeyer {\n        Self::make(StoreKeyerIdx::IIDToTerms(iid), bucket)\n    }\n\n    fn make<'a>(idx: StoreKeyerIdx<'a>, bucket: &'a str) -> StoreKeyer {\n        StoreKeyer {\n            key: Self::build_key(idx, bucket),\n        }\n    }\n\n    fn build_key<'a>(idx: StoreKeyerIdx<'a>, bucket: &'a str) -> StoreKeyerKey {\n        // Key format: [idx<1B> | bucket<4B> | route<4B>]\n\n        // Encode key bucket + key route from u32 to array of u8 (ie. binary)\n        let (mut bucket_encoded, mut route_encoded) = ([0; 4], [0; 4]);\n\n        LittleEndian::write_u32(&mut bucket_encoded, StoreKeyerHasher::to_compact(bucket));\n        LittleEndian::write_u32(&mut route_encoded, Self::route_to_compact(&idx));\n\n        // Generate final binary key\n        [\n            // [idx<1B>]\n            idx.to_index(),\n            // [bucket<4B>]\n            bucket_encoded[0],\n            bucket_encoded[1],\n            bucket_encoded[2],\n            bucket_encoded[3],\n            // [route<4B>]\n            route_encoded[0],\n            route_encoded[1],\n            route_encoded[2],\n            route_encoded[3],\n        ]\n    }\n\n    fn route_to_compact(idx: &StoreKeyerIdx) -> u32 {\n        match idx {\n            StoreKeyerIdx::MetaToValue(route) => route.as_u32(),\n            StoreKeyerIdx::TermToIIDs(route) => *route,\n            StoreKeyerIdx::OIDToIID(route) => StoreKeyerHasher::to_compact(route),\n            StoreKeyerIdx::IIDToOID(route) => *route,\n            StoreKeyerIdx::IIDToTerms(route) => *route,\n        }\n    }\n}\n\nimpl StoreKeyer {\n    pub fn as_bytes(&self) -> StoreKeyerKey {\n        self.key\n    }\n\n    pub fn as_prefix(&self) -> StoreKeyerPrefix {\n        // Prefix format: [idx<1B> | bucket<4B>]\n\n        [\n            self.key[0],\n            self.key[1],\n            self.key[2],\n            self.key[3],\n            self.key[4],\n        ]\n    }\n}\n\nimpl StoreKeyerHasher {\n    #![allow(clippy::wrong_self_convention)]\n    pub fn to_compact(part: &str) -> u32 {\n        let mut hasher = XxHash32::with_seed(0);\n\n        hasher.write(part.as_bytes());\n        hasher.finish() as u32\n    }\n}\n\nimpl fmt::Display for StoreKeyer {\n    fn fmt(&self, f: &mut fmt::Formatter) -> fmt::Result {\n        // Convert to number\n        let (key_bucket, key_route) = (\n            Cursor::new(&self.key[1..5])\n                .read_u32::<LittleEndian>()\n                .unwrap_or(0),\n            Cursor::new(&self.key[5..9])\n                .read_u32::<LittleEndian>()\n                .unwrap_or(0),\n        );\n\n        write!(\n            f,\n            \"'{}:{:x?}:{:x?}' {:?}\",\n            self.key[0], key_bucket, key_route, self.key\n        )\n    }\n}\n\n#[cfg(test)]\nmod tests {\n    use super::*;\n\n    #[test]\n    fn it_keys_meta_to_value() {\n        assert_eq!(\n            StoreKeyerBuilder::meta_to_value(\"bucket:1\", &StoreMetaKey::IIDIncr).as_bytes(),\n            [0, 108, 244, 29, 93, 0, 0, 0, 0]\n        );\n    }\n\n    #[test]\n    fn it_keys_term_to_iids() {\n        assert_eq!(\n            StoreKeyerBuilder::term_to_iids(\"bucket:2\", 772137347).as_bytes(),\n            [1, 50, 220, 166, 65, 131, 225, 5, 46]\n        );\n        assert_eq!(\n            StoreKeyerBuilder::term_to_iids(\"bucket:2\", 3582484684).as_bytes(),\n            [1, 50, 220, 166, 65, 204, 96, 136, 213]\n        );\n    }\n\n    #[test]\n    fn it_keys_oid_to_iid() {\n        assert_eq!(\n            StoreKeyerBuilder::oid_to_iid(\"bucket:3\", &\"conversation:6501e83a\".to_string())\n                .as_bytes(),\n            [2, 171, 194, 213, 57, 31, 156, 118, 213]\n        );\n    }\n\n    #[test]\n    fn it_keys_iid_to_oid() {\n        assert_eq!(\n            StoreKeyerBuilder::iid_to_oid(\"bucket:4\", 10292198).as_bytes(),\n            [3, 105, 12, 54, 147, 230, 11, 157, 0]\n        );\n    }\n\n    #[test]\n    fn it_keys_iid_to_terms() {\n        assert_eq!(\n            StoreKeyerBuilder::iid_to_terms(\"bucket:5\", 1).as_bytes(),\n            [4, 137, 142, 73, 67, 1, 0, 0, 0]\n        );\n        assert_eq!(\n            StoreKeyerBuilder::iid_to_terms(\"bucket:5\", 20).as_bytes(),\n            [4, 137, 142, 73, 67, 20, 0, 0, 0]\n        );\n    }\n\n    #[test]\n    fn it_hashes_compact() {\n        assert_eq!(StoreKeyerHasher::to_compact(\"key:1\"), 3370353088);\n        assert_eq!(StoreKeyerHasher::to_compact(\"key:2\"), 1042559698);\n    }\n\n    #[test]\n    fn it_formats_key() {\n        assert_eq!(\n            &format!(\"{}\", StoreKeyerBuilder::term_to_iids(\"bucket:6\", 72137347)),\n            \"'1:71198b49:44cba83' [1, 73, 139, 25, 113, 131, 186, 76, 4]\"\n        );\n        assert_eq!(\n            &format!(\n                \"{}\",\n                StoreKeyerBuilder::meta_to_value(\"bucket:6\", &StoreMetaKey::IIDIncr)\n            ),\n            \"'0:71198b49:0' [0, 73, 139, 25, 113, 0, 0, 0, 0]\"\n        );\n    }\n}\n\n#[cfg(all(feature = \"benchmark\", test))]\nmod benches {\n    extern crate test;\n\n    use super::*;\n    use test::Bencher;\n\n    #[bench]\n    fn bench_hash_compact_short(b: &mut Bencher) {\n        b.iter(|| StoreKeyerHasher::to_compact(\"key:bench:1\"));\n    }\n\n    #[bench]\n    fn bench_hash_compact_long(b: &mut Bencher) {\n        b.iter(|| {\n            StoreKeyerHasher::to_compact(\n                \"key:bench:2:long:long:long:long:long:long:long:long:long:long:long:long:long:long\",\n            )\n        });\n    }\n\n    #[bench]\n    fn bench_key_meta_to_value(b: &mut Bencher) {\n        b.iter(|| StoreKeyerBuilder::meta_to_value(\"bucket:bench:1\", &StoreMetaKey::IIDIncr));\n    }\n\n    #[bench]\n    fn bench_key_term_to_iids(b: &mut Bencher) {\n        b.iter(|| StoreKeyerBuilder::term_to_iids(\"bucket:bench:2\", 772137347));\n    }\n\n    #[bench]\n    fn bench_key_oid_to_iid(b: &mut Bencher) {\n        let key = \"conversation:6501e83a\".to_string();\n\n        b.iter(|| StoreKeyerBuilder::oid_to_iid(\"bucket:bench:3\", &key));\n    }\n\n    #[bench]\n    fn bench_key_iid_to_oid(b: &mut Bencher) {\n        b.iter(|| StoreKeyerBuilder::iid_to_oid(\"bucket:bench:4\", 10292198));\n    }\n\n    #[bench]\n    fn bench_key_iid_to_terms(b: &mut Bencher) {\n        b.iter(|| StoreKeyerBuilder::iid_to_terms(\"bucket:bench:5\", 1));\n    }\n}\n"
  },
  {
    "path": "src/store/kv.rs",
    "content": "// Sonic\n//\n// Fast, lightweight and schema-less search backend\n// Copyright: 2019, Valerian Saliou <valerian@valeriansaliou.name>\n// License: Mozilla Public License v2.0 (MPL v2.0)\n\nuse byteorder::{ByteOrder, LittleEndian, ReadBytesExt};\nuse hashbrown::HashMap;\nuse radix::RadixNum;\nuse rocksdb::backup::{\n    BackupEngine as DBBackupEngine, BackupEngineOptions as DBBackupEngineOptions,\n    RestoreOptions as DBRestoreOptions,\n};\nuse rocksdb::{\n    DBCompactionStyle, DBCompressionType, Env as DBEnv, Error as DBError, FlushOptions,\n    Options as DBOptions, WriteBatch, WriteOptions, DB,\n};\nuse std::fmt;\nuse std::fs;\nuse std::io::{self, Cursor};\nuse std::path::{Path, PathBuf};\nuse std::str;\nuse std::sync::{Arc, Mutex, RwLock};\nuse std::thread;\nuse std::time::{Duration, SystemTime};\nuse std::vec::Drain;\n\nuse super::generic::{\n    StoreGeneric, StoreGenericActionBuilder, StoreGenericBuilder, StoreGenericPool,\n};\nuse super::identifiers::*;\nuse super::item::StoreItemPart;\nuse super::keyer::{StoreKeyerBuilder, StoreKeyerHasher, StoreKeyerKey, StoreKeyerPrefix};\nuse crate::APP_CONF;\n\npub struct StoreKVPool;\npub struct StoreKVBuilder;\n\npub struct StoreKV {\n    database: DB,\n    last_used: Arc<RwLock<SystemTime>>,\n    last_flushed: Arc<RwLock<SystemTime>>,\n    pub lock: RwLock<bool>,\n}\n\npub struct StoreKVActionBuilder;\n\npub struct StoreKVAction<'a> {\n    store: Option<StoreKVBox>,\n    bucket: StoreItemPart<'a>,\n}\n\n#[derive(PartialEq, Eq, Hash, Clone, Copy)]\npub struct StoreKVKey {\n    collection_hash: StoreKVAtom,\n}\n\n#[derive(PartialEq)]\npub enum StoreKVAcquireMode {\n    Any,\n    OpenOnly,\n}\n\ntype StoreKVAtom = u32;\ntype StoreKVBox = Arc<StoreKV>;\n\nconst ATOM_HASH_RADIX: usize = 16;\n\nlazy_static! {\n    pub static ref STORE_ACCESS_LOCK: Arc<RwLock<bool>> = Arc::new(RwLock::new(false));\n    static ref STORE_ACQUIRE_LOCK: Arc<Mutex<()>> = Arc::new(Mutex::new(()));\n    static ref STORE_FLUSH_LOCK: Arc<Mutex<()>> = Arc::new(Mutex::new(()));\n    static ref STORE_POOL: Arc<RwLock<HashMap<StoreKVKey, StoreKVBox>>> =\n        Arc::new(RwLock::new(HashMap::new()));\n}\n\nimpl StoreKVPool {\n    pub fn count() -> usize {\n        STORE_POOL.read().unwrap().len()\n    }\n\n    pub fn acquire<'a, T: Into<&'a str>>(\n        mode: StoreKVAcquireMode,\n        collection: T,\n    ) -> Result<Option<StoreKVBox>, ()> {\n        let collection_str = collection.into();\n        let pool_key = StoreKVKey::from_str(collection_str);\n\n        // Freeze acquire lock, and reference it in context\n        // Notice: this prevents two databases on the same collection to be opened at the same time.\n        let _acquire = STORE_ACQUIRE_LOCK.lock().unwrap();\n\n        // Acquire a thread-safe store pool reference in read mode\n        let store_pool_read = STORE_POOL.read().unwrap();\n\n        if let Some(store_kv) = store_pool_read.get(&pool_key) {\n            Self::proceed_acquire_cache(\"kv\", collection_str, pool_key, store_kv).map(Some)\n        } else {\n            info!(\n                \"kv store not in pool for collection: {} {}, opening it\",\n                collection_str, pool_key\n            );\n\n            // Important: we need to drop the read reference first, to avoid \\\n            //   dead-locking when acquiring the RWLock in write mode in this block.\n            drop(store_pool_read);\n\n            // Check if can open database?\n            let can_open_db = if mode == StoreKVAcquireMode::OpenOnly {\n                StoreKVBuilder::path(pool_key.collection_hash).exists()\n            } else {\n                true\n            };\n\n            // Open KV database? (ie. we do not need to create a new KV database file tree if \\\n            //   the database does not exist yet on disk and we are just looking to read data from \\\n            //   it)\n            if can_open_db {\n                Self::proceed_acquire_open(\"kv\", collection_str, pool_key, &*STORE_POOL).map(Some)\n            } else {\n                Ok(None)\n            }\n        }\n    }\n\n    pub fn janitor() {\n        Self::proceed_janitor(\n            \"kv\",\n            &*STORE_POOL,\n            APP_CONF.store.kv.pool.inactive_after,\n            &*STORE_ACCESS_LOCK,\n        )\n    }\n\n    pub fn backup(path: &Path) -> Result<(), io::Error> {\n        debug!(\"backing up all kv stores to path: {:?}\", path);\n\n        // Create backup directory (full path)\n        fs::create_dir_all(path)?;\n\n        // Proceed dump action (backup)\n        Self::dump_action(\"backup\", &*APP_CONF.store.kv.path, path, &Self::backup_item)\n    }\n\n    pub fn restore(path: &Path) -> Result<(), io::Error> {\n        debug!(\"restoring all kv stores from path: {:?}\", path);\n\n        // Proceed dump action (restore)\n        Self::dump_action(\n            \"restore\",\n            path,\n            &*APP_CONF.store.kv.path,\n            &Self::restore_item,\n        )\n    }\n\n    pub fn flush(force: bool) {\n        debug!(\"scanning for kv store pool items to flush to disk\");\n\n        // Acquire flush lock, and reference it in context\n        // Notice: this prevents two flush operations to be executed at the same time.\n        let _flush = STORE_FLUSH_LOCK.lock().unwrap();\n\n        // Step 1: List keys to be flushed\n        let mut keys_flush: Vec<StoreKVKey> = Vec::new();\n\n        {\n            // Acquire access lock (in blocking write mode), and reference it in context\n            // Notice: this prevents store to be acquired from any context\n            let _access = STORE_ACCESS_LOCK.write().unwrap();\n\n            let store_pool_read = STORE_POOL.read().unwrap();\n\n            for (key, store) in &*store_pool_read {\n                // Important: be lenient with system clock going back to a past duration, since \\\n                //   we may be running in a virtualized environment where clock is not guaranteed \\\n                //   to be monotonic. This is done to avoid poisoning associated mutexes by \\\n                //   crashing on unwrap().\n                let not_flushed_for = store\n                    .last_flushed\n                    .read()\n                    .unwrap()\n                    .elapsed()\n                    .unwrap_or_else(|err| {\n                        error!(\n                            \"kv key: {} last flush duration clock issue, zeroing: {}\",\n                            key, err\n                        );\n\n                        // Assuming a zero seconds fallback duration\n                        Duration::from_secs(0)\n                    })\n                    .as_secs();\n\n                if force || not_flushed_for >= APP_CONF.store.kv.database.flush_after {\n                    info!(\n                        \"kv key: {} not flushed for: {} seconds, may flush\",\n                        key, not_flushed_for\n                    );\n\n                    keys_flush.push(*key);\n                } else {\n                    debug!(\n                        \"kv key: {} not flushed for: {} seconds, no flush\",\n                        key, not_flushed_for\n                    );\n                }\n            }\n        }\n\n        // Exit trap: Nothing to flush yet? Abort there.\n        if keys_flush.is_empty() {\n            info!(\"no kv store pool items need to be flushed at the moment\");\n\n            return;\n        }\n\n        // Step 2: Flush KVs, one-by-one (sequential locking; this avoids global locks)\n        let mut count_flushed = 0;\n\n        {\n            for key in &keys_flush {\n                {\n                    // Acquire access lock (in blocking write mode), and reference it in context\n                    // Notice: this prevents store to be acquired from any context\n                    let _access = STORE_ACCESS_LOCK.write().unwrap();\n\n                    if let Some(store) = STORE_POOL.read().unwrap().get(key) {\n                        debug!(\"kv key: {} flush started\", key);\n\n                        if let Err(err) = store.flush() {\n                            error!(\"kv key: {} flush failed: {}\", key, err);\n                        } else {\n                            count_flushed += 1;\n\n                            debug!(\"kv key: {} flush complete\", key);\n                        }\n\n                        // Bump 'last flushed' time\n                        *store.last_flushed.write().unwrap() = SystemTime::now();\n                    }\n                }\n\n                // Give a bit of time to other threads before continuing\n                thread::yield_now();\n            }\n        }\n\n        info!(\n            \"done scanning for kv store pool items to flush to disk (flushed: {})\",\n            count_flushed\n        );\n    }\n\n    fn dump_action(\n        action: &str,\n        read_path: &Path,\n        write_path: &Path,\n        fn_item: &dyn Fn(&Path, &Path, &str) -> Result<(), io::Error>,\n    ) -> Result<(), io::Error> {\n        // Iterate on KV collections\n        for collection in fs::read_dir(read_path)? {\n            let collection = collection?;\n\n            // Actual collection found?\n            if let (Ok(collection_file_type), Some(collection_name)) =\n                (collection.file_type(), collection.file_name().to_str())\n            {\n                if collection_file_type.is_dir() {\n                    debug!(\"kv collection ongoing {}: {}\", action, collection_name);\n\n                    fn_item(write_path, &collection.path(), collection_name)?;\n                }\n            }\n        }\n\n        Ok(())\n    }\n\n    fn backup_item(\n        backup_path: &Path,\n        _origin_path: &Path,\n        collection_name: &str,\n    ) -> Result<(), io::Error> {\n        // Acquire access lock (in blocking write mode), and reference it in context\n        // Notice: this prevents store to be acquired from any context\n        let _access = STORE_ACCESS_LOCK.write().unwrap();\n\n        // Generate path to KV backup\n        let kv_backup_path = backup_path.join(collection_name);\n\n        debug!(\n            \"kv collection: {} backing up to path: {:?}\",\n            collection_name, kv_backup_path\n        );\n\n        // Erase any previously-existing KV backup\n        if kv_backup_path.exists() {\n            fs::remove_dir_all(&kv_backup_path)?;\n        }\n\n        // Create backup folder for collection\n        fs::create_dir_all(backup_path.join(collection_name))?;\n\n        // Convert names to hashes (as names are hashes encoded as base-16 strings, but we need \\\n        //   them as proper integers)\n        if let Ok(collection_radix) = RadixNum::from_str(collection_name, ATOM_HASH_RADIX) {\n            if let Ok(collection_hash) = collection_radix.as_decimal() {\n                let origin_kv = StoreKVBuilder::open(collection_hash as StoreKVAtom)\n                    .map_err(|_| io_error!(\"database open failure\"))?;\n\n                // Initialize KV database backup engine\n                let kv_backup_options = DBBackupEngineOptions::new(&kv_backup_path)\n                    .map_err(|_| io_error!(\"backup engine options acquire failure\"))?;\n                let kv_backup_environment = DBEnv::new()\n                    .map_err(|_| io_error!(\"backup engine environment acquire failure\"))?;\n\n                let mut kv_backup_engine =\n                    DBBackupEngine::open(&kv_backup_options, &kv_backup_environment)\n                        .map_err(|_| io_error!(\"backup engine failure\"))?;\n\n                // Proceed actual KV database backup\n                kv_backup_engine\n                    .create_new_backup(&origin_kv)\n                    .map_err(|_| io_error!(\"database backup failure\"))?;\n\n                info!(\n                    \"kv collection: {} backed up to path: {:?}\",\n                    collection_name, kv_backup_path\n                );\n            }\n        }\n\n        Ok(())\n    }\n\n    fn restore_item(\n        _backup_path: &Path,\n        origin_path: &Path,\n        collection_name: &str,\n    ) -> Result<(), io::Error> {\n        // Acquire access lock (in blocking write mode), and reference it in context\n        // Notice: this prevents store to be acquired from any context\n        let _access = STORE_ACCESS_LOCK.write().unwrap();\n\n        debug!(\n            \"kv collection: {} restoring from path: {:?}\",\n            collection_name, origin_path\n        );\n\n        // Convert names to hashes (as names are hashes encoded as base-16 strings, but we need \\\n        //   them as proper integers)\n        if let Ok(collection_radix) = RadixNum::from_str(collection_name, ATOM_HASH_RADIX) {\n            if let Ok(collection_hash) = collection_radix.as_decimal() {\n                // Force a KV store close\n                StoreKVBuilder::close(collection_hash as StoreKVAtom);\n\n                // Generate path to KV\n                let kv_path = StoreKVBuilder::path(collection_hash as StoreKVAtom);\n\n                // Remove existing KV database data?\n                if kv_path.exists() {\n                    fs::remove_dir_all(&kv_path)?;\n                }\n\n                // Create KV folder for collection\n                fs::create_dir_all(&kv_path)?;\n\n                // Initialize KV database backup engine\n                let kv_backup_options = DBBackupEngineOptions::new(&origin_path)\n                    .map_err(|_| io_error!(\"backup engine options acquire failure\"))?;\n                let kv_backup_environment = DBEnv::new()\n                    .map_err(|_| io_error!(\"backup engine environment acquire failure\"))?;\n\n                let mut kv_backup_engine =\n                    DBBackupEngine::open(&kv_backup_options, &kv_backup_environment)\n                        .map_err(|_| io_error!(\"backup engine failure\"))?;\n\n                kv_backup_engine\n                    .restore_from_latest_backup(&kv_path, &kv_path, &DBRestoreOptions::default())\n                    .map_err(|_| io_error!(\"database restore failure\"))?;\n\n                info!(\n                    \"kv collection: {} restored to path: {:?} from backup: {:?}\",\n                    collection_name, kv_path, origin_path\n                );\n            }\n        }\n\n        Ok(())\n    }\n}\n\nimpl StoreGenericPool<StoreKVKey, StoreKV, StoreKVBuilder> for StoreKVPool {}\n\nimpl StoreKVBuilder {\n    fn open(collection_hash: StoreKVAtom) -> Result<DB, DBError> {\n        debug!(\n            \"opening key-value database for collection: <{:x?}>\",\n            collection_hash\n        );\n\n        // Configure database options\n        let db_options = Self::configure();\n\n        // Open database at path for collection\n        DB::open(&db_options, Self::path(collection_hash))\n    }\n\n    fn close(collection_hash: StoreKVAtom) {\n        debug!(\n            \"closing key-value database for collection: <{:x?}>\",\n            collection_hash\n        );\n\n        let mut store_pool_write = STORE_POOL.write().unwrap();\n\n        let collection_target = StoreKVKey::from_atom(collection_hash);\n\n        store_pool_write.remove(&collection_target);\n    }\n\n    fn path(collection_hash: StoreKVAtom) -> PathBuf {\n        APP_CONF\n            .store\n            .kv\n            .path\n            .join(format!(\"{:x?}\", collection_hash))\n    }\n\n    fn configure() -> DBOptions {\n        debug!(\"configuring key-value database\");\n\n        // Make database options\n        let mut db_options = DBOptions::default();\n\n        // Set static options\n        db_options.create_if_missing(true);\n        db_options.set_use_fsync(false);\n        db_options.set_compaction_style(DBCompactionStyle::Level);\n        db_options.set_min_write_buffer_number(1);\n        db_options.set_max_write_buffer_number(2);\n\n        // Set dynamic options\n        db_options.set_compression_type(if APP_CONF.store.kv.database.compress {\n            DBCompressionType::Zstd\n        } else {\n            DBCompressionType::None\n        });\n\n        db_options.set_max_open_files(if let Some(value) = APP_CONF.store.kv.database.max_files {\n            value as i32\n        } else {\n            -1\n        });\n\n        db_options.increase_parallelism(APP_CONF.store.kv.database.parallelism as i32);\n        db_options.set_max_subcompactions(APP_CONF.store.kv.database.max_compactions as u32);\n        db_options.set_max_background_jobs(\n            (APP_CONF.store.kv.database.max_compactions + APP_CONF.store.kv.database.max_flushes)\n                as i32,\n        );\n        db_options.set_write_buffer_size(APP_CONF.store.kv.database.write_buffer * 1024);\n\n        db_options\n    }\n}\n\nimpl StoreGenericBuilder<StoreKVKey, StoreKV> for StoreKVBuilder {\n    fn build(pool_key: StoreKVKey) -> Result<StoreKV, ()> {\n        Self::open(pool_key.collection_hash)\n            .map(|db| {\n                let now = SystemTime::now();\n\n                StoreKV {\n                    database: db,\n                    last_used: Arc::new(RwLock::new(now)),\n                    last_flushed: Arc::new(RwLock::new(now)),\n                    lock: RwLock::new(false),\n                }\n            })\n            .map_err(|err| {\n                error!(\"failed opening kv: {}\", err);\n            })\n    }\n}\n\nimpl StoreKV {\n    pub fn get(&self, key: &[u8]) -> Result<Option<Vec<u8>>, DBError> {\n        self.database.get(key)\n    }\n\n    pub fn put(&self, key: &[u8], data: &[u8]) -> Result<(), DBError> {\n        let mut batch = WriteBatch::default();\n\n        batch.put(key, data);\n\n        self.do_write(batch)\n    }\n\n    pub fn delete(&self, key: &[u8]) -> Result<(), DBError> {\n        let mut batch = WriteBatch::default();\n\n        batch.delete(key);\n\n        self.do_write(batch)\n    }\n\n    fn flush(&self) -> Result<(), DBError> {\n        // Generate flush options\n        let mut flush_options = FlushOptions::default();\n\n        flush_options.set_wait(true);\n\n        // Perform flush (in blocking mode)\n        self.database.flush_opt(&flush_options)\n    }\n\n    fn do_write(&self, batch: WriteBatch) -> Result<(), DBError> {\n        // Configure this write\n        let mut write_options = WriteOptions::default();\n\n        // WAL disabled?\n        if !APP_CONF.store.kv.database.write_ahead_log {\n            debug!(\"ignoring wal for kv write\");\n\n            write_options.disable_wal(true);\n        } else {\n            debug!(\"using wal for kv write\");\n\n            write_options.disable_wal(false);\n        }\n\n        // Commit this write\n        self.database.write_opt(batch, &write_options)\n    }\n}\n\nimpl StoreGeneric for StoreKV {\n    fn ref_last_used(&self) -> &RwLock<SystemTime> {\n        &self.last_used\n    }\n}\n\nimpl StoreKVActionBuilder {\n    pub fn access(bucket: StoreItemPart, store: Option<StoreKVBox>) -> StoreKVAction {\n        Self::build(bucket, store)\n    }\n\n    pub fn erase<'a, T: Into<&'a str>>(collection: T, bucket: Option<T>) -> Result<u32, ()> {\n        Self::dispatch_erase(\"kv\", collection, bucket)\n    }\n\n    fn build(bucket: StoreItemPart, store: Option<StoreKVBox>) -> StoreKVAction {\n        StoreKVAction { store, bucket }\n    }\n}\n\nimpl StoreGenericActionBuilder for StoreKVActionBuilder {\n    fn proceed_erase_collection(collection_str: &str) -> Result<u32, ()> {\n        let collection_atom = StoreKeyerHasher::to_compact(collection_str);\n        let collection_path = StoreKVBuilder::path(collection_atom);\n\n        // Force a KV store close\n        StoreKVBuilder::close(collection_atom);\n\n        if collection_path.exists() {\n            debug!(\n                \"kv collection store exists, erasing: {}/* at path: {:?}\",\n                collection_str, &collection_path\n            );\n\n            // Remove KV store storage from filesystem\n            let erase_result = fs::remove_dir_all(&collection_path);\n\n            if erase_result.is_ok() {\n                debug!(\"done with kv collection erasure\");\n\n                Ok(1)\n            } else {\n                Err(())\n            }\n        } else {\n            debug!(\n                \"kv collection store does not exist, consider already erased: {}/* at path: {:?}\",\n                collection_str, &collection_path\n            );\n\n            Ok(0)\n        }\n    }\n\n    fn proceed_erase_bucket(_collection: &str, _bucket: &str) -> Result<u32, ()> {\n        // This one is not implemented, as we need to acquire the collection; which would cause \\\n        //   a party-killer dead-lock.\n        Err(())\n    }\n}\n\nimpl<'a> StoreKVAction<'a> {\n    /// Meta-to-Value mapper\n    ///\n    /// [IDX=0] ((meta)) ~> ((value))\n    pub fn get_meta_to_value(&self, meta: StoreMetaKey) -> Result<Option<StoreMetaValue>, ()> {\n        if let Some(ref store) = self.store {\n            let store_key = StoreKeyerBuilder::meta_to_value(self.bucket.as_str(), &meta);\n\n            debug!(\"store get meta-to-value: {}\", store_key);\n\n            match store.get(&store_key.as_bytes()) {\n                Ok(Some(value)) => {\n                    debug!(\"got meta-to-value: {}\", store_key);\n\n                    Ok(if let Ok(value) = str::from_utf8(&value) {\n                        match meta {\n                            StoreMetaKey::IIDIncr => value\n                                .parse::<StoreObjectIID>()\n                                .ok()\n                                .map(StoreMetaValue::IIDIncr)\n                                .or(None),\n                        }\n                    } else {\n                        None\n                    })\n                }\n                Ok(None) => {\n                    debug!(\"no meta-to-value found: {}\", store_key);\n\n                    Ok(None)\n                }\n                Err(err) => {\n                    error!(\n                        \"error getting meta-to-value: {} with trace: {}\",\n                        store_key, err\n                    );\n\n                    Err(())\n                }\n            }\n        } else {\n            Ok(None)\n        }\n    }\n\n    pub fn set_meta_to_value(&self, meta: StoreMetaKey, value: StoreMetaValue) -> Result<(), ()> {\n        if let Some(ref store) = self.store {\n            let store_key = StoreKeyerBuilder::meta_to_value(self.bucket.as_str(), &meta);\n\n            debug!(\"store set meta-to-value: {}\", store_key);\n\n            let value_string = match value {\n                StoreMetaValue::IIDIncr(iid_incr) => iid_incr.to_string(),\n            };\n\n            store\n                .put(&store_key.as_bytes(), value_string.as_bytes())\n                .or(Err(()))\n        } else {\n            Err(())\n        }\n    }\n\n    /// Term-to-IIDs mapper\n    ///\n    /// [IDX=1] ((term)) ~> [((iid))]\n    pub fn get_term_to_iids(\n        &self,\n        term_hashed: StoreTermHashed,\n    ) -> Result<Option<Vec<StoreObjectIID>>, ()> {\n        if let Some(ref store) = self.store {\n            let store_key = StoreKeyerBuilder::term_to_iids(self.bucket.as_str(), term_hashed);\n\n            debug!(\"store get term-to-iids: {}\", store_key);\n\n            match store.get(&store_key.as_bytes()) {\n                Ok(Some(value)) => {\n                    debug!(\n                        \"got term-to-iids: {} with encoded value: {:?}\",\n                        store_key, &*value\n                    );\n\n                    Self::decode_u32_list(&*value)\n                        .or(Err(()))\n                        .map(|value_decoded| {\n                            debug!(\n                                \"got term-to-iids: {} with decoded value: {:?}\",\n                                store_key, &value_decoded\n                            );\n\n                            Some(value_decoded)\n                        })\n                }\n                Ok(None) => {\n                    debug!(\"no term-to-iids found: {}\", store_key);\n\n                    Ok(None)\n                }\n                Err(err) => {\n                    error!(\n                        \"error getting term-to-iids: {} with trace: {}\",\n                        store_key, err\n                    );\n\n                    Err(())\n                }\n            }\n        } else {\n            Ok(None)\n        }\n    }\n\n    pub fn set_term_to_iids(\n        &self,\n        term_hashed: StoreTermHashed,\n        iids: &[StoreObjectIID],\n    ) -> Result<(), ()> {\n        if let Some(ref store) = self.store {\n            let store_key = StoreKeyerBuilder::term_to_iids(self.bucket.as_str(), term_hashed);\n\n            debug!(\"store set term-to-iids: {}\", store_key);\n\n            // Encode IID list into storage serialized format\n            let iids_encoded = Self::encode_u32_list(iids);\n\n            debug!(\n                \"store set term-to-iids: {} with encoded value: {:?}\",\n                store_key, iids_encoded\n            );\n\n            store.put(&store_key.as_bytes(), &iids_encoded).or(Err(()))\n        } else {\n            Err(())\n        }\n    }\n\n    pub fn delete_term_to_iids(&self, term_hashed: StoreTermHashed) -> Result<(), ()> {\n        if let Some(ref store) = self.store {\n            let store_key = StoreKeyerBuilder::term_to_iids(self.bucket.as_str(), term_hashed);\n\n            debug!(\"store delete term-to-iids: {}\", store_key);\n\n            store.delete(&store_key.as_bytes()).or(Err(()))\n        } else {\n            Err(())\n        }\n    }\n\n    /// OID-to-IID mapper\n    ///\n    /// [IDX=2] ((oid)) ~> ((iid))\n    pub fn get_oid_to_iid(&self, oid: StoreObjectOID<'a>) -> Result<Option<StoreObjectIID>, ()> {\n        if let Some(ref store) = self.store {\n            let store_key = StoreKeyerBuilder::oid_to_iid(self.bucket.as_str(), oid);\n\n            debug!(\"store get oid-to-iid: {}\", store_key);\n\n            match store.get(&store_key.as_bytes()) {\n                Ok(Some(value)) => {\n                    debug!(\n                        \"got oid-to-iid: {} with encoded value: {:?}\",\n                        store_key, &*value\n                    );\n\n                    Self::decode_u32(&*value).or(Err(())).map(|value_decoded| {\n                        debug!(\n                            \"got oid-to-iid: {} with decoded value: {:?}\",\n                            store_key, &value_decoded\n                        );\n\n                        Some(value_decoded)\n                    })\n                }\n                Ok(None) => {\n                    debug!(\"no oid-to-iid found: {}\", store_key);\n\n                    Ok(None)\n                }\n                Err(err) => {\n                    error!(\n                        \"error getting oid-to-iid: {} with trace: {}\",\n                        store_key, err\n                    );\n\n                    Err(())\n                }\n            }\n        } else {\n            Ok(None)\n        }\n    }\n\n    pub fn set_oid_to_iid(&self, oid: StoreObjectOID<'a>, iid: StoreObjectIID) -> Result<(), ()> {\n        if let Some(ref store) = self.store {\n            let store_key = StoreKeyerBuilder::oid_to_iid(self.bucket.as_str(), oid);\n\n            debug!(\"store set oid-to-iid: {}\", store_key);\n\n            // Encode IID\n            let iid_encoded = Self::encode_u32(iid);\n\n            debug!(\n                \"store set oid-to-iid: {} with encoded value: {:?}\",\n                store_key, iid_encoded\n            );\n\n            store.put(&store_key.as_bytes(), &iid_encoded).or(Err(()))\n        } else {\n            Err(())\n        }\n    }\n\n    pub fn delete_oid_to_iid(&self, oid: StoreObjectOID<'a>) -> Result<(), ()> {\n        if let Some(ref store) = self.store {\n            let store_key = StoreKeyerBuilder::oid_to_iid(self.bucket.as_str(), oid);\n\n            debug!(\"store delete oid-to-iid: {}\", store_key);\n\n            store.delete(&store_key.as_bytes()).or(Err(()))\n        } else {\n            Err(())\n        }\n    }\n\n    /// IID-to-OID mapper\n    ///\n    /// [IDX=3] ((iid)) ~> ((oid))\n    pub fn get_iid_to_oid(&self, iid: StoreObjectIID) -> Result<Option<String>, ()> {\n        if let Some(ref store) = self.store {\n            let store_key = StoreKeyerBuilder::iid_to_oid(self.bucket.as_str(), iid);\n\n            debug!(\"store get iid-to-oid: {}\", store_key);\n\n            match store.get(&store_key.as_bytes()) {\n                Ok(Some(value)) => Ok(str::from_utf8(&value).ok().map(|value| value.to_string())),\n                Ok(None) => Ok(None),\n                Err(_) => Err(()),\n            }\n        } else {\n            Ok(None)\n        }\n    }\n\n    pub fn set_iid_to_oid(&self, iid: StoreObjectIID, oid: StoreObjectOID<'a>) -> Result<(), ()> {\n        if let Some(ref store) = self.store {\n            let store_key = StoreKeyerBuilder::iid_to_oid(self.bucket.as_str(), iid);\n\n            debug!(\"store set iid-to-oid: {}\", store_key);\n\n            store.put(&store_key.as_bytes(), oid.as_bytes()).or(Err(()))\n        } else {\n            Err(())\n        }\n    }\n\n    pub fn delete_iid_to_oid(&self, iid: StoreObjectIID) -> Result<(), ()> {\n        if let Some(ref store) = self.store {\n            let store_key = StoreKeyerBuilder::iid_to_oid(self.bucket.as_str(), iid);\n\n            debug!(\"store delete iid-to-oid: {}\", store_key);\n\n            store.delete(&store_key.as_bytes()).or(Err(()))\n        } else {\n            Err(())\n        }\n    }\n\n    /// IID-to-Terms mapper\n    ///\n    /// [IDX=4] ((iid)) ~> [((term))]\n    pub fn get_iid_to_terms(\n        &self,\n        iid: StoreObjectIID,\n    ) -> Result<Option<Vec<StoreTermHashed>>, ()> {\n        if let Some(ref store) = self.store {\n            let store_key = StoreKeyerBuilder::iid_to_terms(self.bucket.as_str(), iid);\n\n            debug!(\"store get iid-to-terms: {}\", store_key);\n\n            match store.get(&store_key.as_bytes()) {\n                Ok(Some(value)) => {\n                    debug!(\n                        \"got iid-to-terms: {} with encoded value: {:?}\",\n                        store_key, &*value\n                    );\n\n                    Self::decode_u32_list(&*value)\n                        .or(Err(()))\n                        .map(|value_decoded| {\n                            debug!(\n                                \"got iid-to-terms: {} with decoded value: {:?}\",\n                                store_key, &value_decoded\n                            );\n\n                            if !value_decoded.is_empty() {\n                                Some(value_decoded)\n                            } else {\n                                None\n                            }\n                        })\n                }\n                Ok(None) => Ok(None),\n                Err(_) => Err(()),\n            }\n        } else {\n            Ok(None)\n        }\n    }\n\n    pub fn set_iid_to_terms(\n        &self,\n        iid: StoreObjectIID,\n        terms_hashed: &[StoreTermHashed],\n    ) -> Result<(), ()> {\n        if let Some(ref store) = self.store {\n            let store_key = StoreKeyerBuilder::iid_to_terms(self.bucket.as_str(), iid);\n\n            debug!(\"store set iid-to-terms: {}\", store_key);\n\n            // Encode term list into storage serialized format\n            let terms_hashed_encoded = Self::encode_u32_list(terms_hashed);\n\n            debug!(\n                \"store set iid-to-terms: {} with encoded value: {:?}\",\n                store_key, terms_hashed_encoded\n            );\n\n            store\n                .put(&store_key.as_bytes(), &terms_hashed_encoded)\n                .or(Err(()))\n        } else {\n            Err(())\n        }\n    }\n\n    pub fn delete_iid_to_terms(&self, iid: StoreObjectIID) -> Result<(), ()> {\n        if let Some(ref store) = self.store {\n            let store_key = StoreKeyerBuilder::iid_to_terms(self.bucket.as_str(), iid);\n\n            debug!(\"store delete iid-to-terms: {}\", store_key);\n\n            store.delete(&store_key.as_bytes()).or(Err(()))\n        } else {\n            Err(())\n        }\n    }\n\n    pub fn batch_flush_bucket(\n        &self,\n        iid: StoreObjectIID,\n        oid: StoreObjectOID<'a>,\n        iid_terms_hashed: &[StoreTermHashed],\n    ) -> Result<u32, ()> {\n        let mut count = 0;\n\n        debug!(\n            \"store batch flush bucket: {} with hashed terms: {:?}\",\n            iid, iid_terms_hashed\n        );\n\n        // Delete OID <> IID association\n        match (\n            self.delete_oid_to_iid(oid),\n            self.delete_iid_to_oid(iid),\n            self.delete_iid_to_terms(iid),\n        ) {\n            (Ok(_), Ok(_), Ok(_)) => {\n                // Delete IID from each associated term\n                for iid_term in iid_terms_hashed {\n                    if let Ok(Some(mut iid_term_iids)) = self.get_term_to_iids(*iid_term) {\n                        if iid_term_iids.contains(&iid) {\n                            count += 1;\n\n                            // Remove IID from list of IIDs\n                            iid_term_iids.retain(|cur_iid| cur_iid != &iid);\n                        }\n\n                        let is_ok = if iid_term_iids.is_empty() {\n                            self.delete_term_to_iids(*iid_term).is_ok()\n                        } else {\n                            self.set_term_to_iids(*iid_term, &iid_term_iids).is_ok()\n                        };\n\n                        if !is_ok {\n                            return Err(());\n                        }\n                    }\n                }\n\n                Ok(count)\n            }\n            _ => Err(()),\n        }\n    }\n\n    pub fn batch_truncate_object(\n        &self,\n        term_hashed: StoreTermHashed,\n        term_iids_drain: Drain<StoreObjectIID>,\n    ) -> Result<u32, ()> {\n        let mut count = 0;\n\n        for term_iid_drain in term_iids_drain {\n            debug!(\"store batch truncate object iid: {}\", term_iid_drain);\n\n            // Nuke term in IID to Terms list\n            if let Ok(Some(mut term_iid_drain_terms)) = self.get_iid_to_terms(term_iid_drain) {\n                count += 1;\n\n                term_iid_drain_terms.retain(|cur_term| cur_term != &term_hashed);\n\n                // IID to Terms list is empty? Flush whole object.\n                if term_iid_drain_terms.is_empty() {\n                    // Acquire OID for this drained IID\n                    if let Ok(Some(term_iid_drain_oid)) = self.get_iid_to_oid(term_iid_drain) {\n                        if self\n                            .batch_flush_bucket(term_iid_drain, &term_iid_drain_oid, &Vec::new())\n                            .is_err()\n                        {\n                            error!(\n                                \"failed executing store batch truncate object batch-flush-bucket\"\n                            );\n                        }\n                    } else {\n                        error!(\"failed getting store batch truncate object iid-to-oid\");\n                    }\n                } else {\n                    // Update IID to Terms list\n                    if self\n                        .set_iid_to_terms(term_iid_drain, &term_iid_drain_terms)\n                        .is_err()\n                    {\n                        error!(\"failed setting store batch truncate object iid-to-terms\");\n                    }\n                }\n            }\n        }\n\n        Ok(count)\n    }\n\n    pub fn batch_erase_bucket(&self) -> Result<u32, ()> {\n        if let Some(ref store) = self.store {\n            // Generate all key prefix values (with dummy post-prefix values; we dont care)\n            let (k_meta_to_value, k_term_to_iids, k_oid_to_iid, k_iid_to_oid, k_iid_to_terms) = (\n                StoreKeyerBuilder::meta_to_value(self.bucket.as_str(), &StoreMetaKey::IIDIncr),\n                StoreKeyerBuilder::term_to_iids(self.bucket.as_str(), 0),\n                StoreKeyerBuilder::oid_to_iid(self.bucket.as_str(), &String::new()),\n                StoreKeyerBuilder::iid_to_oid(self.bucket.as_str(), 0),\n                StoreKeyerBuilder::iid_to_terms(self.bucket.as_str(), 0),\n            );\n\n            let key_prefixes: [StoreKeyerPrefix; 5] = [\n                k_meta_to_value.as_prefix(),\n                k_term_to_iids.as_prefix(),\n                k_oid_to_iid.as_prefix(),\n                k_iid_to_oid.as_prefix(),\n                k_iid_to_terms.as_prefix(),\n            ];\n\n            // Scan all keys per-prefix and nuke them right away\n            for key_prefix in &key_prefixes {\n                debug!(\n                    \"store batch erase bucket: {} for prefix: {:?}\",\n                    self.bucket.as_str(),\n                    key_prefix\n                );\n\n                // Generate start and end prefix for batch delete (in other words, the minimum \\\n                //   key value possible, and the highest key value possible)\n                let key_prefix_start: StoreKeyerKey = [\n                    key_prefix[0],\n                    key_prefix[1],\n                    key_prefix[2],\n                    key_prefix[3],\n                    key_prefix[4],\n                    0,\n                    0,\n                    0,\n                    0,\n                ];\n                let key_prefix_end: StoreKeyerKey = [\n                    key_prefix[0],\n                    key_prefix[1],\n                    key_prefix[2],\n                    key_prefix[3],\n                    key_prefix[4],\n                    255,\n                    255,\n                    255,\n                    255,\n                ];\n\n                // Batch-delete keys matching range\n                let mut batch = WriteBatch::default();\n\n                batch.delete_range(&key_prefix_start, &key_prefix_end);\n\n                // Commit operation to database\n                if let Err(err) = store.do_write(batch) {\n                    error!(\n                        \"failed in store batch erase bucket: {} with error: {}\",\n                        self.bucket.as_str(),\n                        err\n                    );\n                } else {\n                    // Ensure last key is deleted (as RocksDB end key is exclusive; while \\\n                    //   start key is inclusive, we need to ensure the end-of-range key is \\\n                    //   deleted)\n                    store.delete(&key_prefix_end).ok();\n\n                    debug!(\n                        \"succeeded in store batch erase bucket: {}\",\n                        self.bucket.as_str()\n                    );\n                }\n            }\n\n            info!(\n                \"done processing store batch erase bucket: {}\",\n                self.bucket.as_str()\n            );\n\n            Ok(1)\n        } else {\n            Err(())\n        }\n    }\n\n    fn encode_u32(decoded: u32) -> [u8; 4] {\n        let mut encoded = [0; 4];\n\n        LittleEndian::write_u32(&mut encoded, decoded);\n\n        encoded\n    }\n\n    fn decode_u32(encoded: &[u8]) -> Result<u32, ()> {\n        Cursor::new(encoded).read_u32::<LittleEndian>().or(Err(()))\n    }\n\n    fn encode_u32_list(decoded: &[u32]) -> Vec<u8> {\n        // Pre-reserve required capacity as to avoid heap resizes (50% performance gain relative \\\n        //   to initializing this with a zero-capacity)\n        let mut encoded = Vec::with_capacity(decoded.len() * 4);\n\n        for decoded_item in decoded {\n            encoded.extend(&Self::encode_u32(*decoded_item))\n        }\n\n        encoded\n    }\n\n    fn decode_u32_list(encoded: &[u8]) -> Result<Vec<u32>, ()> {\n        // Pre-reserve required capacity as to avoid heap resizes (50% performance gain relative \\\n        //   to initializing this with a zero-capacity)\n        let mut decoded = Vec::with_capacity(encoded.len() / 4);\n\n        for encoded_chunk in encoded.chunks(4) {\n            if let Ok(decoded_chunk) = Self::decode_u32(encoded_chunk) {\n                decoded.push(decoded_chunk);\n            } else {\n                return Err(());\n            }\n        }\n\n        Ok(decoded)\n    }\n}\n\nimpl StoreKVKey {\n    pub fn from_atom(collection_hash: StoreKVAtom) -> StoreKVKey {\n        StoreKVKey { collection_hash }\n    }\n\n    pub fn from_str(collection_str: &str) -> StoreKVKey {\n        StoreKVKey {\n            collection_hash: StoreKeyerHasher::to_compact(collection_str),\n        }\n    }\n}\n\nimpl fmt::Display for StoreKVKey {\n    fn fmt(&self, f: &mut fmt::Formatter) -> fmt::Result {\n        write!(f, \"<{:x?}>\", self.collection_hash)\n    }\n}\n\n#[cfg(test)]\nmod tests {\n    use super::*;\n\n    #[test]\n    fn it_acquires_database() {\n        assert!(StoreKVPool::acquire(StoreKVAcquireMode::Any, \"c:test:1\").is_ok());\n    }\n\n    #[test]\n    fn it_janitors_database() {\n        StoreKVPool::janitor();\n    }\n\n    #[test]\n    fn it_proceeds_primitives() {\n        let store = StoreKVPool::acquire(StoreKVAcquireMode::Any, \"c:test:2\")\n            .unwrap()\n            .unwrap();\n\n        assert!(store.get(&[0]).is_ok());\n        assert!(store.put(&[0], &[1, 0, 0, 0]).is_ok());\n        assert!(store.delete(&[0]).is_ok());\n    }\n\n    #[test]\n    fn it_proceeds_actions() {\n        let store = StoreKVPool::acquire(StoreKVAcquireMode::Any, \"c:test:3\").unwrap();\n        let action =\n            StoreKVActionBuilder::access(StoreItemPart::from_str(\"b:test:3\").unwrap(), store);\n\n        assert!(action.get_meta_to_value(StoreMetaKey::IIDIncr).is_ok());\n        assert!(action\n            .set_meta_to_value(StoreMetaKey::IIDIncr, StoreMetaValue::IIDIncr(1))\n            .is_ok());\n\n        assert!(action.get_term_to_iids(1).is_ok());\n        assert!(action.set_term_to_iids(1, &[0, 1, 2]).is_ok());\n        assert!(action.delete_term_to_iids(1).is_ok());\n\n        assert!(action.get_oid_to_iid(&\"s\".to_string()).is_ok());\n        assert!(action.set_oid_to_iid(&\"s\".to_string(), 4).is_ok());\n        assert!(action.delete_oid_to_iid(&\"s\".to_string()).is_ok());\n\n        assert!(action.get_iid_to_oid(4).is_ok());\n        assert!(action.set_iid_to_oid(4, &\"s\".to_string()).is_ok());\n        assert!(action.delete_iid_to_oid(4).is_ok());\n\n        assert!(action.get_iid_to_terms(4).is_ok());\n        assert!(action.set_iid_to_terms(4, &[45402]).is_ok());\n        assert!(action.delete_iid_to_terms(4).is_ok());\n    }\n\n    #[test]\n    fn it_encodes_atom() {\n        assert_eq!(StoreKVAction::encode_u32(0), [0, 0, 0, 0]);\n        assert_eq!(StoreKVAction::encode_u32(1), [1, 0, 0, 0]);\n        assert_eq!(StoreKVAction::encode_u32(45402), [90, 177, 0, 0]);\n    }\n\n    #[test]\n    fn it_decodes_atom() {\n        assert_eq!(StoreKVAction::decode_u32(&[0, 0, 0, 0]), Ok(0));\n        assert_eq!(StoreKVAction::decode_u32(&[1, 0, 0, 0]), Ok(1));\n        assert_eq!(StoreKVAction::decode_u32(&[90, 177, 0, 0]), Ok(45402));\n    }\n\n    #[test]\n    fn it_encodes_atom_list() {\n        assert_eq!(\n            StoreKVAction::encode_u32_list(&[0, 2, 3]),\n            [0, 0, 0, 0, 2, 0, 0, 0, 3, 0, 0, 0]\n        );\n        assert_eq!(StoreKVAction::encode_u32_list(&[45402]), [90, 177, 0, 0]);\n    }\n\n    #[test]\n    fn it_decodes_atom_list() {\n        assert_eq!(\n            StoreKVAction::decode_u32_list(&[0, 0, 0, 0, 2, 0, 0, 0, 3, 0, 0, 0]),\n            Ok(vec![0, 2, 3])\n        );\n        assert_eq!(\n            StoreKVAction::decode_u32_list(&[90, 177, 0, 0]),\n            Ok(vec![45402])\n        );\n    }\n}\n\n#[cfg(all(feature = \"benchmark\", test))]\nmod benches {\n    extern crate test;\n\n    use super::*;\n    use test::Bencher;\n\n    #[bench]\n    fn bench_encode_atom(b: &mut Bencher) {\n        b.iter(|| StoreKVAction::encode_u32(0));\n    }\n\n    #[bench]\n    fn bench_decode_atom(b: &mut Bencher) {\n        let encoded_atom = [0, 0, 0, 0];\n\n        b.iter(|| StoreKVAction::decode_u32(&encoded_atom));\n    }\n\n    #[bench]\n    fn bench_encode_atom_list(b: &mut Bencher) {\n        let atom_list = [0, 2, 3];\n\n        b.iter(|| StoreKVAction::encode_u32_list(&atom_list));\n    }\n\n    #[bench]\n    fn bench_decode_atom_list(b: &mut Bencher) {\n        let encoded_atom_list = [0, 0, 0, 0, 2, 0, 0, 0, 3, 0, 0, 0];\n\n        b.iter(|| StoreKVAction::decode_u32_list(&encoded_atom_list));\n    }\n}\n"
  },
  {
    "path": "src/store/macros.rs",
    "content": "// Sonic\n//\n// Fast, lightweight and schema-less search backend\n// Copyright: 2019, Valerian Saliou <valerian@valeriansaliou.name>\n// License: Mozilla Public License v2.0 (MPL v2.0)\n\n#[macro_export]\nmacro_rules! io_error {\n    ($error:expr) => {\n        io::Error::new(io::ErrorKind::Other, $error)\n    };\n}\n"
  },
  {
    "path": "src/store/mod.rs",
    "content": "// Sonic\n//\n// Fast, lightweight and schema-less search backend\n// Copyright: 2019, Valerian Saliou <valerian@valeriansaliou.name>\n// License: Mozilla Public License v2.0 (MPL v2.0)\n\n#[macro_use]\nmod macros;\n\nmod generic;\nmod keyer;\n\npub mod fst;\npub mod identifiers;\npub mod item;\npub mod kv;\npub mod operation;\n"
  },
  {
    "path": "src/store/operation.rs",
    "content": "// Sonic\n//\n// Fast, lightweight and schema-less search backend\n// Copyright: 2019, Valerian Saliou <valerian@valeriansaliou.name>\n// License: Mozilla Public License v2.0 (MPL v2.0)\n\nuse crate::executor::count::ExecutorCount;\nuse crate::executor::flushb::ExecutorFlushB;\nuse crate::executor::flushc::ExecutorFlushC;\nuse crate::executor::flusho::ExecutorFlushO;\nuse crate::executor::list::ExecutorList;\nuse crate::executor::pop::ExecutorPop;\nuse crate::executor::push::ExecutorPush;\nuse crate::executor::search::ExecutorSearch;\nuse crate::executor::suggest::ExecutorSuggest;\nuse crate::query::actions::Query;\n\npub struct StoreOperationDispatch;\n\nimpl StoreOperationDispatch {\n    pub fn dispatch(query: Query) -> Result<Option<String>, ()> {\n        // Dispatch de-constructed query to its target executor\n        match query {\n            Query::Search(store, query_id, lexer, limit, offset) => {\n                ExecutorSearch::execute(store, query_id, lexer, limit, offset)\n                    .map(|results| results.map(|results| results.join(\" \")))\n            }\n            Query::Suggest(store, query_id, lexer, limit) => {\n                ExecutorSuggest::execute(store, query_id, lexer, limit)\n                    .map(|results| results.map(|results| results.join(\" \")))\n            }\n            Query::List(store, query_id, limit, offset) => {\n                ExecutorList::execute(store, query_id, limit, offset)\n                    .map(|results| results.join(\" \"))\n                    .map(|results| Some(results))\n            }\n            Query::Push(store, lexer) => ExecutorPush::execute(store, lexer).map(|_| None),\n            Query::Pop(store, lexer) => {\n                ExecutorPop::execute(store, lexer).map(|count| Some(count.to_string()))\n            }\n            Query::Count(store) => {\n                ExecutorCount::execute(store).map(|count| Some(count.to_string()))\n            }\n            Query::FlushC(store) => {\n                ExecutorFlushC::execute(store).map(|count| Some(count.to_string()))\n            }\n            Query::FlushB(store) => {\n                ExecutorFlushB::execute(store).map(|count| Some(count.to_string()))\n            }\n            Query::FlushO(store) => {\n                ExecutorFlushO::execute(store).map(|count| Some(count.to_string()))\n            }\n        }\n    }\n}\n"
  },
  {
    "path": "src/tasker/mod.rs",
    "content": "// Sonic\n//\n// Fast, lightweight and schema-less search backend\n// Copyright: 2019, Valerian Saliou <valerian@valeriansaliou.name>\n// License: Mozilla Public License v2.0 (MPL v2.0)\n\npub mod runtime;\npub mod shutdown;\n"
  },
  {
    "path": "src/tasker/runtime.rs",
    "content": "// Sonic\n//\n// Fast, lightweight and schema-less search backend\n// Copyright: 2019, Valerian Saliou <valerian@valeriansaliou.name>\n// License: Mozilla Public License v2.0 (MPL v2.0)\n\nuse std::thread;\nuse std::time::{Duration, Instant};\n\nuse crate::store::fst::StoreFSTPool;\nuse crate::store::kv::StoreKVPool;\n\npub struct TaskerBuilder;\npub struct Tasker;\n\nconst TASKER_TICK_INTERVAL: Duration = Duration::from_secs(10);\n\nimpl TaskerBuilder {\n    pub fn build() -> Tasker {\n        Tasker {}\n    }\n}\n\nimpl Tasker {\n    pub fn run(&self) {\n        info!(\"tasker is now active\");\n\n        loop {\n            // Hold for next aggregate run\n            thread::sleep(TASKER_TICK_INTERVAL);\n\n            debug!(\"running a tasker tick...\");\n\n            let tick_start = Instant::now();\n\n            Self::tick();\n\n            let tick_took = tick_start.elapsed();\n\n            info!(\n                \"ran tasker tick (took {}s + {}ms)\",\n                tick_took.as_secs(),\n                tick_took.subsec_millis()\n            );\n        }\n    }\n\n    fn tick() {\n        // Proceed all tick actions\n\n        // #1: Janitors\n        StoreKVPool::janitor();\n        StoreFSTPool::janitor();\n\n        // #2: Others\n        StoreKVPool::flush(false);\n        StoreFSTPool::consolidate(false);\n    }\n}\n"
  },
  {
    "path": "src/tasker/shutdown.rs",
    "content": "// Sonic\n//\n// Fast, lightweight and schema-less search backend\n// Copyright: 2019, Valerian Saliou <valerian@valeriansaliou.name>\n// License: Mozilla Public License v2.0 (MPL v2.0)\n\n#[cfg(windows)]\nmod platform {\n    // Notice: the following module is inspired from a fork of `graceful`, which implements \\\n    //   Windows support upon the original `graceful` crate; find the fork at: \\\n    //   https://github.com/Git0Shuai/graceful\n\n    use std::sync::mpsc::{sync_channel, Receiver, SyncSender};\n    use std::sync::Mutex;\n\n    use winapi::shared::minwindef::{BOOL, DWORD, TRUE};\n    use winapi::um::consoleapi::SetConsoleCtrlHandler;\n\n    lazy_static! {\n        static ref CHANNEL: (SyncSender<DWORD>, Mutex<Receiver<DWORD>>) = {\n            let channel = sync_channel(0);\n\n            (channel.0, Mutex::new(channel.1))\n        };\n    }\n\n    unsafe extern \"system\" fn handler(event: DWORD) -> BOOL {\n        CHANNEL.0.send(event).unwrap();\n        CHANNEL.0.send(0).unwrap();\n\n        TRUE\n    }\n\n    pub struct ShutdownSignal;\n\n    impl ShutdownSignal {\n        pub fn new() -> ShutdownSignal {\n            unsafe { SetConsoleCtrlHandler(Some(handler), TRUE) };\n\n            ShutdownSignal\n        }\n\n        pub fn at_exit<F: FnOnce(usize)>(&self, handler: F) {\n            let event = {\n                let receiver = CHANNEL.1.lock().unwrap();\n\n                receiver.recv().unwrap()\n            };\n\n            handler(event as usize);\n\n            CHANNEL.1.lock().unwrap().recv().unwrap();\n        }\n    }\n}\n\n#[cfg(unix)]\nmod platform {\n    // Notice: the following module is inspired from `graceful`, which can be found at: \\\n    //   https://github.com/0x1997/graceful\n\n    use nix::sys::signal::{SigSet, SIGINT, SIGQUIT, SIGTERM};\n\n    pub struct ShutdownSignal(SigSet);\n\n    impl ShutdownSignal {\n        pub fn new() -> ShutdownSignal {\n            let mut mask = SigSet::empty();\n\n            ShutdownSignal::init(&mut mask).unwrap();\n            ShutdownSignal(mask)\n        }\n\n        fn init(mask: &mut SigSet) -> nix::Result<()> {\n            mask.add(SIGINT);\n            mask.add(SIGQUIT);\n            mask.add(SIGTERM);\n\n            mask.thread_block()\n        }\n\n        pub fn at_exit<F: FnOnce(usize)>(&self, handler: F) {\n            let signal = self.0.wait().unwrap();\n\n            handler(signal as usize);\n        }\n    }\n}\n\npub use platform::ShutdownSignal;\n"
  },
  {
    "path": "tests/integration/.gitignore",
    "content": "instance/data/\n\nrunner/node_modules/\n"
  },
  {
    "path": "tests/integration/instance/config.cfg",
    "content": "# Sonic\n# Configuration file (integration tests)\n\n[server]\n\nlog_level = \"warn\"\n\n[channel]\n\ninet = \"127.0.0.1:1491\"\nauth_password = \"password:test\"\n\n[channel.search]\n\n[store]\n\n[store.kv]\n[store.kv.pool]\n[store.kv.database]\n\n[store.fst]\n[store.fst.pool]\n[store.fst.graph]\n"
  },
  {
    "path": "tests/integration/runner/package.json",
    "content": "{\n  \"name\": \"sonic-tests-integration\",\n  \"description\": \"Sonic integration tests\",\n  \"version\": \"1.0.0\",\n  \"main\": \"runner.js\",\n  \"homepage\": \"https://github.com/valeriansaliou/sonic\",\n  \"license\": \"ISC\",\n  \"engineStrict\": true,\n  \"engines\": {\n    \"node\": \">=10.0.0\",\n    \"npm\": \">=6.0.0\"\n  },\n  \"scripts\": {\n    \"test\": \"echo \\\"Error: no test specified\\\" && exit 1\"\n  },\n  \"author\": {\n    \"name\": \"Nikita Vilunov\",\n    \"email\": \"nikitaoryol@gmail.com\"\n  },\n  \"dependencies\": {\n    \"sonic-channel\": \"^1.2.5\"\n  }\n}\n"
  },
  {
    "path": "tests/integration/runner/runner.js",
    "content": "// Sonic\n//\n// Fast, lightweight and schema-less search backend\n// Copyright: 2019, Nikita Vilunov <nikitaoryol@gmail.com>\n// License: Mozilla Public License v2.0 (MPL v2.0)\n\nconst SonicChannel = require(\"sonic-channel\");\n\nfunction connect(channel, name) {\n  return new Promise((resolve, reject) => {\n    channel.connect({\n      connected() {\n        console.info(\n          `=== Sonic Channel succeeded to connect to host (${name}) ===`\n        );\n\n        resolve(channel);\n      },\n\n      disconnected() {\n        console.error(`=== Sonic Channel is now disconnected (${name}) ===`);\n      },\n\n      timeout() {\n        console.error(`=== Sonic Channel connection timed out (${name}) ===`);\n      },\n\n      retrying() {\n        console.error(`=== Trying to reconnect to Sonic Channel (${name}) ===`);\n      },\n\n      error(error) {\n        console.error(\n          `=== Sonic Channel failed to connect to host (${name}) ===`, error\n        );\n\n        reject(error);\n      }\n    });\n  });\n}\n\nasync function main(scenario) {\n  let parameters = {\n    host : \"localhost\",\n    port : 1491,\n    auth : \"password:test\"\n  };\n\n  // Connect to Sonic Channel\n  let search = new SonicChannel.Search(parameters);\n  let ingest = new SonicChannel.Ingest(parameters);\n\n  await Promise.all([\n    connect(search, \"search\"),\n    connect(ingest, \"ingest\")\n  ]);\n\n  // Run scenario\n  await scenario(search, ingest);\n\n  // Close Sonic Channel\n  await Promise.all([\n    search.close(),\n    ingest.close()\n  ]);\n}\n\nfunction wrapper(name, scenario, timeout) {\n  console.log(`=== Running test scenario ${name} ===`)\n\n  timeout = (timeout || 1000);\n\n  let timer = new Promise((_, reject) => {\n    setTimeout(() => {\n      reject(\"Timeout reached\");\n    }, timeout);\n  });\n\n  let start = process.hrtime();\n\n  Promise.race([\n    main(scenario), timer\n  ])\n    .then(\n      () => {\n        let end = process.hrtime(start);\n\n        console.log(\n          `=== Test scenario ${name} succedeed, execution time: ` +\n            `${end[0] + end[1] / 1e9} s ===`\n        );\n      },\n\n      (error)  => {\n        let end = process.hrtime(start);\n\n        console.error(\n          (`=== Test scenario ${name} failed, execution time: ` +\n            `${end[0] + end[1] / 1e9} s ===`),\n          `\\nERROR >> ${error}`\n        );\n\n        process.exit(-1);\n      }\n  );\n}\n\nmodule.exports = wrapper;\n"
  },
  {
    "path": "tests/integration/scenarios/insert.js",
    "content": "// Sonic\n//\n// Fast, lightweight and schema-less search backend\n// Copyright: 2019, Nikita Vilunov <nikitaoryol@gmail.com>\n// License: Mozilla Public License v2.0 (MPL v2.0)\n\nconst expected_documents = {\n  \"conversation:1\" : (\n    \"Batch normalization is a technique for improving the speed, \" +\n      \"performance, and stability of artificial neural networks\"\n  ),\n\n  \"conversation:2\" : (\n    \"This scratch technique is much like the transform in some ways\"\n  )\n};\n\nconst unexpected_documents = {\n  \"conversation:3\" : \"Glissando is a glide from one pitch to another\"\n}\n\nasync function run(search, ingest) {\n  // Ingest documents\n  for (const key in expected_documents) {\n    await ingest.push(\"messages\", \"default\", key, expected_documents[key]);\n  }\n\n  for (const key in unexpected_documents) {\n    await ingest.push(\"messages\", \"default\", key, unexpected_documents[key]);\n  }\n\n  // Perform search on ingested documents\n  let response = await search.query(\"messages\", \"default\", \"technique\");\n\n  for (const key in expected_documents) {\n    if (!response.includes(key) === true) {\n      throw `Expected document ${key} was not found`;\n    }\n  }\n\n  for (const key in unexpected_documents) {\n    if (response.includes(key) === true) {\n      throw `Unexpected document ${key} was returned`;\n    }\n  }\n}\n\nrequire(\"../runner/runner.js\")(\n  \"Insert & Search\", run\n);\n"
  },
  {
    "path": "tests/integration/scenarios/ping.js",
    "content": "// Sonic\n//\n// Fast, lightweight and schema-less search backend\n// Copyright: 2019, Nikita Vilunov <nikitaoryol@gmail.com>\n// License: Mozilla Public License v2.0 (MPL v2.0)\n\nasync function run(search) {\n  // Perform a ping\n  await search.ping();\n}\n\nrequire(\"../runner/runner.js\")(\n  \"Ping\", run\n);\n"
  },
  {
    "path": "tests/integration/scripts/run.sh",
    "content": "#!/bin/bash\n\n##\n#  Sonic\n#  Fast, lightweight and schema-less search backend\n#\n#  Copyright: 2019, Nikita Vilunov <nikitaoryol@gmail.com>, \\\n#             2019, Valerian Saliou <valerian@valeriansaliou.name>\n#  License: Mozilla Public License v2.0 (MPL v2.0)\n##\n\nABSPATH=$(cd \"$(dirname \"$0\")\"; pwd)\nTESTSPATH=\"$ABSPATH/../\"\n\nSTATUS=0\n\n# Run tests\npushd \"$TESTSPATH\" > /dev/null\n  # Install test dependencies from a clean state\n  pushd \"./runner/\" > /dev/null\n    npm ci\n  popd\n\n  # Run each test scenario\n  for scenario in $(find ./scenarios/ -name \"*.js\")\n  do\n      [[ -d ./instance/data/ ]] && rm -r ./instance/data/\n\n      # Run sonic from a clean state\n      pushd \"./instance/\" > /dev/null\n        cargo run -- --config config.cfg &\n        SONIC_PID=$!\n        sleep 2\n      popd\n\n      # Run scenario\n      node $scenario\n\n      [[ $? -eq 0 ]] || STATUS=1\n\n      # Stop Sonic\n      kill $SONIC_PID\n      wait $SONIC_PID\n  done\n\n  [[ -d ./instance/data/ ]] && rm -r ./instance/data/\npopd\n\nexit $STATUS\n"
  }
]