gitextract_vbmxaw27/ ├── .Rbuildignore ├── .gitignore ├── .travis.yml ├── CONDUCT.md ├── DESCRIPTION ├── LICENSE ├── Makefile ├── NAMESPACE ├── NEWS.md ├── R/ │ ├── RcppExports.R │ ├── TextReuseCorpus.R │ ├── TextReuseTextDocument.R │ ├── align_local.R │ ├── conversion-functions.R │ ├── filenames.R │ ├── lsh.R │ ├── lsh_candidates.R │ ├── lsh_compare.R │ ├── lsh_probability.R │ ├── lsh_query.R │ ├── lsh_subset.R │ ├── minhash.R │ ├── pairwise_candidates.R │ ├── pairwise_compare.R │ ├── parallel.R │ ├── rehash.R │ ├── similarity.R │ ├── textreuse-package.r │ ├── token_index.R │ ├── tokenize.R │ ├── tokenizers.R │ ├── utils.R │ └── wordcount.R ├── README.Rmd ├── README.md ├── _pkgdown.yml ├── appveyor.yml ├── cran-comments.md ├── inst/ │ └── extdata/ │ ├── ats/ │ │ ├── calltounconv00baxt.txt │ │ ├── gospeltruth00whit.txt │ │ ├── lifeofrevrichard00baxt.txt │ │ ├── memoirjamesbrai00ricegoog.txt │ │ ├── practicalthought00nev.txt │ │ ├── remember00palm.txt │ │ ├── remembermeorholy00palm.txt │ │ └── thoughtsonpopery00nevi.txt │ └── legal/ │ ├── ca1851-match.txt │ ├── ca1851-nomatch.txt │ └── ny1850-match.txt ├── man/ │ ├── TextReuseCorpus.Rd │ ├── TextReuseTextDocument-accessors.Rd │ ├── TextReuseTextDocument.Rd │ ├── align_local.Rd │ ├── as.matrix.textreuse_candidates.Rd │ ├── filenames.Rd │ ├── hash_string.Rd │ ├── lsh.Rd │ ├── lsh_add.Rd │ ├── lsh_candidates.Rd │ ├── lsh_compare.Rd │ ├── lsh_probability.Rd │ ├── lsh_query.Rd │ ├── lsh_subset.Rd │ ├── minhash_generator.Rd │ ├── pairwise_candidates.Rd │ ├── pairwise_compare.Rd │ ├── reexports.Rd │ ├── rehash.Rd │ ├── similarity-functions.Rd │ ├── textreuse-package.Rd │ ├── token_index.Rd │ ├── token_index_candidates.Rd │ ├── tokenize.Rd │ ├── tokenizers.Rd │ └── wordcount.Rd ├── pkgdown/ │ └── extra.css ├── src/ │ ├── RcppExports.cpp │ ├── hash_string.cpp │ ├── shingle_ngrams.cpp │ ├── skip_ngrams.cpp │ └── sw_matrix.cpp ├── tests/ │ ├── testthat/ │ │ ├── newman.txt │ │ ├── test-TextReuseCorpus.R │ │ ├── test-TextReuseTextDocument.R │ │ ├── test-alignment.R │ │ ├── test-candidate_pairs.R │ │ ├── test-filenames.R │ │ ├── test-hashing.R │ │ ├── test-jaccard.R │ │ ├── test-lsh.R │ │ ├── test-minhash.R │ │ ├── test-pairwise_cf.R │ │ ├── test-ratio_of_matches.R │ │ ├── test-token_index.R │ │ ├── test-tokenizers.R │ │ ├── test-utils.R │ │ └── test-wordcount.R │ └── testthat.R └── vignettes/ ├── textreuse-alignment.Rmd ├── textreuse-introduction.Rmd ├── textreuse-minhash.Rmd └── textreuse-pairwise.Rmd