gitextract_pif85cg4/ ├── .circleci/ │ └── config.yml ├── .codeclimate.yml ├── .coveragerc ├── .github/ │ └── CODEOWNERS ├── .gitignore ├── .gitmodules ├── .project ├── .pypirc ├── .pyup.yml ├── .travis.yml ├── AUTHORS.rst ├── CODE_OF_CONDUCT.rst ├── CODING_STANDARDS.rst ├── FAQ.rst ├── HISTORY.rst ├── LICENSE ├── MANIFEST.in ├── Pipfile ├── README.rst ├── VERSION.rst ├── abydos/ │ ├── __init__.py │ ├── compression/ │ │ ├── __init__.py │ │ ├── _arithmetic.py │ │ ├── _bwt.py │ │ └── _rle.py │ ├── corpus/ │ │ ├── __init__.py │ │ ├── _corpus.py │ │ ├── _ngram_corpus.py │ │ └── _unigram_corpus.py │ ├── distance/ │ │ ├── __init__.py │ │ ├── _aline.py │ │ ├── _ample.py │ │ ├── _anderberg.py │ │ ├── _andres_marzo_delta.py │ │ ├── _average_linkage.py │ │ ├── _azzoo.py │ │ ├── _bag.py │ │ ├── _baroni_urbani_buser_i.py │ │ ├── _baroni_urbani_buser_ii.py │ │ ├── _batagelj_bren.py │ │ ├── _baulieu_i.py │ │ ├── _baulieu_ii.py │ │ ├── _baulieu_iii.py │ │ ├── _baulieu_iv.py │ │ ├── _baulieu_ix.py │ │ ├── _baulieu_v.py │ │ ├── _baulieu_vi.py │ │ ├── _baulieu_vii.py │ │ ├── _baulieu_viii.py │ │ ├── _baulieu_x.py │ │ ├── _baulieu_xi.py │ │ ├── _baulieu_xii.py │ │ ├── _baulieu_xiii.py │ │ ├── _baulieu_xiv.py │ │ ├── _baulieu_xv.py │ │ ├── _baystat.py │ │ ├── _benini_i.py │ │ ├── _benini_ii.py │ │ ├── _bennet.py │ │ ├── _bhattacharyya.py │ │ ├── _bisim.py │ │ ├── _bleu.py │ │ ├── _block_levenshtein.py │ │ ├── _brainerd_robinson.py │ │ ├── _braun_blanquet.py │ │ ├── _canberra.py │ │ ├── _cao.py │ │ ├── _chao_dice.py │ │ ├── _chao_jaccard.py │ │ ├── _chebyshev.py │ │ ├── _chord.py │ │ ├── _clark.py │ │ ├── _clement.py │ │ ├── _cohen_kappa.py │ │ ├── _cole.py │ │ ├── _complete_linkage.py │ │ ├── _consonni_todeschini_i.py │ │ ├── _consonni_todeschini_ii.py │ │ ├── _consonni_todeschini_iii.py │ │ ├── _consonni_todeschini_iv.py │ │ ├── _consonni_todeschini_v.py │ │ ├── _cormode_lz.py │ │ ├── _cosine.py │ │ ├── _covington.py │ │ ├── _damerau_levenshtein.py │ │ ├── _dennis.py │ │ ├── _dice.py │ │ ├── _dice_asymmetric_i.py │ │ ├── _dice_asymmetric_ii.py │ │ ├── _digby.py │ │ ├── _discounted_levenshtein.py │ │ ├── _dispersion.py │ │ ├── _distance.py │ │ ├── _doolittle.py │ │ ├── _dunning.py │ │ ├── _editex.py │ │ ├── _euclidean.py │ │ ├── _eudex.py │ │ ├── _eyraud.py │ │ ├── _fager_mcgowan.py │ │ ├── _faith.py │ │ ├── _fellegi_sunter.py │ │ ├── _fidelity.py │ │ ├── _fleiss.py │ │ ├── _fleiss_levin_paik.py │ │ ├── _flexmetric.py │ │ ├── _forbes_i.py │ │ ├── _forbes_ii.py │ │ ├── _fossum.py │ │ ├── _fuzzywuzzy_partial_string.py │ │ ├── _fuzzywuzzy_token_set.py │ │ ├── _fuzzywuzzy_token_sort.py │ │ ├── _generalized_fleiss.py │ │ ├── _gilbert.py │ │ ├── _gilbert_wells.py │ │ ├── _gini_i.py │ │ ├── _gini_ii.py │ │ ├── _goodall.py │ │ ├── _goodman_kruskal_lambda.py │ │ ├── _goodman_kruskal_lambda_r.py │ │ ├── _goodman_kruskal_tau_a.py │ │ ├── _goodman_kruskal_tau_b.py │ │ ├── _gotoh.py │ │ ├── _gower_legendre.py │ │ ├── _guth.py │ │ ├── _guttman_lambda_a.py │ │ ├── _guttman_lambda_b.py │ │ ├── _gwet_ac.py │ │ ├── _hamann.py │ │ ├── _hamming.py │ │ ├── _harris_lahey.py │ │ ├── _hassanat.py │ │ ├── _hawkins_dotson.py │ │ ├── _hellinger.py │ │ ├── _henderson_heron.py │ │ ├── _higuera_mico.py │ │ ├── _horn_morisita.py │ │ ├── _hurlbert.py │ │ ├── _ident.py │ │ ├── _inclusion.py │ │ ├── _indel.py │ │ ├── _isg.py │ │ ├── _iterative_substring.py │ │ ├── _jaccard.py │ │ ├── _jaccard_nm.py │ │ ├── _jaro_winkler.py │ │ ├── _jensen_shannon.py │ │ ├── _johnson.py │ │ ├── _kendall_tau.py │ │ ├── _kent_foster_i.py │ │ ├── _kent_foster_ii.py │ │ ├── _koppen_i.py │ │ ├── _koppen_ii.py │ │ ├── _kuder_richardson.py │ │ ├── _kuhns_i.py │ │ ├── _kuhns_ii.py │ │ ├── _kuhns_iii.py │ │ ├── _kuhns_iv.py │ │ ├── _kuhns_ix.py │ │ ├── _kuhns_v.py │ │ ├── _kuhns_vi.py │ │ ├── _kuhns_vii.py │ │ ├── _kuhns_viii.py │ │ ├── _kuhns_x.py │ │ ├── _kuhns_xi.py │ │ ├── _kuhns_xii.py │ │ ├── _kulczynski_i.py │ │ ├── _kulczynski_ii.py │ │ ├── _lcprefix.py │ │ ├── _lcsseq.py │ │ ├── _lcsstr.py │ │ ├── _lcsuffix.py │ │ ├── _length.py │ │ ├── _levenshtein.py │ │ ├── _lig3.py │ │ ├── _lorentzian.py │ │ ├── _maarel.py │ │ ├── _manhattan.py │ │ ├── _marking.py │ │ ├── _marking_metric.py │ │ ├── _masi.py │ │ ├── _matusita.py │ │ ├── _maxwell_pilliner.py │ │ ├── _mcconnaughey.py │ │ ├── _mcewen_michael.py │ │ ├── _meta_levenshtein.py │ │ ├── _michelet.py │ │ ├── _millar.py │ │ ├── _minhash.py │ │ ├── _minkowski.py │ │ ├── _mlipns.py │ │ ├── _monge_elkan.py │ │ ├── _morisita.py │ │ ├── _mountford.py │ │ ├── _mra.py │ │ ├── _ms_contingency.py │ │ ├── _mutual_information.py │ │ ├── _ncd_arith.py │ │ ├── _ncd_bwtrle.py │ │ ├── _ncd_bz2.py │ │ ├── _ncd_lzma.py │ │ ├── _ncd_lzss.py │ │ ├── _ncd_paq9a.py │ │ ├── _ncd_rle.py │ │ ├── _ncd_zlib.py │ │ ├── _needleman_wunsch.py │ │ ├── _overlap.py │ │ ├── _ozbay.py │ │ ├── _pattern.py │ │ ├── _pearson_chi_squared.py │ │ ├── _pearson_heron_ii.py │ │ ├── _pearson_ii.py │ │ ├── _pearson_iii.py │ │ ├── _pearson_phi.py │ │ ├── _peirce.py │ │ ├── _phonetic_distance.py │ │ ├── _phonetic_edit_distance.py │ │ ├── _positional_q_gram_dice.py │ │ ├── _positional_q_gram_jaccard.py │ │ ├── _positional_q_gram_overlap.py │ │ ├── _prefix.py │ │ ├── _q_gram.py │ │ ├── _quantitative_cosine.py │ │ ├── _quantitative_dice.py │ │ ├── _quantitative_jaccard.py │ │ ├── _ratcliff_obershelp.py │ │ ├── _raup_crick.py │ │ ├── _rees_levenshtein.py │ │ ├── _relaxed_hamming.py │ │ ├── _roberts.py │ │ ├── _rogers_tanimoto.py │ │ ├── _rogot_goldberg.py │ │ ├── _rouge_l.py │ │ ├── _rouge_s.py │ │ ├── _rouge_su.py │ │ ├── _rouge_w.py │ │ ├── _russell_rao.py │ │ ├── _saps.py │ │ ├── _scott_pi.py │ │ ├── _shape.py │ │ ├── _shapira_storer_i.py │ │ ├── _sift4.py │ │ ├── _sift4_extended.py │ │ ├── _sift4_simplest.py │ │ ├── _single_linkage.py │ │ ├── _size.py │ │ ├── _smith_waterman.py │ │ ├── _soft_cosine.py │ │ ├── _softtf_idf.py │ │ ├── _sokal_michener.py │ │ ├── _sokal_sneath_i.py │ │ ├── _sokal_sneath_ii.py │ │ ├── _sokal_sneath_iii.py │ │ ├── _sokal_sneath_iv.py │ │ ├── _sokal_sneath_v.py │ │ ├── _sorgenfrei.py │ │ ├── _ssk.py │ │ ├── _steffensen.py │ │ ├── _stiles.py │ │ ├── _strcmp95.py │ │ ├── _stuart_tau.py │ │ ├── _suffix.py │ │ ├── _synoname.py │ │ ├── _tarantula.py │ │ ├── _tarwid.py │ │ ├── _tetrachoric.py │ │ ├── _tf_idf.py │ │ ├── _tichy.py │ │ ├── _token_distance.py │ │ ├── _tulloss_r.py │ │ ├── _tulloss_s.py │ │ ├── _tulloss_t.py │ │ ├── _tulloss_u.py │ │ ├── _tversky.py │ │ ├── _typo.py │ │ ├── _unigram_subtuple.py │ │ ├── _unknown_a.py │ │ ├── _unknown_b.py │ │ ├── _unknown_c.py │ │ ├── _unknown_d.py │ │ ├── _unknown_e.py │ │ ├── _unknown_f.py │ │ ├── _unknown_g.py │ │ ├── _unknown_h.py │ │ ├── _unknown_i.py │ │ ├── _unknown_j.py │ │ ├── _unknown_k.py │ │ ├── _unknown_l.py │ │ ├── _unknown_m.py │ │ ├── _upholt.py │ │ ├── _vps.py │ │ ├── _warrens_i.py │ │ ├── _warrens_ii.py │ │ ├── _warrens_iii.py │ │ ├── _warrens_iv.py │ │ ├── _warrens_v.py │ │ ├── _weighted_jaccard.py │ │ ├── _whittaker.py │ │ ├── _yates_chi_squared.py │ │ ├── _yjhhr.py │ │ ├── _yujian_bo.py │ │ ├── _yule_q.py │ │ ├── _yule_q_ii.py │ │ └── _yule_y.py │ ├── fingerprint/ │ │ ├── __init__.py │ │ ├── _bwtf.py │ │ ├── _bwtrlef.py │ │ ├── _consonant.py │ │ ├── _count.py │ │ ├── _extract.py │ │ ├── _extract_position_frequency.py │ │ ├── _fingerprint.py │ │ ├── _lacss.py │ │ ├── _lc_cutter.py │ │ ├── _occurrence.py │ │ ├── _occurrence_halved.py │ │ ├── _omission_key.py │ │ ├── _phonetic.py │ │ ├── _position.py │ │ ├── _qgram.py │ │ ├── _skeleton_key.py │ │ ├── _string.py │ │ └── _synoname_toolcode.py │ ├── phones/ │ │ ├── __init__.py │ │ └── _phones.py │ ├── phonetic/ │ │ ├── __init__.py │ │ ├── _ainsworth.py │ │ ├── _alpha_sis.py │ │ ├── _beider_morse.py │ │ ├── _beider_morse_data.py │ │ ├── _caverphone.py │ │ ├── _daitch_mokotoff.py │ │ ├── _davidson.py │ │ ├── _dolby.py │ │ ├── _double_metaphone.py │ │ ├── _eudex.py │ │ ├── _fonem.py │ │ ├── _fuzzy_soundex.py │ │ ├── _haase.py │ │ ├── _henry_early.py │ │ ├── _koelner.py │ │ ├── _lein.py │ │ ├── _meta_soundex.py │ │ ├── _metaphone.py │ │ ├── _mra.py │ │ ├── _norphone.py │ │ ├── _nrl.py │ │ ├── _nysiis.py │ │ ├── _onca.py │ │ ├── _parmar_kumbharana.py │ │ ├── _phonem.py │ │ ├── _phonet.py │ │ ├── _phonetic.py │ │ ├── _phonetic_spanish.py │ │ ├── _phonex.py │ │ ├── _phonic.py │ │ ├── _phonix.py │ │ ├── _pshp_soundex_first.py │ │ ├── _pshp_soundex_last.py │ │ ├── _refined_soundex.py │ │ ├── _reth_schek.py │ │ ├── _roger_root.py │ │ ├── _russell_index.py │ │ ├── _sfinx_bis.py │ │ ├── _sound_d.py │ │ ├── _soundex.py │ │ ├── _soundex_br.py │ │ ├── _spanish_metaphone.py │ │ ├── _spfc.py │ │ ├── _statistics_canada.py │ │ └── _waahlin.py │ ├── stats/ │ │ ├── __init__.py │ │ ├── _confusion_table.py │ │ ├── _mean.py │ │ └── _pairwise.py │ ├── stemmer/ │ │ ├── __init__.py │ │ ├── _caumanns.py │ │ ├── _clef_german.py │ │ ├── _clef_german_plus.py │ │ ├── _clef_swedish.py │ │ ├── _lovins.py │ │ ├── _paice_husk.py │ │ ├── _porter.py │ │ ├── _porter2.py │ │ ├── _s_stemmer.py │ │ ├── _schinke.py │ │ ├── _snowball.py │ │ ├── _snowball_danish.py │ │ ├── _snowball_dutch.py │ │ ├── _snowball_german.py │ │ ├── _snowball_norwegian.py │ │ ├── _snowball_swedish.py │ │ ├── _stemmer.py │ │ └── _uea_lite.py │ ├── tokenizer/ │ │ ├── __init__.py │ │ ├── _c_or_v_cluster.py │ │ ├── _character.py │ │ ├── _cv_cluster.py │ │ ├── _legalipy.py │ │ ├── _nltk.py │ │ ├── _q_grams.py │ │ ├── _q_skipgrams.py │ │ ├── _regexp.py │ │ ├── _saps.py │ │ ├── _sonoripy.py │ │ ├── _tokenizer.py │ │ ├── _vc_cluster.py │ │ ├── _whitespace.py │ │ └── _wordpunct.py │ └── util/ │ ├── __init__.py │ ├── _data.py │ ├── _ncr.py │ └── _prod.py ├── abydos.xcf ├── azure-pipelines.yml ├── badge_update.py ├── binder/ │ ├── Basic Examples.ipynb │ ├── Reversed Metaphone using Keras seq2seq.ipynb │ ├── Text Classification of Drug Reviews.ipynb │ └── requirements.txt ├── data/ │ └── features/ │ ├── features_csv_to_dict.py │ ├── features_symbols.csv │ └── features_terms.csv ├── docs/ │ ├── Makefile │ ├── _build/ │ │ └── .gitignore │ ├── _static/ │ │ └── .gitignore │ ├── _templates/ │ │ └── .gitignore │ ├── abydos.bib │ ├── abydos.compression.rst │ ├── abydos.corpus.rst │ ├── abydos.distance.rst │ ├── abydos.fingerprint.rst │ ├── abydos.phones.rst │ ├── abydos.phonetic.rst │ ├── abydos.rst │ ├── abydos.stats.rst │ ├── abydos.stemmer.rst │ ├── abydos.tokenizer.rst │ ├── abydos.util.rst │ ├── conf.py │ ├── faq.rst │ ├── history.rst │ ├── index.rst │ ├── intro.rst │ ├── make.bat │ ├── modules.rst │ └── requirements.txt ├── helpers/ │ ├── bm_php2py.py │ └── call_and_write_log.py ├── pyproject.toml ├── requirements-dev.txt ├── requirements-test.txt ├── requirements.txt ├── setup.cfg ├── setup.py ├── stubs/ │ ├── lzss/ │ │ └── __init__.pyi │ ├── numpy/ │ │ ├── __init__.pyi │ │ └── core/ │ │ ├── __init__.pyi │ │ ├── _internal.pyi │ │ ├── numeric.pyi │ │ └── numerictypes.pyi │ ├── paq/ │ │ └── __init__.pyi │ └── syllabipy/ │ ├── __init__.pyi │ ├── legalipy.pyi │ └── sonoripy.pyi ├── tests/ │ ├── __init__.py │ ├── compression/ │ │ ├── __init__.py │ │ ├── test_compression_arithmetic.py │ │ ├── test_compression_bwt.py │ │ └── test_compression_rle.py │ ├── corpora/ │ │ ├── fake_words.csv │ │ ├── googlebooks-ger-all-1gram-20120701-y │ │ ├── googlebooks-ger-all-2gram-20120701-yp │ │ ├── googlebooks-ger-all-3gram-20120701-yp │ │ ├── homophones.csv │ │ ├── misspellings.csv │ │ ├── nachnamen.bm.cc.csv │ │ ├── nachnamen.bm.csv │ │ ├── nachnamen.csv │ │ ├── ngerman.csv │ │ ├── paicehusk.csv │ │ ├── php_caverphone.csv │ │ ├── simple-ngrams-pos.txt │ │ ├── simple-ngrams.txt │ │ ├── snowball_danish.csv │ │ ├── snowball_dutch.csv │ │ ├── snowball_german.csv │ │ ├── snowball_lovins.csv │ │ ├── snowball_norwegian.csv │ │ ├── snowball_porter.csv │ │ ├── snowball_porter2.csv │ │ ├── snowball_schinke.csv │ │ ├── snowball_swedish.csv │ │ ├── uea-lite_wsj.csv │ │ ├── uscensus2000.bm.cc.csv │ │ ├── uscensus2000.bm.csv │ │ ├── uscensus2000.csv │ │ ├── variantNames.csv │ │ └── wikipediaCommonMisspellings.csv │ ├── corpus/ │ │ ├── __init__.py │ │ ├── test_corpus_corpus.py │ │ ├── test_corpus_n_gram_corpus.py │ │ └── test_corpus_unigram_corpus.py │ ├── distance/ │ │ ├── __init__.py │ │ ├── test_distance__distance.py │ │ ├── test_distance__token_distance.py │ │ ├── test_distance_aline.py │ │ ├── test_distance_ample.py │ │ ├── test_distance_anderberg.py │ │ ├── test_distance_andres_marzo_delta.py │ │ ├── test_distance_average_linkage.py │ │ ├── test_distance_azzoo.py │ │ ├── test_distance_bag.py │ │ ├── test_distance_baroni_urbani_buser_i.py │ │ ├── test_distance_baroni_urbani_buser_ii.py │ │ ├── test_distance_batagelj_bren.py │ │ ├── test_distance_baulieu_i.py │ │ ├── test_distance_baulieu_ii.py │ │ ├── test_distance_baulieu_iii.py │ │ ├── test_distance_baulieu_iv.py │ │ ├── test_distance_baulieu_ix.py │ │ ├── test_distance_baulieu_v.py │ │ ├── test_distance_baulieu_vi.py │ │ ├── test_distance_baulieu_vii.py │ │ ├── test_distance_baulieu_viii.py │ │ ├── test_distance_baulieu_x.py │ │ ├── test_distance_baulieu_xi.py │ │ ├── test_distance_baulieu_xii.py │ │ ├── test_distance_baulieu_xiii.py │ │ ├── test_distance_baulieu_xiv.py │ │ ├── test_distance_baulieu_xv.py │ │ ├── test_distance_baystat.py │ │ ├── test_distance_benini_i.py │ │ ├── test_distance_benini_ii.py │ │ ├── test_distance_bennet.py │ │ ├── test_distance_bhattacharyya.py │ │ ├── test_distance_bisim.py │ │ ├── test_distance_bleu.py │ │ ├── test_distance_block_levenshtein.py │ │ ├── test_distance_brainerd_robinson.py │ │ ├── test_distance_braun_blanquet.py │ │ ├── test_distance_canberra.py │ │ ├── test_distance_cao.py │ │ ├── test_distance_chao_dice.py │ │ ├── test_distance_chao_jaccard.py │ │ ├── test_distance_chebyshev.py │ │ ├── test_distance_chord.py │ │ ├── test_distance_clark.py │ │ ├── test_distance_clement.py │ │ ├── test_distance_cohen_kappa.py │ │ ├── test_distance_cole.py │ │ ├── test_distance_complete_linkage.py │ │ ├── test_distance_consonni_todeschini_i.py │ │ ├── test_distance_consonni_todeschini_ii.py │ │ ├── test_distance_consonni_todeschini_iii.py │ │ ├── test_distance_consonni_todeschini_iv.py │ │ ├── test_distance_consonni_todeschini_v.py │ │ ├── test_distance_cormode_lz.py │ │ ├── test_distance_cosine.py │ │ ├── test_distance_covington.py │ │ ├── test_distance_damerau_levenshtein.py │ │ ├── test_distance_dennis.py │ │ ├── test_distance_dice.py │ │ ├── test_distance_dice_asymmetric_i.py │ │ ├── test_distance_dice_asymmetric_ii.py │ │ ├── test_distance_digby.py │ │ ├── test_distance_discounted_levenshtein.py │ │ ├── test_distance_dispersion.py │ │ ├── test_distance_doolittle.py │ │ ├── test_distance_dunning.py │ │ ├── test_distance_editex.py │ │ ├── test_distance_euclidean.py │ │ ├── test_distance_eudex.py │ │ ├── test_distance_eyraud.py │ │ ├── test_distance_fager_mcgowan.py │ │ ├── test_distance_faith.py │ │ ├── test_distance_fellegi_sunter.py │ │ ├── test_distance_fidelity.py │ │ ├── test_distance_fleiss.py │ │ ├── test_distance_fleiss_levin_paik.py │ │ ├── test_distance_flexmetric.py │ │ ├── test_distance_forbes_i.py │ │ ├── test_distance_forbes_ii.py │ │ ├── test_distance_fossum.py │ │ ├── test_distance_fuzzywuzzy_partial_string.py │ │ ├── test_distance_fuzzywuzzy_token_set.py │ │ ├── test_distance_fuzzywuzzy_token_sort.py │ │ ├── test_distance_generalized_fleiss.py │ │ ├── test_distance_gilbert.py │ │ ├── test_distance_gilbert_wells.py │ │ ├── test_distance_gini_i.py │ │ ├── test_distance_gini_ii.py │ │ ├── test_distance_goodall.py │ │ ├── test_distance_goodman_kruskal_lambda.py │ │ ├── test_distance_goodman_kruskal_lambda_r.py │ │ ├── test_distance_goodman_kruskal_tau_a.py │ │ ├── test_distance_goodman_kruskal_tau_b.py │ │ ├── test_distance_gotoh.py │ │ ├── test_distance_gower_legendre.py │ │ ├── test_distance_guth.py │ │ ├── test_distance_guttman_lambda_a.py │ │ ├── test_distance_guttman_lambda_b.py │ │ ├── test_distance_gwet_ac.py │ │ ├── test_distance_hamann.py │ │ ├── test_distance_hamming.py │ │ ├── test_distance_harris_lahey.py │ │ ├── test_distance_hassanat.py │ │ ├── test_distance_hawkins_dotson.py │ │ ├── test_distance_hellinger.py │ │ ├── test_distance_henderson_heron.py │ │ ├── test_distance_higuera_mico.py │ │ ├── test_distance_horn_morisita.py │ │ ├── test_distance_hurlbert.py │ │ ├── test_distance_ident.py │ │ ├── test_distance_inclusion.py │ │ ├── test_distance_indel.py │ │ ├── test_distance_isg.py │ │ ├── test_distance_iterative_substring.py │ │ ├── test_distance_jaccard.py │ │ ├── test_distance_jaccard_nm.py │ │ ├── test_distance_jaro_winkler.py │ │ ├── test_distance_jensen_shannon.py │ │ ├── test_distance_johnson.py │ │ ├── test_distance_kendall_tau.py │ │ ├── test_distance_kent_foster_i.py │ │ ├── test_distance_kent_foster_ii.py │ │ ├── test_distance_koppen_i.py │ │ ├── test_distance_koppen_ii.py │ │ ├── test_distance_kuder_richardson.py │ │ ├── test_distance_kuhns_i.py │ │ ├── test_distance_kuhns_ii.py │ │ ├── test_distance_kuhns_iii.py │ │ ├── test_distance_kuhns_iv.py │ │ ├── test_distance_kuhns_ix.py │ │ ├── test_distance_kuhns_v.py │ │ ├── test_distance_kuhns_vi.py │ │ ├── test_distance_kuhns_vii.py │ │ ├── test_distance_kuhns_viii.py │ │ ├── test_distance_kuhns_x.py │ │ ├── test_distance_kuhns_xi.py │ │ ├── test_distance_kuhns_xii.py │ │ ├── test_distance_kulczynski_i.py │ │ ├── test_distance_kulczynski_ii.py │ │ ├── test_distance_lcprefix.py │ │ ├── test_distance_lcsseq.py │ │ ├── test_distance_lcsstr.py │ │ ├── test_distance_lcsuffix.py │ │ ├── test_distance_length.py │ │ ├── test_distance_levenshtein.py │ │ ├── test_distance_lig3.py │ │ ├── test_distance_lorentzian.py │ │ ├── test_distance_maarel.py │ │ ├── test_distance_manhattan.py │ │ ├── test_distance_marking.py │ │ ├── test_distance_marking_metric.py │ │ ├── test_distance_masi.py │ │ ├── test_distance_matusita.py │ │ ├── test_distance_maxwell_pilliner.py │ │ ├── test_distance_mcconnaughey.py │ │ ├── test_distance_mcewen_michael.py │ │ ├── test_distance_meta_levenshtein.py │ │ ├── test_distance_michelet.py │ │ ├── test_distance_millar.py │ │ ├── test_distance_minhash.py │ │ ├── test_distance_minkowski.py │ │ ├── test_distance_mlipns.py │ │ ├── test_distance_monge_elkan.py │ │ ├── test_distance_morisita.py │ │ ├── test_distance_mountford.py │ │ ├── test_distance_mra.py │ │ ├── test_distance_ms_contingency.py │ │ ├── test_distance_mutual_information.py │ │ ├── test_distance_ncd_arith.py │ │ ├── test_distance_ncd_bwtrle.py │ │ ├── test_distance_ncd_bz2.py │ │ ├── test_distance_ncd_lzma.py │ │ ├── test_distance_ncd_lzss.py │ │ ├── test_distance_ncd_paq9a.py │ │ ├── test_distance_ncd_rle.py │ │ ├── test_distance_ncd_zlib.py │ │ ├── test_distance_needleman_wunsch.py │ │ ├── test_distance_overlap.py │ │ ├── test_distance_ozbay.py │ │ ├── test_distance_pattern.py │ │ ├── test_distance_pearson_chi_squared.py │ │ ├── test_distance_pearson_heron_ii.py │ │ ├── test_distance_pearson_ii.py │ │ ├── test_distance_pearson_iii.py │ │ ├── test_distance_pearson_phi.py │ │ ├── test_distance_peirce.py │ │ ├── test_distance_phonetic_distance.py │ │ ├── test_distance_phonetic_edit_distance.py │ │ ├── test_distance_positional_q_gram_dice.py │ │ ├── test_distance_positional_q_gram_jaccard.py │ │ ├── test_distance_positional_q_gram_overlap.py │ │ ├── test_distance_prefix.py │ │ ├── test_distance_q_gram.py │ │ ├── test_distance_quantitative_cosine.py │ │ ├── test_distance_quantitative_dice.py │ │ ├── test_distance_quantitative_jaccard.py │ │ ├── test_distance_ratcliff_obershelp.py │ │ ├── test_distance_raup_crick.py │ │ ├── test_distance_rees_levenshtein.py │ │ ├── test_distance_relaxed_hamming.py │ │ ├── test_distance_roberts.py │ │ ├── test_distance_rogers_tanimoto.py │ │ ├── test_distance_rogot_goldberg.py │ │ ├── test_distance_rouge_l.py │ │ ├── test_distance_rouge_s.py │ │ ├── test_distance_rouge_su.py │ │ ├── test_distance_rouge_w.py │ │ ├── test_distance_russell_rao.py │ │ ├── test_distance_saps.py │ │ ├── test_distance_scott_pi.py │ │ ├── test_distance_shape.py │ │ ├── test_distance_shapira_storer_i.py │ │ ├── test_distance_sift4.py │ │ ├── test_distance_sift4_extended.py │ │ ├── test_distance_sift4_simplest.py │ │ ├── test_distance_single_linkage.py │ │ ├── test_distance_size.py │ │ ├── test_distance_smith_waterman.py │ │ ├── test_distance_soft_cosine.py │ │ ├── test_distance_softtf_idf.py │ │ ├── test_distance_sokal_michener.py │ │ ├── test_distance_sokal_sneath_i.py │ │ ├── test_distance_sokal_sneath_ii.py │ │ ├── test_distance_sokal_sneath_iii.py │ │ ├── test_distance_sokal_sneath_iv.py │ │ ├── test_distance_sokal_sneath_v.py │ │ ├── test_distance_sorgenfrei.py │ │ ├── test_distance_ssk.py │ │ ├── test_distance_steffensen.py │ │ ├── test_distance_stiles.py │ │ ├── test_distance_strcmp95.py │ │ ├── test_distance_stuart_tau.py │ │ ├── test_distance_suffix.py │ │ ├── test_distance_synoname.py │ │ ├── test_distance_tarantula.py │ │ ├── test_distance_tarwid.py │ │ ├── test_distance_tetrachoric.py │ │ ├── test_distance_tf_idf.py │ │ ├── test_distance_tichy.py │ │ ├── test_distance_tulloss_r.py │ │ ├── test_distance_tulloss_s.py │ │ ├── test_distance_tulloss_t.py │ │ ├── test_distance_tulloss_u.py │ │ ├── test_distance_tversky.py │ │ ├── test_distance_typo.py │ │ ├── test_distance_unigram_subtuple.py │ │ ├── test_distance_unknown_a.py │ │ ├── test_distance_unknown_b.py │ │ ├── test_distance_unknown_c.py │ │ ├── test_distance_unknown_d.py │ │ ├── test_distance_unknown_e.py │ │ ├── test_distance_unknown_f.py │ │ ├── test_distance_unknown_g.py │ │ ├── test_distance_unknown_h.py │ │ ├── test_distance_unknown_i.py │ │ ├── test_distance_unknown_j.py │ │ ├── test_distance_unknown_k.py │ │ ├── test_distance_unknown_l.py │ │ ├── test_distance_unknown_m.py │ │ ├── test_distance_upholt.py │ │ ├── test_distance_vps.py │ │ ├── test_distance_warrens_i.py │ │ ├── test_distance_warrens_ii.py │ │ ├── test_distance_warrens_iii.py │ │ ├── test_distance_warrens_iv.py │ │ ├── test_distance_warrens_v.py │ │ ├── test_distance_weighted_jaccard.py │ │ ├── test_distance_whittaker.py │ │ ├── test_distance_yates_chi_squared.py │ │ ├── test_distance_yjhhr.py │ │ ├── test_distance_yujian_bo.py │ │ ├── test_distance_yule_q.py │ │ ├── test_distance_yule_q_ii.py │ │ └── test_distance_yule_y.py │ ├── fingerprint/ │ │ ├── __init__.py │ │ ├── test_fingerprint__fingerprint.py │ │ ├── test_fingerprint_bwtf.py │ │ ├── test_fingerprint_bwtrlef.py │ │ ├── test_fingerprint_consonant.py │ │ ├── test_fingerprint_count.py │ │ ├── test_fingerprint_extract.py │ │ ├── test_fingerprint_extract_position_frequency.py │ │ ├── test_fingerprint_lacss.py │ │ ├── test_fingerprint_lc_cutter.py │ │ ├── test_fingerprint_occurrence.py │ │ ├── test_fingerprint_occurrence_halved.py │ │ ├── test_fingerprint_omission_key.py │ │ ├── test_fingerprint_phonetic.py │ │ ├── test_fingerprint_position.py │ │ ├── test_fingerprint_qgram.py │ │ ├── test_fingerprint_skeleton_key.py │ │ ├── test_fingerprint_string.py │ │ └── test_fingerprint_synoname_toolcode.py │ ├── fuzz/ │ │ ├── __init__.py │ │ ├── corpora/ │ │ │ ├── basewords.txt │ │ │ └── blns.txt │ │ ├── fuzz_test_distance.py │ │ ├── fuzz_test_fingerprint.py │ │ ├── fuzz_test_phonetic.py │ │ ├── fuzz_test_stemmer.py │ │ └── fuzz_test_tokenizer.py │ ├── phones/ │ │ ├── __init__.py │ │ └── test_phones.py │ ├── phonetic/ │ │ ├── __init__.py │ │ ├── test_phonetic__phonetic.py │ │ ├── test_phonetic_ainsworth.py │ │ ├── test_phonetic_alpha_sis.py │ │ ├── test_phonetic_beider_morse.py │ │ ├── test_phonetic_caverphone.py │ │ ├── test_phonetic_daitch_mokotoff.py │ │ ├── test_phonetic_davidson.py │ │ ├── test_phonetic_dolby.py │ │ ├── test_phonetic_double_metaphone.py │ │ ├── test_phonetic_eudex.py │ │ ├── test_phonetic_fonem.py │ │ ├── test_phonetic_fuzzy_soundex.py │ │ ├── test_phonetic_haase.py │ │ ├── test_phonetic_henry_early.py │ │ ├── test_phonetic_koelner.py │ │ ├── test_phonetic_lein.py │ │ ├── test_phonetic_meta_soundex.py │ │ ├── test_phonetic_metaphone.py │ │ ├── test_phonetic_mra.py │ │ ├── test_phonetic_norphone.py │ │ ├── test_phonetic_nrl.py │ │ ├── test_phonetic_nysiis.py │ │ ├── test_phonetic_onca.py │ │ ├── test_phonetic_parmar_kumbharana.py │ │ ├── test_phonetic_phonem.py │ │ ├── test_phonetic_phonet.py │ │ ├── test_phonetic_phonetic_spanish.py │ │ ├── test_phonetic_phonex.py │ │ ├── test_phonetic_phonic.py │ │ ├── test_phonetic_phonix.py │ │ ├── test_phonetic_pshp_soundex_first.py │ │ ├── test_phonetic_pshp_soundex_last.py │ │ ├── test_phonetic_refined_soundex.py │ │ ├── test_phonetic_reth_schek.py │ │ ├── test_phonetic_roger_root.py │ │ ├── test_phonetic_russell_index.py │ │ ├── test_phonetic_sfinxbis.py │ │ ├── test_phonetic_sound_d.py │ │ ├── test_phonetic_soundex.py │ │ ├── test_phonetic_soundex_br.py │ │ ├── test_phonetic_spanish_metaphone.py │ │ ├── test_phonetic_spfc.py │ │ ├── test_phonetic_statistics_canada.py │ │ └── test_phonetic_waahlin.py │ ├── stats/ │ │ ├── __init__.py │ │ ├── test_stats_confusion_table.py │ │ ├── test_stats_mean.py │ │ └── test_stats_pairwise.py │ ├── stemmer/ │ │ ├── __init__.py │ │ ├── test_stemmer__snowball.py │ │ ├── test_stemmer__stemmer.py │ │ ├── test_stemmer_caumanns.py │ │ ├── test_stemmer_clef_german.py │ │ ├── test_stemmer_clef_german_plus.py │ │ ├── test_stemmer_clef_swedish.py │ │ ├── test_stemmer_lovins.py │ │ ├── test_stemmer_paice_husk.py │ │ ├── test_stemmer_porter.py │ │ ├── test_stemmer_porter2.py │ │ ├── test_stemmer_s_stemmer.py │ │ ├── test_stemmer_schinke.py │ │ ├── test_stemmer_snowball_danish.py │ │ ├── test_stemmer_snowball_dutch.py │ │ ├── test_stemmer_snowball_german.py │ │ ├── test_stemmer_snowball_norwegian.py │ │ ├── test_stemmer_snowball_swedish.py │ │ └── test_stemmer_uealite.py │ ├── tokenizer/ │ │ ├── __init__.py │ │ ├── test_tokenizer__tokenizer.py │ │ ├── test_tokenizer_c_or_v_cluster.py │ │ ├── test_tokenizer_character.py │ │ ├── test_tokenizer_cv_cluster.py │ │ ├── test_tokenizer_legalipy.py │ │ ├── test_tokenizer_nltk.py │ │ ├── test_tokenizer_q_grams.py │ │ ├── test_tokenizer_q_skipgrams.py │ │ ├── test_tokenizer_regexp.py │ │ ├── test_tokenizer_saps.py │ │ ├── test_tokenizer_sonoripy.py │ │ ├── test_tokenizer_vc_cluster.py │ │ ├── test_tokenizer_whitespace.py │ │ └── test_tokenizer_wordpunct.py │ └── util/ │ ├── __init__.py │ ├── test_data.py │ ├── test_ncr.py │ └── test_prod.py └── tox.ini