Copy disabled (too large)
Download .txt
Showing preview only (134,097K chars total). Download the full file to get everything.
Repository: huggingface/fineweb-2
Branch: main
Commit: d0defb24f193
Files: 7704
Total size: 228.9 MB
Directory structure:
gitextract_xum9dop4/
├── LICENSE
├── README.md
├── ablations/
│ ├── evaluation/
│ │ ├── launch_evals.py
│ │ ├── launch_random_evals.py
│ │ └── run_all_missing_evals.sh
│ ├── tokenization/
│ │ └── launch_tokenization.py
│ └── training/
│ └── launch_exp.py
├── configs/
│ ├── aai_Latn.yml
│ ├── aak_Latn.yml
│ ├── aau_Latn.yml
│ ├── aaz_Latn.yml
│ ├── aba_Latn.yml
│ ├── abi_Latn.yml
│ ├── abk_Cyrl.yml
│ ├── abn_Latn.yml
│ ├── abq_Cyrl.yml
│ ├── abs_Latn.yml
│ ├── abt_Latn.yml
│ ├── abx_Latn.yml
│ ├── aby_Latn.yml
│ ├── abz_Latn.yml
│ ├── aca_Latn.yml
│ ├── acd_Latn.yml
│ ├── ace_Arab.yml
│ ├── ace_Latn.yml
│ ├── acf_Latn.yml
│ ├── ach_Latn.yml
│ ├── acm_Arab.yml
│ ├── acn_Latn.yml
│ ├── acr_Latn.yml
│ ├── acu_Latn.yml
│ ├── ada_Latn.yml
│ ├── ade_Latn.yml
│ ├── adh_Latn.yml
│ ├── adi_Latn.yml
│ ├── adj_Latn.yml
│ ├── adl_Latn.yml
│ ├── ady_Cyrl.yml
│ ├── adz_Latn.yml
│ ├── aeb_Arab.yml
│ ├── aer_Latn.yml
│ ├── aeu_Latn.yml
│ ├── aey_Latn.yml
│ ├── afr_Latn.yml
│ ├── agd_Latn.yml
│ ├── agg_Latn.yml
│ ├── agm_Latn.yml
│ ├── agn_Latn.yml
│ ├── agr_Latn.yml
│ ├── agt_Latn.yml
│ ├── agu_Latn.yml
│ ├── agw_Latn.yml
│ ├── agx_Cyrl.yml
│ ├── aha_Latn.yml
│ ├── ahk_Latn.yml
│ ├── aia_Latn.yml
│ ├── aii_Syrc.yml
│ ├── aim_Latn.yml
│ ├── ain_Latn.yml
│ ├── ajg_Latn.yml
│ ├── aji_Latn.yml
│ ├── ajz_Latn.yml
│ ├── akb_Latn.yml
│ ├── ake_Latn.yml
│ ├── akh_Latn.yml
│ ├── akp_Latn.yml
│ ├── ald_Latn.yml
│ ├── alj_Latn.yml
│ ├── aln_Latn.yml
│ ├── alp_Latn.yml
│ ├── alq_Latn.yml
│ ├── als_Latn.yml
│ ├── alt_Cyrl.yml
│ ├── aly_Latn.yml
│ ├── alz_Latn.yml
│ ├── ame_Latn.yml
│ ├── amf_Latn.yml
│ ├── amh_Ethi.yml
│ ├── ami_Latn.yml
│ ├── amk_Latn.yml
│ ├── amm_Latn.yml
│ ├── amn_Latn.yml
│ ├── amp_Latn.yml
│ ├── amr_Latn.yml
│ ├── amu_Latn.yml
│ ├── amx_Latn.yml
│ ├── ang_Latn.yml
│ ├── anm_Latn.yml
│ ├── ann_Latn.yml
│ ├── anp_Deva.yml
│ ├── anv_Latn.yml
│ ├── any_Latn.yml
│ ├── aoi_Latn.yml
│ ├── aoj_Latn.yml
│ ├── aom_Latn.yml
│ ├── aoz_Latn.yml
│ ├── apb_Latn.yml
│ ├── apc_Arab.yml
│ ├── ape_Latn.yml
│ ├── apn_Latn.yml
│ ├── apr_Latn.yml
│ ├── apt_Latn.yml
│ ├── apu_Latn.yml
│ ├── apw_Latn.yml
│ ├── apy_Latn.yml
│ ├── apz_Latn.yml
│ ├── aqz_Latn.yml
│ ├── arb_Arab.yml
│ ├── arb_Latn.yml
│ ├── are_Latn.yml
│ ├── arg_Latn.yml
│ ├── arl_Latn.yml
│ ├── arn_Latn.yml
│ ├── arp_Latn.yml
│ ├── arq_Arab.yml
│ ├── arr_Latn.yml
│ ├── ars_Arab.yml
│ ├── ary_Arab.yml
│ ├── arz_Arab.yml
│ ├── asg_Latn.yml
│ ├── asm_Beng.yml
│ ├── asm_Latn.yml
│ ├── aso_Latn.yml
│ ├── ast_Latn.yml
│ ├── ata_Latn.yml
│ ├── atb_Latn.yml
│ ├── atd_Latn.yml
│ ├── atg_Latn.yml
│ ├── ati_Latn.yml
│ ├── atj_Latn.yml
│ ├── atq_Latn.yml
│ ├── att_Latn.yml
│ ├── auc_Latn.yml
│ ├── aui_Latn.yml
│ ├── auy_Latn.yml
│ ├── ava_Cyrl.yml
│ ├── avk_Latn.yml
│ ├── avn_Latn.yml
│ ├── avt_Latn.yml
│ ├── avu_Latn.yml
│ ├── awa_Deva.yml
│ ├── awb_Latn.yml
│ ├── awi_Latn.yml
│ ├── awx_Latn.yml
│ ├── ayo_Latn.yml
│ ├── ayp_Arab.yml
│ ├── ayr_Latn.yml
│ ├── azb_Arab.yml
│ ├── azg_Latn.yml
│ ├── azj_Cyrl.yml
│ ├── azj_Latn.yml
│ ├── azz_Latn.yml
│ ├── bak_Cyrl.yml
│ ├── bam_Latn.yml
│ ├── ban_Latn.yml
│ ├── bao_Latn.yml
│ ├── bar_Latn.yml
│ ├── bas_Latn.yml
│ ├── bav_Latn.yml
│ ├── bba_Latn.yml
│ ├── bbb_Latn.yml
│ ├── bbc_Latn.yml
│ ├── bbj_Latn.yml
│ ├── bbk_Latn.yml
│ ├── bbo_Latn.yml
│ ├── bbr_Latn.yml
│ ├── bch_Latn.yml
│ ├── bci_Latn.yml
│ ├── bcl_Latn.yml
│ ├── bco_Latn.yml
│ ├── bcw_Latn.yml
│ ├── bdd_Latn.yml
│ ├── bdh_Latn.yml
│ ├── bdq_Latn.yml
│ ├── bea_Latn.yml
│ ├── bef_Latn.yml
│ ├── bel_Cyrl.yml
│ ├── bem_Latn.yml
│ ├── ben_Beng.yml
│ ├── ben_Latn.yml
│ ├── beq_Latn.yml
│ ├── bew_Latn.yml
│ ├── bex_Latn.yml
│ ├── bfd_Latn.yml
│ ├── bfo_Latn.yml
│ ├── bgr_Latn.yml
│ ├── bgs_Latn.yml
│ ├── bgt_Latn.yml
│ ├── bgz_Latn.yml
│ ├── bhg_Latn.yml
│ ├── bhl_Latn.yml
│ ├── bho_Deva.yml
│ ├── bhp_Latn.yml
│ ├── bhw_Latn.yml
│ ├── bhz_Latn.yml
│ ├── bib_Latn.yml
│ ├── big_Latn.yml
│ ├── bim_Latn.yml
│ ├── bin_Latn.yml
│ ├── bis_Latn.yml
│ ├── biu_Latn.yml
│ ├── biv_Latn.yml
│ ├── bjn_Arab.yml
│ ├── bjn_Latn.yml
│ ├── bjp_Latn.yml
│ ├── bjr_Latn.yml
│ ├── bjv_Latn.yml
│ ├── bkd_Latn.yml
│ ├── bkl_Latn.yml
│ ├── bkq_Latn.yml
│ ├── bku_Latn.yml
│ ├── bkv_Latn.yml
│ ├── bla_Latn.yml
│ ├── blh_Latn.yml
│ ├── blk_Mymr.yml
│ ├── blt_Latn.yml
│ ├── blw_Latn.yml
│ ├── blz_Latn.yml
│ ├── bmh_Latn.yml
│ ├── bmk_Latn.yml
│ ├── bmq_Latn.yml
│ ├── bmr_Latn.yml
│ ├── bmu_Latn.yml
│ ├── bmv_Latn.yml
│ ├── bnj_Latn.yml
│ ├── bno_Latn.yml
│ ├── bnp_Latn.yml
│ ├── boa_Latn.yml
│ ├── bod_Tibt.yml
│ ├── boj_Latn.yml
│ ├── bom_Latn.yml
│ ├── bon_Latn.yml
│ ├── bor_Latn.yml
│ ├── bos_Latn.yml
│ ├── bov_Latn.yml
│ ├── box_Latn.yml
│ ├── bpr_Latn.yml
│ ├── bps_Latn.yml
│ ├── bpy_Beng.yml
│ ├── bqc_Latn.yml
│ ├── bqj_Latn.yml
│ ├── bqp_Latn.yml
│ ├── bre_Latn.yml
│ ├── brh_Arab.yml
│ ├── bru_Latn.yml
│ ├── brx_Deva.yml
│ ├── brx_Latn.yml
│ ├── bsc_Latn.yml
│ ├── bsn_Latn.yml
│ ├── bsp_Latn.yml
│ ├── bsq_Latn.yml
│ ├── bss_Latn.yml
│ ├── btd_Latn.yml
│ ├── bth_Latn.yml
│ ├── bts_Latn.yml
│ ├── btt_Latn.yml
│ ├── btx_Latn.yml
│ ├── bud_Latn.yml
│ ├── bug_Latn.yml
│ ├── buk_Latn.yml
│ ├── bul_Cyrl.yml
│ ├── bum_Latn.yml
│ ├── bus_Latn.yml
│ ├── bvc_Latn.yml
│ ├── bvd_Latn.yml
│ ├── bvr_Latn.yml
│ ├── bvz_Latn.yml
│ ├── bwd_Latn.yml
│ ├── bwi_Latn.yml
│ ├── bwq_Latn.yml
│ ├── bwu_Latn.yml
│ ├── bxh_Latn.yml
│ ├── bxr_Cyrl.yml
│ ├── byr_Latn.yml
│ ├── byv_Latn.yml
│ ├── byx_Latn.yml
│ ├── bzd_Latn.yml
│ ├── bzh_Latn.yml
│ ├── bzi_Thai.yml
│ ├── bzj_Latn.yml
│ ├── caa_Latn.yml
│ ├── cab_Latn.yml
│ ├── cac_Latn.yml
│ ├── caf_Latn.yml
│ ├── cag_Latn.yml
│ ├── cak_Latn.yml
│ ├── cao_Latn.yml
│ ├── cap_Latn.yml
│ ├── caq_Latn.yml
│ ├── car_Latn.yml
│ ├── cas_Latn.yml
│ ├── cat_Latn.yml
│ ├── cav_Latn.yml
│ ├── cax_Latn.yml
│ ├── cbc_Latn.yml
│ ├── cbi_Latn.yml
│ ├── cbk_Latn.yml
│ ├── cbr_Latn.yml
│ ├── cbs_Latn.yml
│ ├── cbt_Latn.yml
│ ├── cbu_Latn.yml
│ ├── cbv_Latn.yml
│ ├── cce_Latn.yml
│ ├── cco_Latn.yml
│ ├── ccp_Latn.yml
│ ├── cdf_Latn.yml
│ ├── ceb_Latn.yml
│ ├── ceg_Latn.yml
│ ├── cek_Latn.yml
│ ├── ces_Latn.yml
│ ├── cfm_Latn.yml
│ ├── cgc_Latn.yml
│ ├── cgg_Latn.yml
│ ├── cha_Latn.yml
│ ├── chd_Latn.yml
│ ├── che_Cyrl.yml
│ ├── chf_Latn.yml
│ ├── chj_Latn.yml
│ ├── chk_Latn.yml
│ ├── cho_Latn.yml
│ ├── chq_Latn.yml
│ ├── chr_Cher.yml
│ ├── chr_Latn.yml
│ ├── chu_Cyrl.yml
│ ├── chv_Cyrl.yml
│ ├── chw_Latn.yml
│ ├── chz_Latn.yml
│ ├── cjk_Latn.yml
│ ├── cjo_Latn.yml
│ ├── cjp_Latn.yml
│ ├── cjs_Cyrl.yml
│ ├── cjv_Latn.yml
│ ├── ckb_Arab.yml
│ ├── cko_Latn.yml
│ ├── ckt_Cyrl.yml
│ ├── cle_Latn.yml
│ ├── clu_Latn.yml
│ ├── cly_Latn.yml
│ ├── cme_Latn.yml
│ ├── cmn_Hani.yml
│ ├── cmo_Khmr.yml
│ ├── cmo_Latn.yml
│ ├── cmr_Latn.yml
│ ├── cnh_Latn.yml
│ ├── cni_Latn.yml
│ ├── cnk_Latn.yml
│ ├── cnl_Latn.yml
│ ├── cnt_Latn.yml
│ ├── cnw_Latn.yml
│ ├── coe_Latn.yml
│ ├── cof_Latn.yml
│ ├── cok_Latn.yml
│ ├── con_Latn.yml
│ ├── cop_Copt.yml
│ ├── cor_Latn.yml
│ ├── cos_Latn.yml
│ ├── cot_Latn.yml
│ ├── cou_Latn.yml
│ ├── cpa_Latn.yml
│ ├── cpb_Latn.yml
│ ├── cpc_Latn.yml
│ ├── cpu_Latn.yml
│ ├── cpy_Latn.yml
│ ├── crh_Cyrl.yml
│ ├── crh_Latn.yml
│ ├── cri_Latn.yml
│ ├── crj_Cans.yml
│ ├── crk_Cans.yml
│ ├── crk_Latn.yml
│ ├── crl_Cans.yml
│ ├── crm_Cans.yml
│ ├── crn_Latn.yml
│ ├── crs_Latn.yml
│ ├── crt_Latn.yml
│ ├── crx_Latn.yml
│ ├── csb_Latn.yml
│ ├── csk_Latn.yml
│ ├── cso_Latn.yml
│ ├── csw_Latn.yml
│ ├── csy_Latn.yml
│ ├── cta_Latn.yml
│ ├── ctd_Latn.yml
│ ├── cto_Latn.yml
│ ├── ctp_Latn.yml
│ ├── ctu_Latn.yml
│ ├── cub_Latn.yml
│ ├── cuc_Latn.yml
│ ├── cui_Latn.yml
│ ├── cuk_Latn.yml
│ ├── cul_Latn.yml
│ ├── cut_Latn.yml
│ ├── cux_Latn.yml
│ ├── cwe_Latn.yml
│ ├── cwt_Latn.yml
│ ├── cya_Latn.yml
│ ├── cym_Latn.yml
│ ├── czt_Latn.yml
│ ├── daa_Latn.yml
│ ├── dad_Latn.yml
│ ├── daf_Latn.yml
│ ├── dag_Latn.yml
│ ├── dah_Latn.yml
│ ├── dak_Latn.yml
│ ├── dan_Latn.yml
│ ├── dar_Cyrl.yml
│ ├── dbq_Latn.yml
│ ├── ddg_Latn.yml
│ ├── ddn_Latn.yml
│ ├── ded_Latn.yml
│ ├── des_Latn.yml
│ ├── deu_Latn.yml
│ ├── dga_Latn.yml
│ ├── dgc_Latn.yml
│ ├── dgi_Latn.yml
│ ├── dgr_Latn.yml
│ ├── dgz_Latn.yml
│ ├── dhg_Latn.yml
│ ├── dhm_Latn.yml
│ ├── dhv_Latn.yml
│ ├── did_Latn.yml
│ ├── dig_Latn.yml
│ ├── dik_Latn.yml
│ ├── dip_Latn.yml
│ ├── diq_Latn.yml
│ ├── dis_Latn.yml
│ ├── diu_Latn.yml
│ ├── div_Thaa.yml
│ ├── dje_Latn.yml
│ ├── djk_Latn.yml
│ ├── djr_Latn.yml
│ ├── dks_Latn.yml
│ ├── dln_Latn.yml
│ ├── dng_Cyrl.yml
│ ├── dnj_Latn.yml
│ ├── dnw_Latn.yml
│ ├── dob_Latn.yml
│ ├── doi_Deva.yml
│ ├── dop_Latn.yml
│ ├── dos_Latn.yml
│ ├── dow_Latn.yml
│ ├── drg_Latn.yml
│ ├── dru_Latn.yml
│ ├── dsb_Latn.yml
│ ├── dsh_Latn.yml
│ ├── dtb_Latn.yml
│ ├── dtp_Latn.yml
│ ├── dts_Latn.yml
│ ├── dty_Deva.yml
│ ├── dua_Latn.yml
│ ├── due_Latn.yml
│ ├── dug_Latn.yml
│ ├── duo_Latn.yml
│ ├── dur_Latn.yml
│ ├── dwr_Latn.yml
│ ├── dww_Latn.yml
│ ├── dyi_Latn.yml
│ ├── dyo_Latn.yml
│ ├── dyu_Latn.yml
│ ├── dzo_Tibt.yml
│ ├── ebk_Latn.yml
│ ├── efi_Latn.yml
│ ├── eka_Latn.yml
│ ├── ekk_Latn.yml
│ ├── eko_Latn.yml
│ ├── ell_Grek.yml
│ ├── eme_Latn.yml
│ ├── emi_Latn.yml
│ ├── eml_Latn.yml
│ ├── emp_Latn.yml
│ ├── enb_Latn.yml
│ ├── enl_Latn.yml
│ ├── enm_Latn.yml
│ ├── enq_Latn.yml
│ ├── enx_Latn.yml
│ ├── epo_Latn.yml
│ ├── eri_Latn.yml
│ ├── ese_Latn.yml
│ ├── esi_Latn.yml
│ ├── esk_Latn.yml
│ ├── ess_Latn.yml
│ ├── esu_Latn.yml
│ ├── eto_Latn.yml
│ ├── etr_Latn.yml
│ ├── etu_Latn.yml
│ ├── eus_Latn.yml
│ ├── eve_Cyrl.yml
│ ├── ewe_Latn.yml
│ ├── ewo_Latn.yml
│ ├── ext_Latn.yml
│ ├── eza_Latn.yml
│ ├── faa_Latn.yml
│ ├── fad_Latn.yml
│ ├── fai_Latn.yml
│ ├── fal_Latn.yml
│ ├── fan_Latn.yml
│ ├── fao_Latn.yml
│ ├── far_Latn.yml
│ ├── fas_Arab.yml
│ ├── fat_Latn.yml
│ ├── ffm_Latn.yml
│ ├── fij_Latn.yml
│ ├── fil_Latn.yml
│ ├── fin_Latn.yml
│ ├── fit_Latn.yml
│ ├── fkv_Latn.yml
│ ├── fmu_Deva.yml
│ ├── fon_Latn.yml
│ ├── for_Latn.yml
│ ├── fra_Latn.yml
│ ├── frd_Latn.yml
│ ├── fro_Latn.yml
│ ├── frp_Latn.yml
│ ├── frr_Latn.yml
│ ├── fry_Latn.yml
│ ├── fub_Latn.yml
│ ├── fud_Latn.yml
│ ├── fue_Latn.yml
│ ├── fuf_Latn.yml
│ ├── fuh_Latn.yml
│ ├── fuq_Latn.yml
│ ├── fur_Latn.yml
│ ├── fuv_Arab.yml
│ ├── fuv_Latn.yml
│ ├── gaa_Latn.yml
│ ├── gag_Cyrl.yml
│ ├── gag_Latn.yml
│ ├── gah_Latn.yml
│ ├── gai_Latn.yml
│ ├── gam_Latn.yml
│ ├── gaw_Latn.yml
│ ├── gaz_Latn.yml
│ ├── gbi_Latn.yml
│ ├── gbo_Latn.yml
│ ├── gbr_Latn.yml
│ ├── gcf_Latn.yml
│ ├── gcr_Latn.yml
│ ├── gde_Latn.yml
│ ├── gdg_Latn.yml
│ ├── gdn_Latn.yml
│ ├── gdr_Latn.yml
│ ├── geb_Latn.yml
│ ├── gej_Latn.yml
│ ├── gfk_Latn.yml
│ ├── ghe_Deva.yml
│ ├── ghs_Latn.yml
│ ├── gid_Latn.yml
│ ├── gil_Latn.yml
│ ├── giz_Latn.yml
│ ├── gjn_Latn.yml
│ ├── gkn_Latn.yml
│ ├── gla_Latn.yml
│ ├── gle_Latn.yml
│ ├── glg_Latn.yml
│ ├── glk_Arab.yml
│ ├── glv_Latn.yml
│ ├── gmh_Latn.yml
│ ├── gmv_Ethi.yml
│ ├── gmv_Latn.yml
│ ├── gna_Latn.yml
│ ├── gnb_Latn.yml
│ ├── gnd_Latn.yml
│ ├── gng_Latn.yml
│ ├── gnn_Latn.yml
│ ├── gnw_Latn.yml
│ ├── goa_Latn.yml
│ ├── gof_Ethi.yml
│ ├── gof_Latn.yml
│ ├── gog_Latn.yml
│ ├── goh_Latn.yml
│ ├── gom_Deva.yml
│ ├── gom_Latn.yml
│ ├── gor_Latn.yml
│ ├── gos_Latn.yml
│ ├── got_Goth.yml
│ ├── got_Latn.yml
│ ├── gqr_Latn.yml
│ ├── grc_Grek.yml
│ ├── grt_Beng.yml
│ ├── gso_Latn.yml
│ ├── gsw_Latn.yml
│ ├── gub_Latn.yml
│ ├── guc_Latn.yml
│ ├── gud_Latn.yml
│ ├── gug_Latn.yml
│ ├── guh_Latn.yml
│ ├── gui_Latn.yml
│ ├── guj_Gujr.yml
│ ├── guj_Latn.yml
│ ├── guk_Ethi.yml
│ ├── gul_Latn.yml
│ ├── gum_Latn.yml
│ ├── gun_Latn.yml
│ ├── guo_Latn.yml
│ ├── guq_Latn.yml
│ ├── gur_Latn.yml
│ ├── guu_Latn.yml
│ ├── guw_Latn.yml
│ ├── gux_Latn.yml
│ ├── guz_Latn.yml
│ ├── gvc_Latn.yml
│ ├── gvf_Latn.yml
│ ├── gvl_Latn.yml
│ ├── gvn_Latn.yml
│ ├── gwi_Latn.yml
│ ├── gwr_Latn.yml
│ ├── gya_Latn.yml
│ ├── gym_Latn.yml
│ ├── gyr_Latn.yml
│ ├── hac_Arab.yml
│ ├── hae_Latn.yml
│ ├── hag_Latn.yml
│ ├── hak_Hani.yml
│ ├── hak_Latn.yml
│ ├── hat_Latn.yml
│ ├── hau_Latn.yml
│ ├── hav_Latn.yml
│ ├── haw_Latn.yml
│ ├── hay_Latn.yml
│ ├── hbo_Hebr.yml
│ ├── hch_Latn.yml
│ ├── heb_Hebr.yml
│ ├── heg_Latn.yml
│ ├── heh_Latn.yml
│ ├── her_Latn.yml
│ ├── hif_Latn.yml
│ ├── hig_Latn.yml
│ ├── hil_Latn.yml
│ ├── hin_Deva.yml
│ ├── hin_Latn.yml
│ ├── hix_Latn.yml
│ ├── hla_Latn.yml
│ ├── hlt_Latn.yml
│ ├── hmo_Latn.yml
│ ├── hmr_Latn.yml
│ ├── hne_Deva.yml
│ ├── hnj_Latn.yml
│ ├── hnn_Latn.yml
│ ├── hns_Latn.yml
│ ├── hoc_Latn.yml
│ ├── hoc_Wara.yml
│ ├── hop_Latn.yml
│ ├── hot_Latn.yml
│ ├── hra_Latn.yml
│ ├── hrv_Latn.yml
│ ├── hrx_Latn.yml
│ ├── hsb_Latn.yml
│ ├── hto_Latn.yml
│ ├── hub_Latn.yml
│ ├── hui_Latn.yml
│ ├── hun_Latn.yml
│ ├── hus_Latn.yml
│ ├── huu_Latn.yml
│ ├── huv_Latn.yml
│ ├── hvn_Latn.yml
│ ├── hwc_Latn.yml
│ ├── hye_Armn.yml
│ ├── hyw_Armn.yml
│ ├── ian_Latn.yml
│ ├── iba_Latn.yml
│ ├── ibg_Latn.yml
│ ├── ibo_Latn.yml
│ ├── icr_Latn.yml
│ ├── ido_Latn.yml
│ ├── idu_Latn.yml
│ ├── ifa_Latn.yml
│ ├── ifb_Latn.yml
│ ├── ife_Latn.yml
│ ├── ifk_Latn.yml
│ ├── ifu_Latn.yml
│ ├── ify_Latn.yml
│ ├── ige_Latn.yml
│ ├── ign_Latn.yml
│ ├── ike_Cans.yml
│ ├── ikk_Latn.yml
│ ├── ikt_Latn.yml
│ ├── ikw_Latn.yml
│ ├── ilb_Latn.yml
│ ├── ile_Latn.yml
│ ├── ilo_Latn.yml
│ ├── imo_Latn.yml
│ ├── ina_Latn.yml
│ ├── inb_Latn.yml
│ ├── ind_Latn.yml
│ ├── inh_Cyrl.yml
│ ├── ino_Latn.yml
│ ├── iou_Latn.yml
│ ├── ipi_Latn.yml
│ ├── iqw_Latn.yml
│ ├── iri_Latn.yml
│ ├── irk_Latn.yml
│ ├── iry_Latn.yml
│ ├── isd_Latn.yml
│ ├── ish_Latn.yml
│ ├── isl_Latn.yml
│ ├── iso_Latn.yml
│ ├── ita_Latn.yml
│ ├── itl_Cyrl.yml
│ ├── itv_Latn.yml
│ ├── ium_Latn.yml
│ ├── ivb_Latn.yml
│ ├── ivv_Latn.yml
│ ├── iws_Latn.yml
│ ├── ixl_Latn.yml
│ ├── izr_Latn.yml
│ ├── izz_Latn.yml
│ ├── jaa_Latn.yml
│ ├── jac_Latn.yml
│ ├── jae_Latn.yml
│ ├── jam_Latn.yml
│ ├── jav_Latn.yml
│ ├── jbo_Latn.yml
│ ├── jbu_Latn.yml
│ ├── jic_Latn.yml
│ ├── jiv_Latn.yml
│ ├── jmc_Latn.yml
│ ├── jpn_Jpan.yml
│ ├── jra_Latn.yml
│ ├── jun_Orya.yml
│ ├── jvn_Latn.yml
│ ├── kaa_Cyrl.yml
│ ├── kaa_Latn.yml
│ ├── kab_Latn.yml
│ ├── kac_Latn.yml
│ ├── kak_Latn.yml
│ ├── kal_Latn.yml
│ ├── kam_Latn.yml
│ ├── kan_Knda.yml
│ ├── kan_Latn.yml
│ ├── kao_Latn.yml
│ ├── kap_Cyrl.yml
│ ├── kaq_Latn.yml
│ ├── kas_Arab.yml
│ ├── kas_Deva.yml
│ ├── kas_Latn.yml
│ ├── kat_Geor.yml
│ ├── kaz_Cyrl.yml
│ ├── kbc_Latn.yml
│ ├── kbd_Cyrl.yml
│ ├── kbh_Latn.yml
│ ├── kbm_Latn.yml
│ ├── kbo_Latn.yml
│ ├── kbp_Latn.yml
│ ├── kbq_Latn.yml
│ ├── kbr_Latn.yml
│ ├── kby_Latn.yml
│ ├── kca_Cyrl.yml
│ ├── kcg_Latn.yml
│ ├── kck_Latn.yml
│ ├── kdc_Latn.yml
│ ├── kde_Latn.yml
│ ├── kdh_Latn.yml
│ ├── kdi_Latn.yml
│ ├── kdj_Latn.yml
│ ├── kdl_Latn.yml
│ ├── kdr_Latn.yml
│ ├── kea_Latn.yml
│ ├── kei_Latn.yml
│ ├── kek_Latn.yml
│ ├── ken_Latn.yml
│ ├── keo_Latn.yml
│ ├── ker_Latn.yml
│ ├── kew_Latn.yml
│ ├── kex_Deva.yml
│ ├── kez_Latn.yml
│ ├── kff_Telu.yml
│ ├── kgf_Latn.yml
│ ├── kgk_Latn.yml
│ ├── kgp_Latn.yml
│ ├── kgr_Latn.yml
│ ├── kha_Latn.yml
│ ├── khk_Cyrl.yml
│ ├── khm_Khmr.yml
│ ├── khq_Latn.yml
│ ├── khs_Latn.yml
│ ├── khy_Latn.yml
│ ├── khz_Latn.yml
│ ├── kia_Latn.yml
│ ├── kij_Latn.yml
│ ├── kik_Latn.yml
│ ├── kin_Latn.yml
│ ├── kir_Cyrl.yml
│ ├── kiu_Latn.yml
│ ├── kix_Latn.yml
│ ├── kjb_Latn.yml
│ ├── kje_Latn.yml
│ ├── kjh_Cyrl.yml
│ ├── kjs_Latn.yml
│ ├── kkc_Latn.yml
│ ├── kki_Latn.yml
│ ├── kkj_Latn.yml
│ ├── kkl_Latn.yml
│ ├── kle_Deva.yml
│ ├── klt_Latn.yml
│ ├── klv_Latn.yml
│ ├── kma_Latn.yml
│ ├── kmb_Latn.yml
│ ├── kmd_Latn.yml
│ ├── kmg_Latn.yml
│ ├── kmh_Latn.yml
│ ├── kmk_Latn.yml
│ ├── kmm_Latn.yml
│ ├── kmo_Latn.yml
│ ├── kmr_Cyrl.yml
│ ├── kmr_Latn.yml
│ ├── kms_Latn.yml
│ ├── kmu_Latn.yml
│ ├── kmy_Latn.yml
│ ├── knc_Arab.yml
│ ├── knc_Latn.yml
│ ├── kne_Latn.yml
│ ├── knf_Latn.yml
│ ├── kng_Latn.yml
│ ├── knj_Latn.yml
│ ├── knk_Latn.yml
│ ├── kno_Latn.yml
│ ├── knv_Latn.yml
│ ├── knx_Latn.yml
│ ├── kny_Latn.yml
│ ├── kog_Latn.yml
│ ├── koi_Cyrl.yml
│ ├── koo_Latn.yml
│ ├── kor_Hang.yml
│ ├── kos_Latn.yml
│ ├── kpe_Latn.yml
│ ├── kpf_Latn.yml
│ ├── kpg_Latn.yml
│ ├── kpj_Latn.yml
│ ├── kpq_Latn.yml
│ ├── kpr_Latn.yml
│ ├── kpv_Cyrl.yml
│ ├── kpw_Latn.yml
│ ├── kpx_Latn.yml
│ ├── kpz_Latn.yml
│ ├── kqa_Latn.yml
│ ├── kqc_Latn.yml
│ ├── kqe_Latn.yml
│ ├── kqf_Latn.yml
│ ├── kql_Latn.yml
│ ├── kqn_Latn.yml
│ ├── kqo_Latn.yml
│ ├── kqp_Latn.yml
│ ├── kqs_Latn.yml
│ ├── kqw_Latn.yml
│ ├── kqy_Ethi.yml
│ ├── krc_Cyrl.yml
│ ├── kri_Latn.yml
│ ├── krj_Latn.yml
│ ├── krl_Latn.yml
│ ├── kru_Deva.yml
│ ├── krx_Latn.yml
│ ├── ksb_Latn.yml
│ ├── ksc_Latn.yml
│ ├── ksd_Latn.yml
│ ├── ksf_Latn.yml
│ ├── ksh_Latn.yml
│ ├── ksj_Latn.yml
│ ├── ksp_Latn.yml
│ ├── ksr_Latn.yml
│ ├── kss_Latn.yml
│ ├── ksw_Mymr.yml
│ ├── ktb_Ethi.yml
│ ├── ktj_Latn.yml
│ ├── ktm_Latn.yml
│ ├── kto_Latn.yml
│ ├── ktu_Latn.yml
│ ├── ktz_Latn.yml
│ ├── kua_Latn.yml
│ ├── kub_Latn.yml
│ ├── kud_Latn.yml
│ ├── kue_Latn.yml
│ ├── kuj_Latn.yml
│ ├── kum_Cyrl.yml
│ ├── kup_Latn.yml
│ ├── kus_Latn.yml
│ ├── kvg_Latn.yml
│ ├── kvj_Latn.yml
│ ├── kvn_Latn.yml
│ ├── kwd_Latn.yml
│ ├── kwf_Latn.yml
│ ├── kwi_Latn.yml
│ ├── kwj_Latn.yml
│ ├── kwn_Latn.yml
│ ├── kwy_Latn.yml
│ ├── kxc_Ethi.yml
│ ├── kxm_Thai.yml
│ ├── kxw_Latn.yml
│ ├── kyc_Latn.yml
│ ├── kyf_Latn.yml
│ ├── kyg_Latn.yml
│ ├── kyq_Latn.yml
│ ├── kyu_Kali.yml
│ ├── kyu_Latn.yml
│ ├── kyu_Mymr.yml
│ ├── kyz_Latn.yml
│ ├── kze_Latn.yml
│ ├── kzf_Latn.yml
│ ├── kzj_Latn.yml
│ ├── kzn_Latn.yml
│ ├── lac_Latn.yml
│ ├── lad_Hebr.yml
│ ├── lad_Latn.yml
│ ├── lai_Latn.yml
│ ├── laj_Latn.yml
│ ├── lam_Latn.yml
│ ├── lao_Laoo.yml
│ ├── lap_Latn.yml
│ ├── las_Latn.yml
│ ├── lat_Latn.yml
│ ├── law_Latn.yml
│ ├── lbb_Latn.yml
│ ├── lbe_Cyrl.yml
│ ├── lbj_Tibt.yml
│ ├── lbk_Latn.yml
│ ├── lcm_Latn.yml
│ ├── lcp_Thai.yml
│ ├── ldi_Latn.yml
│ ├── ldn_Latn.yml
│ ├── lea_Latn.yml
│ ├── led_Latn.yml
│ ├── lee_Latn.yml
│ ├── lef_Latn.yml
│ ├── leh_Latn.yml
│ ├── lem_Latn.yml
│ ├── leu_Latn.yml
│ ├── lew_Latn.yml
│ ├── lex_Latn.yml
│ ├── lez_Cyrl.yml
│ ├── lfn_Cyrl.yml
│ ├── lfn_Latn.yml
│ ├── lgg_Latn.yml
│ ├── lgl_Latn.yml
│ ├── lgm_Latn.yml
│ ├── lhi_Latn.yml
│ ├── lhu_Latn.yml
│ ├── lia_Latn.yml
│ ├── lid_Latn.yml
│ ├── lif_Deva.yml
│ ├── lif_Limb.yml
│ ├── lij_Latn.yml
│ ├── lim_Latn.yml
│ ├── lin_Latn.yml
│ ├── lip_Latn.yml
│ ├── lis_Lisu.yml
│ ├── lit_Latn.yml
│ ├── liv_Latn.yml
│ ├── ljp_Latn.yml
│ ├── lki_Arab.yml
│ ├── llb_Latn.yml
│ ├── lld_Latn.yml
│ ├── llg_Latn.yml
│ ├── lln_Latn.yml
│ ├── lmk_Latn.yml
│ ├── lmo_Latn.yml
│ ├── lmp_Latn.yml
│ ├── lnd_Latn.yml
│ ├── lob_Latn.yml
│ ├── loe_Latn.yml
│ ├── log_Latn.yml
│ ├── lok_Latn.yml
│ ├── lol_Latn.yml
│ ├── lom_Latn.yml
│ ├── loq_Latn.yml
│ ├── loz_Latn.yml
│ ├── lrc_Arab.yml
│ ├── lsi_Latn.yml
│ ├── lsm_Latn.yml
│ ├── ltg_Latn.yml
│ ├── ltz_Latn.yml
│ ├── lua_Latn.yml
│ ├── lub_Latn.yml
│ ├── luc_Latn.yml
│ ├── lud_Latn.yml
│ ├── lue_Latn.yml
│ ├── lug_Latn.yml
│ ├── lun_Latn.yml
│ ├── luo_Latn.yml
│ ├── lus_Latn.yml
│ ├── lvs_Latn.yml
│ ├── lwg_Latn.yml
│ ├── lwo_Latn.yml
│ ├── lww_Latn.yml
│ ├── lzh_Hani.yml
│ ├── maa_Latn.yml
│ ├── mad_Latn.yml
│ ├── maf_Latn.yml
│ ├── mag_Deva.yml
│ ├── mah_Latn.yml
│ ├── mai_Deva.yml
│ ├── maj_Latn.yml
│ ├── mak_Latn.yml
│ ├── mal_Latn.yml
│ ├── mal_Mlym.yml
│ ├── mam_Latn.yml
│ ├── maq_Latn.yml
│ ├── mar_Deva.yml
│ ├── mar_Latn.yml
│ ├── mas_Latn.yml
│ ├── mau_Latn.yml
│ ├── mav_Latn.yml
│ ├── maw_Latn.yml
│ ├── max_Latn.yml
│ ├── maz_Latn.yml
│ ├── mbb_Latn.yml
│ ├── mbc_Latn.yml
│ ├── mbd_Latn.yml
│ ├── mbf_Latn.yml
│ ├── mbh_Latn.yml
│ ├── mbi_Latn.yml
│ ├── mbj_Latn.yml
│ ├── mbl_Latn.yml
│ ├── mbs_Latn.yml
│ ├── mbt_Latn.yml
│ ├── mca_Latn.yml
│ ├── mcb_Latn.yml
│ ├── mcd_Latn.yml
│ ├── mcf_Latn.yml
│ ├── mck_Latn.yml
│ ├── mcn_Latn.yml
│ ├── mco_Latn.yml
│ ├── mcp_Latn.yml
│ ├── mcq_Latn.yml
│ ├── mcu_Latn.yml
│ ├── mda_Latn.yml
│ ├── mdf_Cyrl.yml
│ ├── mdy_Ethi.yml
│ ├── med_Latn.yml
│ ├── mee_Latn.yml
│ ├── mej_Latn.yml
│ ├── mek_Latn.yml
│ ├── men_Latn.yml
│ ├── meq_Latn.yml
│ ├── mer_Latn.yml
│ ├── met_Latn.yml
│ ├── meu_Latn.yml
│ ├── mev_Latn.yml
│ ├── mfe_Latn.yml
│ ├── mfg_Latn.yml
│ ├── mfh_Latn.yml
│ ├── mfi_Latn.yml
│ ├── mfk_Latn.yml
│ ├── mfq_Latn.yml
│ ├── mfy_Latn.yml
│ ├── mfz_Latn.yml
│ ├── mgc_Latn.yml
│ ├── mgh_Latn.yml
│ ├── mgm_Latn.yml
│ ├── mgo_Latn.yml
│ ├── mgr_Latn.yml
│ ├── mhi_Latn.yml
│ ├── mhl_Latn.yml
│ ├── mhr_Cyrl.yml
│ ├── mhw_Latn.yml
│ ├── mhx_Latn.yml
│ ├── mhy_Latn.yml
│ ├── mib_Latn.yml
│ ├── mic_Latn.yml
│ ├── mie_Latn.yml
│ ├── mif_Latn.yml
│ ├── mig_Latn.yml
│ ├── mih_Latn.yml
│ ├── mil_Latn.yml
│ ├── mim_Latn.yml
│ ├── min_Arab.yml
│ ├── min_Latn.yml
│ ├── mio_Latn.yml
│ ├── mip_Latn.yml
│ ├── miq_Latn.yml
│ ├── mir_Latn.yml
│ ├── mit_Latn.yml
│ ├── miy_Latn.yml
│ ├── miz_Latn.yml
│ ├── mjc_Latn.yml
│ ├── mjw_Latn.yml
│ ├── mkd_Cyrl.yml
│ ├── mkl_Latn.yml
│ ├── mkn_Latn.yml
│ ├── mks_Latn.yml
│ ├── mkz_Latn.yml
│ ├── mlh_Latn.yml
│ ├── mlp_Latn.yml
│ ├── mlt_Latn.yml
│ ├── mlu_Latn.yml
│ ├── mmn_Latn.yml
│ ├── mmo_Latn.yml
│ ├── mmx_Latn.yml
│ ├── mna_Latn.yml
│ ├── mnb_Latn.yml
│ ├── mnf_Latn.yml
│ ├── mni_Beng.yml
│ ├── mni_Latn.yml
│ ├── mni_Mtei.yml
│ ├── mnk_Latn.yml
│ ├── mns_Cyrl.yml
│ ├── mnw_Mymr.yml
│ ├── mnx_Latn.yml
│ ├── mny_Latn.yml
│ ├── moa_Latn.yml
│ ├── moc_Latn.yml
│ ├── mog_Latn.yml
│ ├── moh_Latn.yml
│ ├── mop_Latn.yml
│ ├── mor_Latn.yml
│ ├── mos_Latn.yml
│ ├── mox_Latn.yml
│ ├── mpg_Latn.yml
│ ├── mph_Latn.yml
│ ├── mpm_Latn.yml
│ ├── mpp_Latn.yml
│ ├── mps_Latn.yml
│ ├── mpt_Latn.yml
│ ├── mpx_Latn.yml
│ ├── mqb_Latn.yml
│ ├── mqj_Latn.yml
│ ├── mqy_Latn.yml
│ ├── mrg_Latn.yml
│ ├── mri_Latn.yml
│ ├── mrj_Cyrl.yml
│ ├── mrq_Latn.yml
│ ├── mrv_Latn.yml
│ ├── mrw_Latn.yml
│ ├── msb_Latn.yml
│ ├── msc_Latn.yml
│ ├── mse_Latn.yml
│ ├── msk_Latn.yml
│ ├── msy_Latn.yml
│ ├── mta_Latn.yml
│ ├── mtg_Latn.yml
│ ├── mti_Latn.yml
│ ├── mtj_Latn.yml
│ ├── mto_Latn.yml
│ ├── mtp_Latn.yml
│ ├── mua_Latn.yml
│ ├── mug_Latn.yml
│ ├── muh_Latn.yml
│ ├── mui_Latn.yml
│ ├── mup_Deva.yml
│ ├── mur_Latn.yml
│ ├── mus_Latn.yml
│ ├── mux_Latn.yml
│ ├── muy_Latn.yml
│ ├── mva_Latn.yml
│ ├── mvn_Latn.yml
│ ├── mvp_Latn.yml
│ ├── mwc_Latn.yml
│ ├── mwf_Latn.yml
│ ├── mwl_Latn.yml
│ ├── mwm_Latn.yml
│ ├── mwn_Latn.yml
│ ├── mwp_Latn.yml
│ ├── mwq_Latn.yml
│ ├── mwv_Latn.yml
│ ├── mww_Latn.yml
│ ├── mxb_Latn.yml
│ ├── mxp_Latn.yml
│ ├── mxq_Latn.yml
│ ├── mxt_Latn.yml
│ ├── mxv_Latn.yml
│ ├── mya_Mymr.yml
│ ├── myb_Latn.yml
│ ├── myk_Latn.yml
│ ├── myu_Latn.yml
│ ├── myv_Cyrl.yml
│ ├── myw_Latn.yml
│ ├── myx_Latn.yml
│ ├── myy_Latn.yml
│ ├── mza_Latn.yml
│ ├── mzh_Latn.yml
│ ├── mzk_Latn.yml
│ ├── mzl_Latn.yml
│ ├── mzm_Latn.yml
│ ├── mzn_Arab.yml
│ ├── mzw_Latn.yml
│ ├── mzz_Latn.yml
│ ├── nab_Latn.yml
│ ├── naf_Latn.yml
│ ├── nah_Latn.yml
│ ├── nak_Latn.yml
│ ├── nan_Latn.yml
│ ├── nap_Latn.yml
│ ├── naq_Latn.yml
│ ├── nas_Latn.yml
│ ├── nav_Latn.yml
│ ├── naw_Latn.yml
│ ├── nba_Latn.yml
│ ├── nbc_Latn.yml
│ ├── nbe_Latn.yml
│ ├── nbl_Latn.yml
│ ├── nbq_Latn.yml
│ ├── nbu_Latn.yml
│ ├── nca_Latn.yml
│ ├── nch_Latn.yml
│ ├── ncj_Latn.yml
│ ├── ncl_Latn.yml
│ ├── ncq_Laoo.yml
│ ├── nct_Latn.yml
│ ├── ncu_Latn.yml
│ ├── ncx_Latn.yml
│ ├── ndc_Latn.yml
│ ├── nde_Latn.yml
│ ├── ndh_Latn.yml
│ ├── ndi_Latn.yml
│ ├── ndj_Latn.yml
│ ├── ndo_Latn.yml
│ ├── ndp_Latn.yml
│ ├── nds_Latn.yml
│ ├── ndy_Latn.yml
│ ├── ndz_Latn.yml
│ ├── neb_Latn.yml
│ ├── new_Deva.yml
│ ├── nfa_Latn.yml
│ ├── nfr_Latn.yml
│ ├── ngb_Latn.yml
│ ├── ngc_Latn.yml
│ ├── ngl_Latn.yml
│ ├── ngp_Latn.yml
│ ├── ngu_Latn.yml
│ ├── nhd_Latn.yml
│ ├── nhe_Latn.yml
│ ├── nhg_Latn.yml
│ ├── nhi_Latn.yml
│ ├── nhk_Latn.yml
│ ├── nho_Latn.yml
│ ├── nhr_Latn.yml
│ ├── nhu_Latn.yml
│ ├── nhw_Latn.yml
│ ├── nhx_Latn.yml
│ ├── nhy_Latn.yml
│ ├── nia_Latn.yml
│ ├── nif_Latn.yml
│ ├── nii_Latn.yml
│ ├── nij_Latn.yml
│ ├── nim_Latn.yml
│ ├── nin_Latn.yml
│ ├── nio_Cyrl.yml
│ ├── niq_Latn.yml
│ ├── niu_Latn.yml
│ ├── niy_Latn.yml
│ ├── njb_Latn.yml
│ ├── njm_Latn.yml
│ ├── njn_Latn.yml
│ ├── njo_Latn.yml
│ ├── njz_Latn.yml
│ ├── nkf_Latn.yml
│ ├── nki_Latn.yml
│ ├── nko_Latn.yml
│ ├── nla_Latn.yml
│ ├── nlc_Latn.yml
│ ├── nld_Latn.yml
│ ├── nlg_Latn.yml
│ ├── nma_Latn.yml
│ ├── nmf_Latn.yml
│ ├── nmh_Latn.yml
│ ├── nmo_Latn.yml
│ ├── nmw_Latn.yml
│ ├── nmz_Latn.yml
│ ├── nnb_Latn.yml
│ ├── nng_Latn.yml
│ ├── nnh_Latn.yml
│ ├── nnl_Latn.yml
│ ├── nno_Latn.yml
│ ├── nnp_Latn.yml
│ ├── nnq_Latn.yml
│ ├── nnw_Latn.yml
│ ├── noa_Latn.yml
│ ├── nob_Latn.yml
│ ├── nod_Thai.yml
│ ├── nog_Cyrl.yml
│ ├── non_Latn.yml
│ ├── nop_Latn.yml
│ ├── not_Latn.yml
│ ├── nou_Latn.yml
│ ├── nov_Latn.yml
│ ├── nph_Latn.yml
│ ├── npi_Deva.yml
│ ├── npi_Latn.yml
│ ├── npl_Latn.yml
│ ├── npo_Latn.yml
│ ├── npy_Latn.yml
│ ├── nqo_Nkoo.yml
│ ├── nre_Latn.yml
│ ├── nrf_Latn.yml
│ ├── nri_Latn.yml
│ ├── nrm_Latn.yml
│ ├── nsa_Latn.yml
│ ├── nse_Latn.yml
│ ├── nsm_Latn.yml
│ ├── nsn_Latn.yml
│ ├── nso_Latn.yml
│ ├── nss_Latn.yml
│ ├── nst_Latn.yml
│ ├── nsu_Latn.yml
│ ├── ntp_Latn.yml
│ ├── ntr_Latn.yml
│ ├── ntu_Latn.yml
│ ├── nuj_Latn.yml
│ ├── nus_Latn.yml
│ ├── nuy_Latn.yml
│ ├── nuz_Latn.yml
│ ├── nvm_Latn.yml
│ ├── nwb_Latn.yml
│ ├── nwi_Latn.yml
│ ├── nwx_Deva.yml
│ ├── nxd_Latn.yml
│ ├── nya_Latn.yml
│ ├── nyf_Latn.yml
│ ├── nyk_Latn.yml
│ ├── nyn_Latn.yml
│ ├── nyo_Latn.yml
│ ├── nyu_Latn.yml
│ ├── nyy_Latn.yml
│ ├── nza_Latn.yml
│ ├── nzi_Latn.yml
│ ├── nzm_Latn.yml
│ ├── obo_Latn.yml
│ ├── oci_Latn.yml
│ ├── ogo_Latn.yml
│ ├── ojb_Cans.yml
│ ├── ojb_Latn.yml
│ ├── oke_Latn.yml
│ ├── oku_Latn.yml
│ ├── okv_Latn.yml
│ ├── old_Latn.yml
│ ├── olo_Latn.yml
│ ├── omb_Latn.yml
│ ├── omw_Latn.yml
│ ├── ong_Latn.yml
│ ├── ons_Latn.yml
│ ├── ood_Latn.yml
│ ├── opm_Latn.yml
│ ├── orv_Cyrl.yml
│ ├── ory_Latn.yml
│ ├── ory_Orya.yml
│ ├── oss_Cyrl.yml
│ ├── ota_Arab.yml
│ ├── otd_Latn.yml
│ ├── ote_Latn.yml
│ ├── otm_Latn.yml
│ ├── otn_Latn.yml
│ ├── oto_Latn.yml
│ ├── otq_Latn.yml
│ ├── ots_Latn.yml
│ ├── otw_Latn.yml
│ ├── oym_Latn.yml
│ ├── ozm_Latn.yml
│ ├── pab_Latn.yml
│ ├── pad_Latn.yml
│ ├── pag_Latn.yml
│ ├── pah_Latn.yml
│ ├── pam_Latn.yml
│ ├── pan_Guru.yml
│ ├── pan_Latn.yml
│ ├── pao_Latn.yml
│ ├── pap_Latn.yml
│ ├── pau_Latn.yml
│ ├── pbb_Latn.yml
│ ├── pbc_Latn.yml
│ ├── pbi_Latn.yml
│ ├── pbt_Arab.yml
│ ├── pcd_Latn.yml
│ ├── pck_Latn.yml
│ ├── pcm_Latn.yml
│ ├── pdc_Latn.yml
│ ├── pdt_Latn.yml
│ ├── pem_Latn.yml
│ ├── pfe_Latn.yml
│ ├── pfl_Latn.yml
│ ├── phm_Latn.yml
│ ├── pib_Latn.yml
│ ├── pio_Latn.yml
│ ├── pir_Latn.yml
│ ├── pis_Latn.yml
│ ├── pjt_Latn.yml
│ ├── pkb_Latn.yml
│ ├── plg_Latn.yml
│ ├── pls_Latn.yml
│ ├── plt_Latn.yml
│ ├── plu_Latn.yml
│ ├── plw_Latn.yml
│ ├── pma_Latn.yml
│ ├── pmf_Latn.yml
│ ├── pmq_Latn.yml
│ ├── pms_Latn.yml
│ ├── pmx_Latn.yml
│ ├── pnb_Arab.yml
│ ├── pne_Latn.yml
│ ├── pnt_Grek.yml
│ ├── pny_Latn.yml
│ ├── poe_Latn.yml
│ ├── poh_Latn.yml
│ ├── poi_Latn.yml
│ ├── pol_Latn.yml
│ ├── pon_Latn.yml
│ ├── por_Latn.yml
│ ├── pos_Latn.yml
│ ├── pot_Latn.yml
│ ├── pov_Latn.yml
│ ├── poy_Latn.yml
│ ├── ppk_Latn.yml
│ ├── ppo_Latn.yml
│ ├── pps_Latn.yml
│ ├── prf_Latn.yml
│ ├── prg_Latn.yml
│ ├── pri_Latn.yml
│ ├── prq_Latn.yml
│ ├── pse_Latn.yml
│ ├── pss_Latn.yml
│ ├── ptp_Latn.yml
│ ├── ptu_Latn.yml
│ ├── pua_Latn.yml
│ ├── pui_Latn.yml
│ ├── pwg_Latn.yml
│ ├── pwn_Latn.yml
│ ├── pww_Thai.yml
│ ├── pxm_Latn.yml
│ ├── qub_Latn.yml
│ ├── quc_Latn.yml
│ ├── quf_Latn.yml
│ ├── qug_Latn.yml
│ ├── quh_Latn.yml
│ ├── qul_Latn.yml
│ ├── qup_Latn.yml
│ ├── qus_Latn.yml
│ ├── quw_Latn.yml
│ ├── quy_Latn.yml
│ ├── quz_Latn.yml
│ ├── qva_Latn.yml
│ ├── qvc_Latn.yml
│ ├── qve_Latn.yml
│ ├── qvh_Latn.yml
│ ├── qvi_Latn.yml
│ ├── qvm_Latn.yml
│ ├── qvn_Latn.yml
│ ├── qvo_Latn.yml
│ ├── qvs_Latn.yml
│ ├── qvw_Latn.yml
│ ├── qvz_Latn.yml
│ ├── qwh_Latn.yml
│ ├── qxh_Latn.yml
│ ├── qxl_Latn.yml
│ ├── qxn_Latn.yml
│ ├── qxo_Latn.yml
│ ├── qxr_Latn.yml
│ ├── rad_Latn.yml
│ ├── rai_Latn.yml
│ ├── rap_Latn.yml
│ ├── rar_Latn.yml
│ ├── rav_Deva.yml
│ ├── raw_Latn.yml
│ ├── rcf_Latn.yml
│ ├── rej_Latn.yml
│ ├── rel_Latn.yml
│ ├── rgu_Latn.yml
│ ├── rhg_Latn.yml
│ ├── ria_Latn.yml
│ ├── rim_Latn.yml
│ ├── rjs_Deva.yml
│ ├── rkb_Latn.yml
│ ├── rmc_Latn.yml
│ ├── rme_Latn.yml
│ ├── rml_Latn.yml
│ ├── rmn_Cyrl.yml
│ ├── rmn_Grek.yml
│ ├── rmn_Latn.yml
│ ├── rmo_Latn.yml
│ ├── rmq_Latn.yml
│ ├── rmy_Cyrl.yml
│ ├── rmy_Latn.yml
│ ├── rnd_Latn.yml
│ ├── rng_Latn.yml
│ ├── rnl_Latn.yml
│ ├── roh_Latn.yml
│ ├── ron_Cyrl.yml
│ ├── ron_Latn.yml
│ ├── roo_Latn.yml
│ ├── rop_Latn.yml
│ ├── row_Latn.yml
│ ├── rro_Latn.yml
│ ├── rtm_Latn.yml
│ ├── rub_Latn.yml
│ ├── rue_Cyrl.yml
│ ├── ruf_Latn.yml
│ ├── rug_Latn.yml
│ ├── run_Latn.yml
│ ├── rup_Latn.yml
│ ├── rus_Cyrl.yml
│ ├── rwo_Latn.yml
│ ├── sab_Latn.yml
│ ├── sag_Latn.yml
│ ├── sah_Cyrl.yml
│ ├── saj_Latn.yml
│ ├── san_Deva.yml
│ ├── san_Latn.yml
│ ├── sas_Latn.yml
│ ├── sat_Latn.yml
│ ├── sat_Olck.yml
│ ├── say_Latn.yml
│ ├── sba_Latn.yml
│ ├── sbd_Latn.yml
│ ├── sbe_Latn.yml
│ ├── sbl_Latn.yml
│ ├── sbs_Latn.yml
│ ├── sby_Latn.yml
│ ├── sck_Deva.yml
│ ├── scn_Latn.yml
│ ├── sco_Latn.yml
│ ├── sda_Latn.yml
│ ├── sdc_Latn.yml
│ ├── sdh_Arab.yml
│ ├── sdo_Latn.yml
│ ├── sdq_Latn.yml
│ ├── seh_Latn.yml
│ ├── sel_Cyrl.yml
│ ├── ses_Latn.yml
│ ├── sey_Latn.yml
│ ├── sfw_Latn.yml
│ ├── sgb_Latn.yml
│ ├── sgc_Latn.yml
│ ├── sgh_Cyrl.yml
│ ├── sgs_Latn.yml
│ ├── sgw_Ethi.yml
│ ├── sgz_Latn.yml
│ ├── shi_Latn.yml
│ ├── shk_Latn.yml
│ ├── shn_Mymr.yml
│ ├── shp_Latn.yml
│ ├── shu_Arab.yml
│ ├── sid_Latn.yml
│ ├── sig_Latn.yml
│ ├── sil_Latn.yml
│ ├── sim_Latn.yml
│ ├── sin_Sinh.yml
│ ├── sja_Latn.yml
│ ├── sjo_Mong.yml
│ ├── sju_Latn.yml
│ ├── skg_Latn.yml
│ ├── skr_Arab.yml
│ ├── sld_Latn.yml
│ ├── slk_Latn.yml
│ ├── sll_Latn.yml
│ ├── slv_Latn.yml
│ ├── sma_Latn.yml
│ ├── sme_Latn.yml
│ ├── smj_Latn.yml
│ ├── smk_Latn.yml
│ ├── sml_Latn.yml
│ ├── smn_Latn.yml
│ ├── smo_Latn.yml
│ ├── sms_Latn.yml
│ ├── smt_Latn.yml
│ ├── sna_Latn.yml
│ ├── snc_Latn.yml
│ ├── snd_Arab.yml
│ ├── snd_Deva.yml
│ ├── snd_Latn.yml
│ ├── snf_Latn.yml
│ ├── snn_Latn.yml
│ ├── snp_Latn.yml
│ ├── snw_Latn.yml
│ ├── sny_Latn.yml
│ ├── soe_Latn.yml
│ ├── som_Latn.yml
│ ├── sop_Latn.yml
│ ├── soq_Latn.yml
│ ├── sot_Latn.yml
│ ├── soy_Latn.yml
│ ├── spa_Latn.yml
│ ├── spl_Latn.yml
│ ├── spm_Latn.yml
│ ├── spp_Latn.yml
│ ├── sps_Latn.yml
│ ├── spy_Latn.yml
│ ├── srd_Latn.yml
│ ├── sri_Latn.yml
│ ├── srm_Latn.yml
│ ├── srn_Latn.yml
│ ├── srp_Cyrl.yml
│ ├── srp_Latn.yml
│ ├── srq_Latn.yml
│ ├── srr_Latn.yml
│ ├── ssd_Latn.yml
│ ├── ssg_Latn.yml
│ ├── ssw_Latn.yml
│ ├── ssx_Latn.yml
│ ├── stn_Latn.yml
│ ├── stp_Latn.yml
│ ├── stq_Latn.yml
│ ├── sua_Latn.yml
│ ├── suc_Latn.yml
│ ├── sue_Latn.yml
│ ├── suk_Latn.yml
│ ├── sun_Latn.yml
│ ├── sur_Latn.yml
│ ├── sus_Arab.yml
│ ├── sus_Latn.yml
│ ├── suz_Deva.yml
│ ├── swb_Latn.yml
│ ├── swc_Latn.yml
│ ├── swe_Latn.yml
│ ├── swg_Latn.yml
│ ├── swh_Latn.yml
│ ├── swk_Latn.yml
│ ├── swp_Latn.yml
│ ├── sxb_Latn.yml
│ ├── sxn_Latn.yml
│ ├── syb_Latn.yml
│ ├── syc_Syrc.yml
│ ├── syl_Beng.yml
│ ├── syl_Latn.yml
│ ├── szb_Latn.yml
│ ├── szl_Latn.yml
│ ├── szy_Latn.yml
│ ├── tab_Cyrl.yml
│ ├── tac_Latn.yml
│ ├── tah_Latn.yml
│ ├── taj_Deva.yml
│ ├── tam_Latn.yml
│ ├── tam_Taml.yml
│ ├── tap_Latn.yml
│ ├── taq_Latn.yml
│ ├── taq_Tfng.yml
│ ├── tar_Latn.yml
│ ├── tat_Cyrl.yml
│ ├── tat_Latn.yml
│ ├── tav_Latn.yml
│ ├── taw_Latn.yml
│ ├── tay_Latn.yml
│ ├── tbc_Latn.yml
│ ├── tbg_Latn.yml
│ ├── tbk_Latn.yml
│ ├── tbl_Latn.yml
│ ├── tbo_Latn.yml
│ ├── tbw_Latn.yml
│ ├── tby_Latn.yml
│ ├── tbz_Latn.yml
│ ├── tca_Latn.yml
│ ├── tcc_Latn.yml
│ ├── tcf_Latn.yml
│ ├── tcs_Latn.yml
│ ├── tcy_Knda.yml
│ ├── tcz_Latn.yml
│ ├── tdx_Latn.yml
│ ├── ted_Latn.yml
│ ├── tee_Latn.yml
│ ├── tel_Latn.yml
│ ├── tel_Telu.yml
│ ├── tem_Latn.yml
│ ├── teo_Latn.yml
│ ├── ter_Latn.yml
│ ├── tet_Latn.yml
│ ├── tew_Latn.yml
│ ├── tfr_Latn.yml
│ ├── tgk_Cyrl.yml
│ ├── tgo_Latn.yml
│ ├── tgp_Latn.yml
│ ├── tha_Thai.yml
│ ├── thk_Latn.yml
│ ├── thl_Deva.yml
│ ├── thv_Latn.yml
│ ├── tif_Latn.yml
│ ├── tig_Ethi.yml
│ ├── tih_Latn.yml
│ ├── tik_Latn.yml
│ ├── tim_Latn.yml
│ ├── tir_Ethi.yml
│ ├── tiv_Latn.yml
│ ├── tiy_Latn.yml
│ ├── tke_Latn.yml
│ ├── tkl_Latn.yml
│ ├── tkr_Cyrl.yml
│ ├── tku_Latn.yml
│ ├── tlb_Latn.yml
│ ├── tlf_Latn.yml
│ ├── tlh_Latn.yml
│ ├── tlj_Latn.yml
│ ├── tll_Latn.yml
│ ├── tly_Latn.yml
│ ├── tmc_Latn.yml
│ ├── tmd_Latn.yml
│ ├── tna_Latn.yml
│ ├── tnc_Latn.yml
│ ├── tnk_Latn.yml
│ ├── tnn_Latn.yml
│ ├── tnp_Latn.yml
│ ├── tnr_Latn.yml
│ ├── tob_Latn.yml
│ ├── toc_Latn.yml
│ ├── tod_Latn.yml
│ ├── tog_Latn.yml
│ ├── toh_Latn.yml
│ ├── toi_Latn.yml
│ ├── toj_Latn.yml
│ ├── tok_Latn.yml
│ ├── ton_Latn.yml
│ ├── too_Latn.yml
│ ├── top_Latn.yml
│ ├── tos_Latn.yml
│ ├── tpa_Latn.yml
│ ├── tpi_Latn.yml
│ ├── tpm_Latn.yml
│ ├── tpn_Latn.yml
│ ├── tpp_Latn.yml
│ ├── tpt_Latn.yml
│ ├── tpw_Latn.yml
│ ├── tpz_Latn.yml
│ ├── tqo_Latn.yml
│ ├── trc_Latn.yml
│ ├── trn_Latn.yml
│ ├── tro_Latn.yml
│ ├── trp_Latn.yml
│ ├── trq_Latn.yml
│ ├── trs_Latn.yml
│ ├── trv_Latn.yml
│ ├── tsc_Latn.yml
│ ├── tsg_Latn.yml
│ ├── tsn_Latn.yml
│ ├── tso_Latn.yml
│ ├── tsw_Latn.yml
│ ├── tsz_Latn.yml
│ ├── ttc_Latn.yml
│ ├── tte_Latn.yml
│ ├── ttj_Latn.yml
│ ├── ttq_Latn.yml
│ ├── ttq_Tfng.yml
│ ├── tuc_Latn.yml
│ ├── tue_Latn.yml
│ ├── tuf_Latn.yml
│ ├── tui_Latn.yml
│ ├── tuk_Arab.yml
│ ├── tuk_Cyrl.yml
│ ├── tuk_Latn.yml
│ ├── tul_Latn.yml
│ ├── tum_Latn.yml
│ ├── tuo_Latn.yml
│ ├── tur_Latn.yml
│ ├── tuv_Latn.yml
│ ├── tvk_Latn.yml
│ ├── tvl_Latn.yml
│ ├── twb_Latn.yml
│ ├── twi_Latn.yml
│ ├── twu_Latn.yml
│ ├── twx_Latn.yml
│ ├── txq_Latn.yml
│ ├── txu_Latn.yml
│ ├── tyv_Cyrl.yml
│ ├── tzh_Latn.yml
│ ├── tzj_Latn.yml
│ ├── tzl_Latn.yml
│ ├── tzm_Tfng.yml
│ ├── tzo_Latn.yml
│ ├── ubr_Latn.yml
│ ├── ubu_Latn.yml
│ ├── udm_Cyrl.yml
│ ├── udu_Latn.yml
│ ├── uig_Arab.yml
│ ├── uig_Cyrl.yml
│ ├── uig_Latn.yml
│ ├── ukr_Cyrl.yml
│ ├── umb_Latn.yml
│ ├── upv_Latn.yml
│ ├── ura_Latn.yml
│ ├── urb_Latn.yml
│ ├── urd_Arab.yml
│ ├── urd_Latn.yml
│ ├── urh_Latn.yml
│ ├── uri_Latn.yml
│ ├── urk_Thai.yml
│ ├── urt_Latn.yml
│ ├── urw_Latn.yml
│ ├── ury_Latn.yml
│ ├── usa_Latn.yml
│ ├── usp_Latn.yml
│ ├── uth_Latn.yml
│ ├── uvh_Latn.yml
│ ├── uvl_Latn.yml
│ ├── uzn_Cyrl.yml
│ ├── uzn_Latn.yml
│ ├── uzs_Arab.yml
│ ├── vag_Latn.yml
│ ├── vap_Latn.yml
│ ├── var_Latn.yml
│ ├── vec_Latn.yml
│ ├── ven_Latn.yml
│ ├── vep_Latn.yml
│ ├── vid_Latn.yml
│ ├── vie_Latn.yml
│ ├── viv_Latn.yml
│ ├── vls_Latn.yml
│ ├── vmk_Latn.yml
│ ├── vmw_Latn.yml
│ ├── vmy_Latn.yml
│ ├── vol_Latn.yml
│ ├── vot_Latn.yml
│ ├── vro_Latn.yml
│ ├── vun_Latn.yml
│ ├── vut_Latn.yml
│ ├── waj_Latn.yml
│ ├── wal_Ethi.yml
│ ├── wal_Latn.yml
│ ├── wap_Latn.yml
│ ├── war_Latn.yml
│ ├── wat_Latn.yml
│ ├── way_Latn.yml
│ ├── wba_Latn.yml
│ ├── wbm_Latn.yml
│ ├── wbp_Latn.yml
│ ├── wed_Latn.yml
│ ├── wer_Latn.yml
│ ├── wes_Latn.yml
│ ├── wew_Latn.yml
│ ├── whg_Latn.yml
│ ├── whk_Latn.yml
│ ├── wib_Latn.yml
│ ├── wim_Latn.yml
│ ├── wiu_Latn.yml
│ ├── wln_Latn.yml
│ ├── wls_Latn.yml
│ ├── wlv_Latn.yml
│ ├── wlx_Latn.yml
│ ├── wmt_Latn.yml
│ ├── wmw_Latn.yml
│ ├── wnc_Latn.yml
│ ├── wnu_Latn.yml
│ ├── wob_Latn.yml
│ ├── wol_Latn.yml
│ ├── wos_Latn.yml
│ ├── wrk_Latn.yml
│ ├── wrs_Latn.yml
│ ├── wsg_Telu.yml
│ ├── wsk_Latn.yml
│ ├── wuu_Hani.yml
│ ├── wuv_Latn.yml
│ ├── wwa_Latn.yml
│ ├── xal_Cyrl.yml
│ ├── xav_Latn.yml
│ ├── xbi_Latn.yml
│ ├── xbr_Latn.yml
│ ├── xed_Latn.yml
│ ├── xho_Latn.yml
│ ├── xla_Latn.yml
│ ├── xmf_Geor.yml
│ ├── xmm_Latn.yml
│ ├── xmv_Latn.yml
│ ├── xnn_Latn.yml
│ ├── xog_Latn.yml
│ ├── xon_Latn.yml
│ ├── xrb_Latn.yml
│ ├── xsb_Latn.yml
│ ├── xsi_Latn.yml
│ ├── xsm_Latn.yml
│ ├── xsr_Deva.yml
│ ├── xsu_Latn.yml
│ ├── xtd_Latn.yml
│ ├── xtm_Latn.yml
│ ├── xtn_Latn.yml
│ ├── xum_Latn.yml
│ ├── xuo_Latn.yml
│ ├── yaa_Latn.yml
│ ├── yad_Latn.yml
│ ├── yal_Latn.yml
│ ├── yam_Latn.yml
│ ├── yan_Latn.yml
│ ├── yao_Latn.yml
│ ├── yap_Latn.yml
│ ├── yaq_Latn.yml
│ ├── yas_Latn.yml
│ ├── yat_Latn.yml
│ ├── yaz_Latn.yml
│ ├── ybb_Latn.yml
│ ├── yby_Latn.yml
│ ├── ycn_Latn.yml
│ ├── ydd_Hebr.yml
│ ├── yim_Latn.yml
│ ├── yka_Latn.yml
│ ├── yle_Latn.yml
│ ├── yli_Latn.yml
│ ├── yml_Latn.yml
│ ├── yom_Latn.yml
│ ├── yon_Latn.yml
│ ├── yor_Latn.yml
│ ├── yrb_Latn.yml
│ ├── yre_Latn.yml
│ ├── yrk_Cyrl.yml
│ ├── yrl_Latn.yml
│ ├── yss_Latn.yml
│ ├── yua_Latn.yml
│ ├── yue_Hani.yml
│ ├── yuj_Latn.yml
│ ├── yup_Latn.yml
│ ├── yut_Latn.yml
│ ├── yuw_Latn.yml
│ ├── yuz_Latn.yml
│ ├── yva_Latn.yml
│ ├── zaa_Latn.yml
│ ├── zab_Latn.yml
│ ├── zac_Latn.yml
│ ├── zad_Latn.yml
│ ├── zae_Latn.yml
│ ├── zai_Latn.yml
│ ├── zam_Latn.yml
│ ├── zao_Latn.yml
│ ├── zar_Latn.yml
│ ├── zas_Latn.yml
│ ├── zat_Latn.yml
│ ├── zav_Latn.yml
│ ├── zaw_Latn.yml
│ ├── zca_Latn.yml
│ ├── zdj_Latn.yml
│ ├── zea_Latn.yml
│ ├── zgh_Tfng.yml
│ ├── zia_Latn.yml
│ ├── ziw_Latn.yml
│ ├── zne_Latn.yml
│ ├── zoc_Latn.yml
│ ├── zom_Latn.yml
│ ├── zos_Latn.yml
│ ├── zpa_Latn.yml
│ ├── zpc_Latn.yml
│ ├── zpg_Latn.yml
│ ├── zpi_Latn.yml
│ ├── zpj_Latn.yml
│ ├── zpl_Latn.yml
│ ├── zpm_Latn.yml
│ ├── zpo_Latn.yml
│ ├── zpq_Latn.yml
│ ├── zpt_Latn.yml
│ ├── zpu_Latn.yml
│ ├── zpv_Latn.yml
│ ├── zpz_Latn.yml
│ ├── zsm_Arab.yml
│ ├── zsm_Latn.yml
│ ├── zsr_Latn.yml
│ ├── ztq_Latn.yml
│ ├── zty_Latn.yml
│ ├── zul_Latn.yml
│ ├── zyb_Latn.yml
│ └── zyp_Latn.yml
├── fineweb-2-pipeline.py
├── fineweb2-language-distribution.csv
└── misc/
├── precision_filtering/
│ ├── README.md
│ ├── audits/
│ │ ├── ary_Arab.tsv
│ │ ├── bar_Latn.tsv
│ │ ├── glk_Arab.tsv
│ │ ├── pcm_Latn.csv
│ │ └── pcm_Latn.tsv
│ ├── cont_scores.json
│ ├── count_common.py
│ ├── run_precision_filtering.py
│ ├── slurm_count_word.py
│ ├── url_whitelist.json
│ ├── wordlist_gen.py
│ ├── wordlist_score.py
│ ├── wordlists-0.85/
│ │ ├── aai_Latn.txt
│ │ ├── aak_Latn.txt
│ │ ├── aau_Latn.txt
│ │ ├── aaz_Latn.txt
│ │ ├── aba_Latn.txt
│ │ ├── abi_Latn.txt
│ │ ├── abk_Cyrl.txt
│ │ ├── abn_Latn.txt
│ │ ├── abq_Cyrl.txt
│ │ ├── abs_Latn.txt
│ │ ├── abt_Latn.txt
│ │ ├── abx_Latn.txt
│ │ ├── aby_Latn.txt
│ │ ├── abz_Latn.txt
│ │ ├── aca_Latn.txt
│ │ ├── acd_Latn.txt
│ │ ├── ace_Arab.txt
│ │ ├── ace_Latn.txt
│ │ ├── acf_Latn.txt
│ │ ├── ach_Latn.txt
│ │ ├── acm_Arab.txt
│ │ ├── acn_Latn.txt
│ │ ├── acr_Latn.txt
│ │ ├── acu_Latn.txt
│ │ ├── ada_Latn.txt
│ │ ├── ade_Latn.txt
│ │ ├── adh_Latn.txt
│ │ ├── adi_Latn.txt
│ │ ├── adj_Latn.txt
│ │ ├── adl_Latn.txt
│ │ ├── ady_Cyrl.txt
│ │ ├── adz_Latn.txt
│ │ ├── aeb_Arab.txt
│ │ ├── aer_Latn.txt
│ │ ├── aeu_Latn.txt
│ │ ├── aey_Latn.txt
│ │ ├── afr_Latn.txt
│ │ ├── agd_Latn.txt
│ │ ├── agg_Latn.txt
│ │ ├── agm_Latn.txt
│ │ ├── agn_Latn.txt
│ │ ├── agr_Latn.txt
│ │ ├── agt_Latn.txt
│ │ ├── agu_Latn.txt
│ │ ├── agw_Latn.txt
│ │ ├── agx_Cyrl.txt
│ │ ├── aha_Latn.txt
│ │ ├── ahk_Latn.txt
│ │ ├── aia_Latn.txt
│ │ ├── aii_Syrc.txt
│ │ ├── aim_Latn.txt
│ │ ├── ain_Latn.txt
│ │ ├── ajg_Latn.txt
│ │ ├── aji_Latn.txt
│ │ ├── ajz_Latn.txt
│ │ ├── akb_Latn.txt
│ │ ├── ake_Latn.txt
│ │ ├── akh_Latn.txt
│ │ ├── akp_Latn.txt
│ │ ├── ald_Latn.txt
│ │ ├── alj_Latn.txt
│ │ ├── aln_Latn.txt
│ │ ├── alp_Latn.txt
│ │ ├── alq_Latn.txt
│ │ ├── als_Latn.txt
│ │ ├── alt_Cyrl.txt
│ │ ├── aly_Latn.txt
│ │ ├── alz_Latn.txt
│ │ ├── ame_Latn.txt
│ │ ├── amf_Latn.txt
│ │ ├── amh_Ethi.txt
│ │ ├── ami_Latn.txt
│ │ ├── amk_Latn.txt
│ │ ├── amm_Latn.txt
│ │ ├── amn_Latn.txt
│ │ ├── amp_Latn.txt
│ │ ├── amr_Latn.txt
│ │ ├── amu_Latn.txt
│ │ ├── amx_Latn.txt
│ │ ├── ang_Latn.txt
│ │ ├── anm_Latn.txt
│ │ ├── ann_Latn.txt
│ │ ├── anp_Deva.txt
│ │ ├── anv_Latn.txt
│ │ ├── any_Latn.txt
│ │ ├── aoi_Latn.txt
│ │ ├── aoj_Latn.txt
│ │ ├── aom_Latn.txt
│ │ ├── aoz_Latn.txt
│ │ ├── apb_Latn.txt
│ │ ├── apc_Arab.txt
│ │ ├── ape_Latn.txt
│ │ ├── apn_Latn.txt
│ │ ├── apr_Latn.txt
│ │ ├── apt_Latn.txt
│ │ ├── apu_Latn.txt
│ │ ├── apw_Latn.txt
│ │ ├── apy_Latn.txt
│ │ ├── apz_Latn.txt
│ │ ├── aqz_Latn.txt
│ │ ├── arb_Arab.txt
│ │ ├── arb_Latn.txt
│ │ ├── are_Latn.txt
│ │ ├── arg_Latn.txt
│ │ ├── arl_Latn.txt
│ │ ├── arn_Latn.txt
│ │ ├── arp_Latn.txt
│ │ ├── arq_Arab.txt
│ │ ├── arr_Latn.txt
│ │ ├── ars_Arab.txt
│ │ ├── ary_Arab.txt
│ │ ├── arz_Arab.txt
│ │ ├── asg_Latn.txt
│ │ ├── asm_Beng.txt
│ │ ├── asm_Latn.txt
│ │ ├── aso_Latn.txt
│ │ ├── ast_Latn.txt
│ │ ├── ata_Latn.txt
│ │ ├── atb_Latn.txt
│ │ ├── atd_Latn.txt
│ │ ├── atg_Latn.txt
│ │ ├── ati_Latn.txt
│ │ ├── atj_Latn.txt
│ │ ├── atq_Latn.txt
│ │ ├── att_Latn.txt
│ │ ├── auc_Latn.txt
│ │ ├── aui_Latn.txt
│ │ ├── auy_Latn.txt
│ │ ├── ava_Cyrl.txt
│ │ ├── avk_Latn.txt
│ │ ├── avn_Latn.txt
│ │ ├── avt_Latn.txt
│ │ ├── avu_Latn.txt
│ │ ├── awa_Deva.txt
│ │ ├── awb_Latn.txt
│ │ ├── awi_Latn.txt
│ │ ├── awx_Latn.txt
│ │ ├── ayo_Latn.txt
│ │ ├── ayp_Arab.txt
│ │ ├── ayr_Latn.txt
│ │ ├── azb_Arab.txt
│ │ ├── azg_Latn.txt
│ │ ├── azj_Cyrl.txt
│ │ ├── azj_Latn.txt
│ │ ├── azz_Latn.txt
│ │ ├── bak_Cyrl.txt
│ │ ├── bal_Arab.txt
│ │ ├── bam_Latn.txt
│ │ ├── ban_Latn.txt
│ │ ├── bao_Latn.txt
│ │ ├── bar_Latn.txt
│ │ ├── bas_Latn.txt
│ │ ├── bav_Latn.txt
│ │ ├── bba_Latn.txt
│ │ ├── bbb_Latn.txt
│ │ ├── bbc_Latn.txt
│ │ ├── bbj_Latn.txt
│ │ ├── bbk_Latn.txt
│ │ ├── bbo_Latn.txt
│ │ ├── bbr_Latn.txt
│ │ ├── bcc_Arab.txt
│ │ ├── bch_Latn.txt
│ │ ├── bci_Latn.txt
│ │ ├── bcl_Latn.txt
│ │ ├── bco_Latn.txt
│ │ ├── bcw_Latn.txt
│ │ ├── bdd_Latn.txt
│ │ ├── bdh_Latn.txt
│ │ ├── bdq_Latn.txt
│ │ ├── bea_Latn.txt
│ │ ├── bef_Latn.txt
│ │ ├── bel_Cyrl.txt
│ │ ├── bem_Latn.txt
│ │ ├── ben_Beng.txt
│ │ ├── ben_Latn.txt
│ │ ├── beq_Latn.txt
│ │ ├── bew_Latn.txt
│ │ ├── bex_Latn.txt
│ │ ├── bfd_Latn.txt
│ │ ├── bfo_Latn.txt
│ │ ├── bgr_Latn.txt
│ │ ├── bgs_Latn.txt
│ │ ├── bgt_Latn.txt
│ │ ├── bgz_Latn.txt
│ │ ├── bhg_Latn.txt
│ │ ├── bhl_Latn.txt
│ │ ├── bho_Deva.txt
│ │ ├── bhp_Latn.txt
│ │ ├── bhw_Latn.txt
│ │ ├── bhz_Latn.txt
│ │ ├── bib_Latn.txt
│ │ ├── big_Latn.txt
│ │ ├── bim_Latn.txt
│ │ ├── bin_Latn.txt
│ │ ├── bis_Latn.txt
│ │ ├── biu_Latn.txt
│ │ ├── biv_Latn.txt
│ │ ├── bjn_Arab.txt
│ │ ├── bjn_Latn.txt
│ │ ├── bjp_Latn.txt
│ │ ├── bjr_Latn.txt
│ │ ├── bjv_Latn.txt
│ │ ├── bkd_Latn.txt
│ │ ├── bkl_Latn.txt
│ │ ├── bkq_Latn.txt
│ │ ├── bku_Latn.txt
│ │ ├── bkv_Latn.txt
│ │ ├── bla_Latn.txt
│ │ ├── blh_Latn.txt
│ │ ├── blk_Mymr.txt
│ │ ├── blt_Latn.txt
│ │ ├── blw_Latn.txt
│ │ ├── blz_Latn.txt
│ │ ├── bmh_Latn.txt
│ │ ├── bmk_Latn.txt
│ │ ├── bmq_Latn.txt
│ │ ├── bmr_Latn.txt
│ │ ├── bmu_Latn.txt
│ │ ├── bmv_Latn.txt
│ │ ├── bnj_Latn.txt
│ │ ├── bno_Latn.txt
│ │ ├── bnp_Latn.txt
│ │ ├── boa_Latn.txt
│ │ ├── bod_Tibt.txt
│ │ ├── boj_Latn.txt
│ │ ├── bom_Latn.txt
│ │ ├── bon_Latn.txt
│ │ ├── bor_Latn.txt
│ │ ├── bov_Latn.txt
│ │ ├── box_Latn.txt
│ │ ├── bpr_Latn.txt
│ │ ├── bps_Latn.txt
│ │ ├── bpy_Beng.txt
│ │ ├── bqc_Latn.txt
│ │ ├── bqj_Latn.txt
│ │ ├── bqp_Latn.txt
│ │ ├── bre_Latn.txt
│ │ ├── brh_Arab.txt
│ │ ├── bru_Latn.txt
│ │ ├── brx_Deva.txt
│ │ ├── brx_Latn.txt
│ │ ├── bsc_Latn.txt
│ │ ├── bsn_Latn.txt
│ │ ├── bsp_Latn.txt
│ │ ├── bsq_Latn.txt
│ │ ├── bss_Latn.txt
│ │ ├── btd_Latn.txt
│ │ ├── bth_Latn.txt
│ │ ├── bts_Latn.txt
│ │ ├── btt_Latn.txt
│ │ ├── btx_Latn.txt
│ │ ├── bud_Latn.txt
│ │ ├── bug_Latn.txt
│ │ ├── buk_Latn.txt
│ │ ├── bul_Cyrl.txt
│ │ ├── bum_Latn.txt
│ │ ├── bus_Latn.txt
│ │ ├── bvc_Latn.txt
│ │ ├── bvd_Latn.txt
│ │ ├── bvr_Latn.txt
│ │ ├── bvz_Latn.txt
│ │ ├── bwd_Latn.txt
│ │ ├── bwi_Latn.txt
│ │ ├── bwq_Latn.txt
│ │ ├── bwu_Latn.txt
│ │ ├── bxh_Latn.txt
│ │ ├── bxr_Cyrl.txt
│ │ ├── byr_Latn.txt
│ │ ├── byv_Latn.txt
│ │ ├── byx_Latn.txt
│ │ ├── bzd_Latn.txt
│ │ ├── bzh_Latn.txt
│ │ ├── bzi_Thai.txt
│ │ ├── bzj_Latn.txt
│ │ ├── caa_Latn.txt
│ │ ├── cab_Latn.txt
│ │ ├── cac_Latn.txt
│ │ ├── caf_Latn.txt
│ │ ├── cag_Latn.txt
│ │ ├── cak_Latn.txt
│ │ ├── cao_Latn.txt
│ │ ├── cap_Latn.txt
│ │ ├── caq_Latn.txt
│ │ ├── car_Latn.txt
│ │ ├── cas_Latn.txt
│ │ ├── cat_Latn.txt
│ │ ├── cav_Latn.txt
│ │ ├── cax_Latn.txt
│ │ ├── cbc_Latn.txt
│ │ ├── cbi_Latn.txt
│ │ ├── cbk_Latn.txt
│ │ ├── cbr_Latn.txt
│ │ ├── cbs_Latn.txt
│ │ ├── cbt_Latn.txt
│ │ ├── cbu_Latn.txt
│ │ ├── cbv_Latn.txt
│ │ ├── cce_Latn.txt
│ │ ├── cco_Latn.txt
│ │ ├── ccp_Latn.txt
│ │ ├── cdf_Latn.txt
│ │ ├── ceb_Latn.txt
│ │ ├── ceg_Latn.txt
│ │ ├── cek_Latn.txt
│ │ ├── ces_Latn.txt
│ │ ├── cfm_Latn.txt
│ │ ├── cgc_Latn.txt
│ │ ├── cgg_Latn.txt
│ │ ├── cha_Latn.txt
│ │ ├── chd_Latn.txt
│ │ ├── che_Cyrl.txt
│ │ ├── chf_Latn.txt
│ │ ├── chj_Latn.txt
│ │ ├── chk_Latn.txt
│ │ ├── cho_Latn.txt
│ │ ├── chq_Latn.txt
│ │ ├── chr_Cher.txt
│ │ ├── chr_Latn.txt
│ │ ├── chu_Cyrl.txt
│ │ ├── chv_Cyrl.txt
│ │ ├── chw_Latn.txt
│ │ ├── chz_Latn.txt
│ │ ├── cjk_Latn.txt
│ │ ├── cjo_Latn.txt
│ │ ├── cjp_Latn.txt
│ │ ├── cjs_Cyrl.txt
│ │ ├── cjv_Latn.txt
│ │ ├── ckb_Arab.txt
│ │ ├── cko_Latn.txt
│ │ ├── ckt_Cyrl.txt
│ │ ├── cle_Latn.txt
│ │ ├── clu_Latn.txt
│ │ ├── cly_Latn.txt
│ │ ├── cme_Latn.txt
│ │ ├── cmn_Hani.txt
│ │ ├── cmo_Khmr.txt
│ │ ├── cmo_Latn.txt
│ │ ├── cmr_Latn.txt
│ │ ├── cnh_Latn.txt
│ │ ├── cni_Latn.txt
│ │ ├── cnk_Latn.txt
│ │ ├── cnl_Latn.txt
│ │ ├── cnt_Latn.txt
│ │ ├── cnw_Latn.txt
│ │ ├── coe_Latn.txt
│ │ ├── cof_Latn.txt
│ │ ├── cok_Latn.txt
│ │ ├── con_Latn.txt
│ │ ├── cop_Copt.txt
│ │ ├── cor_Latn.txt
│ │ ├── cos_Latn.txt
│ │ ├── cot_Latn.txt
│ │ ├── cou_Latn.txt
│ │ ├── cpa_Latn.txt
│ │ ├── cpb_Latn.txt
│ │ ├── cpc_Latn.txt
│ │ ├── cpu_Latn.txt
│ │ ├── cpy_Latn.txt
│ │ ├── crh_Cyrl.txt
│ │ ├── crh_Latn.txt
│ │ ├── cri_Latn.txt
│ │ ├── crj_Cans.txt
│ │ ├── crk_Cans.txt
│ │ ├── crk_Latn.txt
│ │ ├── crl_Cans.txt
│ │ ├── crm_Cans.txt
│ │ ├── crn_Latn.txt
│ │ ├── crs_Latn.txt
│ │ ├── crt_Latn.txt
│ │ ├── crx_Latn.txt
│ │ ├── csb_Latn.txt
│ │ ├── csk_Latn.txt
│ │ ├── cso_Latn.txt
│ │ ├── csw_Latn.txt
│ │ ├── csy_Latn.txt
│ │ ├── cta_Latn.txt
│ │ ├── ctd_Latn.txt
│ │ ├── cto_Latn.txt
│ │ ├── ctp_Latn.txt
│ │ ├── ctu_Latn.txt
│ │ ├── cub_Latn.txt
│ │ ├── cuc_Latn.txt
│ │ ├── cui_Latn.txt
│ │ ├── cuk_Latn.txt
│ │ ├── cul_Latn.txt
│ │ ├── cut_Latn.txt
│ │ ├── cux_Latn.txt
│ │ ├── cwd_Cans.txt
│ │ ├── cwe_Latn.txt
│ │ ├── cwt_Latn.txt
│ │ ├── cya_Latn.txt
│ │ ├── cym_Latn.txt
│ │ ├── czt_Latn.txt
│ │ ├── daa_Latn.txt
│ │ ├── dad_Latn.txt
│ │ ├── daf_Latn.txt
│ │ ├── dag_Latn.txt
│ │ ├── dah_Latn.txt
│ │ ├── dak_Latn.txt
│ │ ├── dan_Latn.txt
│ │ ├── dar_Cyrl.txt
│ │ ├── dbq_Latn.txt
│ │ ├── ddg_Latn.txt
│ │ ├── ddn_Latn.txt
│ │ ├── ded_Latn.txt
│ │ ├── des_Latn.txt
│ │ ├── deu_Latn.txt
│ │ ├── dga_Latn.txt
│ │ ├── dgc_Latn.txt
│ │ ├── dgi_Latn.txt
│ │ ├── dgr_Latn.txt
│ │ ├── dgz_Latn.txt
│ │ ├── dhg_Latn.txt
│ │ ├── dhm_Latn.txt
│ │ ├── dhv_Latn.txt
│ │ ├── did_Latn.txt
│ │ ├── dig_Latn.txt
│ │ ├── dik_Latn.txt
│ │ ├── dip_Latn.txt
│ │ ├── diq_Latn.txt
│ │ ├── dis_Latn.txt
│ │ ├── diu_Latn.txt
│ │ ├── div_Thaa.txt
│ │ ├── dje_Latn.txt
│ │ ├── djk_Latn.txt
│ │ ├── djr_Latn.txt
│ │ ├── dks_Latn.txt
│ │ ├── dln_Latn.txt
│ │ ├── dng_Cyrl.txt
│ │ ├── dnj_Latn.txt
│ │ ├── dnw_Latn.txt
│ │ ├── dob_Latn.txt
│ │ ├── doi_Deva.txt
│ │ ├── dop_Latn.txt
│ │ ├── dos_Latn.txt
│ │ ├── dow_Latn.txt
│ │ ├── drg_Latn.txt
│ │ ├── dru_Latn.txt
│ │ ├── dsb_Latn.txt
│ │ ├── dsh_Latn.txt
│ │ ├── dtb_Latn.txt
│ │ ├── dtp_Latn.txt
│ │ ├── dts_Latn.txt
│ │ ├── dty_Deva.txt
│ │ ├── dua_Latn.txt
│ │ ├── due_Latn.txt
│ │ ├── dug_Latn.txt
│ │ ├── duo_Latn.txt
│ │ ├── dur_Latn.txt
│ │ ├── dwr_Latn.txt
│ │ ├── dww_Latn.txt
│ │ ├── dyi_Latn.txt
│ │ ├── dyo_Latn.txt
│ │ ├── dyu_Latn.txt
│ │ ├── dzo_Tibt.txt
│ │ ├── ebk_Latn.txt
│ │ ├── efi_Latn.txt
│ │ ├── eka_Latn.txt
│ │ ├── ekk_Latn.txt
│ │ ├── eko_Latn.txt
│ │ ├── ell_Grek.txt
│ │ ├── eme_Latn.txt
│ │ ├── emi_Latn.txt
│ │ ├── eml_Latn.txt
│ │ ├── emp_Latn.txt
│ │ ├── enb_Latn.txt
│ │ ├── eng_Latn.txt
│ │ ├── enl_Latn.txt
│ │ ├── enm_Latn.txt
│ │ ├── enq_Latn.txt
│ │ ├── enx_Latn.txt
│ │ ├── epo_Latn.txt
│ │ ├── eri_Latn.txt
│ │ ├── ese_Latn.txt
│ │ ├── esi_Latn.txt
│ │ ├── esk_Latn.txt
│ │ ├── ess_Latn.txt
│ │ ├── esu_Latn.txt
│ │ ├── eto_Latn.txt
│ │ ├── etr_Latn.txt
│ │ ├── etu_Latn.txt
│ │ ├── eus_Latn.txt
│ │ ├── eve_Cyrl.txt
│ │ ├── ewe_Latn.txt
│ │ ├── ewo_Latn.txt
│ │ ├── ext_Latn.txt
│ │ ├── eza_Latn.txt
│ │ ├── faa_Latn.txt
│ │ ├── fad_Latn.txt
│ │ ├── fai_Latn.txt
│ │ ├── fal_Latn.txt
│ │ ├── fan_Latn.txt
│ │ ├── fao_Latn.txt
│ │ ├── far_Latn.txt
│ │ ├── fas_Arab.txt
│ │ ├── fat_Latn.txt
│ │ ├── ffm_Latn.txt
│ │ ├── fij_Latn.txt
│ │ ├── fil_Latn.txt
│ │ ├── fin_Latn.txt
│ │ ├── fit_Latn.txt
│ │ ├── fkv_Latn.txt
│ │ ├── fmu_Deva.txt
│ │ ├── fon_Latn.txt
│ │ ├── for_Latn.txt
│ │ ├── fra_Latn.txt
│ │ ├── frd_Latn.txt
│ │ ├── fro_Latn.txt
│ │ ├── frp_Latn.txt
│ │ ├── frr_Latn.txt
│ │ ├── fry_Latn.txt
│ │ ├── fub_Latn.txt
│ │ ├── fud_Latn.txt
│ │ ├── fue_Latn.txt
│ │ ├── fuf_Latn.txt
│ │ ├── fuh_Latn.txt
│ │ ├── fuq_Latn.txt
│ │ ├── fur_Latn.txt
│ │ ├── fuv_Arab.txt
│ │ ├── fuv_Latn.txt
│ │ ├── gaa_Latn.txt
│ │ ├── gag_Cyrl.txt
│ │ ├── gag_Latn.txt
│ │ ├── gah_Latn.txt
│ │ ├── gai_Latn.txt
│ │ ├── gam_Latn.txt
│ │ ├── gaw_Latn.txt
│ │ ├── gaz_Latn.txt
│ │ ├── gbi_Latn.txt
│ │ ├── gbo_Latn.txt
│ │ ├── gbr_Latn.txt
│ │ ├── gcf_Latn.txt
│ │ ├── gcr_Latn.txt
│ │ ├── gde_Latn.txt
│ │ ├── gdg_Latn.txt
│ │ ├── gdn_Latn.txt
│ │ ├── gdr_Latn.txt
│ │ ├── geb_Latn.txt
│ │ ├── gej_Latn.txt
│ │ ├── gfk_Latn.txt
│ │ ├── ghe_Deva.txt
│ │ ├── ghs_Latn.txt
│ │ ├── gid_Latn.txt
│ │ ├── gil_Latn.txt
│ │ ├── giz_Latn.txt
│ │ ├── gjn_Latn.txt
│ │ ├── gkn_Latn.txt
│ │ ├── gla_Latn.txt
│ │ ├── gle_Latn.txt
│ │ ├── glg_Latn.txt
│ │ ├── glk_Arab.txt
│ │ ├── glv_Latn.txt
│ │ ├── gmh_Latn.txt
│ │ ├── gmv_Ethi.txt
│ │ ├── gmv_Latn.txt
│ │ ├── gna_Latn.txt
│ │ ├── gnb_Latn.txt
│ │ ├── gnd_Latn.txt
│ │ ├── gng_Latn.txt
│ │ ├── gnn_Latn.txt
│ │ ├── gnw_Latn.txt
│ │ ├── goa_Latn.txt
│ │ ├── gof_Ethi.txt
│ │ ├── gof_Latn.txt
│ │ ├── gog_Latn.txt
│ │ ├── goh_Latn.txt
│ │ ├── gom_Deva.txt
│ │ ├── gom_Latn.txt
│ │ ├── gor_Latn.txt
│ │ ├── gos_Latn.txt
│ │ ├── got_Goth.txt
│ │ ├── got_Latn.txt
│ │ ├── gqr_Latn.txt
│ │ ├── grc_Grek.txt
│ │ ├── grt_Beng.txt
│ │ ├── gso_Latn.txt
│ │ ├── gsw_Latn.txt
│ │ ├── gub_Latn.txt
│ │ ├── guc_Latn.txt
│ │ ├── gud_Latn.txt
│ │ ├── gug_Latn.txt
│ │ ├── guh_Latn.txt
│ │ ├── gui_Latn.txt
│ │ ├── guj_Gujr.txt
│ │ ├── guj_Latn.txt
│ │ ├── guk_Ethi.txt
│ │ ├── gul_Latn.txt
│ │ ├── gum_Latn.txt
│ │ ├── gun_Latn.txt
│ │ ├── guo_Latn.txt
│ │ ├── guq_Latn.txt
│ │ ├── gur_Latn.txt
│ │ ├── guu_Latn.txt
│ │ ├── guw_Latn.txt
│ │ ├── gux_Latn.txt
│ │ ├── guz_Latn.txt
│ │ ├── gvc_Latn.txt
│ │ ├── gvf_Latn.txt
│ │ ├── gvl_Latn.txt
│ │ ├── gvn_Latn.txt
│ │ ├── gwi_Latn.txt
│ │ ├── gwr_Latn.txt
│ │ ├── gya_Latn.txt
│ │ ├── gym_Latn.txt
│ │ ├── gyr_Latn.txt
│ │ ├── hac_Arab.txt
│ │ ├── hae_Latn.txt
│ │ ├── hag_Latn.txt
│ │ ├── hak_Hani.txt
│ │ ├── hak_Latn.txt
│ │ ├── hat_Latn.txt
│ │ ├── hau_Latn.txt
│ │ ├── hav_Latn.txt
│ │ ├── haw_Latn.txt
│ │ ├── hay_Latn.txt
│ │ ├── hbo_Hebr.txt
│ │ ├── hbs_Latn.txt
│ │ ├── hch_Latn.txt
│ │ ├── heb_Hebr.txt
│ │ ├── heg_Latn.txt
│ │ ├── heh_Latn.txt
│ │ ├── her_Latn.txt
│ │ ├── hif_Latn.txt
│ │ ├── hig_Latn.txt
│ │ ├── hil_Latn.txt
│ │ ├── hin_Deva.txt
│ │ ├── hin_Latn.txt
│ │ ├── hix_Latn.txt
│ │ ├── hla_Latn.txt
│ │ ├── hlt_Latn.txt
│ │ ├── hmo_Latn.txt
│ │ ├── hmr_Latn.txt
│ │ ├── hne_Deva.txt
│ │ ├── hnj_Latn.txt
│ │ ├── hnn_Latn.txt
│ │ ├── hns_Latn.txt
│ │ ├── hoc_Latn.txt
│ │ ├── hoc_Wara.txt
│ │ ├── hop_Latn.txt
│ │ ├── hot_Latn.txt
│ │ ├── hra_Latn.txt
│ │ ├── hrv_Latn.txt
│ │ ├── hrx_Latn.txt
│ │ ├── hsb_Latn.txt
│ │ ├── hto_Latn.txt
│ │ ├── hub_Latn.txt
│ │ ├── hui_Latn.txt
│ │ ├── hun_Latn.txt
│ │ ├── hus_Latn.txt
│ │ ├── huu_Latn.txt
│ │ ├── huv_Latn.txt
│ │ ├── hvn_Latn.txt
│ │ ├── hwc_Latn.txt
│ │ ├── hye_Armn.txt
│ │ ├── hyw_Armn.txt
│ │ ├── ian_Latn.txt
│ │ ├── iba_Latn.txt
│ │ ├── ibg_Latn.txt
│ │ ├── ibo_Latn.txt
│ │ ├── icr_Latn.txt
│ │ ├── ido_Latn.txt
│ │ ├── idu_Latn.txt
│ │ ├── ifa_Latn.txt
│ │ ├── ifb_Latn.txt
│ │ ├── ife_Latn.txt
│ │ ├── ifk_Latn.txt
│ │ ├── ifu_Latn.txt
│ │ ├── ify_Latn.txt
│ │ ├── ige_Latn.txt
│ │ ├── ign_Latn.txt
│ │ ├── ike_Cans.txt
│ │ ├── ikk_Latn.txt
│ │ ├── ikt_Latn.txt
│ │ ├── ikw_Latn.txt
│ │ ├── ilb_Latn.txt
│ │ ├── ile_Latn.txt
│ │ ├── ilo_Latn.txt
│ │ ├── imo_Latn.txt
│ │ ├── ina_Latn.txt
│ │ ├── inb_Latn.txt
│ │ ├── ind_Latn.txt
│ │ ├── inh_Cyrl.txt
│ │ ├── ino_Latn.txt
│ │ ├── iou_Latn.txt
│ │ ├── ipi_Latn.txt
│ │ ├── iqw_Latn.txt
│ │ ├── iri_Latn.txt
│ │ ├── irk_Latn.txt
│ │ ├── iry_Latn.txt
│ │ ├── isd_Latn.txt
│ │ ├── ish_Latn.txt
│ │ ├── isl_Latn.txt
│ │ ├── iso_Latn.txt
│ │ ├── ita_Latn.txt
│ │ ├── itl_Cyrl.txt
│ │ ├── itv_Latn.txt
│ │ ├── ium_Latn.txt
│ │ ├── ivb_Latn.txt
│ │ ├── ivv_Latn.txt
│ │ ├── iws_Latn.txt
│ │ ├── ixl_Latn.txt
│ │ ├── izr_Latn.txt
│ │ ├── izz_Latn.txt
│ │ ├── jaa_Latn.txt
│ │ ├── jac_Latn.txt
│ │ ├── jae_Latn.txt
│ │ ├── jam_Latn.txt
│ │ ├── jav_Latn.txt
│ │ ├── jbo_Latn.txt
│ │ ├── jbu_Latn.txt
│ │ ├── jic_Latn.txt
│ │ ├── jiv_Latn.txt
│ │ ├── jmc_Latn.txt
│ │ ├── jpn_Jpan.txt
│ │ ├── jra_Latn.txt
│ │ ├── jun_Orya.txt
│ │ ├── jvn_Latn.txt
│ │ ├── kaa_Cyrl.txt
│ │ ├── kaa_Latn.txt
│ │ ├── kab_Latn.txt
│ │ ├── kac_Latn.txt
│ │ ├── kak_Latn.txt
│ │ ├── kal_Latn.txt
│ │ ├── kam_Latn.txt
│ │ ├── kan_Knda.txt
│ │ ├── kan_Latn.txt
│ │ ├── kao_Latn.txt
│ │ ├── kap_Cyrl.txt
│ │ ├── kaq_Latn.txt
│ │ ├── kas_Arab.txt
│ │ ├── kas_Deva.txt
│ │ ├── kas_Latn.txt
│ │ ├── kat_Geor.txt
│ │ ├── kaz_Cyrl.txt
│ │ ├── kbc_Latn.txt
│ │ ├── kbd_Cyrl.txt
│ │ ├── kbh_Latn.txt
│ │ ├── kbm_Latn.txt
│ │ ├── kbo_Latn.txt
│ │ ├── kbp_Latn.txt
│ │ ├── kbq_Latn.txt
│ │ ├── kbr_Latn.txt
│ │ ├── kby_Latn.txt
│ │ ├── kca_Cyrl.txt
│ │ ├── kcg_Latn.txt
│ │ ├── kck_Latn.txt
│ │ ├── kdc_Latn.txt
│ │ ├── kde_Latn.txt
│ │ ├── kdh_Latn.txt
│ │ ├── kdi_Latn.txt
│ │ ├── kdj_Latn.txt
│ │ ├── kdl_Latn.txt
│ │ ├── kdr_Latn.txt
│ │ ├── kea_Latn.txt
│ │ ├── kei_Latn.txt
│ │ ├── kek_Latn.txt
│ │ ├── ken_Latn.txt
│ │ ├── keo_Latn.txt
│ │ ├── ker_Latn.txt
│ │ ├── kew_Latn.txt
│ │ ├── kex_Deva.txt
│ │ ├── kez_Latn.txt
│ │ ├── kff_Telu.txt
│ │ ├── kgf_Latn.txt
│ │ ├── kgk_Latn.txt
│ │ ├── kgp_Latn.txt
│ │ ├── kgr_Latn.txt
│ │ ├── kha_Latn.txt
│ │ ├── khk_Cyrl.txt
│ │ ├── khm_Khmr.txt
│ │ ├── khq_Latn.txt
│ │ ├── khs_Latn.txt
│ │ ├── khy_Latn.txt
│ │ ├── khz_Latn.txt
│ │ ├── kia_Latn.txt
│ │ ├── kij_Latn.txt
│ │ ├── kik_Latn.txt
│ │ ├── kin_Latn.txt
│ │ ├── kir_Cyrl.txt
│ │ ├── kiu_Latn.txt
│ │ ├── kix_Latn.txt
│ │ ├── kjb_Latn.txt
│ │ ├── kje_Latn.txt
│ │ ├── kjh_Cyrl.txt
│ │ ├── kjs_Latn.txt
│ │ ├── kkc_Latn.txt
│ │ ├── kki_Latn.txt
│ │ ├── kkj_Latn.txt
│ │ ├── kkl_Latn.txt
│ │ ├── kle_Deva.txt
│ │ ├── klt_Latn.txt
│ │ ├── klv_Latn.txt
│ │ ├── kma_Latn.txt
│ │ ├── kmb_Latn.txt
│ │ ├── kmd_Latn.txt
│ │ ├── kmg_Latn.txt
│ │ ├── kmh_Latn.txt
│ │ ├── kmk_Latn.txt
│ │ ├── kmm_Latn.txt
│ │ ├── kmo_Latn.txt
│ │ ├── kmr_Cyrl.txt
│ │ ├── kmr_Latn.txt
│ │ ├── kms_Latn.txt
│ │ ├── kmu_Latn.txt
│ │ ├── kmy_Latn.txt
│ │ ├── knc_Arab.txt
│ │ ├── knc_Latn.txt
│ │ ├── kne_Latn.txt
│ │ ├── knf_Latn.txt
│ │ ├── kng_Latn.txt
│ │ ├── knj_Latn.txt
│ │ ├── knk_Latn.txt
│ │ ├── kno_Latn.txt
│ │ ├── knv_Latn.txt
│ │ ├── knx_Latn.txt
│ │ ├── kny_Latn.txt
│ │ ├── kog_Latn.txt
│ │ ├── koi_Cyrl.txt
│ │ ├── koo_Latn.txt
│ │ ├── kor_Hang.txt
│ │ ├── kos_Latn.txt
│ │ ├── kpe_Latn.txt
│ │ ├── kpf_Latn.txt
│ │ ├── kpg_Latn.txt
│ │ ├── kpj_Latn.txt
│ │ ├── kpq_Latn.txt
│ │ ├── kpr_Latn.txt
│ │ ├── kpv_Cyrl.txt
│ │ ├── kpw_Latn.txt
│ │ ├── kpx_Latn.txt
│ │ ├── kpz_Latn.txt
│ │ ├── kqa_Latn.txt
│ │ ├── kqc_Latn.txt
│ │ ├── kqe_Latn.txt
│ │ ├── kqf_Latn.txt
│ │ ├── kql_Latn.txt
│ │ ├── kqn_Latn.txt
│ │ ├── kqo_Latn.txt
│ │ ├── kqp_Latn.txt
│ │ ├── kqs_Latn.txt
│ │ ├── kqw_Latn.txt
│ │ ├── kqy_Ethi.txt
│ │ ├── krc_Cyrl.txt
│ │ ├── kri_Latn.txt
│ │ ├── krj_Latn.txt
│ │ ├── krl_Latn.txt
│ │ ├── kru_Deva.txt
│ │ ├── krx_Latn.txt
│ │ ├── ksb_Latn.txt
│ │ ├── ksc_Latn.txt
│ │ ├── ksd_Latn.txt
│ │ ├── ksf_Latn.txt
│ │ ├── ksh_Latn.txt
│ │ ├── ksj_Latn.txt
│ │ ├── ksp_Latn.txt
│ │ ├── ksr_Latn.txt
│ │ ├── kss_Latn.txt
│ │ ├── ksw_Mymr.txt
│ │ ├── ktb_Ethi.txt
│ │ ├── ktj_Latn.txt
│ │ ├── ktm_Latn.txt
│ │ ├── kto_Latn.txt
│ │ ├── ktu_Latn.txt
│ │ ├── ktz_Latn.txt
│ │ ├── kua_Latn.txt
│ │ ├── kub_Latn.txt
│ │ ├── kud_Latn.txt
│ │ ├── kue_Latn.txt
│ │ ├── kuj_Latn.txt
│ │ ├── kum_Cyrl.txt
│ │ ├── kup_Latn.txt
│ │ ├── kus_Latn.txt
│ │ ├── kvg_Latn.txt
│ │ ├── kvj_Latn.txt
│ │ ├── kvn_Latn.txt
│ │ ├── kwd_Latn.txt
│ │ ├── kwf_Latn.txt
│ │ ├── kwi_Latn.txt
│ │ ├── kwj_Latn.txt
│ │ ├── kwn_Latn.txt
│ │ ├── kwy_Latn.txt
│ │ ├── kxc_Ethi.txt
│ │ ├── kxm_Thai.txt
│ │ ├── kxw_Latn.txt
│ │ ├── kyc_Latn.txt
│ │ ├── kyf_Latn.txt
│ │ ├── kyg_Latn.txt
│ │ ├── kyq_Latn.txt
│ │ ├── kyu_Kali.txt
│ │ ├── kyu_Latn.txt
│ │ ├── kyu_Mymr.txt
│ │ ├── kyz_Latn.txt
│ │ ├── kze_Latn.txt
│ │ ├── kzf_Latn.txt
│ │ ├── kzj_Latn.txt
│ │ ├── kzn_Latn.txt
│ │ ├── lac_Latn.txt
│ │ ├── lad_Hebr.txt
│ │ ├── lad_Latn.txt
│ │ ├── lai_Latn.txt
│ │ ├── laj_Latn.txt
│ │ ├── lam_Latn.txt
│ │ ├── lao_Laoo.txt
│ │ ├── lap_Latn.txt
│ │ ├── las_Latn.txt
│ │ ├── lat_Latn.txt
│ │ ├── law_Latn.txt
│ │ ├── lbb_Latn.txt
│ │ ├── lbe_Cyrl.txt
│ │ ├── lbj_Tibt.txt
│ │ ├── lbk_Latn.txt
│ │ ├── lcm_Latn.txt
│ │ ├── lcp_Thai.txt
│ │ ├── ldi_Latn.txt
│ │ ├── ldn_Latn.txt
│ │ ├── lea_Latn.txt
│ │ ├── led_Latn.txt
│ │ ├── lee_Latn.txt
│ │ ├── lef_Latn.txt
│ │ ├── leh_Latn.txt
│ │ ├── lem_Latn.txt
│ │ ├── leu_Latn.txt
│ │ ├── lew_Latn.txt
│ │ ├── lex_Latn.txt
│ │ ├── lez_Cyrl.txt
│ │ ├── lfn_Cyrl.txt
│ │ ├── lfn_Latn.txt
│ │ ├── lgg_Latn.txt
│ │ ├── lgl_Latn.txt
│ │ ├── lgm_Latn.txt
│ │ ├── lhi_Latn.txt
│ │ ├── lhu_Latn.txt
│ │ ├── lia_Latn.txt
│ │ ├── lid_Latn.txt
│ │ ├── lif_Deva.txt
│ │ ├── lif_Limb.txt
│ │ ├── lij_Latn.txt
│ │ ├── lim_Latn.txt
│ │ ├── lin_Latn.txt
│ │ ├── lip_Latn.txt
│ │ ├── lis_Lisu.txt
│ │ ├── lit_Latn.txt
│ │ ├── liv_Latn.txt
│ │ ├── ljp_Latn.txt
│ │ ├── lki_Arab.txt
│ │ ├── llb_Latn.txt
│ │ ├── lld_Latn.txt
│ │ ├── llg_Latn.txt
│ │ ├── lln_Latn.txt
│ │ ├── lmk_Latn.txt
│ │ ├── lmo_Latn.txt
│ │ ├── lmp_Latn.txt
│ │ ├── lnd_Latn.txt
│ │ ├── lob_Latn.txt
│ │ ├── loe_Latn.txt
│ │ ├── log_Latn.txt
│ │ ├── lok_Latn.txt
│ │ ├── lol_Latn.txt
│ │ ├── lom_Latn.txt
│ │ ├── loq_Latn.txt
│ │ ├── loz_Latn.txt
│ │ ├── lrc_Arab.txt
│ │ ├── lsi_Latn.txt
│ │ ├── lsm_Latn.txt
│ │ ├── ltg_Latn.txt
│ │ ├── ltz_Latn.txt
│ │ ├── lua_Latn.txt
│ │ ├── lub_Latn.txt
│ │ ├── luc_Latn.txt
│ │ ├── lud_Latn.txt
│ │ ├── lue_Latn.txt
│ │ ├── lug_Latn.txt
│ │ ├── lun_Latn.txt
│ │ ├── luo_Latn.txt
│ │ ├── lus_Latn.txt
│ │ ├── lvs_Latn.txt
│ │ ├── lwg_Latn.txt
│ │ ├── lwo_Latn.txt
│ │ ├── lww_Latn.txt
│ │ ├── lzh_Hani.txt
│ │ ├── maa_Latn.txt
│ │ ├── mad_Latn.txt
│ │ ├── maf_Latn.txt
│ │ ├── mag_Deva.txt
│ │ ├── mah_Latn.txt
│ │ ├── mai_Deva.txt
│ │ ├── maj_Latn.txt
│ │ ├── mak_Latn.txt
│ │ ├── mal_Latn.txt
│ │ ├── mal_Mlym.txt
│ │ ├── mam_Latn.txt
│ │ ├── maq_Latn.txt
│ │ ├── mar_Deva.txt
│ │ ├── mar_Latn.txt
│ │ ├── mas_Latn.txt
│ │ ├── mau_Latn.txt
│ │ ├── mav_Latn.txt
│ │ ├── maw_Latn.txt
│ │ ├── max_Latn.txt
│ │ ├── maz_Latn.txt
│ │ ├── mbb_Latn.txt
│ │ ├── mbc_Latn.txt
│ │ ├── mbd_Latn.txt
│ │ ├── mbf_Latn.txt
│ │ ├── mbh_Latn.txt
│ │ ├── mbi_Latn.txt
│ │ ├── mbj_Latn.txt
│ │ ├── mbl_Latn.txt
│ │ ├── mbs_Latn.txt
│ │ ├── mbt_Latn.txt
│ │ ├── mca_Latn.txt
│ │ ├── mcb_Latn.txt
│ │ ├── mcd_Latn.txt
│ │ ├── mcf_Latn.txt
│ │ ├── mck_Latn.txt
│ │ ├── mcn_Latn.txt
│ │ ├── mco_Latn.txt
│ │ ├── mcp_Latn.txt
│ │ ├── mcq_Latn.txt
│ │ ├── mcu_Latn.txt
│ │ ├── mda_Latn.txt
│ │ ├── mdf_Cyrl.txt
│ │ ├── mdy_Ethi.txt
│ │ ├── med_Latn.txt
│ │ ├── mee_Latn.txt
│ │ ├── mej_Latn.txt
│ │ ├── mek_Latn.txt
│ │ ├── men_Latn.txt
│ │ ├── meq_Latn.txt
│ │ ├── mer_Latn.txt
│ │ ├── met_Latn.txt
│ │ ├── meu_Latn.txt
│ │ ├── mev_Latn.txt
│ │ ├── mfe_Latn.txt
│ │ ├── mfg_Latn.txt
│ │ ├── mfh_Latn.txt
│ │ ├── mfi_Latn.txt
│ │ ├── mfk_Latn.txt
│ │ ├── mfq_Latn.txt
│ │ ├── mfy_Latn.txt
│ │ ├── mfz_Latn.txt
│ │ ├── mgc_Latn.txt
│ │ ├── mgh_Latn.txt
│ │ ├── mgm_Latn.txt
│ │ ├── mgo_Latn.txt
│ │ ├── mgr_Latn.txt
│ │ ├── mhi_Latn.txt
│ │ ├── mhl_Latn.txt
│ │ ├── mhr_Cyrl.txt
│ │ ├── mhw_Latn.txt
│ │ ├── mhx_Latn.txt
│ │ ├── mhy_Latn.txt
│ │ ├── mib_Latn.txt
│ │ ├── mic_Latn.txt
│ │ ├── mie_Latn.txt
│ │ ├── mif_Latn.txt
│ │ ├── mig_Latn.txt
│ │ ├── mih_Latn.txt
│ │ ├── mil_Latn.txt
│ │ ├── mim_Latn.txt
│ │ ├── min_Arab.txt
│ │ ├── min_Latn.txt
│ │ ├── mio_Latn.txt
│ │ ├── mip_Latn.txt
│ │ ├── miq_Latn.txt
│ │ ├── mir_Latn.txt
│ │ ├── mit_Latn.txt
│ │ ├── miy_Latn.txt
│ │ ├── miz_Latn.txt
│ │ ├── mjc_Latn.txt
│ │ ├── mjw_Latn.txt
│ │ ├── mkd_Cyrl.txt
│ │ ├── mkl_Latn.txt
│ │ ├── mkn_Latn.txt
│ │ ├── mks_Latn.txt
│ │ ├── mkz_Latn.txt
│ │ ├── mlh_Latn.txt
│ │ ├── mlp_Latn.txt
│ │ ├── mlt_Latn.txt
│ │ ├── mlu_Latn.txt
│ │ ├── mmn_Latn.txt
│ │ ├── mmo_Latn.txt
│ │ ├── mmx_Latn.txt
│ │ ├── mna_Latn.txt
│ │ ├── mnb_Latn.txt
│ │ ├── mnf_Latn.txt
│ │ ├── mni_Beng.txt
│ │ ├── mni_Latn.txt
│ │ ├── mni_Mtei.txt
│ │ ├── mnk_Latn.txt
│ │ ├── mns_Cyrl.txt
│ │ ├── mnw_Mymr.txt
│ │ ├── mnx_Latn.txt
│ │ ├── mny_Latn.txt
│ │ ├── moa_Latn.txt
│ │ ├── moc_Latn.txt
│ │ ├── mog_Latn.txt
│ │ ├── moh_Latn.txt
│ │ ├── mop_Latn.txt
│ │ ├── mor_Latn.txt
│ │ ├── mos_Latn.txt
│ │ ├── mox_Latn.txt
│ │ ├── mpg_Latn.txt
│ │ ├── mph_Latn.txt
│ │ ├── mpm_Latn.txt
│ │ ├── mpp_Latn.txt
│ │ ├── mps_Latn.txt
│ │ ├── mpt_Latn.txt
│ │ ├── mpx_Latn.txt
│ │ ├── mqb_Latn.txt
│ │ ├── mqj_Latn.txt
│ │ ├── mqy_Latn.txt
│ │ ├── mrg_Latn.txt
│ │ ├── mri_Latn.txt
│ │ ├── mrj_Cyrl.txt
│ │ ├── mrq_Latn.txt
│ │ ├── mrv_Latn.txt
│ │ ├── mrw_Latn.txt
│ │ ├── msb_Latn.txt
│ │ ├── msc_Latn.txt
│ │ ├── mse_Latn.txt
│ │ ├── msk_Latn.txt
│ │ ├── msm_Latn.txt
│ │ ├── msy_Latn.txt
│ │ ├── mta_Latn.txt
│ │ ├── mtg_Latn.txt
│ │ ├── mti_Latn.txt
│ │ ├── mtj_Latn.txt
│ │ ├── mto_Latn.txt
│ │ ├── mtp_Latn.txt
│ │ ├── mua_Latn.txt
│ │ ├── mug_Latn.txt
│ │ ├── muh_Latn.txt
│ │ ├── mui_Latn.txt
│ │ ├── mup_Deva.txt
│ │ ├── mur_Latn.txt
│ │ ├── mus_Latn.txt
│ │ ├── mux_Latn.txt
│ │ ├── muy_Latn.txt
│ │ ├── mva_Latn.txt
│ │ ├── mvn_Latn.txt
│ │ ├── mvp_Latn.txt
│ │ ├── mwc_Latn.txt
│ │ ├── mwf_Latn.txt
│ │ ├── mwl_Latn.txt
│ │ ├── mwm_Latn.txt
│ │ ├── mwn_Latn.txt
│ │ ├── mwp_Latn.txt
│ │ ├── mwq_Latn.txt
│ │ ├── mwv_Latn.txt
│ │ ├── mww_Latn.txt
│ │ ├── mxb_Latn.txt
│ │ ├── mxp_Latn.txt
│ │ ├── mxq_Latn.txt
│ │ ├── mxt_Latn.txt
│ │ ├── mxv_Latn.txt
│ │ ├── mya_Mymr.txt
│ │ ├── myb_Latn.txt
│ │ ├── myk_Latn.txt
│ │ ├── myu_Latn.txt
│ │ ├── myv_Cyrl.txt
│ │ ├── myw_Latn.txt
│ │ ├── myx_Latn.txt
│ │ ├── myy_Latn.txt
│ │ ├── mza_Latn.txt
│ │ ├── mzh_Latn.txt
│ │ ├── mzk_Latn.txt
│ │ ├── mzl_Latn.txt
│ │ ├── mzm_Latn.txt
│ │ ├── mzn_Arab.txt
│ │ ├── mzw_Latn.txt
│ │ ├── mzz_Latn.txt
│ │ ├── nab_Latn.txt
│ │ ├── naf_Latn.txt
│ │ ├── nah_Latn.txt
│ │ ├── nak_Latn.txt
│ │ ├── nan_Latn.txt
│ │ ├── nap_Latn.txt
│ │ ├── naq_Latn.txt
│ │ ├── nas_Latn.txt
│ │ ├── nav_Latn.txt
│ │ ├── naw_Latn.txt
│ │ ├── nba_Latn.txt
│ │ ├── nbc_Latn.txt
│ │ ├── nbe_Latn.txt
│ │ ├── nbl_Latn.txt
│ │ ├── nbq_Latn.txt
│ │ ├── nbu_Latn.txt
│ │ ├── nca_Latn.txt
│ │ ├── nch_Latn.txt
│ │ ├── ncj_Latn.txt
│ │ ├── ncl_Latn.txt
│ │ ├── ncq_Laoo.txt
│ │ ├── nct_Latn.txt
│ │ ├── ncu_Latn.txt
│ │ ├── ncx_Latn.txt
│ │ ├── ndc_Latn.txt
│ │ ├── nde_Latn.txt
│ │ ├── ndh_Latn.txt
│ │ ├── ndi_Latn.txt
│ │ ├── ndj_Latn.txt
│ │ ├── ndo_Latn.txt
│ │ ├── ndp_Latn.txt
│ │ ├── nds_Latn.txt
│ │ ├── ndy_Latn.txt
│ │ ├── ndz_Latn.txt
│ │ ├── neb_Latn.txt
│ │ ├── new_Deva.txt
│ │ ├── nfa_Latn.txt
│ │ ├── nfr_Latn.txt
│ │ ├── ngb_Latn.txt
│ │ ├── ngc_Latn.txt
│ │ ├── ngl_Latn.txt
│ │ ├── ngp_Latn.txt
│ │ ├── ngu_Latn.txt
│ │ ├── nhd_Latn.txt
│ │ ├── nhe_Latn.txt
│ │ ├── nhg_Latn.txt
│ │ ├── nhi_Latn.txt
│ │ ├── nhk_Latn.txt
│ │ ├── nho_Latn.txt
│ │ ├── nhr_Latn.txt
│ │ ├── nhu_Latn.txt
│ │ ├── nhw_Latn.txt
│ │ ├── nhx_Latn.txt
│ │ ├── nhy_Latn.txt
│ │ ├── nia_Latn.txt
│ │ ├── nif_Latn.txt
│ │ ├── nii_Latn.txt
│ │ ├── nij_Latn.txt
│ │ ├── nim_Latn.txt
│ │ ├── nin_Latn.txt
│ │ ├── nio_Cyrl.txt
│ │ ├── niq_Latn.txt
│ │ ├── niu_Latn.txt
│ │ ├── niy_Latn.txt
│ │ ├── njb_Latn.txt
│ │ ├── njm_Latn.txt
│ │ ├── njn_Latn.txt
│ │ ├── njo_Latn.txt
│ │ ├── njz_Latn.txt
│ │ ├── nkf_Latn.txt
│ │ ├── nki_Latn.txt
│ │ ├── nko_Latn.txt
│ │ ├── nla_Latn.txt
│ │ ├── nlc_Latn.txt
│ │ ├── nld_Latn.txt
│ │ ├── nlg_Latn.txt
│ │ ├── nma_Latn.txt
│ │ ├── nmf_Latn.txt
│ │ ├── nmh_Latn.txt
│ │ ├── nmo_Latn.txt
│ │ ├── nmw_Latn.txt
│ │ ├── nmz_Latn.txt
│ │ ├── nnb_Latn.txt
│ │ ├── nng_Latn.txt
│ │ ├── nnh_Latn.txt
│ │ ├── nnl_Latn.txt
│ │ ├── nno_Latn.txt
│ │ ├── nnp_Latn.txt
│ │ ├── nnq_Latn.txt
│ │ ├── nnw_Latn.txt
│ │ ├── noa_Latn.txt
│ │ ├── nob_Latn.txt
│ │ ├── nod_Thai.txt
│ │ ├── nog_Cyrl.txt
│ │ ├── non_Latn.txt
│ │ ├── nop_Latn.txt
│ │ ├── not_Latn.txt
│ │ ├── nou_Latn.txt
│ │ ├── nov_Latn.txt
│ │ ├── nph_Latn.txt
│ │ ├── npi_Deva.txt
│ │ ├── npi_Latn.txt
│ │ ├── npl_Latn.txt
│ │ ├── npo_Latn.txt
│ │ ├── npy_Latn.txt
│ │ ├── nqo_Nkoo.txt
│ │ ├── nre_Latn.txt
│ │ ├── nrf_Latn.txt
│ │ ├── nri_Latn.txt
│ │ ├── nsa_Latn.txt
│ │ ├── nse_Latn.txt
│ │ ├── nsm_Latn.txt
│ │ ├── nsn_Latn.txt
│ │ ├── nso_Latn.txt
│ │ ├── nss_Latn.txt
│ │ ├── nst_Latn.txt
│ │ ├── nsu_Latn.txt
│ │ ├── ntp_Latn.txt
│ │ ├── ntr_Latn.txt
│ │ ├── ntu_Latn.txt
│ │ ├── nuj_Latn.txt
│ │ ├── nus_Latn.txt
│ │ ├── nuy_Latn.txt
│ │ ├── nuz_Latn.txt
│ │ ├── nvm_Latn.txt
│ │ ├── nwb_Latn.txt
│ │ ├── nwi_Latn.txt
│ │ ├── nwx_Deva.txt
│ │ ├── nxd_Latn.txt
│ │ ├── nya_Latn.txt
│ │ ├── nyf_Latn.txt
│ │ ├── nyk_Latn.txt
│ │ ├── nyn_Latn.txt
│ │ ├── nyo_Latn.txt
│ │ ├── nyu_Latn.txt
│ │ ├── nyy_Latn.txt
│ │ ├── nza_Latn.txt
│ │ ├── nzi_Latn.txt
│ │ ├── nzm_Latn.txt
│ │ ├── obo_Latn.txt
│ │ ├── oci_Latn.txt
│ │ ├── ogo_Latn.txt
│ │ ├── ojb_Cans.txt
│ │ ├── ojb_Latn.txt
│ │ ├── oke_Latn.txt
│ │ ├── oku_Latn.txt
│ │ ├── okv_Latn.txt
│ │ ├── old_Latn.txt
│ │ ├── olo_Latn.txt
│ │ ├── omb_Latn.txt
│ │ ├── omw_Latn.txt
│ │ ├── ong_Latn.txt
│ │ ├── ons_Latn.txt
│ │ ├── ood_Latn.txt
│ │ ├── opm_Latn.txt
│ │ ├── orv_Cyrl.txt
│ │ ├── ory_Latn.txt
│ │ ├── ory_Orya.txt
│ │ ├── oss_Cyrl.txt
│ │ ├── ota_Arab.txt
│ │ ├── otd_Latn.txt
│ │ ├── ote_Latn.txt
│ │ ├── otm_Latn.txt
│ │ ├── otn_Latn.txt
│ │ ├── oto_Latn.txt
│ │ ├── otq_Latn.txt
│ │ ├── ots_Latn.txt
│ │ ├── otw_Latn.txt
│ │ ├── oym_Latn.txt
│ │ ├── ozm_Latn.txt
│ │ ├── pab_Latn.txt
│ │ ├── pad_Latn.txt
│ │ ├── pag_Latn.txt
│ │ ├── pah_Latn.txt
│ │ ├── pam_Latn.txt
│ │ ├── pan_Guru.txt
│ │ ├── pan_Latn.txt
│ │ ├── pao_Latn.txt
│ │ ├── pap_Latn.txt
│ │ ├── pau_Latn.txt
│ │ ├── pbb_Latn.txt
│ │ ├── pbc_Latn.txt
│ │ ├── pbi_Latn.txt
│ │ ├── pbt_Arab.txt
│ │ ├── pcd_Latn.txt
│ │ ├── pck_Latn.txt
│ │ ├── pcm_Latn.txt
│ │ ├── pdc_Latn.txt
│ │ ├── pdt_Latn.txt
│ │ ├── pem_Latn.txt
│ │ ├── pfe_Latn.txt
│ │ ├── pfl_Latn.txt
│ │ ├── phm_Latn.txt
│ │ ├── pib_Latn.txt
│ │ ├── pio_Latn.txt
│ │ ├── pir_Latn.txt
│ │ ├── pis_Latn.txt
│ │ ├── pjt_Latn.txt
│ │ ├── pkb_Latn.txt
│ │ ├── plg_Latn.txt
│ │ ├── pls_Latn.txt
│ │ ├── plt_Latn.txt
│ │ ├── plu_Latn.txt
│ │ ├── plw_Latn.txt
│ │ ├── pma_Latn.txt
│ │ ├── pmf_Latn.txt
│ │ ├── pmq_Latn.txt
│ │ ├── pms_Latn.txt
│ │ ├── pmx_Latn.txt
│ │ ├── pnb_Arab.txt
│ │ ├── pne_Latn.txt
│ │ ├── pnt_Grek.txt
│ │ ├── pny_Latn.txt
│ │ ├── poe_Latn.txt
│ │ ├── poh_Latn.txt
│ │ ├── poi_Latn.txt
│ │ ├── pol_Latn.txt
│ │ ├── pon_Latn.txt
│ │ ├── por_Latn.txt
│ │ ├── pos_Latn.txt
│ │ ├── pot_Latn.txt
│ │ ├── pov_Latn.txt
│ │ ├── poy_Latn.txt
│ │ ├── ppk_Latn.txt
│ │ ├── ppo_Latn.txt
│ │ ├── pps_Latn.txt
│ │ ├── prf_Latn.txt
│ │ ├── prg_Latn.txt
│ │ ├── pri_Latn.txt
│ │ ├── prq_Latn.txt
│ │ ├── pse_Latn.txt
│ │ ├── pss_Latn.txt
│ │ ├── ptp_Latn.txt
│ │ ├── ptu_Latn.txt
│ │ ├── pua_Latn.txt
│ │ ├── pui_Latn.txt
│ │ ├── pwg_Latn.txt
│ │ ├── pwn_Latn.txt
│ │ ├── pww_Thai.txt
│ │ ├── pxm_Latn.txt
│ │ ├── qub_Latn.txt
│ │ ├── quc_Latn.txt
│ │ ├── quf_Latn.txt
│ │ ├── qug_Latn.txt
│ │ ├── quh_Latn.txt
│ │ ├── qul_Latn.txt
│ │ ├── qup_Latn.txt
│ │ ├── qus_Latn.txt
│ │ ├── quw_Latn.txt
│ │ ├── quy_Latn.txt
│ │ ├── quz_Latn.txt
│ │ ├── qva_Latn.txt
│ │ ├── qvc_Latn.txt
│ │ ├── qve_Latn.txt
│ │ ├── qvh_Latn.txt
│ │ ├── qvi_Latn.txt
│ │ ├── qvm_Latn.txt
│ │ ├── qvn_Latn.txt
│ │ ├── qvo_Latn.txt
│ │ ├── qvs_Latn.txt
│ │ ├── qvw_Latn.txt
│ │ ├── qvz_Latn.txt
│ │ ├── qwh_Latn.txt
│ │ ├── qxh_Latn.txt
│ │ ├── qxl_Latn.txt
│ │ ├── qxn_Latn.txt
│ │ ├── qxo_Latn.txt
│ │ ├── qxr_Latn.txt
│ │ ├── rad_Latn.txt
│ │ ├── rai_Latn.txt
│ │ ├── rap_Latn.txt
│ │ ├── rar_Latn.txt
│ │ ├── rav_Deva.txt
│ │ ├── raw_Latn.txt
│ │ ├── rcf_Latn.txt
│ │ ├── rej_Latn.txt
│ │ ├── rel_Latn.txt
│ │ ├── rgu_Latn.txt
│ │ ├── rhg_Latn.txt
│ │ ├── ria_Latn.txt
│ │ ├── rim_Latn.txt
│ │ ├── rjs_Deva.txt
│ │ ├── rkb_Latn.txt
│ │ ├── rmc_Latn.txt
│ │ ├── rme_Latn.txt
│ │ ├── rml_Latn.txt
│ │ ├── rmn_Cyrl.txt
│ │ ├── rmn_Grek.txt
│ │ ├── rmn_Latn.txt
│ │ ├── rmo_Latn.txt
│ │ ├── rmq_Latn.txt
│ │ ├── rmy_Cyrl.txt
│ │ ├── rmy_Latn.txt
│ │ ├── rnd_Latn.txt
│ │ ├── rng_Latn.txt
│ │ ├── rnl_Latn.txt
│ │ ├── roh_Latn.txt
│ │ ├── ron_Cyrl.txt
│ │ ├── ron_Latn.txt
│ │ ├── roo_Latn.txt
│ │ ├── rop_Latn.txt
│ │ ├── row_Latn.txt
│ │ ├── rro_Latn.txt
│ │ ├── rtm_Latn.txt
│ │ ├── rub_Latn.txt
│ │ ├── rue_Cyrl.txt
│ │ ├── ruf_Latn.txt
│ │ ├── rug_Latn.txt
│ │ ├── run_Latn.txt
│ │ ├── rup_Latn.txt
│ │ ├── rus_Cyrl.txt
│ │ ├── rwo_Latn.txt
│ │ ├── sab_Latn.txt
│ │ ├── sag_Latn.txt
│ │ ├── sah_Cyrl.txt
│ │ ├── saj_Latn.txt
│ │ ├── san_Deva.txt
│ │ ├── san_Latn.txt
│ │ ├── sas_Latn.txt
│ │ ├── sat_Latn.txt
│ │ ├── sat_Olck.txt
│ │ ├── say_Latn.txt
│ │ ├── sba_Latn.txt
│ │ ├── sbd_Latn.txt
│ │ ├── sbe_Latn.txt
│ │ ├── sbl_Latn.txt
│ │ ├── sbs_Latn.txt
│ │ ├── sby_Latn.txt
│ │ ├── sck_Deva.txt
│ │ ├── scn_Latn.txt
│ │ ├── sco_Latn.txt
│ │ ├── sda_Latn.txt
│ │ ├── sdc_Latn.txt
│ │ ├── sdh_Arab.txt
│ │ ├── sdo_Latn.txt
│ │ ├── sdq_Latn.txt
│ │ ├── seh_Latn.txt
│ │ ├── sel_Cyrl.txt
│ │ ├── ses_Latn.txt
│ │ ├── sey_Latn.txt
│ │ ├── sfw_Latn.txt
│ │ ├── sgb_Latn.txt
│ │ ├── sgc_Latn.txt
│ │ ├── sgh_Cyrl.txt
│ │ ├── sgs_Latn.txt
│ │ ├── sgw_Ethi.txt
│ │ ├── sgz_Latn.txt
│ │ ├── shi_Latn.txt
│ │ ├── shk_Latn.txt
│ │ ├── shn_Mymr.txt
│ │ ├── shp_Latn.txt
│ │ ├── shr_Latn.txt
│ │ ├── shu_Arab.txt
│ │ ├── sid_Latn.txt
│ │ ├── sig_Latn.txt
│ │ ├── sil_Latn.txt
│ │ ├── sim_Latn.txt
│ │ ├── sin_Sinh.txt
│ │ ├── sja_Latn.txt
│ │ ├── sjo_Mong.txt
│ │ ├── sju_Latn.txt
│ │ ├── skg_Latn.txt
│ │ ├── skr_Arab.txt
│ │ ├── sld_Latn.txt
│ │ ├── slk_Latn.txt
│ │ ├── sll_Latn.txt
│ │ ├── slv_Latn.txt
│ │ ├── sma_Latn.txt
│ │ ├── sme_Latn.txt
│ │ ├── smj_Latn.txt
│ │ ├── smk_Latn.txt
│ │ ├── sml_Latn.txt
│ │ ├── smn_Latn.txt
│ │ ├── smo_Latn.txt
│ │ ├── sms_Latn.txt
│ │ ├── smt_Latn.txt
│ │ ├── sna_Latn.txt
│ │ ├── snc_Latn.txt
│ │ ├── snd_Arab.txt
│ │ ├── snd_Deva.txt
│ │ ├── snd_Latn.txt
│ │ ├── snf_Latn.txt
│ │ ├── snn_Latn.txt
│ │ ├── snp_Latn.txt
│ │ ├── snw_Latn.txt
│ │ ├── sny_Latn.txt
│ │ ├── soe_Latn.txt
│ │ ├── som_Latn.txt
│ │ ├── sop_Latn.txt
│ │ ├── soq_Latn.txt
│ │ ├── sot_Latn.txt
│ │ ├── soy_Latn.txt
│ │ ├── spa_Latn.txt
│ │ ├── spl_Latn.txt
│ │ ├── spm_Latn.txt
│ │ ├── spp_Latn.txt
│ │ ├── sps_Latn.txt
│ │ ├── spy_Latn.txt
│ │ ├── srd_Latn.txt
│ │ ├── sri_Latn.txt
│ │ ├── srm_Latn.txt
│ │ ├── srn_Latn.txt
│ │ ├── srp_Cyrl.txt
│ │ ├── srp_Latn.txt
│ │ ├── srq_Latn.txt
│ │ ├── srr_Latn.txt
│ │ ├── ssd_Latn.txt
│ │ ├── ssg_Latn.txt
│ │ ├── ssw_Latn.txt
│ │ ├── ssx_Latn.txt
│ │ ├── stn_Latn.txt
│ │ ├── stp_Latn.txt
│ │ ├── stq_Latn.txt
│ │ ├── sua_Latn.txt
│ │ ├── suc_Latn.txt
│ │ ├── sue_Latn.txt
│ │ ├── suk_Latn.txt
│ │ ├── sun_Latn.txt
│ │ ├── sur_Latn.txt
│ │ ├── sus_Arab.txt
│ │ ├── sus_Latn.txt
│ │ ├── suz_Deva.txt
│ │ ├── swb_Latn.txt
│ │ ├── swc_Latn.txt
│ │ ├── swe_Latn.txt
│ │ ├── swg_Latn.txt
│ │ ├── swh_Latn.txt
│ │ ├── swk_Latn.txt
│ │ ├── swp_Latn.txt
│ │ ├── sxb_Latn.txt
│ │ ├── sxn_Latn.txt
│ │ ├── syb_Latn.txt
│ │ ├── syc_Syrc.txt
│ │ ├── syl_Beng.txt
│ │ ├── syl_Latn.txt
│ │ ├── szb_Latn.txt
│ │ ├── szl_Latn.txt
│ │ ├── szy_Latn.txt
│ │ ├── tab_Cyrl.txt
│ │ ├── tac_Latn.txt
│ │ ├── tah_Latn.txt
│ │ ├── taj_Deva.txt
│ │ ├── tam_Latn.txt
│ │ ├── tam_Taml.txt
│ │ ├── tap_Latn.txt
│ │ ├── taq_Latn.txt
│ │ ├── taq_Tfng.txt
│ │ ├── tar_Latn.txt
│ │ ├── tat_Cyrl.txt
│ │ ├── tat_Latn.txt
│ │ ├── tav_Latn.txt
│ │ ├── taw_Latn.txt
│ │ ├── tay_Latn.txt
│ │ ├── tbc_Latn.txt
│ │ ├── tbg_Latn.txt
│ │ ├── tbk_Latn.txt
│ │ ├── tbl_Latn.txt
│ │ ├── tbo_Latn.txt
│ │ ├── tbw_Latn.txt
│ │ ├── tby_Latn.txt
│ │ ├── tbz_Latn.txt
│ │ ├── tca_Latn.txt
│ │ ├── tcc_Latn.txt
│ │ ├── tcf_Latn.txt
│ │ ├── tcs_Latn.txt
│ │ ├── tcy_Knda.txt
│ │ ├── tcz_Latn.txt
│ │ ├── tdx_Latn.txt
│ │ ├── ted_Latn.txt
│ │ ├── tee_Latn.txt
│ │ ├── tel_Latn.txt
│ │ ├── tel_Telu.txt
│ │ ├── tem_Latn.txt
│ │ ├── teo_Latn.txt
│ │ ├── ter_Latn.txt
│ │ ├── tet_Latn.txt
│ │ ├── tew_Latn.txt
│ │ ├── tfr_Latn.txt
│ │ ├── tgk_Cyrl.txt
│ │ ├── tgo_Latn.txt
│ │ ├── tgp_Latn.txt
│ │ ├── tha_Thai.txt
│ │ ├── thk_Latn.txt
│ │ ├── thl_Deva.txt
│ │ ├── thv_Latn.txt
│ │ ├── tif_Latn.txt
│ │ ├── tig_Ethi.txt
│ │ ├── tih_Latn.txt
│ │ ├── tik_Latn.txt
│ │ ├── tim_Latn.txt
│ │ ├── tir_Ethi.txt
│ │ ├── tiv_Latn.txt
│ │ ├── tiy_Latn.txt
│ │ ├── tke_Latn.txt
│ │ ├── tkl_Latn.txt
│ │ ├── tkr_Cyrl.txt
│ │ ├── tku_Latn.txt
│ │ ├── tlb_Latn.txt
│ │ ├── tlf_Latn.txt
│ │ ├── tlh_Latn.txt
│ │ ├── tlj_Latn.txt
│ │ ├── tll_Latn.txt
│ │ ├── tly_Latn.txt
│ │ ├── tmc_Latn.txt
│ │ ├── tmd_Latn.txt
│ │ ├── tna_Latn.txt
│ │ ├── tnc_Latn.txt
│ │ ├── tnk_Latn.txt
│ │ ├── tnn_Latn.txt
│ │ ├── tnp_Latn.txt
│ │ ├── tnr_Latn.txt
│ │ ├── tob_Latn.txt
│ │ ├── toc_Latn.txt
│ │ ├── tod_Latn.txt
│ │ ├── tog_Latn.txt
│ │ ├── toh_Latn.txt
│ │ ├── toi_Latn.txt
│ │ ├── toj_Latn.txt
│ │ ├── tok_Latn.txt
│ │ ├── ton_Latn.txt
│ │ ├── too_Latn.txt
│ │ ├── top_Latn.txt
│ │ ├── tos_Latn.txt
│ │ ├── tpa_Latn.txt
│ │ ├── tpi_Latn.txt
│ │ ├── tpm_Latn.txt
│ │ ├── tpn_Latn.txt
│ │ ├── tpp_Latn.txt
│ │ ├── tpt_Latn.txt
│ │ ├── tpw_Latn.txt
│ │ ├── tpz_Latn.txt
│ │ ├── tqo_Latn.txt
│ │ ├── trc_Latn.txt
│ │ ├── trn_Latn.txt
│ │ ├── tro_Latn.txt
│ │ ├── trp_Latn.txt
│ │ ├── trq_Latn.txt
│ │ ├── trs_Latn.txt
│ │ ├── trv_Latn.txt
│ │ ├── tsc_Latn.txt
│ │ ├── tsg_Latn.txt
│ │ ├── tsn_Latn.txt
│ │ ├── tso_Latn.txt
│ │ ├── tsw_Latn.txt
│ │ ├── tsz_Latn.txt
│ │ ├── ttc_Latn.txt
│ │ ├── tte_Latn.txt
│ │ ├── ttj_Latn.txt
│ │ ├── ttq_Latn.txt
│ │ ├── ttq_Tfng.txt
│ │ ├── tuc_Latn.txt
│ │ ├── tue_Latn.txt
│ │ ├── tuf_Latn.txt
│ │ ├── tui_Latn.txt
│ │ ├── tuk_Arab.txt
│ │ ├── tuk_Cyrl.txt
│ │ ├── tuk_Latn.txt
│ │ ├── tul_Latn.txt
│ │ ├── tum_Latn.txt
│ │ ├── tuo_Latn.txt
│ │ ├── tur_Latn.txt
│ │ ├── tuv_Latn.txt
│ │ ├── tvk_Latn.txt
│ │ ├── tvl_Latn.txt
│ │ ├── twb_Latn.txt
│ │ ├── twi_Latn.txt
│ │ ├── twu_Latn.txt
│ │ ├── twx_Latn.txt
│ │ ├── txq_Latn.txt
│ │ ├── txu_Latn.txt
│ │ ├── tyv_Cyrl.txt
│ │ ├── tzh_Latn.txt
│ │ ├── tzj_Latn.txt
│ │ ├── tzl_Latn.txt
│ │ ├── tzm_Tfng.txt
│ │ ├── tzo_Latn.txt
│ │ ├── ubr_Latn.txt
│ │ ├── ubu_Latn.txt
│ │ ├── udm_Cyrl.txt
│ │ ├── udu_Latn.txt
│ │ ├── uig_Arab.txt
│ │ ├── uig_Cyrl.txt
│ │ ├── uig_Latn.txt
│ │ ├── ukr_Cyrl.txt
│ │ ├── umb_Latn.txt
│ │ ├── upv_Latn.txt
│ │ ├── ura_Latn.txt
│ │ ├── urb_Latn.txt
│ │ ├── urd_Arab.txt
│ │ ├── urd_Latn.txt
│ │ ├── urh_Latn.txt
│ │ ├── uri_Latn.txt
│ │ ├── urk_Thai.txt
│ │ ├── urt_Latn.txt
│ │ ├── urw_Latn.txt
│ │ ├── ury_Latn.txt
│ │ ├── usa_Latn.txt
│ │ ├── usp_Latn.txt
│ │ ├── uth_Latn.txt
│ │ ├── uvh_Latn.txt
│ │ ├── uvl_Latn.txt
│ │ ├── uzn_Cyrl.txt
│ │ ├── uzn_Latn.txt
│ │ ├── uzs_Arab.txt
│ │ ├── vag_Latn.txt
│ │ ├── vap_Latn.txt
│ │ ├── var_Latn.txt
│ │ ├── vec_Latn.txt
│ │ ├── ven_Latn.txt
│ │ ├── vep_Latn.txt
│ │ ├── vid_Latn.txt
│ │ ├── vie_Latn.txt
│ │ ├── viv_Latn.txt
│ │ ├── vls_Latn.txt
│ │ ├── vmk_Latn.txt
│ │ ├── vmw_Latn.txt
│ │ ├── vmy_Latn.txt
│ │ ├── vol_Latn.txt
│ │ ├── vot_Latn.txt
│ │ ├── vro_Latn.txt
│ │ ├── vun_Latn.txt
│ │ ├── vut_Latn.txt
│ │ ├── waj_Latn.txt
│ │ ├── wal_Ethi.txt
│ │ ├── wal_Latn.txt
│ │ ├── wap_Latn.txt
│ │ ├── war_Latn.txt
│ │ ├── wat_Latn.txt
│ │ ├── way_Latn.txt
│ │ ├── wba_Latn.txt
│ │ ├── wbm_Latn.txt
│ │ ├── wbp_Latn.txt
│ │ ├── wed_Latn.txt
│ │ ├── wer_Latn.txt
│ │ ├── wes_Latn.txt
│ │ ├── wew_Latn.txt
│ │ ├── whg_Latn.txt
│ │ ├── whk_Latn.txt
│ │ ├── wib_Latn.txt
│ │ ├── wim_Latn.txt
│ │ ├── wiu_Latn.txt
│ │ ├── wln_Latn.txt
│ │ ├── wls_Latn.txt
│ │ ├── wlv_Latn.txt
│ │ ├── wlx_Latn.txt
│ │ ├── wmt_Latn.txt
│ │ ├── wmw_Latn.txt
│ │ ├── wnc_Latn.txt
│ │ ├── wnu_Latn.txt
│ │ ├── wob_Latn.txt
│ │ ├── wol_Latn.txt
│ │ ├── wos_Latn.txt
│ │ ├── wrk_Latn.txt
│ │ ├── wrs_Latn.txt
│ │ ├── wsg_Telu.txt
│ │ ├── wsk_Latn.txt
│ │ ├── wuu_Hani.txt
│ │ ├── wuv_Latn.txt
│ │ ├── wwa_Latn.txt
│ │ ├── xal_Cyrl.txt
│ │ ├── xav_Latn.txt
│ │ ├── xbi_Latn.txt
│ │ ├── xbr_Latn.txt
│ │ ├── xed_Latn.txt
│ │ ├── xho_Latn.txt
│ │ ├── xla_Latn.txt
│ │ ├── xmf_Geor.txt
│ │ ├── xmm_Latn.txt
│ │ ├── xmv_Latn.txt
│ │ ├── xnn_Latn.txt
│ │ ├── xog_Latn.txt
│ │ ├── xon_Latn.txt
│ │ ├── xrb_Latn.txt
│ │ ├── xsb_Latn.txt
│ │ ├── xsi_Latn.txt
│ │ ├── xsm_Latn.txt
│ │ ├── xsr_Deva.txt
│ │ ├── xsu_Latn.txt
│ │ ├── xtd_Latn.txt
│ │ ├── xtm_Latn.txt
│ │ ├── xtn_Latn.txt
│ │ ├── xum_Latn.txt
│ │ ├── xuo_Latn.txt
│ │ ├── yaa_Latn.txt
│ │ ├── yad_Latn.txt
│ │ ├── yal_Latn.txt
│ │ ├── yam_Latn.txt
│ │ ├── yan_Latn.txt
│ │ ├── yao_Latn.txt
│ │ ├── yap_Latn.txt
│ │ ├── yaq_Latn.txt
│ │ ├── yas_Latn.txt
│ │ ├── yat_Latn.txt
│ │ ├── yaz_Latn.txt
│ │ ├── ybb_Latn.txt
│ │ ├── yby_Latn.txt
│ │ ├── ycn_Latn.txt
│ │ ├── ydd_Hebr.txt
│ │ ├── yim_Latn.txt
│ │ ├── yka_Latn.txt
│ │ ├── yle_Latn.txt
│ │ ├── yli_Latn.txt
│ │ ├── yml_Latn.txt
│ │ ├── yom_Latn.txt
│ │ ├── yon_Latn.txt
│ │ ├── yor_Latn.txt
│ │ ├── yrb_Latn.txt
│ │ ├── yre_Latn.txt
│ │ ├── yrk_Cyrl.txt
│ │ ├── yrl_Latn.txt
│ │ ├── yss_Latn.txt
│ │ ├── yua_Latn.txt
│ │ ├── yue_Hani.txt
│ │ ├── yuj_Latn.txt
│ │ ├── yup_Latn.txt
│ │ ├── yut_Latn.txt
│ │ ├── yuw_Latn.txt
│ │ ├── yuz_Latn.txt
│ │ ├── yva_Latn.txt
│ │ ├── zaa_Latn.txt
│ │ ├── zab_Latn.txt
│ │ ├── zac_Latn.txt
│ │ ├── zad_Latn.txt
│ │ ├── zae_Latn.txt
│ │ ├── zai_Latn.txt
│ │ ├── zam_Latn.txt
│ │ ├── zao_Latn.txt
│ │ ├── zar_Latn.txt
│ │ ├── zas_Latn.txt
│ │ ├── zat_Latn.txt
│ │ ├── zav_Latn.txt
│ │ ├── zaw_Latn.txt
│ │ ├── zca_Latn.txt
│ │ ├── zdj_Latn.txt
│ │ ├── zea_Latn.txt
│ │ ├── zgh_Tfng.txt
│ │ ├── zho_Hani.txt
│ │ ├── zia_Latn.txt
│ │ ├── ziw_Latn.txt
│ │ ├── zne_Latn.txt
│ │ ├── zoc_Latn.txt
│ │ ├── zom_Latn.txt
│ │ ├── zos_Latn.txt
│ │ ├── zpa_Latn.txt
│ │ ├── zpc_Latn.txt
│ │ ├── zpg_Latn.txt
│ │ ├── zpi_Latn.txt
│ │ ├── zpj_Latn.txt
│ │ ├── zpl_Latn.txt
│ │ ├── zpm_Latn.txt
│ │ ├── zpo_Latn.txt
│ │ ├── zpq_Latn.txt
│ │ ├── zpt_Latn.txt
│ │ ├── zpu_Latn.txt
│ │ ├── zpv_Latn.txt
│ │ ├── zpz_Latn.txt
│ │ ├── zsm_Arab.txt
│ │ ├── zsm_Latn.txt
│ │ ├── zsr_Latn.txt
│ │ ├── ztq_Latn.txt
│ │ ├── zty_Latn.txt
│ │ ├── zul_Latn.txt
│ │ ├── zyb_Latn.txt
│ │ └── zyp_Latn.txt
│ └── wordlists-0.95/
│ ├── aai_Latn.txt
│ ├── aak_Latn.txt
│ ├── aau_Latn.txt
│ ├── aaz_Latn.txt
│ ├── aba_Latn.txt
│ ├── abi_Latn.txt
│ ├── abk_Cyrl.txt
│ ├── abn_Latn.txt
│ ├── abq_Cyrl.txt
│ ├── abs_Latn.txt
│ ├── abt_Latn.txt
│ ├── abx_Latn.txt
│ ├── aby_Latn.txt
│ ├── abz_Latn.txt
│ ├── aca_Latn.txt
│ ├── acd_Latn.txt
│ ├── ace_Arab.txt
│ ├── ace_Latn.txt
│ ├── acf_Latn.txt
│ ├── ach_Latn.txt
│ ├── acm_Arab.txt
│ ├── acn_Latn.txt
│ ├── acr_Latn.txt
│ ├── acu_Latn.txt
│ ├── ada_Latn.txt
│ ├── ade_Latn.txt
│ ├── adh_Latn.txt
│ ├── adi_Latn.txt
│ ├── adj_Latn.txt
│ ├── adl_Latn.txt
│ ├── ady_Cyrl.txt
│ ├── adz_Latn.txt
│ ├── aeb_Arab.txt
│ ├── aer_Latn.txt
│ ├── aeu_Latn.txt
│ ├── aey_Latn.txt
│ ├── afr_Latn.txt
│ ├── agd_Latn.txt
│ ├── agg_Latn.txt
│ ├── agm_Latn.txt
│ ├── agn_Latn.txt
│ ├── agr_Latn.txt
│ ├── agt_Latn.txt
│ ├── agu_Latn.txt
│ ├── agw_Latn.txt
│ ├── agx_Cyrl.txt
│ ├── aha_Latn.txt
│ ├── ahk_Latn.txt
│ ├── aia_Latn.txt
│ ├── aii_Syrc.txt
│ ├── aim_Latn.txt
│ ├── ain_Latn.txt
│ ├── ajg_Latn.txt
│ ├── aji_Latn.txt
│ ├── ajz_Latn.txt
│ ├── akb_Latn.txt
│ ├── ake_Latn.txt
│ ├── akh_Latn.txt
│ ├── akp_Latn.txt
│ ├── ald_Latn.txt
│ ├── alj_Latn.txt
│ ├── aln_Latn.txt
│ ├── alp_Latn.txt
│ ├── alq_Latn.txt
│ ├── als_Latn.txt
│ ├── alt_Cyrl.txt
│ ├── aly_Latn.txt
│ ├── alz_Latn.txt
│ ├── ame_Latn.txt
│ ├── amf_Latn.txt
│ ├── amh_Ethi.txt
│ ├── ami_Latn.txt
│ ├── amk_Latn.txt
│ ├── amm_Latn.txt
│ ├── amn_Latn.txt
│ ├── amp_Latn.txt
│ ├── amr_Latn.txt
│ ├── amu_Latn.txt
│ ├── amx_Latn.txt
│ ├── ang_Latn.txt
│ ├── anm_Latn.txt
│ ├── ann_Latn.txt
│ ├── anp_Deva.txt
│ ├── anv_Latn.txt
│ ├── any_Latn.txt
│ ├── aoi_Latn.txt
│ ├── aoj_Latn.txt
│ ├── aom_Latn.txt
│ ├── aoz_Latn.txt
│ ├── apb_Latn.txt
│ ├── apc_Arab.txt
│ ├── ape_Latn.txt
│ ├── apn_Latn.txt
│ ├── apr_Latn.txt
│ ├── apt_Latn.txt
│ ├── apu_Latn.txt
│ ├── apw_Latn.txt
│ ├── apy_Latn.txt
│ ├── apz_Latn.txt
│ ├── aqz_Latn.txt
│ ├── arb_Arab.txt
│ ├── arb_Latn.txt
│ ├── are_Latn.txt
│ ├── arg_Latn.txt
│ ├── arl_Latn.txt
│ ├── arn_Latn.txt
│ ├── arp_Latn.txt
│ ├── arq_Arab.txt
│ ├── arr_Latn.txt
│ ├── ars_Arab.txt
│ ├── ary_Arab.txt
│ ├── arz_Arab.txt
│ ├── asg_Latn.txt
│ ├── asm_Beng.txt
│ ├── asm_Latn.txt
│ ├── aso_Latn.txt
│ ├── ast_Latn.txt
│ ├── ata_Latn.txt
│ ├── atb_Latn.txt
│ ├── atd_Latn.txt
│ ├── atg_Latn.txt
│ ├── ati_Latn.txt
│ ├── atj_Latn.txt
│ ├── atq_Latn.txt
│ ├── att_Latn.txt
│ ├── auc_Latn.txt
│ ├── aui_Latn.txt
│ ├── auy_Latn.txt
│ ├── ava_Cyrl.txt
│ ├── avk_Latn.txt
│ ├── avn_Latn.txt
│ ├── avt_Latn.txt
│ ├── avu_Latn.txt
│ ├── awa_Deva.txt
│ ├── awb_Latn.txt
│ ├── awi_Latn.txt
│ ├── awx_Latn.txt
│ ├── ayo_Latn.txt
│ ├── ayp_Arab.txt
│ ├── ayr_Latn.txt
│ ├── azb_Arab.txt
│ ├── azg_Latn.txt
│ ├── azj_Cyrl.txt
│ ├── azj_Latn.txt
│ ├── azz_Latn.txt
│ ├── bak_Cyrl.txt
│ ├── bal_Arab.txt
│ ├── bam_Latn.txt
│ ├── ban_Latn.txt
│ ├── bao_Latn.txt
│ ├── bar_Latn.txt
│ ├── bas_Latn.txt
│ ├── bav_Latn.txt
│ ├── bba_Latn.txt
│ ├── bbb_Latn.txt
│ ├── bbc_Latn.txt
│ ├── bbj_Latn.txt
│ ├── bbk_Latn.txt
│ ├── bbo_Latn.txt
│ ├── bbr_Latn.txt
│ ├── bcc_Arab.txt
│ ├── bch_Latn.txt
│ ├── bci_Latn.txt
│ ├── bcl_Latn.txt
│ ├── bco_Latn.txt
│ ├── bcw_Latn.txt
│ ├── bdd_Latn.txt
│ ├── bdh_Latn.txt
│ ├── bdq_Latn.txt
│ ├── bea_Latn.txt
│ ├── bef_Latn.txt
│ ├── bel_Cyrl.txt
│ ├── bem_Latn.txt
│ ├── ben_Beng.txt
│ ├── ben_Latn.txt
│ ├── beq_Latn.txt
│ ├── bew_Latn.txt
│ ├── bex_Latn.txt
│ ├── bfd_Latn.txt
│ ├── bfo_Latn.txt
│ ├── bgr_Latn.txt
│ ├── bgs_Latn.txt
│ ├── bgt_Latn.txt
│ ├── bgz_Latn.txt
│ ├── bhg_Latn.txt
│ ├── bhl_Latn.txt
│ ├── bho_Deva.txt
│ ├── bhp_Latn.txt
│ ├── bhw_Latn.txt
│ ├── bhz_Latn.txt
│ ├── bib_Latn.txt
│ ├── big_Latn.txt
│ ├── bim_Latn.txt
│ ├── bin_Latn.txt
│ ├── bis_Latn.txt
│ ├── biu_Latn.txt
│ ├── biv_Latn.txt
│ ├── bjn_Arab.txt
│ ├── bjn_Latn.txt
│ ├── bjp_Latn.txt
│ ├── bjr_Latn.txt
│ ├── bjv_Latn.txt
│ ├── bkd_Latn.txt
│ ├── bkl_Latn.txt
│ ├── bkq_Latn.txt
│ ├── bku_Latn.txt
│ ├── bkv_Latn.txt
│ ├── bla_Latn.txt
│ ├── blh_Latn.txt
│ ├── blk_Mymr.txt
│ ├── blt_Latn.txt
│ ├── blw_Latn.txt
│ ├── blz_Latn.txt
│ ├── bmh_Latn.txt
│ ├── bmk_Latn.txt
│ ├── bmq_Latn.txt
│ ├── bmr_Latn.txt
│ ├── bmu_Latn.txt
│ ├── bmv_Latn.txt
│ ├── bnj_Latn.txt
│ ├── bno_Latn.txt
│ ├── bnp_Latn.txt
│ ├── boa_Latn.txt
│ ├── bod_Tibt.txt
│ ├── boj_Latn.txt
│ ├── bom_Latn.txt
│ ├── bon_Latn.txt
│ ├── bor_Latn.txt
│ ├── bos_Latn.txt
│ ├── bov_Latn.txt
│ ├── box_Latn.txt
│ ├── bpr_Latn.txt
│ ├── bps_Latn.txt
│ ├── bpy_Beng.txt
│ ├── bqc_Latn.txt
│ ├── bqj_Latn.txt
│ ├── bqp_Latn.txt
│ ├── bre_Latn.txt
│ ├── brh_Arab.txt
│ ├── bru_Latn.txt
│ ├── brx_Deva.txt
│ ├── brx_Latn.txt
│ ├── bsc_Latn.txt
│ ├── bsn_Latn.txt
│ ├── bsp_Latn.txt
│ ├── bsq_Latn.txt
│ ├── bss_Latn.txt
│ ├── btd_Latn.txt
│ ├── bth_Latn.txt
│ ├── bts_Latn.txt
│ ├── btt_Latn.txt
│ ├── btx_Latn.txt
│ ├── bud_Latn.txt
│ ├── bug_Latn.txt
│ ├── buk_Latn.txt
│ ├── bul_Cyrl.txt
│ ├── bum_Latn.txt
│ ├── bus_Latn.txt
│ ├── bvc_Latn.txt
│ ├── bvd_Latn.txt
│ ├── bvr_Latn.txt
│ ├── bvz_Latn.txt
│ ├── bwd_Latn.txt
│ ├── bwi_Latn.txt
│ ├── bwq_Latn.txt
│ ├── bwu_Latn.txt
│ ├── bxh_Latn.txt
│ ├── bxr_Cyrl.txt
│ ├── byr_Latn.txt
│ ├── byv_Latn.txt
│ ├── byx_Latn.txt
│ ├── bzd_Latn.txt
│ ├── bzh_Latn.txt
│ ├── bzi_Thai.txt
│ ├── bzj_Latn.txt
│ ├── caa_Latn.txt
│ ├── cab_Latn.txt
│ ├── cac_Latn.txt
│ ├── caf_Latn.txt
│ ├── cag_Latn.txt
│ ├── cak_Latn.txt
│ ├── cao_Latn.txt
│ ├── cap_Latn.txt
│ ├── caq_Latn.txt
│ ├── car_Latn.txt
│ ├── cas_Latn.txt
│ ├── cat_Latn.txt
│ ├── cav_Latn.txt
│ ├── cax_Latn.txt
│ ├── cbc_Latn.txt
│ ├── cbi_Latn.txt
│ ├── cbk_Latn.txt
│ ├── cbr_Latn.txt
│ ├── cbs_Latn.txt
│ ├── cbt_Latn.txt
│ ├── cbu_Latn.txt
│ ├── cbv_Latn.txt
│ ├── cce_Latn.txt
│ ├── cco_Latn.txt
│ ├── ccp_Latn.txt
│ ├── cdf_Latn.txt
│ ├── ceb_Latn.txt
│ ├── ceg_Latn.txt
│ ├── cek_Latn.txt
│ ├── ces_Latn.txt
│ ├── cfm_Latn.txt
│ ├── cgc_Latn.txt
│ ├── cgg_Latn.txt
│ ├── cha_Latn.txt
│ ├── chd_Latn.txt
│ ├── che_Cyrl.txt
│ ├── chf_Latn.txt
│ ├── chj_Latn.txt
│ ├── chk_Latn.txt
│ ├── cho_Latn.txt
│ ├── chq_Latn.txt
│ ├── chr_Cher.txt
│ ├── chr_Latn.txt
│ ├── chu_Cyrl.txt
│ ├── chv_Cyrl.txt
│ ├── chw_Latn.txt
│ ├── chz_Latn.txt
│ ├── cjk_Latn.txt
│ ├── cjo_Latn.txt
│ ├── cjp_Latn.txt
│ ├── cjs_Cyrl.txt
│ ├── cjv_Latn.txt
│ ├── ckb_Arab.txt
│ ├── cko_Latn.txt
│ ├── ckt_Cyrl.txt
│ ├── cle_Latn.txt
│ ├── clu_Latn.txt
│ ├── cly_Latn.txt
│ ├── cme_Latn.txt
│ ├── cmn_Hani.txt
│ ├── cmo_Khmr.txt
│ ├── cmo_Latn.txt
│ ├── cmr_Latn.txt
│ ├── cnh_Latn.txt
│ ├── cni_Latn.txt
│ ├── cnk_Latn.txt
│ ├── cnl_Latn.txt
│ ├── cnt_Latn.txt
│ ├── cnw_Latn.txt
│ ├── coe_Latn.txt
│ ├── cof_Latn.txt
│ ├── cok_Latn.txt
│ ├── con_Latn.txt
│ ├── cop_Copt.txt
│ ├── cor_Latn.txt
│ ├── cos_Latn.txt
│ ├── cot_Latn.txt
│ ├── cou_Latn.txt
│ ├── cpa_Latn.txt
│ ├── cpb_Latn.txt
│ ├── cpc_Latn.txt
│ ├── cpu_Latn.txt
│ ├── cpy_Latn.txt
│ ├── crh_Cyrl.txt
│ ├── crh_Latn.txt
│ ├── cri_Latn.txt
│ ├── crj_Cans.txt
│ ├── crk_Cans.txt
│ ├── crk_Latn.txt
│ ├── crl_Cans.txt
│ ├── crm_Cans.txt
│ ├── crn_Latn.txt
│ ├── crs_Latn.txt
│ ├── crt_Latn.txt
│ ├── crx_Latn.txt
│ ├── csb_Latn.txt
│ ├── csk_Latn.txt
│ ├── cso_Latn.txt
│ ├── csw_Latn.txt
│ ├── csy_Latn.txt
│ ├── cta_Latn.txt
│ ├── ctd_Latn.txt
│ ├── cto_Latn.txt
│ ├── ctp_Latn.txt
│ ├── ctu_Latn.txt
│ ├── cub_Latn.txt
│ ├── cuc_Latn.txt
│ ├── cui_Latn.txt
│ ├── cuk_Latn.txt
│ ├── cul_Latn.txt
│ ├── cut_Latn.txt
│ ├── cux_Latn.txt
│ ├── cwd_Cans.txt
│ ├── cwe_Latn.txt
│ ├── cwt_Latn.txt
│ ├── cya_Latn.txt
│ ├── cym_Latn.txt
│ ├── czt_Latn.txt
│ ├── daa_Latn.txt
│ ├── dad_Latn.txt
│ ├── daf_Latn.txt
│ ├── dag_Latn.txt
│ ├── dah_Latn.txt
│ ├── dak_Latn.txt
│ ├── dan_Latn.txt
│ ├── dar_Cyrl.txt
│ ├── dbq_Latn.txt
│ ├── ddg_Latn.txt
│ ├── ddn_Latn.txt
│ ├── ded_Latn.txt
│ ├── des_Latn.txt
│ ├── deu_Latn.txt
│ ├── dga_Latn.txt
│ ├── dgc_Latn.txt
│ ├── dgi_Latn.txt
│ ├── dgr_Latn.txt
│ ├── dgz_Latn.txt
│ ├── dhg_Latn.txt
│ ├── dhm_Latn.txt
│ ├── dhv_Latn.txt
│ ├── did_Latn.txt
│ ├── dig_Latn.txt
│ ├── dik_Latn.txt
│ ├── dip_Latn.txt
│ ├── diq_Latn.txt
│ ├── dis_Latn.txt
│ ├── diu_Latn.txt
│ ├── div_Thaa.txt
│ ├── dje_Latn.txt
│ ├── djk_Latn.txt
│ ├── djr_Latn.txt
│ ├── dks_Latn.txt
│ ├── dln_Latn.txt
│ ├── dng_Cyrl.txt
│ ├── dnj_Latn.txt
│ ├── dnw_Latn.txt
│ ├── dob_Latn.txt
│ ├── doi_Deva.txt
│ ├── dop_Latn.txt
│ ├── dos_Latn.txt
│ ├── dow_Latn.txt
│ ├── drg_Latn.txt
│ ├── dru_Latn.txt
│ ├── dsb_Latn.txt
│ ├── dsh_Latn.txt
│ ├── dtb_Latn.txt
│ ├── dtp_Latn.txt
│ ├── dts_Latn.txt
│ ├── dty_Deva.txt
│ ├── dua_Latn.txt
│ ├── due_Latn.txt
│ ├── dug_Latn.txt
│ ├── duo_Latn.txt
│ ├── dur_Latn.txt
│ ├── dwr_Latn.txt
│ ├── dww_Latn.txt
│ ├── dyi_Latn.txt
│ ├── dyo_Latn.txt
│ ├── dyu_Latn.txt
│ ├── dzo_Tibt.txt
│ ├── ebk_Latn.txt
│ ├── efi_Latn.txt
│ ├── eka_Latn.txt
│ ├── ekk_Latn.txt
│ ├── eko_Latn.txt
│ ├── ell_Grek.txt
│ ├── eme_Latn.txt
│ ├── emi_Latn.txt
│ ├── eml_Latn.txt
│ ├── emp_Latn.txt
│ ├── enb_Latn.txt
│ ├── eng_Latn.txt
│ ├── enl_Latn.txt
│ ├── enm_Latn.txt
│ ├── enq_Latn.txt
│ ├── enx_Latn.txt
│ ├── epo_Latn.txt
│ ├── eri_Latn.txt
│ ├── ese_Latn.txt
│ ├── esi_Latn.txt
│ ├── esk_Latn.txt
│ ├── ess_Latn.txt
│ ├── esu_Latn.txt
│ ├── eto_Latn.txt
│ ├── etr_Latn.txt
│ ├── etu_Latn.txt
│ ├── eus_Latn.txt
│ ├── eve_Cyrl.txt
│ ├── ewe_Latn.txt
│ ├── ewo_Latn.txt
│ ├── ext_Latn.txt
│ ├── eza_Latn.txt
│ ├── faa_Latn.txt
│ ├── fad_Latn.txt
│ ├── fai_Latn.txt
│ ├── fal_Latn.txt
│ ├── fan_Latn.txt
│ ├── fao_Latn.txt
│ ├── far_Latn.txt
│ ├── fas_Arab.txt
│ ├── fat_Latn.txt
│ ├── ffm_Latn.txt
│ ├── fij_Latn.txt
│ ├── fil_Latn.txt
│ ├── fin_Latn.txt
│ ├── fit_Latn.txt
│ ├── fkv_Latn.txt
│ ├── fmu_Deva.txt
│ ├── fon_Latn.txt
│ ├── for_Latn.txt
│ ├── fra_Latn.txt
│ ├── frd_Latn.txt
│ ├── fro_Latn.txt
│ ├── frp_Latn.txt
│ ├── frr_Latn.txt
│ ├── fry_Latn.txt
│ ├── fub_Latn.txt
│ ├── fud_Latn.txt
│ ├── fue_Latn.txt
│ ├── fuf_Latn.txt
│ ├── fuh_Latn.txt
│ ├── fuq_Latn.txt
│ ├── fur_Latn.txt
│ ├── fuv_Arab.txt
│ ├── fuv_Latn.txt
│ ├── gaa_Latn.txt
│ ├── gag_Cyrl.txt
│ ├── gag_Latn.txt
│ ├── gah_Latn.txt
│ ├── gai_Latn.txt
│ ├── gam_Latn.txt
│ ├── gaw_Latn.txt
│ ├── gaz_Latn.txt
│ ├── gbi_Latn.txt
│ ├── gbo_Latn.txt
│ ├── gbr_Latn.txt
│ ├── gcf_Latn.txt
│ ├── gcr_Latn.txt
│ ├── gde_Latn.txt
│ ├── gdg_Latn.txt
│ ├── gdn_Latn.txt
│ ├── gdr_Latn.txt
│ ├── geb_Latn.txt
│ ├── gej_Latn.txt
│ ├── gfk_Latn.txt
│ ├── ghe_Deva.txt
│ ├── ghs_Latn.txt
│ ├── gid_Latn.txt
│ ├── gil_Latn.txt
│ ├── giz_Latn.txt
│ ├── gjn_Latn.txt
│ ├── gkn_Latn.txt
│ ├── gla_Latn.txt
│ ├── gle_Latn.txt
│ ├── glg_Latn.txt
│ ├── glk_Arab.txt
│ ├── glv_Latn.txt
│ ├── gmh_Latn.txt
│ ├── gmv_Ethi.txt
│ ├── gmv_Latn.txt
│ ├── gna_Latn.txt
│ ├── gnb_Latn.txt
│ ├── gnd_Latn.txt
│ ├── gng_Latn.txt
│ ├── gnn_Latn.txt
│ ├── gnw_Latn.txt
│ ├── goa_Latn.txt
│ ├── gof_Ethi.txt
│ ├── gof_Latn.txt
│ ├── gog_Latn.txt
│ ├── goh_Latn.txt
│ ├── gom_Deva.txt
│ ├── gom_Latn.txt
│ ├── gor_Latn.txt
│ ├── gos_Latn.txt
│ ├── got_Latn.txt
│ ├── gqr_Latn.txt
│ ├── grc_Grek.txt
│ ├── grt_Beng.txt
│ ├── gso_Latn.txt
│ ├── gsw_Latn.txt
│ ├── gub_Latn.txt
│ ├── guc_Latn.txt
│ ├── gud_Latn.txt
│ ├── gug_Latn.txt
│ ├── guh_Latn.txt
│ ├── gui_Latn.txt
│ ├── guj_Gujr.txt
│ ├── guj_Latn.txt
│ ├── guk_Ethi.txt
│ ├── gul_Latn.txt
│ ├── gum_Latn.txt
│ ├── gun_Latn.txt
│ ├── guo_Latn.txt
│ ├── guq_Latn.txt
│ ├── gur_Latn.txt
│ ├── guu_Latn.txt
│ ├── guw_Latn.txt
│ ├── gux_Latn.txt
│ ├── guz_Latn.txt
│ ├── gvc_Latn.txt
│ ├── gvf_Latn.txt
│ ├── gvl_Latn.txt
│ ├── gvn_Latn.txt
│ ├── gwi_Latn.txt
│ ├── gwr_Latn.txt
│ ├── gya_Latn.txt
│ ├── gym_Latn.txt
│ ├── gyr_Latn.txt
│ ├── hac_Arab.txt
│ ├── hae_Latn.txt
│ ├── hag_Latn.txt
│ ├── hak_Hani.txt
│ ├── hak_Latn.txt
│ ├── hat_Latn.txt
│ ├── hau_Latn.txt
│ ├── hav_Latn.txt
│ ├── haw_Latn.txt
│ ├── hay_Latn.txt
│ ├── hbo_Hebr.txt
│ ├── hbs_Latn.txt
│ ├── hch_Latn.txt
│ ├── heb_Hebr.txt
│ ├── heg_Latn.txt
│ ├── heh_Latn.txt
│ ├── her_Latn.txt
│ ├── hif_Latn.txt
│ ├── hig_Latn.txt
│ ├── hil_Latn.txt
│ ├── hin_Deva.txt
│ ├── hin_Latn.txt
│ ├── hix_Latn.txt
│ ├── hla_Latn.txt
│ ├── hlt_Latn.txt
│ ├── hmo_Latn.txt
│ ├── hmr_Latn.txt
│ ├── hne_Deva.txt
│ ├── hnj_Latn.txt
│ ├── hnn_Latn.txt
│ ├── hns_Latn.txt
│ ├── hoc_Latn.txt
│ ├── hop_Latn.txt
│ ├── hot_Latn.txt
│ ├── hra_Latn.txt
│ ├── hrv_Latn.txt
│ ├── hrx_Latn.txt
│ ├── hsb_Latn.txt
│ ├── hto_Latn.txt
│ ├── hub_Latn.txt
│ ├── hui_Latn.txt
│ ├── hun_Latn.txt
│ ├── hus_Latn.txt
│ ├── huu_Latn.txt
│ ├── huv_Latn.txt
│ ├── hvn_Latn.txt
│ ├── hwc_Latn.txt
│ ├── hye_Armn.txt
│ ├── hyw_Armn.txt
│ ├── ian_Latn.txt
│ ├── iba_Latn.txt
│ ├── ibg_Latn.txt
│ ├── ibo_Latn.txt
│ ├── icr_Latn.txt
│ ├── ido_Latn.txt
│ ├── idu_Latn.txt
│ ├── ifa_Latn.txt
│ ├── ifb_Latn.txt
│ ├── ife_Latn.txt
│ ├── ifk_Latn.txt
│ ├── ifu_Latn.txt
│ ├── ify_Latn.txt
│ ├── ige_Latn.txt
│ ├── ign_Latn.txt
│ ├── ike_Cans.txt
│ ├── ikk_Latn.txt
│ ├── ikt_Latn.txt
│ ├── ikw_Latn.txt
│ ├── ilb_Latn.txt
│ ├── ile_Latn.txt
│ ├── ilo_Latn.txt
│ ├── imo_Latn.txt
│ ├── ina_Latn.txt
│ ├── inb_Latn.txt
│ ├── ind_Latn.txt
│ ├── inh_Cyrl.txt
│ ├── ino_Latn.txt
│ ├── iou_Latn.txt
│ ├── ipi_Latn.txt
│ ├── iqw_Latn.txt
│ ├── iri_Latn.txt
│ ├── irk_Latn.txt
│ ├── iry_Latn.txt
│ ├── isd_Latn.txt
│ ├── ish_Latn.txt
│ ├── isl_Latn.txt
│ ├── iso_Latn.txt
│ ├── ita_Latn.txt
│ ├── itl_Cyrl.txt
│ ├── itv_Latn.txt
│ ├── ium_Latn.txt
│ ├── ivb_Latn.txt
│ ├── ivv_Latn.txt
│ ├── iws_Latn.txt
│ ├── ixl_Latn.txt
│ ├── izr_Latn.txt
│ ├── izz_Latn.txt
│ ├── jaa_Latn.txt
│ ├── jac_Latn.txt
│ ├── jae_Latn.txt
│ ├── jam_Latn.txt
│ ├── jav_Latn.txt
│ ├── jbo_Latn.txt
│ ├── jbu_Latn.txt
│ ├── jic_Latn.txt
│ ├── jiv_Latn.txt
│ ├── jmc_Latn.txt
│ ├── jpn_Jpan.txt
│ ├── jra_Latn.txt
│ ├── jun_Orya.txt
│ ├── jvn_Latn.txt
│ ├── kaa_Cyrl.txt
│ ├── kaa_Latn.txt
│ ├── kab_Latn.txt
│ ├── kac_Latn.txt
│ ├── kak_Latn.txt
│ ├── kal_Latn.txt
│ ├── kam_Latn.txt
│ ├── kan_Knda.txt
│ ├── kan_Latn.txt
│ ├── kao_Latn.txt
│ ├── kap_Cyrl.txt
│ ├── kaq_Latn.txt
│ ├── kas_Arab.txt
│ ├── kas_Deva.txt
│ ├── kas_Latn.txt
│ ├── kat_Geor.txt
│ ├── kaz_Cyrl.txt
│ ├── kbc_Latn.txt
│ ├── kbd_Cyrl.txt
│ ├── kbh_Latn.txt
│ ├── kbm_Latn.txt
│ ├── kbo_Latn.txt
│ ├── kbp_Latn.txt
│ ├── kbq_Latn.txt
│ ├── kbr_Latn.txt
│ ├── kby_Latn.txt
│ ├── kca_Cyrl.txt
│ ├── kcg_Latn.txt
│ ├── kck_Latn.txt
│ ├── kdc_Latn.txt
│ ├── kde_Latn.txt
│ ├── kdh_Latn.txt
│ ├── kdi_Latn.txt
│ ├── kdj_Latn.txt
│ ├── kdl_Latn.txt
│ ├── kdr_Latn.txt
│ ├── kea_Latn.txt
│ ├── kei_Latn.txt
│ ├── kek_Latn.txt
│ ├── ken_Latn.txt
│ ├── keo_Latn.txt
│ ├── ker_Latn.txt
│ ├── kew_Latn.txt
│ ├── kex_Deva.txt
│ ├── kez_Latn.txt
│ ├── kff_Telu.txt
│ ├── kgf_Latn.txt
│ ├── kgk_Latn.txt
│ ├── kgp_Latn.txt
│ ├── kgr_Latn.txt
│ ├── kha_Latn.txt
│ ├── khk_Cyrl.txt
│ ├── khm_Khmr.txt
│ ├── khq_Latn.txt
│ ├── khs_Latn.txt
│ ├── khy_Latn.txt
│ ├── khz_Latn.txt
│ ├── kia_Latn.txt
│ ├── kij_Latn.txt
│ ├── kik_Latn.txt
│ ├── kin_Latn.txt
│ ├── kir_Cyrl.txt
│ ├── kiu_Latn.txt
│ ├── kix_Latn.txt
│ ├── kjb_Latn.txt
│ ├── kje_Latn.txt
│ ├── kjh_Cyrl.txt
│ ├── kjs_Latn.txt
│ ├── kkc_Latn.txt
│ ├── kki_Latn.txt
│ ├── kkj_Latn.txt
│ ├── kkl_Latn.txt
│ ├── kle_Deva.txt
│ ├── klt_Latn.txt
│ ├── klv_Latn.txt
│ ├── kma_Latn.txt
│ ├── kmb_Latn.txt
│ ├── kmd_Latn.txt
│ ├── kmg_Latn.txt
│ ├── kmh_Latn.txt
│ ├── kmk_Latn.txt
│ ├── kmm_Latn.txt
│ ├── kmo_Latn.txt
│ ├── kmr_Cyrl.txt
│ ├── kmr_Latn.txt
│ ├── kms_Latn.txt
│ ├── kmu_Latn.txt
│ ├── kmy_Latn.txt
│ ├── knc_Arab.txt
│ ├── knc_Latn.txt
│ ├── kne_Latn.txt
│ ├── knf_Latn.txt
│ ├── kng_Latn.txt
│ ├── knj_Latn.txt
│ ├── knk_Latn.txt
│ ├── kno_Latn.txt
│ ├── knv_Latn.txt
│ ├── knx_Latn.txt
│ ├── kny_Latn.txt
│ ├── kog_Latn.txt
│ ├── koi_Cyrl.txt
│ ├── koo_Latn.txt
│ ├── kor_Hang.txt
│ ├── kos_Latn.txt
│ ├── kpe_Latn.txt
│ ├── kpf_Latn.txt
│ ├── kpg_Latn.txt
│ ├── kpj_Latn.txt
│ ├── kpq_Latn.txt
│ ├── kpr_Latn.txt
│ ├── kpv_Cyrl.txt
│ ├── kpw_Latn.txt
│ ├── kpx_Latn.txt
│ ├── kpz_Latn.txt
│ ├── kqa_Latn.txt
│ ├── kqc_Latn.txt
│ ├── kqe_Latn.txt
│ ├── kqf_Latn.txt
│ ├── kql_Latn.txt
│ ├── kqn_Latn.txt
│ ├── kqo_Latn.txt
│ ├── kqp_Latn.txt
│ ├── kqs_Latn.txt
│ ├── kqw_Latn.txt
│ ├── kqy_Ethi.txt
│ ├── krc_Cyrl.txt
│ ├── kri_Latn.txt
│ ├── krj_Latn.txt
│ ├── krl_Latn.txt
│ ├── kru_Deva.txt
│ ├── krx_Latn.txt
│ ├── ksb_Latn.txt
│ ├── ksc_Latn.txt
│ ├── ksd_Latn.txt
│ ├── ksf_Latn.txt
│ ├── ksh_Latn.txt
│ ├── ksj_Latn.txt
│ ├── ksp_Latn.txt
│ ├── ksr_Latn.txt
│ ├── kss_Latn.txt
│ ├── ksw_Mymr.txt
│ ├── ktb_Ethi.txt
│ ├── ktj_Latn.txt
│ ├── ktm_Latn.txt
│ ├── kto_Latn.txt
│ ├── ktu_Latn.txt
│ ├── ktz_Latn.txt
│ ├── kua_Latn.txt
│ ├── kub_Latn.txt
│ ├── kud_Latn.txt
│ ├── kue_Latn.txt
│ ├── kuj_Latn.txt
│ ├── kum_Cyrl.txt
│ ├── kup_Latn.txt
│ ├── kus_Latn.txt
│ ├── kvg_Latn.txt
│ ├── kvj_Latn.txt
│ ├── kvn_Latn.txt
│ ├── kwd_Latn.txt
│ ├── kwf_Latn.txt
│ ├── kwi_Latn.txt
│ ├── kwj_Latn.txt
│ ├── kwn_Latn.txt
│ ├── kwy_Latn.txt
│ ├── kxc_Ethi.txt
│ ├── kxm_Thai.txt
│ ├── kxw_Latn.txt
│ ├── kyc_Latn.txt
│ ├── kyf_Latn.txt
│ ├── kyg_Latn.txt
│ ├── kyq_Latn.txt
│ ├── kyu_Kali.txt
│ ├── kyu_Latn.txt
│ ├── kyu_Mymr.txt
│ ├── kyz_Latn.txt
│ ├── kze_Latn.txt
│ ├── kzf_Latn.txt
│ ├── kzj_Latn.txt
│ ├── kzn_Latn.txt
│ ├── lac_Latn.txt
│ ├── lad_Hebr.txt
│ ├── lad_Latn.txt
│ ├── lai_Latn.txt
│ ├── laj_Latn.txt
│ ├── lam_Latn.txt
│ ├── lao_Laoo.txt
│ ├── lap_Latn.txt
│ ├── las_Latn.txt
│ ├── lat_Latn.txt
│ ├── law_Latn.txt
│ ├── lbb_Latn.txt
│ ├── lbe_Cyrl.txt
│ ├── lbj_Tibt.txt
│ ├── lbk_Latn.txt
│ ├── lcm_Latn.txt
│ ├── lcp_Thai.txt
│ ├── ldi_Latn.txt
│ ├── ldn_Latn.txt
│ ├── lea_Latn.txt
│ ├── led_Latn.txt
│ ├── lee_Latn.txt
│ ├── lef_Latn.txt
│ ├── leh_Latn.txt
│ ├── lem_Latn.txt
│ ├── leu_Latn.txt
│ ├── lew_Latn.txt
│ ├── lex_Latn.txt
│ ├── lez_Cyrl.txt
│ ├── lfn_Cyrl.txt
│ ├── lfn_Latn.txt
│ ├── lgg_Latn.txt
│ ├── lgl_Latn.txt
│ ├── lgm_Latn.txt
│ ├── lhi_Latn.txt
│ ├── lhu_Latn.txt
│ ├── lia_Latn.txt
│ ├── lid_Latn.txt
│ ├── lif_Deva.txt
│ ├── lif_Limb.txt
│ ├── lij_Latn.txt
│ ├── lim_Latn.txt
│ ├── lin_Latn.txt
│ ├── lip_Latn.txt
│ ├── lis_Lisu.txt
│ ├── lit_Latn.txt
│ ├── liv_Latn.txt
│ ├── ljp_Latn.txt
│ ├── lki_Arab.txt
│ ├── llb_Latn.txt
│ ├── lld_Latn.txt
│ ├── llg_Latn.txt
│ ├── lln_Latn.txt
│ ├── lmk_Latn.txt
│ ├── lmo_Latn.txt
│ ├── lmp_Latn.txt
│ ├── lnd_Latn.txt
│ ├── lob_Latn.txt
│ ├── loe_Latn.txt
│ ├── log_Latn.txt
│ ├── lok_Latn.txt
│ ├── lol_Latn.txt
│ ├── lom_Latn.txt
│ ├── loq_Latn.txt
│ ├── loz_Latn.txt
│ ├── lrc_Arab.txt
│ ├── lsi_Latn.txt
│ ├── lsm_Latn.txt
│ ├── ltg_Latn.txt
│ ├── ltz_Latn.txt
│ ├── lua_Latn.txt
│ ├── lub_Latn.txt
│ ├── luc_Latn.txt
│ ├── lud_Latn.txt
│ ├── lue_Latn.txt
│ ├── lug_Latn.txt
│ ├── lun_Latn.txt
│ ├── luo_Latn.txt
│ ├── lus_Latn.txt
│ ├── lvs_Latn.txt
│ ├── lwg_Latn.txt
│ ├── lwo_Latn.txt
│ ├── lww_Latn.txt
│ ├── lzh_Hani.txt
│ ├── maa_Latn.txt
│ ├── mad_Latn.txt
│ ├── maf_Latn.txt
│ ├── mag_Deva.txt
│ ├── mah_Latn.txt
│ ├── mai_Deva.txt
│ ├── maj_Latn.txt
│ ├── mak_Latn.txt
│ ├── mal_Latn.txt
│ ├── mal_Mlym.txt
│ ├── mam_Latn.txt
│ ├── maq_Latn.txt
│ ├── mar_Deva.txt
│ ├── mar_Latn.txt
│ ├── mas_Latn.txt
│ ├── mau_Latn.txt
│ ├── mav_Latn.txt
│ ├── maw_Latn.txt
│ ├── max_Latn.txt
│ ├── maz_Latn.txt
│ ├── mbb_Latn.txt
│ ├── mbc_Latn.txt
│ ├── mbd_Latn.txt
│ ├── mbf_Latn.txt
│ ├── mbh_Latn.txt
│ ├── mbi_Latn.txt
│ ├── mbj_Latn.txt
│ ├── mbl_Latn.txt
│ ├── mbs_Latn.txt
│ ├── mbt_Latn.txt
│ ├── mca_Latn.txt
│ ├── mcb_Latn.txt
│ ├── mcd_Latn.txt
│ ├── mcf_Latn.txt
│ ├── mck_Latn.txt
│ ├── mcn_Latn.txt
│ ├── mco_Latn.txt
│ ├── mcp_Latn.txt
│ ├── mcq_Latn.txt
│ ├── mcu_Latn.txt
│ ├── mda_Latn.txt
│ ├── mdf_Cyrl.txt
│ ├── mdy_Ethi.txt
│ ├── med_Latn.txt
│ ├── mee_Latn.txt
│ ├── mej_Latn.txt
│ ├── mek_Latn.txt
│ ├── men_Latn.txt
│ ├── meq_Latn.txt
│ ├── mer_Latn.txt
│ ├── met_Latn.txt
│ ├── meu_Latn.txt
│ ├── mev_Latn.txt
│ ├── mfe_Latn.txt
│ ├── mfg_Latn.txt
│ ├── mfh_Latn.txt
│ ├── mfi_Latn.txt
│ ├── mfk_Latn.txt
│ ├── mfq_Latn.txt
│ ├── mfy_Latn.txt
│ ├── mfz_Latn.txt
│ ├── mgc_Latn.txt
│ ├── mgh_Latn.txt
│ ├── mgm_Latn.txt
│ ├── mgo_Latn.txt
│ ├── mgr_Latn.txt
│ ├── mhi_Latn.txt
│ ├── mhl_Latn.txt
│ ├── mhr_Cyrl.txt
│ ├── mhw_Latn.txt
│ ├── mhx_Latn.txt
│ ├── mhy_Latn.txt
│ ├── mib_Latn.txt
│ ├── mic_Latn.txt
│ ├── mie_Latn.txt
│ ├── mif_Latn.txt
│ ├── mig_Latn.txt
│ ├── mih_Latn.txt
│ ├── mil_Latn.txt
│ ├── mim_Latn.txt
│ ├── min_Arab.txt
│ ├── min_Latn.txt
│ ├── mio_Latn.txt
│ ├── mip_Latn.txt
│ ├── miq_Latn.txt
│ ├── mir_Latn.txt
│ ├── mit_Latn.txt
│ ├── miy_Latn.txt
│ ├── miz_Latn.txt
│ ├── mjc_Latn.txt
│ ├── mjw_Latn.txt
│ ├── mkd_Cyrl.txt
│ ├── mkl_Latn.txt
│ ├── mkn_Latn.txt
│ ├── mks_Latn.txt
│ ├── mkz_Latn.txt
│ ├── mlh_Latn.txt
│ ├── mlp_Latn.txt
│ ├── mlt_Latn.txt
│ ├── mlu_Latn.txt
│ ├── mmn_Latn.txt
│ ├── mmo_Latn.txt
│ ├── mmx_Latn.txt
│ ├── mna_Latn.txt
│ ├── mnb_Latn.txt
│ ├── mnf_Latn.txt
│ ├── mni_Beng.txt
│ ├── mni_Latn.txt
│ ├── mni_Mtei.txt
│ ├── mnk_Latn.txt
│ ├── mns_Cyrl.txt
│ ├── mnw_Mymr.txt
│ ├── mnx_Latn.txt
│ ├── mny_Latn.txt
│ ├── moa_Latn.txt
│ ├── moc_Latn.txt
│ ├── mog_Latn.txt
│ ├── moh_Latn.txt
│ ├── mop_Latn.txt
│ ├── mor_Latn.txt
│ ├── mos_Latn.txt
│ ├── mox_Latn.txt
│ ├── mpg_Latn.txt
│ ├── mph_Latn.txt
│ ├── mpm_Latn.txt
│ ├── mpp_Latn.txt
│ ├── mps_Latn.txt
│ ├── mpt_Latn.txt
│ ├── mpx_Latn.txt
│ ├── mqb_Latn.txt
│ ├── mqj_Latn.txt
│ ├── mqy_Latn.txt
│ ├── mrg_Latn.txt
│ ├── mri_Latn.txt
│ ├── mrj_Cyrl.txt
│ ├── mrq_Latn.txt
│ ├── mrv_Latn.txt
│ ├── mrw_Latn.txt
│ ├── msb_Latn.txt
│ ├── msc_Latn.txt
│ ├── mse_Latn.txt
│ ├── msk_Latn.txt
│ ├── msm_Latn.txt
│ ├── msy_Latn.txt
│ ├── mta_Latn.txt
│ ├── mtg_Latn.txt
│ ├── mti_Latn.txt
│ ├── mtj_Latn.txt
│ ├── mto_Latn.txt
│ ├── mtp_Latn.txt
│ ├── mua_Latn.txt
│ ├── mug_Latn.txt
│ ├── muh_Latn.txt
│ ├── mui_Latn.txt
│ ├── mup_Deva.txt
│ ├── mur_Latn.txt
│ ├── mus_Latn.txt
│ ├── mux_Latn.txt
│ ├── muy_Latn.txt
│ ├── mva_Latn.txt
│ ├── mvn_Latn.txt
│ ├── mvp_Latn.txt
│ ├── mwc_Latn.txt
│ ├── mwf_Latn.txt
│ ├── mwl_Latn.txt
│ ├── mwm_Latn.txt
│ ├── mwn_Latn.txt
│ ├── mwp_Latn.txt
│ ├── mwq_Latn.txt
│ ├── mwv_Latn.txt
│ ├── mww_Latn.txt
│ ├── mxb_Latn.txt
│ ├── mxp_Latn.txt
│ ├── mxq_Latn.txt
│ ├── mxt_Latn.txt
│ ├── mxv_Latn.txt
│ ├── mya_Mymr.txt
│ ├── myb_Latn.txt
│ ├── myk_Latn.txt
│ ├── myu_Latn.txt
│ ├── myv_Cyrl.txt
│ ├── myw_Latn.txt
│ ├── myx_Latn.txt
│ ├── myy_Latn.txt
│ ├── mza_Latn.txt
│ ├── mzh_Latn.txt
│ ├── mzk_Latn.txt
│ ├── mzl_Latn.txt
│ ├── mzm_Latn.txt
│ ├── mzn_Arab.txt
│ ├── mzw_Latn.txt
│ ├── mzz_Latn.txt
│ ├── nab_Latn.txt
│ ├── naf_Latn.txt
│ ├── nah_Latn.txt
│ ├── nak_Latn.txt
│ ├── nan_Latn.txt
│ ├── nap_Latn.txt
│ ├── naq_Latn.txt
│ ├── nas_Latn.txt
│ ├── nav_Latn.txt
│ ├── naw_Latn.txt
│ ├── nba_Latn.txt
│ ├── nbc_Latn.txt
│ ├── nbe_Latn.txt
│ ├── nbl_Latn.txt
│ ├── nbq_Latn.txt
│ ├── nbu_Latn.txt
│ ├── nca_Latn.txt
│ ├── nch_Latn.txt
│ ├── ncj_Latn.txt
│ ├── ncl_Latn.txt
│ ├── ncq_Laoo.txt
│ ├── nct_Latn.txt
│ ├── ncu_Latn.txt
│ ├── ncx_Latn.txt
│ ├── ndc_Latn.txt
│ ├── nde_Latn.txt
│ ├── ndh_Latn.txt
│ ├── ndi_Latn.txt
│ ├── ndj_Latn.txt
│ ├── ndo_Latn.txt
│ ├── ndp_Latn.txt
│ ├── nds_Latn.txt
│ ├── ndy_Latn.txt
│ ├── ndz_Latn.txt
│ ├── neb_Latn.txt
│ ├── new_Deva.txt
│ ├── nfa_Latn.txt
│ ├── nfr_Latn.txt
│ ├── ngb_Latn.txt
│ ├── ngc_Latn.txt
│ ├── ngl_Latn.txt
│ ├── ngp_Latn.txt
│ ├── ngu_Latn.txt
│ ├── nhd_Latn.txt
│ ├── nhe_Latn.txt
│ ├── nhg_Latn.txt
│ ├── nhi_Latn.txt
│ ├── nhk_Latn.txt
│ ├── nho_Latn.txt
│ ├── nhr_Latn.txt
│ ├── nhu_Latn.txt
│ ├── nhw_Latn.txt
│ ├── nhx_Latn.txt
│ ├── nhy_Latn.txt
│ ├── nia_Latn.txt
│ ├── nif_Latn.txt
│ ├── nii_Latn.txt
│ ├── nij_Latn.txt
│ ├── nim_Latn.txt
│ ├── nin_Latn.txt
│ ├── nio_Cyrl.txt
│ ├── niq_Latn.txt
│ ├── niu_Latn.txt
│ ├── niy_Latn.txt
│ ├── njb_Latn.txt
│ ├── njm_Latn.txt
│ ├── njn_Latn.txt
│ ├── njo_Latn.txt
│ ├── njz_Latn.txt
│ ├── nkf_Latn.txt
│ ├── nki_Latn.txt
│ ├── nko_Latn.txt
│ ├── nla_Latn.txt
│ ├── nlc_Latn.txt
│ ├── nld_Latn.txt
│ ├── nlg_Latn.txt
│ ├── nma_Latn.txt
│ ├── nmf_Latn.txt
│ ├── nmh_Latn.txt
│ ├── nmo_Latn.txt
│ ├── nmw_Latn.txt
│ ├── nmz_Latn.txt
│ ├── nnb_Latn.txt
│ ├── nng_Latn.txt
│ ├── nnh_Latn.txt
│ ├── nnl_Latn.txt
│ ├── nno_Latn.txt
│ ├── nnp_Latn.txt
│ ├── nnq_Latn.txt
│ ├── nnw_Latn.txt
│ ├── noa_Latn.txt
│ ├── nob_Latn.txt
│ ├── nod_Thai.txt
│ ├── nog_Cyrl.txt
│ ├── non_Latn.txt
│ ├── nop_Latn.txt
│ ├── not_Latn.txt
│ ├── nou_Latn.txt
│ ├── nov_Latn.txt
│ ├── nph_Latn.txt
│ ├── npi_Deva.txt
│ ├── npi_Latn.txt
│ ├── npl_Latn.txt
│ ├── npo_Latn.txt
│ ├── npy_Latn.txt
│ ├── nqo_Nkoo.txt
│ ├── nre_Latn.txt
│ ├── nrf_Latn.txt
│ ├── nri_Latn.txt
│ ├── nsa_Latn.txt
│ ├── nse_Latn.txt
│ ├── nsm_Latn.txt
│ ├── nsn_Latn.txt
│ ├── nso_Latn.txt
│ ├── nss_Latn.txt
│ ├── nst_Latn.txt
│ ├── nsu_Latn.txt
│ ├── ntp_Latn.txt
│ ├── ntr_Latn.txt
│ ├── ntu_Latn.txt
│ ├── nuj_Latn.txt
│ ├── nus_Latn.txt
│ ├── nuy_Latn.txt
│ ├── nuz_Latn.txt
│ ├── nvm_Latn.txt
│ ├── nwb_Latn.txt
│ ├── nwi_Latn.txt
│ ├── nwx_Deva.txt
│ ├── nxd_Latn.txt
│ ├── nya_Latn.txt
│ ├── nyf_Latn.txt
│ ├── nyk_Latn.txt
│ ├── nyn_Latn.txt
│ ├── nyo_Latn.txt
│ ├── nyu_Latn.txt
│ ├── nyy_Latn.txt
│ ├── nza_Latn.txt
│ ├── nzi_Latn.txt
│ ├── nzm_Latn.txt
│ ├── obo_Latn.txt
│ ├── oci_Latn.txt
│ ├── ogo_Latn.txt
│ ├── ojb_Cans.txt
│ ├── ojb_Latn.txt
│ ├── oke_Latn.txt
│ ├── oku_Latn.txt
│ ├── okv_Latn.txt
│ ├── old_Latn.txt
│ ├── olo_Latn.txt
│ ├── omb_Latn.txt
│ ├── omw_Latn.txt
│ ├── ong_Latn.txt
│ ├── ons_Latn.txt
│ ├── ood_Latn.txt
│ ├── opm_Latn.txt
│ ├── orv_Cyrl.txt
│ ├── ory_Latn.txt
│ ├── ory_Orya.txt
│ ├── oss_Cyrl.txt
│ ├── ota_Arab.txt
│ ├── otd_Latn.txt
│ ├── ote_Latn.txt
│ ├── otm_Latn.txt
│ ├── otn_Latn.txt
│ ├── oto_Latn.txt
│ ├── otq_Latn.txt
│ ├── ots_Latn.txt
│ ├── otw_Latn.txt
│ ├── oym_Latn.txt
│ ├── ozm_Latn.txt
│ ├── pab_Latn.txt
│ ├── pad_Latn.txt
│ ├── pag_Latn.txt
│ ├── pah_Latn.txt
│ ├── pam_Latn.txt
│ ├── pan_Guru.txt
│ ├── pan_Latn.txt
│ ├── pao_Latn.txt
│ ├── pap_Latn.txt
│ ├── pau_Latn.txt
│ ├── pbb_Latn.txt
│ ├── pbc_Latn.txt
│ ├── pbi_Latn.txt
│ ├── pbt_Arab.txt
│ ├── pcd_Latn.txt
│ ├── pck_Latn.txt
│ ├── pcm_Latn.txt
│ ├── pdc_Latn.txt
│ ├── pdt_Latn.txt
│ ├── pem_Latn.txt
│ ├── pfe_Latn.txt
│ ├── pfl_Latn.txt
│ ├── phm_Latn.txt
│ ├── pib_Latn.txt
│ ├── pio_Latn.txt
│ ├── pir_Latn.txt
│ ├── pis_Latn.txt
│ ├── pjt_Latn.txt
│ ├── pkb_Latn.txt
│ ├── plg_Latn.txt
│ ├── pls_Latn.txt
│ ├── plt_Latn.txt
│ ├── plu_Latn.txt
│ ├── plw_Latn.txt
│ ├── pma_Latn.txt
│ ├── pmf_Latn.txt
│ ├── pmq_Latn.txt
│ ├── pms_Latn.txt
│ ├── pmx_Latn.txt
│ ├── pnb_Arab.txt
│ ├── pne_Latn.txt
│ ├── pnt_Grek.txt
│ ├── pny_Latn.txt
│ ├── poe_Latn.txt
│ ├── poh_Latn.txt
│ ├── poi_Latn.txt
│ ├── pol_Latn.txt
│ ├── pon_Latn.txt
│ ├── por_Latn.txt
│ ├── pos_Latn.txt
│ ├── pot_Latn.txt
│ ├── pov_Latn.txt
│ ├── poy_Latn.txt
│ ├── ppk_Latn.txt
│ ├── ppo_Latn.txt
│ ├── pps_Latn.txt
│ ├── prf_Latn.txt
│ ├── prg_Latn.txt
│ ├── pri_Latn.txt
│ ├── prq_Latn.txt
│ ├── pse_Latn.txt
│ ├── pss_Latn.txt
│ ├── ptp_Latn.txt
│ ├── ptu_Latn.txt
│ ├── pua_Latn.txt
│ ├── pui_Latn.txt
│ ├── pwg_Latn.txt
│ ├── pwn_Latn.txt
│ ├── pww_Thai.txt
│ ├── pxm_Latn.txt
│ ├── qub_Latn.txt
│ ├── quc_Latn.txt
│ ├── quf_Latn.txt
│ ├── qug_Latn.txt
│ ├── quh_Latn.txt
│ ├── qul_Latn.txt
│ ├── qup_Latn.txt
│ ├── qus_Latn.txt
│ ├── quw_Latn.txt
│ ├── quy_Latn.txt
│ ├── quz_Latn.txt
│ ├── qva_Latn.txt
│ ├── qvc_Latn.txt
│ ├── qve_Latn.txt
│ ├── qvh_Latn.txt
│ ├── qvi_Latn.txt
│ ├── qvm_Latn.txt
│ ├── qvn_Latn.txt
│ ├── qvo_Latn.txt
│ ├── qvs_Latn.txt
│ ├── qvw_Latn.txt
│ ├── qvz_Latn.txt
│ ├── qwh_Latn.txt
│ ├── qxh_Latn.txt
│ ├── qxl_Latn.txt
│ ├── qxn_Latn.txt
│ ├── qxo_Latn.txt
│ ├── qxr_Latn.txt
│ ├── rad_Latn.txt
│ ├── rai_Latn.txt
│ ├── rap_Latn.txt
│ ├── rar_Latn.txt
│ ├── rav_Deva.txt
│ ├── raw_Latn.txt
│ ├── rcf_Latn.txt
│ ├── rej_Latn.txt
│ ├── rel_Latn.txt
│ ├── rgu_Latn.txt
│ ├── rhg_Latn.txt
│ ├── ria_Latn.txt
│ ├── rim_Latn.txt
│ ├── rjs_Deva.txt
│ ├── rkb_Latn.txt
│ ├── rmc_Latn.txt
│ ├── rme_Latn.txt
│ ├── rml_Latn.txt
│ ├── rmn_Cyrl.txt
│ ├── rmn_Grek.txt
│ ├── rmn_Latn.txt
│ ├── rmo_Latn.txt
│ ├── rmq_Latn.txt
│ ├── rmy_Cyrl.txt
│ ├── rmy_Latn.txt
│ ├── rnd_Latn.txt
│ ├── rng_Latn.txt
│ ├── rnl_Latn.txt
│ ├── roh_Latn.txt
│ ├── ron_Cyrl.txt
│ ├── ron_Latn.txt
│ ├── roo_Latn.txt
│ ├── rop_Latn.txt
│ ├── row_Latn.txt
│ ├── rro_Latn.txt
│ ├── rtm_Latn.txt
│ ├── rub_Latn.txt
│ ├── rue_Cyrl.txt
│ ├── ruf_Latn.txt
│ ├── rug_Latn.txt
│ ├── run_Latn.txt
│ ├── rup_Latn.txt
│ ├── rus_Cyrl.txt
│ ├── rwo_Latn.txt
│ ├── sab_Latn.txt
│ ├── sag_Latn.txt
│ ├── sah_Cyrl.txt
│ ├── saj_Latn.txt
│ ├── san_Deva.txt
│ ├── san_Latn.txt
│ ├── sas_Latn.txt
│ ├── sat_Latn.txt
│ ├── sat_Olck.txt
│ ├── say_Latn.txt
│ ├── sba_Latn.txt
│ ├── sbd_Latn.txt
│ ├── sbe_Latn.txt
│ ├── sbl_Latn.txt
│ ├── sbs_Latn.txt
│ ├── sby_Latn.txt
│ ├── sck_Deva.txt
│ ├── scn_Latn.txt
│ ├── sco_Latn.txt
│ ├── sda_Latn.txt
│ ├── sdc_Latn.txt
│ ├── sdh_Arab.txt
│ ├── sdo_Latn.txt
│ ├── sdq_Latn.txt
│ ├── seh_Latn.txt
│ ├── sel_Cyrl.txt
│ ├── ses_Latn.txt
│ ├── sey_Latn.txt
│ ├── sfw_Latn.txt
│ ├── sgb_Latn.txt
│ ├── sgc_Latn.txt
│ ├── sgh_Cyrl.txt
│ ├── sgs_Latn.txt
│ ├── sgw_Ethi.txt
│ ├── sgz_Latn.txt
│ ├── shi_Latn.txt
│ ├── shk_Latn.txt
│ ├── shn_Mymr.txt
│ ├── shp_Latn.txt
│ ├── shr_Latn.txt
│ ├── shu_Arab.txt
│ ├── sid_Latn.txt
│ ├── sig_Latn.txt
│ ├── sil_Latn.txt
│ ├── sim_Latn.txt
│ ├── sin_Sinh.txt
│ ├── sja_Latn.txt
│ ├── sjo_Mong.txt
│ ├── sju_Latn.txt
│ ├── skg_Latn.txt
│ ├── skr_Arab.txt
│ ├── sld_Latn.txt
│ ├── slk_Latn.txt
│ ├── sll_Latn.txt
│ ├── slv_Latn.txt
│ ├── sma_Latn.txt
│ ├── sme_Latn.txt
│ ├── smj_Latn.txt
│ ├── smk_Latn.txt
│ ├── sml_Latn.txt
│ ├── smn_Latn.txt
│ ├── smo_Latn.txt
│ ├── sms_Latn.txt
│ ├── smt_Latn.txt
│ ├── sna_Latn.txt
│ ├── snc_Latn.txt
│ ├── snd_Arab.txt
│ ├── snd_Deva.txt
│ ├── snd_Latn.txt
│ ├── snf_Latn.txt
│ ├── snn_Latn.txt
│ ├── snp_Latn.txt
│ ├── snw_Latn.txt
│ ├── sny_Latn.txt
│ ├── soe_Latn.txt
│ ├── som_Latn.txt
│ ├── sop_Latn.txt
│ ├── soq_Latn.txt
│ ├── sot_Latn.txt
│ ├── soy_Latn.txt
│ ├── spa_Latn.txt
│ ├── spl_Latn.txt
│ ├── spm_Latn.txt
│ ├── spp_Latn.txt
│ ├── sps_Latn.txt
│ ├── spy_Latn.txt
│ ├── srd_Latn.txt
│ ├── sri_Latn.txt
│ ├── srm_Latn.txt
│ ├── srn_Latn.txt
│ ├── srp_Cyrl.txt
│ ├── srp_Latn.txt
│ ├── srq_Latn.txt
│ ├── srr_Latn.txt
│ ├── ssd_Latn.txt
│ ├── ssg_Latn.txt
│ ├── ssw_Latn.txt
│ ├── ssx_Latn.txt
│ ├── stn_Latn.txt
│ ├── stp_Latn.txt
│ ├── stq_Latn.txt
│ ├── sua_Latn.txt
│ ├── suc_Latn.txt
│ ├── sue_Latn.txt
│ ├── suk_Latn.txt
│ ├── sun_Latn.txt
│ ├── sur_Latn.txt
│ ├── sus_Arab.txt
│ ├── sus_Latn.txt
│ ├── suz_Deva.txt
│ ├── swb_Latn.txt
│ ├── swc_Latn.txt
│ ├── swe_Latn.txt
│ ├── swg_Latn.txt
│ ├── swh_Latn.txt
│ ├── swk_Latn.txt
│ ├── swp_Latn.txt
│ ├── sxb_Latn.txt
│ ├── sxn_Latn.txt
│ ├── syb_Latn.txt
│ ├── syc_Syrc.txt
│ ├── syl_Beng.txt
│ ├── syl_Latn.txt
│ ├── szb_Latn.txt
│ ├── szl_Latn.txt
│ ├── szy_Latn.txt
│ ├── tab_Cyrl.txt
│ ├── tac_Latn.txt
│ ├── tah_Latn.txt
│ ├── taj_Deva.txt
│ ├── tam_Latn.txt
│ ├── tam_Taml.txt
│ ├── tap_Latn.txt
│ ├── taq_Latn.txt
│ ├── taq_Tfng.txt
│ ├── tar_Latn.txt
│ ├── tat_Cyrl.txt
│ ├── tat_Latn.txt
│ ├── tav_Latn.txt
│ ├── taw_Latn.txt
│ ├── tay_Latn.txt
│ ├── tbc_Latn.txt
│ ├── tbg_Latn.txt
│ ├── tbk_Latn.txt
│ ├── tbl_Latn.txt
│ ├── tbo_Latn.txt
│ ├── tbw_Latn.txt
│ ├── tby_Latn.txt
│ ├── tbz_Latn.txt
│ ├── tca_Latn.txt
│ ├── tcc_Latn.txt
│ ├── tcf_Latn.txt
│ ├── tcs_Latn.txt
│ ├── tcy_Knda.txt
│ ├── tcz_Latn.txt
│ ├── tdx_Latn.txt
│ ├── ted_Latn.txt
│ ├── tee_Latn.txt
│ ├── tel_Latn.txt
│ ├── tel_Telu.txt
│ ├── tem_Latn.txt
│ ├── teo_Latn.txt
│ ├── ter_Latn.txt
│ ├── tet_Latn.txt
│ ├── tew_Latn.txt
│ ├── tfr_Latn.txt
│ ├── tgk_Cyrl.txt
│ ├── tgo_Latn.txt
│ ├── tgp_Latn.txt
│ ├── tha_Thai.txt
│ ├── thk_Latn.txt
│ ├── thl_Deva.txt
│ ├── thv_Latn.txt
│ ├── tif_Latn.txt
│ ├── tig_Ethi.txt
│ ├── tih_Latn.txt
│ ├── tik_Latn.txt
│ ├── tim_Latn.txt
│ ├── tir_Ethi.txt
│ ├── tiv_Latn.txt
│ ├── tiy_Latn.txt
│ ├── tke_Latn.txt
│ ├── tkl_Latn.txt
│ ├── tkr_Cyrl.txt
│ ├── tku_Latn.txt
│ ├── tlb_Latn.txt
│ ├── tlf_Latn.txt
│ ├── tlh_Latn.txt
│ ├── tlj_Latn.txt
│ ├── tll_Latn.txt
│ ├── tly_Latn.txt
│ ├── tmc_Latn.txt
│ ├── tmd_Latn.txt
│ ├── tna_Latn.txt
│ ├── tnc_Latn.txt
│ ├── tnk_Latn.txt
│ ├── tnn_Latn.txt
│ ├── tnp_Latn.txt
│ ├── tnr_Latn.txt
│ ├── tob_Latn.txt
│ ├── toc_Latn.txt
│ ├── tod_Latn.txt
│ ├── tog_Latn.txt
│ ├── toh_Latn.txt
│ ├── toi_Latn.txt
│ ├── toj_Latn.txt
│ ├── tok_Latn.txt
│ ├── ton_Latn.txt
│ ├── too_Latn.txt
│ ├── top_Latn.txt
│ ├── tos_Latn.txt
│ ├── tpa_Latn.txt
│ ├── tpi_Latn.txt
│ ├── tpm_Latn.txt
│ ├── tpn_Latn.txt
│ ├── tpp_Latn.txt
│ ├── tpt_Latn.txt
│ ├── tpw_Latn.txt
│ ├── tpz_Latn.txt
│ ├── tqo_Latn.txt
│ ├── trc_Latn.txt
│ ├── trn_Latn.txt
│ ├── tro_Latn.txt
│ ├── trp_Latn.txt
│ ├── trq_Latn.txt
│ ├── trs_Latn.txt
│ ├── trv_Latn.txt
│ ├── tsc_Latn.txt
│ ├── tsg_Latn.txt
│ ├── tsn_Latn.txt
│ ├── tso_Latn.txt
│ ├── tsw_Latn.txt
│ ├── tsz_Latn.txt
│ ├── ttc_Latn.txt
│ ├── tte_Latn.txt
│ ├── ttj_Latn.txt
│ ├── ttq_Latn.txt
│ ├── ttq_Tfng.txt
│ ├── tuc_Latn.txt
│ ├── tue_Latn.txt
│ ├── tuf_Latn.txt
│ ├── tui_Latn.txt
│ ├── tuk_Arab.txt
│ ├── tuk_Cyrl.txt
│ ├── tuk_Latn.txt
│ ├── tul_Latn.txt
│ ├── tum_Latn.txt
│ ├── tuo_Latn.txt
│ ├── tur_Latn.txt
│ ├── tuv_Latn.txt
│ ├── tvk_Latn.txt
│ ├── tvl_Latn.txt
│ ├── twb_Latn.txt
│ ├── twi_Latn.txt
│ ├── twu_Latn.txt
│ ├── twx_Latn.txt
│ ├── txq_Latn.txt
│ ├── txu_Latn.txt
│ ├── tyv_Cyrl.txt
│ ├── tzh_Latn.txt
│ ├── tzj_Latn.txt
│ ├── tzl_Latn.txt
│ ├── tzm_Tfng.txt
│ ├── tzo_Latn.txt
│ ├── ubr_Latn.txt
│ ├── ubu_Latn.txt
│ ├── udm_Cyrl.txt
│ ├── udu_Latn.txt
│ ├── uig_Arab.txt
│ ├── uig_Cyrl.txt
│ ├── uig_Latn.txt
│ ├── ukr_Cyrl.txt
│ ├── umb_Latn.txt
│ ├── upv_Latn.txt
│ ├── ura_Latn.txt
│ ├── urb_Latn.txt
│ ├── urd_Arab.txt
│ ├── urd_Latn.txt
│ ├── urh_Latn.txt
│ ├── uri_Latn.txt
│ ├── urk_Thai.txt
│ ├── urt_Latn.txt
│ ├── urw_Latn.txt
│ ├── ury_Latn.txt
│ ├── usa_Latn.txt
│ ├── usp_Latn.txt
│ ├── uth_Latn.txt
│ ├── uvh_Latn.txt
│ ├── uvl_Latn.txt
│ ├── uzn_Cyrl.txt
│ ├── uzn_Latn.txt
│ ├── uzs_Arab.txt
│ ├── vag_Latn.txt
│ ├── vap_Latn.txt
│ ├── var_Latn.txt
│ ├── vec_Latn.txt
│ ├── ven_Latn.txt
│ ├── vep_Latn.txt
│ ├── vid_Latn.txt
│ ├── vie_Latn.txt
│ ├── viv_Latn.txt
│ ├── vls_Latn.txt
│ ├── vmk_Latn.txt
│ ├── vmw_Latn.txt
│ ├── vmy_Latn.txt
│ ├── vol_Latn.txt
│ ├── vot_Latn.txt
│ ├── vro_Latn.txt
│ ├── vun_Latn.txt
│ ├── vut_Latn.txt
│ ├── waj_Latn.txt
│ ├── wal_Ethi.txt
│ ├── wal_Latn.txt
│ ├── wap_Latn.txt
│ ├── war_Latn.txt
│ ├── wat_Latn.txt
│ ├── way_Latn.txt
│ ├── wba_Latn.txt
│ ├── wbm_Latn.txt
│ ├── wbp_Latn.txt
│ ├── wed_Latn.txt
│ ├── wer_Latn.txt
│ ├── wes_Latn.txt
│ ├── wew_Latn.txt
│ ├── whg_Latn.txt
│ ├── whk_Latn.txt
│ ├── wib_Latn.txt
│ ├── wim_Latn.txt
│ ├── wiu_Latn.txt
│ ├── wln_Latn.txt
│ ├── wls_Latn.txt
│ ├── wlv_Latn.txt
│ ├── wlx_Latn.txt
│ ├── wmt_Latn.txt
│ ├── wmw_Latn.txt
│ ├── wnc_Latn.txt
│ ├── wnu_Latn.txt
│ ├── wob_Latn.txt
│ ├── wol_Latn.txt
│ ├── wos_Latn.txt
│ ├── wrk_Latn.txt
│ ├── wrs_Latn.txt
│ ├── wsg_Telu.txt
│ ├── wsk_Latn.txt
│ ├── wuu_Hani.txt
│ ├── wuv_Latn.txt
│ ├── wwa_Latn.txt
│ ├── xal_Cyrl.txt
│ ├── xav_Latn.txt
│ ├── xbi_Latn.txt
│ ├── xbr_Latn.txt
│ ├── xed_Latn.txt
│ ├── xho_Latn.txt
│ ├── xla_Latn.txt
│ ├── xmf_Geor.txt
│ ├── xmm_Latn.txt
│ ├── xmv_Latn.txt
│ ├── xnn_Latn.txt
│ ├── xog_Latn.txt
│ ├── xon_Latn.txt
│ ├── xrb_Latn.txt
│ ├── xsb_Latn.txt
│ ├── xsi_Latn.txt
│ ├── xsm_Latn.txt
│ ├── xsr_Deva.txt
│ ├── xsu_Latn.txt
│ ├── xtd_Latn.txt
│ ├── xtm_Latn.txt
│ ├── xtn_Latn.txt
│ ├── xum_Latn.txt
│ ├── xuo_Latn.txt
│ ├── yaa_Latn.txt
│ ├── yad_Latn.txt
│ ├── yal_Latn.txt
│ ├── yam_Latn.txt
│ ├── yan_Latn.txt
│ ├── yao_Latn.txt
│ ├── yap_Latn.txt
│ ├── yaq_Latn.txt
│ ├── yas_Latn.txt
│ ├── yat_Latn.txt
│ ├── yaz_Latn.txt
│ ├── ybb_Latn.txt
│ ├── yby_Latn.txt
│ ├── ycn_Latn.txt
│ ├── ydd_Hebr.txt
│ ├── yim_Latn.txt
│ ├── yka_Latn.txt
│ ├── yle_Latn.txt
│ ├── yli_Latn.txt
│ ├── yml_Latn.txt
│ ├── yom_Latn.txt
│ ├── yon_Latn.txt
│ ├── yor_Latn.txt
│ ├── yrb_Latn.txt
│ ├── yre_Latn.txt
│ ├── yrk_Cyrl.txt
│ ├── yrl_Latn.txt
│ ├── yss_Latn.txt
│ ├── yua_Latn.txt
│ ├── yue_Hani.txt
│ ├── yuj_Latn.txt
│ ├── yup_Latn.txt
│ ├── yut_Latn.txt
│ ├── yuw_Latn.txt
│ ├── yuz_Latn.txt
│ ├── yva_Latn.txt
│ ├── zaa_Latn.txt
│ ├── zab_Latn.txt
│ ├── zac_Latn.txt
│ ├── zad_Latn.txt
│ ├── zae_Latn.txt
│ ├── zai_Latn.txt
│ ├── zam_Latn.txt
│ ├── zao_Latn.txt
│ ├── zar_Latn.txt
│ ├── zas_Latn.txt
│ ├── zat_Latn.txt
│ ├── zav_Latn.txt
│ ├── zaw_Latn.txt
│ ├── zca_Latn.txt
│ ├── zdj_Latn.txt
│ ├── zea_Latn.txt
│ ├── zgh_Tfng.txt
│ ├── zho_Hani.txt
│ ├── zia_Latn.txt
│ ├── ziw_Latn.txt
│ ├── zne_Latn.txt
│ ├── zoc_Latn.txt
│ ├── zom_Latn.txt
│ ├── zos_Latn.txt
│ ├── zpa_Latn.txt
│ ├── zpc_Latn.txt
│ ├── zpg_Latn.txt
│ ├── zpi_Latn.txt
│ ├── zpj_Latn.txt
│ ├── zpl_Latn.txt
│ ├── zpm_Latn.txt
│ ├── zpo_Latn.txt
│ ├── zpq_Latn.txt
│ ├── zpt_Latn.txt
│ ├── zpu_Latn.txt
│ ├── zpv_Latn.txt
│ ├── zpz_Latn.txt
│ ├── zsm_Arab.txt
│ ├── zsm_Latn.txt
│ ├── zsr_Latn.txt
│ ├── ztq_Latn.txt
│ ├── zty_Latn.txt
│ ├── zul_Latn.txt
│ ├── zyb_Latn.txt
│ └── zyp_Latn.txt
├── reference_datasets/
│ ├── monolingual/
│ │ ├── ar/
│ │ │ ├── download_101b_arabicwords.py
│ │ │ └── download_arabicweb24.py
│ │ ├── fr/
│ │ │ └── download_croissant.py
│ │ ├── hi/
│ │ │ ├── download_odaigen.py
│ │ │ └── download_sangraha.py
│ │ ├── te/
│ │ │ └── download_sangraha.py
│ │ ├── th/
│ │ │ └── download_sea_commoncrawl.py
│ │ ├── tr/
│ │ │ └── download_vngrs.py
│ │ └── zh/
│ │ ├── download_mapcc.py
│ │ ├── download_mnbvc.py
│ │ └── download_tigerbot.py
│ └── multilingual/
│ ├── copy_raw_data.py
│ ├── download_cc-100.py
│ ├── download_culturax.py
│ ├── download_hplt.py
│ ├── download_hplt_split.py
│ ├── download_mc4.py
│ └── part jsons.py
└── rehydration/
├── README.md
├── distributions/
│ ├── aai_Latn.json
│ ├── aak_Latn.json
│ ├── aau_Latn.json
│ ├── aaz_Latn.json
│ ├── aba_Latn.json
│ ├── abi_Latn.json
│ ├── abk_Cyrl.json
│ ├── abn_Latn.json
│ ├── abq_Cyrl.json
│ ├── abs_Latn.json
│ ├── abt_Latn.json
│ ├── abx_Latn.json
│ ├── aby_Latn.json
│ ├── abz_Latn.json
│ ├── aca_Latn.json
│ ├── acd_Latn.json
│ ├── ace_Latn.json
│ ├── acf_Latn.json
│ ├── ach_Latn.json
│ ├── acm_Arab.json
│ ├── acn_Latn.json
│ ├── acr_Latn.json
│ ├── acu_Latn.json
│ ├── ada_Latn.json
│ ├── ade_Latn.json
│ ├── adh_Latn.json
│ ├── adi_Latn.json
│ ├── adj_Latn.json
│ ├── adl_Latn.json
│ ├── ady_Cyrl.json
│ ├── adz_Latn.json
│ ├── aeb_Arab.json
│ ├── aer_Latn.json
│ ├── aeu_Latn.json
│ ├── aey_Latn.json
│ ├── afr_Latn.json
│ ├── agd_Latn.json
│ ├── agg_Latn.json
│ ├── agm_Latn.json
│ ├── agn_Latn.json
│ ├── agr_Latn.json
│ ├── agt_Latn.json
│ ├── agu_Latn.json
│ ├── agw_Latn.json
│ ├── agx_Cyrl.json
│ ├── aha_Latn.json
│ ├── ahk_Latn.json
│ ├── aia_Latn.json
│ ├── aii_Syrc.json
│ ├── aim_Latn.json
│ ├── ain_Latn.json
│ ├── ajg_Latn.json
│ ├── aji_Latn.json
│ ├── ajz_Latn.json
│ ├── akb_Latn.json
│ ├── ake_Latn.json
│ ├── akh_Latn.json
│ ├── akp_Latn.json
│ ├── alj_Latn.json
│ ├── aln_Latn.json
│ ├── alp_Latn.json
│ ├── alq_Latn.json
│ ├── als_Latn.json
│ ├── alt_Cyrl.json
│ ├── aly_Latn.json
│ ├── alz_Latn.json
│ ├── ame_Latn.json
│ ├── amf_Latn.json
│ ├── amh_Ethi.json
│ ├── ami_Latn.json
│ ├── amk_Latn.json
│ ├── amm_Latn.json
│ ├── amn_Latn.json
│ ├── amp_Latn.json
│ ├── amr_Latn.json
│ ├── amu_Latn.json
│ ├── amx_Latn.json
│ ├── ang_Latn.json
│ ├── anm_Latn.json
│ ├── ann_Latn.json
│ ├── anp_Deva.json
│ ├── anv_Latn.json
│ ├── any_Latn.json
│ ├── aoi_Latn.json
│ ├── aoj_Latn.json
│ ├── aom_Latn.json
│ ├── aoz_Latn.json
│ ├── apb_Latn.json
│ ├── apc_Arab.json
│ ├── ape_Latn.json
│ ├── apn_Latn.json
│ ├── apr_Latn.json
│ ├── apt_Latn.json
│ ├── apu_Latn.json
│ ├── apw_Latn.json
│ ├── apy_Latn.json
│ ├── apz_Latn.json
│ ├── arb_Arab.json
│ ├── arb_Latn.json
│ ├── are_Latn.json
│ ├── arg_Latn.json
│ ├── arl_Latn.json
│ ├── arn_Latn.json
│ ├── arp_Latn.json
│ ├── arq_Arab.json
│ ├── ars_Arab.json
│ ├── ary_Arab.json
│ ├── arz_Arab.json
│ ├── asg_Latn.json
│ ├── asm_Beng.json
│ ├── asm_Latn.json
│ ├── aso_Latn.json
│ ├── ast_Latn.json
│ ├── ata_Latn.json
│ ├── atb_Latn.json
│ ├── atd_Latn.json
│ ├── atg_Latn.json
│ ├── ati_Latn.json
│ ├── atj_Latn.json
│ ├── atq_Latn.json
│ ├── att_Latn.json
│ ├── auc_Latn.json
│ ├── aui_Latn.json
│ ├── auy_Latn.json
│ ├── ava_Cyrl.json
│ ├── avk_Latn.json
│ ├── avn_Latn.json
│ ├── avt_Latn.json
│ ├── avu_Latn.json
│ ├── awa_Deva.json
│ ├── awb_Latn.json
│ ├── awx_Latn.json
│ ├── ayo_Latn.json
│ ├── ayp_Arab.json
│ ├── ayr_Latn.json
│ ├── azb_Arab.json
│ ├── azg_Latn.json
│ ├── azj_Cyrl.json
│ ├── azj_Latn.json
│ ├── azz_Latn.json
│ ├── bak_Cyrl.json
│ ├── bam_Latn.json
│ ├── ban_Latn.json
│ ├── bao_Latn.json
│ ├── bar_Latn.json
│ ├── bas_Latn.json
│ ├── bav_Latn.json
│ ├── bba_Latn.json
│ ├── bbb_Latn.json
│ ├── bbc_Latn.json
│ ├── bbj_Latn.json
│ ├── bbk_Latn.json
│ ├── bbr_Latn.json
│ ├── bch_Latn.json
│ ├── bci_Latn.json
│ ├── bcl_Latn.json
│ ├── bco_Latn.json
│ ├── bcw_Latn.json
│ ├── bdd_Latn.json
│ ├── bdh_Latn.json
│ ├── bdq_Latn.json
│ ├── bea_Latn.json
│ ├── bef_Latn.json
│ ├── bel_Cyrl.json
│ ├── bem_Latn.json
│ ├── ben_Beng.json
│ ├── ben_Latn.json
│ ├── beq_Latn.json
│ ├── bew_Latn.json
│ ├── bex_Latn.json
│ ├── bfd_Latn.json
│ ├── bfo_Latn.json
│ ├── bgr_Latn.json
│ ├── bgs_Latn.json
│ ├── bgt_Latn.json
│ ├── bgz_Latn.json
│ ├── bhg_Latn.json
│ ├── bhl_Latn.json
│ ├── bho_Deva.json
│ ├── bhp_Latn.json
│ ├── bhw_Latn.json
│ ├── bhz_Latn.json
│ ├── bib_Latn.json
│ ├── big_Latn.json
│ ├── bim_Latn.json
│ ├── bin_Latn.json
│ ├── bis_Latn.json
│ ├── biu_Latn.json
│ ├── biv_Latn.json
│ ├── bjn_Arab.json
│ ├── bjn_Latn.json
│ ├── bjp_Latn.json
│ ├── bjr_Latn.json
│ ├── bjv_Latn.json
│ ├── bkd_Latn.json
│ ├── bkl_Latn.json
│ ├── bkq_Latn.json
│ ├── bku_Latn.json
│ ├── bkv_Latn.json
│ ├── bla_Latn.json
│ ├── blh_Latn.json
│ ├── blk_Mymr.json
│ ├── blw_Latn.json
│ ├── blz_Latn.json
│ ├── bmh_Latn.json
│ ├── bmk_Latn.json
│ ├── bmq_Latn.json
│ ├── bmr_Latn.json
│ ├── bmu_Latn.json
│ ├── bmv_Latn.json
│ ├── bno_Latn.json
│ ├── bnp_Latn.json
│ ├── boa_Latn.json
│ ├── bod_Tibt.json
│ ├── boj_Latn.json
│ ├── bom_Latn.json
│ ├── bon_Latn.json
│ ├── bos_Latn.json
│ ├── bov_Latn.json
│ ├── box_Latn.json
│ ├── bpr_Latn.json
│ ├── bps_Latn.json
│ ├── bpy_Beng.json
│ ├── bqc_Latn.json
│ ├── bqj_Latn.json
│ ├── bqp_Latn.json
│ ├── bre_Latn.json
│ ├── brh_Arab.json
│ ├── bru_Latn.json
│ ├── brx_Deva.json
│ ├── bsc_Latn.json
│ ├── bsn_Latn.json
│ ├── bsp_Latn.json
│ ├── bsq_Latn.json
│ ├── bss_Latn.json
│ ├── btd_Latn.json
│ ├── bth_Latn.json
│ ├── bts_Latn.json
│ ├── btt_Latn.json
│ ├── btx_Latn.json
│ ├── bud_Latn.json
│ ├── bug_Latn.json
│ ├── buk_Latn.json
│ ├── bul_Cyrl.json
│ ├── bum_Latn.json
│ ├── bus_Latn.json
│ ├── bvc_Latn.json
│ ├── bvd_Latn.json
│ ├── bvr_Latn.json
│ ├── bvz_Latn.json
│ ├── bwd_Latn.json
│ ├── bwi_Latn.json
│ ├── bwq_Latn.json
│ ├── bwu_Latn.json
│ ├── bxh_Latn.json
│ ├── bxr_Cyrl.json
│ ├── byr_Latn.json
│ ├── byv_Latn.json
│ ├── byx_Latn.json
│ ├── bzd_Latn.json
│ ├── bzh_Latn.json
│ ├── bzi_Thai.json
│ ├── bzj_Latn.json
│ ├── caa_Latn.json
│ ├── cab_Latn.json
│ ├── cac_Latn.json
│ ├── caf_Latn.json
│ ├── cag_Latn.json
│ ├── cak_Latn.json
│ ├── cao_Latn.json
│ ├── cap_Latn.json
│ ├── caq_Latn.json
│ ├── car_Latn.json
│ ├── cas_Latn.json
│ ├── cat_Latn.json
│ ├── cav_Latn.json
│ ├── cax_Latn.json
│ ├── cbc_Latn.json
│ ├── cbi_Latn.json
│ ├── cbk_Latn.json
│ ├── cbr_Latn.json
│ ├── cbs_Latn.json
│ ├── cbt_Latn.json
│ ├── cbu_Latn.json
│ ├── cbv_Latn.json
│ ├── cce_Latn.json
│ ├── cco_Latn.json
│ ├── ccp_Latn.json
│ ├── ceb_Latn.json
│ ├── ceg_Latn.json
│ ├── cek_Latn.json
│ ├── ces_Latn.json
│ ├── cfm_Latn.json
│ ├── cgc_Latn.json
│ ├── cgg_Latn.json
│ ├── cha_Latn.json
│ ├── chd_Latn.json
│ ├── che_Cyrl.json
│ ├── chf_Latn.json
│ ├── chj_Latn.json
│ ├── chk_Latn.json
│ ├── cho_Latn.json
│ ├── chq_Latn.json
│ ├── chr_Cher.json
│ ├── chr_Latn.json
│ ├── chu_Cyrl.json
│ ├── chv_Cyrl.json
│ ├── chw_Latn.json
│ ├── chz_Latn.json
│ ├── cjk_Latn.json
│ ├── cjo_Latn.json
│ ├── cjp_Latn.json
│ ├── cjs_Cyrl.json
│ ├── cjv_Latn.json
│ ├── ckb_Arab.json
│ ├── cko_Latn.json
│ ├── ckt_Cyrl.json
│ ├── cle_Latn.json
│ ├── clu_Latn.json
│ ├── cly_Latn.json
│ ├── cme_Latn.json
│ ├── cmn_Hani.json
│ ├── cmo_Latn.json
│ ├── cmr_Latn.json
│ ├── cnh_Latn.json
│ ├── cni_Latn.json
│ ├── cnk_Latn.json
│ ├── cnl_Latn.json
│ ├── cnt_Latn.json
│ ├── cnw_Latn.json
│ ├── coe_Latn.json
│ ├── cof_Latn.json
│ ├── cok_Latn.json
│ ├── con_Latn.json
│ ├── cop_Copt.json
│ ├── cor_Latn.json
│ ├── cos_Latn.json
│ ├── cot_Latn.json
│ ├── cou_Latn.json
│ ├── cpa_Latn.json
│ ├── cpb_Latn.json
│ ├── cpc_Latn.json
│ ├── cpu_Latn.json
│ ├── cpy_Latn.json
│ ├── crh_Cyrl.json
│ ├── crh_Latn.json
│ ├── crj_Cans.json
│ ├── crk_Cans.json
│ ├── crk_Latn.json
│ ├── crl_Cans.json
│ ├── crm_Cans.json
│ ├── crn_Latn.json
│ ├── crs_Latn.json
│ ├── crt_Latn.json
│ ├── crx_Latn.json
│ ├── csb_Latn.json
│ ├── csk_Latn.json
│ ├── cso_Latn.json
│ ├── csw_Latn.json
│ ├── csy_Latn.json
│ ├── cta_Latn.json
│ ├── ctd_Latn.json
│ ├── cto_Latn.json
│ ├── ctp_Latn.json
│ ├── ctu_Latn.json
│ ├── cub_Latn.json
│ ├── cuc_Latn.json
│ ├── cui_Latn.json
│ ├── cuk_Latn.json
│ ├── cul_Latn.json
│ ├── cut_Latn.json
│ ├── cux_Latn.json
│ ├── cwe_Latn.json
│ ├── cwt_Latn.json
│ ├── cya_Latn.json
│ ├── cym_Latn.json
│ ├── czt_Latn.json
│ ├── daa_Latn.json
│ ├── dad_Latn.json
│ ├── daf_Latn.json
│ ├── dag_Latn.json
│ ├── dah_Latn.json
│ ├── dak_Latn.json
│ ├── dan_Latn.json
│ ├── dar_Cyrl.json
│ ├── ddg_Latn.json
│ ├── ddn_Latn.json
│ ├── ded_Latn.json
│ ├── des_Latn.json
│ ├── deu_Latn.json
│ ├── dga_Latn.json
│ ├── dgc_Latn.json
│ ├── dgi_Latn.json
│ ├── dgr_Latn.json
│ ├── dgz_Latn.json
│ ├── dhg_Latn.json
│ ├── dhm_Latn.json
│ ├── dhv_Latn.json
│ ├── did_Latn.json
│ ├── dig_Latn.json
│ ├── dik_Latn.json
│ ├── diq_Latn.json
│ ├── dis_Latn.json
│ ├── diu_Latn.json
│ ├── div_Thaa.json
│ ├── dje_Latn.json
│ ├── djk_Latn.json
│ ├── djr_Latn.json
│ ├── dks_Latn.json
│ ├── dln_Latn.json
│ ├── dng_Cyrl.json
│ ├── dnj_Latn.json
│ ├── dnw_Latn.json
│ ├── dob_Latn.json
│ ├── doi_Deva.json
│ ├── dop_Latn.json
│ ├── dos_Latn.json
│ ├── dow_Latn.json
│ ├── drg_Latn.json
│ ├── dru_Latn.json
│ ├── dsb_Latn.json
│ ├── dtb_Latn.json
│ ├── dtp_Latn.json
│ ├── dts_Latn.json
│ ├── dty_Deva.json
│ ├── dua_Latn.json
│ ├── due_Latn.json
│ ├── dug_Latn.json
│ ├── duo_Latn.json
│ ├── dur_Latn.json
│ ├── dwr_Latn.json
│ ├── dww_Latn.json
│ ├── dyi_Latn.json
│ ├── dyo_Latn.json
│ ├── dyu_Latn.json
│ ├── dzo_Tibt.json
│ ├── ebk_Latn.json
│ ├── efi_Latn.json
│ ├── eka_Latn.json
│ ├── ekk_Latn.json
│ ├── eko_Latn.json
│ ├── ell_Grek.json
│ ├── emi_Latn.json
│ ├── eml_Latn.json
│ ├── emp_Latn.json
│ ├── enb_Latn.json
│ ├── enl_Latn.json
│ ├── enm_Latn.json
│ ├── enq_Latn.json
│ ├── enx_Latn.json
│ ├── epo_Latn.json
│ ├── eri_Latn.json
│ ├── ese_Latn.json
│ ├── esi_Latn.json
│ ├── esk_Latn.json
│ ├── ess_Latn.json
│ ├── esu_Latn.json
│ ├── eto_Latn.json
│ ├── etr_Latn.json
│ ├── etu_Latn.json
│ ├── eus_Latn.json
│ ├── eve_Cyrl.json
│ ├── ewe_Latn.json
│ ├── ewo_Latn.json
│ ├── ext_Latn.json
│ ├── eza_Latn.json
│ ├── faa_Latn.json
│ ├── fad_Latn.json
│ ├── fai_Latn.json
│ ├── fal_Latn.json
│ ├── fan_Latn.json
│ ├── fao_Latn.json
│ ├── far_Latn.json
│ ├── fas_Arab.json
│ ├── fat_Latn.json
│ ├── ffm_Latn.json
│ ├── fij_Latn.json
│ ├── fil_Latn.json
│ ├── fin_Latn.json
│ ├── fit_Latn.json
│ ├── fkv_Latn.json
│ ├── fmu_Deva.json
│ ├── fon_Latn.json
│ ├── for_Latn.json
│ ├── fra_Latn.json
│ ├── frd_Latn.json
│ ├── fro_Latn.json
│ ├── frp_Latn.json
│ ├── frr_Latn.json
│ ├── fry_Latn.json
│ ├── fub_Latn.json
│ ├── fud_Latn.json
│ ├── fue_Latn.json
│ ├── fuf_Latn.json
│ ├── fuh_Latn.json
│ ├── fuq_Latn.json
│ ├── fur_Latn.json
│ ├── fuv_Arab.json
│ ├── fuv_Latn.json
│ ├── gaa_Latn.json
│ ├── gag_Cyrl.json
│ ├── gag_Latn.json
│ ├── gah_Latn.json
│ ├── gai_Latn.json
│ ├── gam_Latn.json
│ ├── gaw_Latn.json
│ ├── gaz_Latn.json
│ ├── gbi_Latn.json
│ ├── gbo_Latn.json
│ ├── gbr_Latn.json
│ ├── gcf_Latn.json
│ ├── gcr_Latn.json
│ ├── gde_Latn.json
│ ├── gdg_Latn.json
│ ├── gdn_Latn.json
│ ├── gdr_Latn.json
│ ├── geb_Latn.json
│ ├── gej_Latn.json
│ ├── gfk_Latn.json
│ ├── ghs_Latn.json
│ ├── gil_Latn.json
│ ├── giz_Latn.json
│ ├── gjn_Latn.json
│ ├── gkn_Latn.json
│ ├── gla_Latn.json
│ ├── gle_Latn.json
│ ├── glg_Latn.json
│ ├── glk_Arab.json
│ ├── glv_Latn.json
│ ├── gmh_Latn.json
│ ├── gmv_Ethi.json
│ ├── gmv_Latn.json
│ ├── gna_Latn.json
│ ├── gnb_Latn.json
│ ├── gnd_Latn.json
│ ├── gng_Latn.json
│ ├── gnn_Latn.json
│ ├── gnw_Latn.json
│ ├── goa_Latn.json
│ ├── gof_Ethi.json
│ ├── gof_Latn.json
│ ├── gog_Latn.json
│ ├── goh_Latn.json
│ ├── gom_Deva.json
│ ├── gom_Latn.json
│ ├── gor_Latn.json
│ ├── gos_Latn.json
│ ├── got_Goth.json
│ ├── gqr_Latn.json
│ ├── grc_Grek.json
│ ├── grt_Beng.json
│ ├── gso_Latn.json
│ ├── gsw_Latn.json
│ ├── gub_Latn.json
│ ├── guc_Latn.json
│ ├── gud_Latn.json
│ ├── gug_Latn.json
│ ├── guh_Latn.json
│ ├── gui_Latn.json
│ ├── guj_Gujr.json
│ ├── guj_Latn.json
│ ├── guk_Ethi.json
│ ├── gul_Latn.json
│ ├── gum_Latn.json
│ ├── gun_Latn.json
│ ├── guo_Latn.json
│ ├── guq_Latn.json
│ ├── gur_Latn.json
│ ├── guu_Latn.json
│ ├── guw_Latn.json
│ ├── gux_Latn.json
│ ├── guz_Latn.json
│ ├── gvc_Latn.json
│ ├── gvf_Latn.json
│ ├── gvl_Latn.json
│ ├── gvn_Latn.json
│ ├── gwi_Latn.json
│ ├── gwr_Latn.json
│ ├── gya_Latn.json
│ ├── gym_Latn.json
│ ├── gyr_Latn.json
│ ├── hac_Arab.json
│ ├── hae_Latn.json
│ ├── hag_Latn.json
│ ├── hak_Hani.json
│ ├── hak_Latn.json
│ ├── hat_Latn.json
│ ├── hav_Latn.json
│ ├── haw_Latn.json
│ ├── hay_Latn.json
│ ├── hbo_Hebr.json
│ ├── hch_Latn.json
│ ├── heb_Hebr.json
│ ├── heg_Latn.json
│ ├── heh_Latn.json
│ ├── her_Latn.json
│ ├── hif_Latn.json
│ ├── hig_Latn.json
│ ├── hil_Latn.json
│ ├── hin_Deva.json
│ ├── hin_Latn.json
│ ├── hix_Latn.json
│ ├── hla_Latn.json
│ ├── hmo_Latn.json
│ ├── hmr_Latn.json
│ ├── hne_Deva.json
│ ├── hnj_Latn.json
│ ├── hnn_Latn.json
│ ├── hns_Latn.json
│ ├── hop_Latn.json
│ ├── hot_Latn.json
│ ├── hra_Latn.json
│ ├── hrv_Latn.json
│ ├── hrx_Latn.json
│ ├── hsb_Latn.json
│ ├── hto_Latn.json
│ ├── hub_Latn.json
│ ├── hui_Latn.json
│ ├── hun_Latn.json
│ ├── hus_Latn.json
│ ├── huu_Latn.json
│ ├── huv_Latn.json
│ ├── hvn_Latn.json
│ ├── hwc_Latn.json
│ ├── hye_Armn.json
│ ├── hyw_Armn.json
│ ├── ian_Latn.json
│ ├── iba_Latn.json
│ ├── ibg_Latn.json
│ ├── ibo_Latn.json
│ ├── icr_Latn.json
│ ├── ido_Latn.json
│ ├── idu_Latn.json
│ ├── ifa_Latn.json
│ ├── ifb_Latn.json
│ ├── ife_Latn.json
│ ├── ifk_Latn.json
│ ├── ifu_Latn.json
│ ├── ify_Latn.json
│ ├── ige_Latn.json
│ ├── ign_Latn.json
│ ├── ike_Cans.json
│ ├── ikk_Latn.json
│ ├── ikt_Latn.json
│ ├── ikw_Latn.json
│ ├── ilb_Latn.json
│ ├── ile_Latn.json
│ ├── ilo_Latn.json
│ ├── imo_Latn.json
│ ├── ina_Latn.json
│ ├── inb_Latn.json
│ ├── ind_Latn.json
│ ├── inh_Cyrl.json
│ ├── ino_Latn.json
│ ├── iou_Latn.json
│ ├── ipi_Latn.json
│ ├── iqw_Latn.json
│ ├── iri_Latn.json
│ ├── irk_Latn.json
│ ├── iry_Latn.json
│ ├── isd_Latn.json
│ ├── ish_Latn.json
│ ├── isl_Latn.json
│ ├── iso_Latn.json
│ ├── ita_Latn.json
│ ├── itv_Latn.json
│ ├── ium_Latn.json
│ ├── ivb_Latn.json
│ ├── ivv_Latn.json
│ ├── iws_Latn.json
│ ├── ixl_Latn.json
│ ├── izr_Latn.json
│ ├── izz_Latn.json
│ ├── jaa_Latn.json
│ ├── jac_Latn.json
│ ├── jae_Latn.json
│ ├── jam_Latn.json
│ ├── jav_Latn.json
│ ├── jbo_Latn.json
│ ├── jbu_Latn.json
│ ├── jic_Latn.json
│ ├── jiv_Latn.json
│ ├── jmc_Latn.json
│ ├── jpn_Jpan.json
│ ├── jra_Latn.json
│ ├── jun_Orya.json
│ ├── jvn_Latn.json
│ ├── kaa_Cyrl.json
│ ├── kaa_Latn.json
│ ├── kab_Latn.json
│ ├── kac_Latn.json
│ ├── kak_Latn.json
│ ├── kal_Latn.json
│ ├── kam_Latn.json
│ ├── kan_Knda.json
│ ├── kan_Latn.json
│ ├── kao_Latn.json
│ ├── kaq_Latn.json
│ ├── kas_Arab.json
│ ├── kas_Deva.json
│ ├── kas_Latn.json
│ ├── kat_Geor.json
│ ├── kaz_Cyrl.json
│ ├── kbc_Latn.json
│ ├── kbd_Cyrl.json
│ ├── kbh_Latn.json
│ ├── kbm_Latn.json
│ ├── kbo_Latn.json
│ ├── kbp_Latn.json
│ ├── kbq_Latn.json
│ ├── kbr_Latn.json
│ ├── kby_Latn.json
│ ├── kca_Cyrl.json
│ ├── kcg_Latn.json
│ ├── kck_Latn.json
│ ├── kdc_Latn.json
│ ├── kde_Latn.json
│ ├── kdh_Latn.json
│ ├── kdi_Latn.json
│ ├── kdj_Latn.json
│ ├── kdl_Latn.json
│ ├── kdr_Latn.json
│ ├── kea_Latn.json
│ ├── kei_Latn.json
│ ├── kek_Latn.json
│ ├── ken_Latn.json
│ ├── keo_Latn.json
│ ├── ker_Latn.json
│ ├── kew_Latn.json
│ ├── kez_Latn.json
│ ├── kff_Telu.json
│ ├── kgf_Latn.json
│ ├── kgk_Latn.json
│ ├── kgp_Latn.json
│ ├── kgr_Latn.json
│ ├── kha_Latn.json
│ ├── khk_Cyrl.json
│ ├── khm_Khmr.json
│ ├── khs_Latn.json
│ ├── khz_Latn.json
│ ├── kia_Latn.json
│ ├── kij_Latn.json
│ ├── kik_Latn.json
│ ├── kin_Latn.json
│ ├── kir_Cyrl.json
│ ├── kiu_Latn.json
│ ├── kix_Latn.json
│ ├── kjb_Latn.json
│ ├── kje_Latn.json
│ ├── kjh_Cyrl.json
│ ├── kjs_Latn.json
│ ├── kkc_Latn.json
│ ├── kki_Latn.json
│ ├── kkj_Latn.json
│ ├── kkl_Latn.json
│ ├── kle_Deva.json
│ ├── klt_Latn.json
│ ├── klv_Latn.json
│ ├── kmb_Latn.json
│ ├── kmg_Latn.json
│ ├── kmh_Latn.json
│ ├── kmk_Latn.json
│ ├── kmm_Latn.json
│ ├── kmo_Latn.json
│ ├── kmr_Cyrl.json
│ ├── kmr_Latn.json
│ ├── kms_Latn.json
│ ├── kmu_Latn.json
│ ├── kmy_Latn.json
│ ├── knc_Latn.json
│ ├── kne_Latn.json
│ ├── knf_Latn.json
│ ├── kng_Latn.json
│ ├── knj_Latn.json
│ ├── knk_Latn.json
│ ├── kno_Latn.json
│ ├── knv_Latn.json
│ ├── knx_Latn.json
│ ├── kny_Latn.json
│ ├── kog_Latn.json
│ ├── koi_Cyrl.json
│ ├── koo_Latn.json
│ ├── kor_Hang.json
│ ├── kos_Latn.json
│ ├── kpe_Latn.json
│ ├── kpf_Latn.json
│ ├── kpg_Latn.json
│ ├── kpj_Latn.json
│ ├── kpq_Latn.json
│ ├── kpr_Latn.json
│ ├── kpv_Cyrl.json
│ ├── kpw_Latn.json
│ ├── kpx_Latn.json
│ ├── kpz_Latn.json
│ ├── kqc_Latn.json
│ ├── kqe_Latn.json
│ ├── kqf_Latn.json
│ ├── kql_Latn.json
│ ├── kqn_Latn.json
│ ├── kqo_Latn.json
│ ├── kqp_Latn.json
│ ├── kqs_Latn.json
│ ├── kqw_Latn.json
│ ├── kqy_Ethi.json
│ ├── krc_Cyrl.json
│ ├── kri_Latn.json
│ ├── krj_Latn.json
│ ├── krl_Latn.json
│ ├── kru_Deva.json
│ ├── krx_Latn.json
│ ├── ksb_Latn.json
│ ├── ksc_Latn.json
│ ├── ksd_Latn.json
│ ├── ksf_Latn.json
│ ├── ksh_Latn.json
│ ├── ksj_Latn.json
│ ├── ksp_Latn.json
│ ├── ksr_Latn.json
│ ├── kss_Latn.json
│ ├── ksw_Mymr.json
│ ├── ktb_Ethi.json
│ ├── ktj_Latn.json
│ ├── ktm_Latn.json
│ ├── kto_Latn.json
│ ├── ktu_Latn.json
│ ├── ktz_Latn.json
│ ├── kua_Latn.json
│ ├── kub_Latn.json
│ ├── kud_Latn.json
│ ├── kue_Latn.json
│ ├── kuj_Latn.json
│ ├── kum_Cyrl.json
│ ├── kup_Latn.json
│ ├── kus_Latn.json
│ ├── kvg_Latn.json
│ ├── kvj_Latn.json
│ ├── kvn_Latn.json
│ ├── kwd_Latn.json
│ ├── kwf_Latn.json
│ ├── kwi_Latn.json
│ ├── kwj_Latn.json
│ ├── kwn_Latn.json
│ ├── kwy_Latn.json
│ ├── kxc_Ethi.json
│ ├── kxm_Thai.json
│ ├── kxw_Latn.json
│ ├── kyc_Latn.json
│ ├── kyf_Latn.json
│ ├── kyg_Latn.json
│ ├── kyq_Latn.json
│ ├── kyu_Kali.json
│ ├── kyu_Latn.json
│ ├── kyu_Mymr.json
│ ├── kyz_Latn.json
│ ├── kze_Latn.json
│ ├── kzf_Latn.json
│ ├── kzj_Latn.json
│ ├── lac_Latn.json
│ ├── lad_Hebr.json
│ ├── lad_Latn.json
│ ├── lai_Latn.json
│ ├── laj_Latn.json
│ ├── lam_Latn.json
│ ├── lao_Laoo.json
│ ├── lap_Latn.json
│ ├── lat_Latn.json
│ ├── lbb_Latn.json
│ ├── lbe_Cyrl.json
│ ├── lbj_Tibt.json
│ ├── lbk_Latn.json
│ ├── lcm_Latn.json
│ ├── lcp_Thai.json
│ ├── ldi_Latn.json
│ ├── ldn_Latn.json
│ ├── lee_Latn.json
│ ├── lef_Latn.json
│ ├── leh_Latn.json
│ ├── lem_Latn.json
│ ├── leu_Latn.json
│ ├── lew_Latn.json
│ ├── lex_Latn.json
│ ├── lez_Cyrl.json
│ ├── lfn_Cyrl.json
│ ├── lfn_Latn.json
│ ├── lgg_Latn.json
│ ├── lgl_Latn.json
│ ├── lgm_Latn.json
│ ├── lhi_Latn.json
│ ├── lhu_Latn.json
│ ├── lia_Latn.json
│ ├── lid_Latn.json
│ ├── lif_Deva.json
│ ├── lif_Limb.json
│ ├── lij_Latn.json
│ ├── lim_Latn.json
│ ├── lin_Latn.json
│ ├── lip_Latn.json
│ ├── lis_Lisu.json
│ ├── lit_Latn.json
│ ├── liv_Latn.json
│ ├── ljp_Latn.json
│ ├── lki_Arab.json
│ ├── llb_Latn.json
│ ├── lld_Latn.json
│ ├── llg_Latn.json
│ ├── lln_Latn.json
│ ├── lmk_Latn.json
│ ├── lmo_Latn.json
│ ├── lmp_Latn.json
│ ├── lnd_Latn.json
│ ├── lob_Latn.json
│ ├── loe_Latn.json
│ ├── log_Latn.json
│ ├── lol_Latn.json
│ ├── lom_Latn.json
│ ├── loq_Latn.json
│ ├── loz_Latn.json
│ ├── lrc_Arab.json
│ ├── lsi_Latn.json
│ ├── lsm_Latn.json
│ ├── ltg_Latn.json
│ ├── ltz_Latn.json
│ ├── lua_Latn.json
│ ├── lub_Latn.json
│ ├── luc_Latn.json
│ ├── lud_Latn.json
│ ├── lue_Latn.json
│ ├── lug_Latn.json
│ ├── lun_Latn.json
│ ├── luo_Latn.json
│ ├── lus_Latn.json
│ ├── lvs_Latn.json
│ ├── lwg_Latn.json
│ ├── lwo_Latn.json
│ ├── lww_Latn.json
│ ├── lzh_Hani.json
│ ├── maa_Latn.json
│ ├── mad_Latn.json
│ ├── maf_Latn.json
│ ├── mag_Deva.json
│ ├── mah_Latn.json
│ ├── mai_Deva.json
│ ├── maj_Latn.json
│ ├── mak_Latn.json
│ ├── mal_Latn.json
│ ├── mal_Mlym.json
│ ├── mam_Latn.json
│ ├── maq_Latn.json
│ ├── mar_Deva.json
│ ├── mar_Latn.json
│ ├── mas_Latn.json
│ ├── mau_Latn.json
│ ├── mav_Latn.json
│ ├── maw_Latn.json
│ ├── maz_Latn.json
│ ├── mbb_Latn.json
│ ├── mbc_Latn.json
│ ├── mbd_Latn.json
│ ├── mbf_Latn.json
│ ├── mbh_Latn.json
│ ├── mbi_Latn.json
│ ├── mbj_Latn.json
│ ├── mbl_Latn.json
│ ├── mbs_Latn.json
│ ├── mbt_Latn.json
│ ├── mca_Latn.json
│ ├── mcb_Latn.json
│ ├── mcd_Latn.json
│ ├── mcf_Latn.json
│ ├── mck_Latn.json
│ ├── mcn_Latn.json
│ ├── mco_Latn.json
│ ├── mcp_Latn.json
│ ├── mcq_Latn.json
│ ├── mcu_Latn.json
│ ├── mda_Latn.json
│ ├── mdf_Cyrl.json
│ ├── mdy_Ethi.json
│ ├── med_Latn.json
│ ├── mee_Latn.json
│ ├── mej_Latn.json
│ ├── mek_Latn.json
│ ├── men_Latn.json
│ ├── meq_Latn.json
│ ├── mer_Latn.json
│ ├── met_Latn.json
│ ├── meu_Latn.json
│ ├── mev_Latn.json
│ ├── mfe_Latn.json
│ ├── mfg_Latn.json
│ ├── mfh_Latn.json
│ ├── mfi_Latn.json
│ ├── mfk_Latn.json
│ ├── mfq_Latn.json
│ ├── mfy_Latn.json
│ ├── mfz_Latn.json
│ ├── mgc_Latn.json
│ ├── mgh_Latn.json
│ ├── mgo_Latn.json
│ ├── mgr_Latn.json
│ ├── mhi_Latn.json
│ ├── mhl_Latn.json
│ ├── mhr_Cyrl.json
│ ├── mhw_Latn.json
│ ├── mhx_Latn.json
│ ├── mhy_Latn.json
│ ├── mib_Latn.json
│ ├── mic_Latn.json
│ ├── mie_Latn.json
│ ├── mif_Latn.json
│ ├── mig_Latn.json
│ ├── mih_Latn.json
│ ├── mil_Latn.json
│ ├── mim_Latn.json
│ ├── min_Latn.json
│ ├── mio_Latn.json
│ ├── mip_Latn.json
│ ├── miq_Latn.json
│ ├── mir_Latn.json
│ ├── mit_Latn.json
│ ├── miy_Latn.json
│ ├── miz_Latn.json
│ ├── mjc_Latn.json
│ ├── mjw_Latn.json
│ ├── mkd_Cyrl.json
│ ├── mkl_Latn.json
│ ├── mkn_Latn.json
│ ├── mks_Latn.json
│ ├── mkz_Latn.json
│ ├── mlh_Latn.json
│ ├── mlp_Latn.json
│ ├── mlt_Latn.json
│ ├── mlu_Latn.json
│ ├── mmn_Latn.json
│ ├── mmo_Latn.json
│ ├── mmx_Latn.json
│ ├── mna_Latn.json
│ ├── mnb_Latn.json
│ ├── mnf_Latn.json
│ ├── mni_Beng.json
│ ├── mni_Latn.json
│ ├── mni_Mtei.json
│ ├── mnk_Latn.json
│ ├── mns_Cyrl.json
│ ├── mnw_Mymr.json
│ ├── mnx_Latn.json
│ ├── mny_Latn.json
│ ├── moa_Latn.json
│ ├── moc_Latn.json
│ ├── mog_Latn.json
│ ├── moh_Latn.json
│ ├── mop_Latn.json
│ ├── mor_Latn.json
│ ├── mos_Latn.json
│ ├── mox_Latn.json
│ ├── mpg_Latn.json
│ ├── mph_Latn.json
│ ├── mpm_Latn.json
│ ├── mpp_Latn.json
│ ├── mps_Latn.json
│ ├── mpt_Latn.json
│ ├── mpx_Latn.json
│ ├── mqb_Latn.json
│ ├── mqj_Latn.json
│ ├── mqy_Latn.json
│ ├── mrg_Latn.json
│ ├── mri_Latn.json
│ ├── mrj_Cyrl.json
│ ├── mrq_Latn.json
│ ├── mrv_Latn.json
│ ├── mrw_Latn.json
│ ├── msb_Latn.json
│ ├── msc_Latn.json
│ ├── mse_Latn.json
│ ├── msk_Latn.json
│ ├── msy_Latn.json
│ ├── mta_Latn.json
│ ├── mtg_Latn.json
│ ├── mti_Latn.json
│ ├── mto_Latn.json
│ ├── mtp_Latn.json
│ ├── mua_Latn.json
│ ├── mug_Latn.json
│ ├── muh_Latn.json
│ ├── mui_Latn.json
│ ├── mup_Deva.json
│ ├── mur_Latn.json
│ ├── mus_Latn.json
│ ├── mux_Latn.json
│ ├── muy_Latn.json
│ ├── mva_Latn.json
│ ├── mvn_Latn.json
│ ├── mvp_Latn.json
│ ├── mwc_Latn.json
│ ├── mwl_Latn.json
│ ├── mwm_Latn.json
│ ├── mwn_Latn.json
│ ├── mwp_Latn.json
│ ├── mwq_Latn.json
│ ├── mwv_Latn.json
│ ├── mww_Latn.json
│ ├── mxb_Latn.json
│ ├── mxp_Latn.json
│ ├── mxq_Latn.json
│ ├── mxt_Latn.json
│ ├── mxv_Latn.json
│ ├── mya_Mymr.json
│ ├── myb_Latn.json
│ ├── myk_Latn.json
│ ├── myu_Latn.json
│ ├── myv_Cyrl.json
│ ├── myw_Latn.json
│ ├── myx_Latn.json
│ ├── myy_Latn.json
│ ├── mza_Latn.json
│ ├── mzh_Latn.json
│ ├── mzk_Latn.json
│ ├── mzl_Latn.json
│ ├── mzm_Latn.json
│ ├── mzn_Arab.json
│ ├── mzw_Latn.json
│ ├── mzz_Latn.json
│ ├── nab_Latn.json
│ ├── naf_Latn.json
│ ├── nah_Latn.json
│ ├── nak_Latn.json
│ ├── nap_Latn.json
│ ├── naq_Latn.json
│ ├── nas_Latn.json
│ ├── nav_Latn.json
│ ├── naw_Latn.json
│ ├── nba_Latn.json
│ ├── nbc_Latn.json
│ ├── nbe_Latn.json
│ ├── nbl_Latn.json
│ ├── nbq_Latn.json
│ ├── nbu_Latn.json
│ ├── nca_Latn.json
│ ├── nch_Latn.json
│ ├── ncj_Latn.json
│ ├── ncl_Latn.json
│ ├── ncq_Laoo.json
│ ├── nct_Latn.json
│ ├── ncu_Latn.json
│ ├── ncx_Latn.json
│ ├── ndc_Latn.json
│ ├── nde_Latn.json
│ ├── ndh_Latn.json
│ ├── ndi_Latn.json
│ ├── ndj_Latn.json
│ ├── ndo_Latn.json
│ ├── nds_Latn.json
│ ├── ndz_Latn.json
│ ├── neb_Latn.json
│ ├── new_Deva.json
│ ├── nfa_Latn.json
│ ├── nfr_Latn.json
│ ├── ngb_Latn.json
│ ├── ngc_Latn.json
│ ├── ngl_Latn.json
│ ├── ngp_Latn.json
│ ├── ngu_Latn.json
│ ├── nhd_Latn.json
│ ├── nhe_Latn.json
│ ├── nhg_Latn.json
│ ├── nhi_Latn.json
│ ├── nhk_Latn.json
│ ├── nho_Latn.json
│ ├── nhr_Latn.json
│ ├── nhu_Latn.json
│ ├── nhw_Latn.json
│ ├── nhx_Latn.json
│ ├── nhy_Latn.json
│ ├── nia_Latn.json
│ ├── nif_Latn.json
│ ├── nii_Latn.json
│ ├── nij_Latn.json
│ ├── nim_Latn.json
│ ├── nin_Latn.json
│ ├── nio_Cyrl.json
│ ├── niu_Latn.json
│ ├── niy_Latn.json
│ ├── njb_Latn.json
│ ├── njm_Latn.json
│ ├── njn_Latn.json
│ ├── njo_Latn.json
│ ├── njz_Latn.json
│ ├── nkf_Latn.json
│ ├── nko_Latn.json
│ ├── nld_Latn.json
│ ├── nlg_Latn.json
│ ├── nma_Latn.json
│ ├── nmf_Latn.json
│ ├── nmo_Latn.json
│ ├── nmw_Latn.json
│ ├── nmz_Latn.json
│ ├── nnb_Latn.json
│ ├── nng_Latn.json
│ ├── nnh_Latn.json
│ ├── nnl_Latn.json
│ ├── nno_Latn.json
│ ├── nnp_Latn.json
│ ├── nnq_Latn.json
│ ├── nnw_Latn.json
│ ├── noa_Latn.json
│ ├── nob_Latn.json
│ ├── nod_Thai.json
│ ├── nog_Cyrl.json
│ ├── non_Latn.json
│ ├── nop_Latn.json
│ ├── not_Latn.json
│ ├── nou_Latn.json
│ ├── nov_Latn.json
│ ├── nph_Latn.json
│ ├── npi_Deva.json
│ ├── npi_Latn.json
│ ├── npl_Latn.json
│ ├── npo_Latn.json
│ ├── npy_Latn.json
│ ├── nqo_Nkoo.json
│ ├── nre_Latn.json
│ ├── nrf_Latn.json
│ ├── nri_Latn.json
│ ├── nrm_Latn.json
│ ├── nsa_Latn.json
│ ├── nse_Latn.json
│ ├── nsm_Latn.json
│ ├── nsn_Latn.json
│ ├── nso_Latn.json
│ ├── nss_Latn.json
│ ├── nst_Latn.json
│ ├── nsu_Latn.json
│ ├── ntp_Latn.json
│ ├── ntr_Latn.json
│ ├── ntu_Latn.json
│ ├── nuj_Latn.json
│ ├── nus_Latn.json
│ ├── nuy_Latn.json
│ ├── nwb_Latn.json
│ ├── nwi_Latn.json
│ ├── nwx_Deva.json
│ ├── nxd_Latn.json
│ ├── nya_Latn.json
│ ├── nyf_Latn.json
│ ├── nyk_Latn.json
│ ├── nyn_Latn.json
│ ├── nyo_Latn.json
│ ├── nyu_Latn.json
│ ├── nyy_Latn.json
│ ├── nzi_Latn.json
│ ├── nzm_Latn.json
│ ├── obo_Latn.json
│ ├── oci_Latn.json
│ ├── ogo_Latn.json
│ ├── ojb_Cans.json
│ ├── ojb_Latn.json
│ ├── oke_Latn.json
│ ├── okv_Latn.json
│ ├── old_Latn.json
│ ├── olo_Latn.json
│ ├── omb_Latn.json
│ ├── omw_Latn.json
│ ├── ong_Latn.json
│ ├── ons_Latn.json
│ ├── ood_Latn.json
│ ├── opm_Latn.json
│ ├── orv_Cyrl.json
│ ├── ory_Latn.json
│ ├── ory_Orya.json
│ ├── oss_Cyrl.json
│ ├── ota_Arab.json
│ ├── otd_Latn.json
│ ├── ote_Latn.json
│ ├── otm_Latn.json
│ ├── otn_Latn.json
│ ├── oto_Latn.json
│ ├── otq_Latn.json
│ ├── ots_Latn.json
│ ├── otw_Latn.json
│ ├── oym_Latn.json
│ ├── ozm_Latn.json
│ ├── pab_Latn.json
│ ├── pad_Latn.json
│ ├── pag_Latn.json
│ ├── pah_Latn.json
│ ├── pam_Latn.json
│ ├── pan_Guru.json
│ ├── pan_Latn.json
│ ├── pao_Latn.json
│ ├── pap_Latn.json
│ ├── pau_Latn.json
│ ├── pbb_Latn.json
│ ├── pbc_Latn.json
│ ├── pbi_Latn.json
│ ├── pbt_Arab.json
│ ├── pcd_Latn.json
│ ├── pck_Latn.json
│ ├── pcm_Latn.json
│ ├── pdc_Latn.json
│ ├── pdt_Latn.json
│ ├── pem_Latn.json
│ ├── pfe_Latn.json
│ ├── pfl_Latn.json
│ ├── phm_Latn.json
│ ├── pib_Latn.json
│ ├── pio_Latn.json
│ ├── pir_Latn.json
│ ├── pis_Latn.json
│ ├── pjt_Latn.json
│ ├── pkb_Latn.json
│ ├── plg_Latn.json
│ ├── pls_Latn.json
│ ├── plt_Latn.json
│ ├── plu_Latn.json
│ ├── plw_Latn.json
│ ├── pma_Latn.json
│ ├── pmf_Latn.json
│ ├── pmq_Latn.json
│ ├── pms_Latn.json
│ ├── pmx_Latn.json
│ ├── pnb_Arab.json
│ ├── pne_Latn.json
│ ├── pnt_Grek.json
│ ├── pny_Latn.json
│ ├── poe_Latn.json
│ ├── poh_Latn.json
│ ├── poi_Latn.json
│ ├── pol_Latn.json
│ ├── pon_Latn.json
│ ├── por_Latn.json
│ ├── pos_Latn.json
│ ├── pot_Latn.json
│ ├── pov_Latn.json
│ ├── poy_Latn.json
│ ├── ppk_Latn.json
│ ├── ppo_Latn.json
│ ├── pps_Latn.json
│ ├── prf_Latn.json
│ ├── prg_Latn.json
│ ├── pri_Latn.json
│ ├── prq_Latn.json
│ ├── pse_Latn.json
│ ├── pss_Latn.json
│ ├── ptp_Latn.json
│ ├── ptu_Latn.json
│ ├── pui_Latn.json
│ ├── pwg_Latn.json
│ ├── pwn_Latn.json
│ ├── pww_Thai.json
│ ├── pxm_Latn.json
│ ├── qub_Latn.json
│ ├── quc_Latn.json
│ ├── quf_Latn.json
│ ├── qug_Latn.json
│ ├── quh_Latn.json
│ ├── qul_Latn.json
│ ├── qup_Latn.json
│ ├── qus_Latn.json
│ ├── quw_Latn.json
│ ├── quy_Latn.json
│ ├── quz_Latn.json
│ ├── qva_Latn.json
│ ├── qvc_Latn.json
│ ├── qve_Latn.json
│ ├── qvh_Latn.json
│ ├── qvi_Latn.json
│ ├── qvm_Latn.json
│ ├── qvn_Latn.json
│ ├── qvo_Latn.json
│ ├── qvs_Latn.json
│ ├── qvw_Latn.json
│ ├── qvz_Latn.json
│ ├── qwh_Latn.json
│ ├── qxh_Latn.json
│ ├── qxl_Latn.json
│ ├── qxn_Latn.json
│ ├── qxo_Latn.json
│ ├── qxr_Latn.json
│ ├── rad_Latn.json
│ ├── rai_Latn.json
│ ├── rap_Latn.json
│ ├── rar_Latn.json
│ ├── rav_Deva.json
│ ├── raw_Latn.json
│ ├── rcf_Latn.json
│ ├── rej_Latn.json
│ ├── rel_Latn.json
│ ├── rgu_Latn.json
│ ├── rhg_Latn.json
│ ├── ria_Latn.json
│ ├── rim_Latn.json
│ ├── rjs_Deva.json
│ ├── rkb_Latn.json
│ ├── rmc_Latn.json
│ ├── rme_Latn.json
│ ├── rml_Latn.json
│ ├── rmn_Cyrl.json
│ ├── rmn_Grek.json
│ ├── rmn_Latn.json
│ ├── rmo_Latn.json
│ ├── rmq_Latn.json
│ ├── rmy_Cyrl.json
│ ├── rmy_Latn.json
│ ├── rnd_Latn.json
│ ├── rng_Latn.json
│ ├── rnl_Latn.json
│ ├── roh_Latn.json
│ ├── ron_Cyrl.json
│ ├── ron_Latn.json
│ ├── roo_Latn.json
│ ├── rop_Latn.json
│ ├── row_Latn.json
│ ├── rro_Latn.json
│ ├── rtm_Latn.json
│ ├── rub_Latn.json
│ ├── rue_Cyrl.json
│ ├── ruf_Latn.json
│ ├── rug_Latn.json
│ ├── run_Latn.json
│ ├── rup_Latn.json
│ ├── rus_Cyrl.json
│ ├── rwo_Latn.json
│ ├── sab_Latn.json
│ ├── sag_Latn.json
│ ├── sah_Cyrl.json
│ ├── san_Deva.json
│ ├── san_Latn.json
│ ├── sas_Latn.json
│ ├── sat_Latn.json
│ ├── sat_Olck.json
│ ├── sba_Latn.json
│ ├── sbd_Latn.json
│ ├── sbe_Latn.json
│ ├── sbl_Latn.json
│ ├── sbs_Latn.json
│ ├── sby_Latn.json
│ ├── sck_Deva.json
│ ├── scn_Latn.json
│ ├── sco_Latn.json
│ ├── sda_Latn.json
│ ├── sdc_Latn.json
│ ├── sdh_Arab.json
│ ├── sdo_Latn.json
│ ├── sdq_Latn.json
│ ├── seh_Latn.json
│ ├── ses_Latn.json
│ ├── sey_Latn.json
│ ├── sfw_Latn.json
│ ├── sgb_Latn.json
│ ├── sgc_Latn.json
│ ├── sgh_Cyrl.json
│ ├── sgs_Latn.json
│ ├── sgw_Ethi.json
│ ├── sgz_Latn.json
│ ├── shi_Latn.json
│ ├── shk_Latn.json
│ ├── shn_Mymr.json
│ ├── shp_Latn.json
│ ├── shu_Arab.json
│ ├── sid_Latn.json
│ ├── sig_Latn.json
│ ├── sil_Latn.json
│ ├── sim_Latn.json
│ ├── sin_Sinh.json
│ ├── sja_Latn.json
│ ├── sjo_Mong.json
│ ├── sju_Latn.json
│ ├── skg_Latn.json
│ ├── skr_Arab.json
│ ├── sld_Latn.json
│ ├── slk_Latn.json
│ ├── sll_Latn.json
│ ├── slv_Latn.json
│ ├── sma_Latn.json
│ ├── sme_Latn.json
│ ├── smj_Latn.json
│ ├── smk_Latn.json
│ ├── sml_Latn.json
│ ├── smn_Latn.json
│ ├── smo_Latn.json
│ ├── sms_Latn.json
│ ├── smt_Latn.json
│ ├── sna_Latn.json
│ ├── snc_Latn.json
│ ├── snd_Arab.json
│ ├── snd_Deva.json
│ ├── snd_Latn.json
│ ├── snf_Latn.json
│ ├── snn_Latn.json
│ ├── snp_Latn.json
│ ├── snw_Latn.json
│ ├── sny_Latn.json
│ ├── soe_Latn.json
│ ├── som_Latn.json
│ ├── sop_Latn.json
│ ├── soq_Latn.json
│ ├── sot_Latn.json
│ ├── soy_Latn.json
│ ├── spa_Latn.json
│ ├── spl_Latn.json
│ ├── spm_Latn.json
│ ├── spp_Latn.json
│ ├── sps_Latn.json
│ ├── spy_Latn.json
│ ├── srd_Latn.json
│ ├── sri_Latn.json
│ ├── srm_Latn.json
│ ├── srn_Latn.json
│ ├── srp_Cyrl.json
│ ├── srp_Latn.json
│ ├── sr
================================================
FILE CONTENTS
================================================
================================================
FILE: LICENSE
================================================
Apache License
Version 2.0, January 2004
http://www.apache.org/licenses/
TERMS AND CONDITIONS FOR USE, REPRODUCTION, AND DISTRIBUTION
1. Definitions.
"License" shall mean the terms and conditions for use, reproduction,
and distribution as defined by Sections 1 through 9 of this document.
"Licensor" shall mean the copyright owner or entity authorized by
the copyright owner that is granting the License.
"Legal Entity" shall mean the union of the acting entity and all
other entities that control, are controlled by, or are under common
control with that entity. For the purposes of this definition,
"control" means (i) the power, direct or indirect, to cause the
direction or management of such entity, whether by contract or
otherwise, or (ii) ownership of fifty percent (50%) or more of the
outstanding shares, or (iii) beneficial ownership of such entity.
"You" (or "Your") shall mean an individual or Legal Entity
exercising permissions granted by this License.
"Source" form shall mean the preferred form for making modifications,
including but not limited to software source code, documentation
source, and configuration files.
"Object" form shall mean any form resulting from mechanical
transformation or translation of a Source form, including but
not limited to compiled object code, generated documentation,
and conversions to other media types.
"Work" shall mean the work of authorship, whether in Source or
Object form, made available under the License, as indicated by a
copyright notice that is included in or attached to the work
(an example is provided in the Appendix below).
"Derivative Works" shall mean any work, whether in Source or Object
form, that is based on (or derived from) the Work and for which the
editorial revisions, annotations, elaborations, or other modifications
represent, as a whole, an original work of authorship. For the purposes
of this License, Derivative Works shall not include works that remain
separable from, or merely link (or bind by name) to the interfaces of,
the Work and Derivative Works thereof.
"Contribution" shall mean any work of authorship, including
the original version of the Work and any modifications or additions
to that Work or Derivative Works thereof, that is intentionally
submitted to Licensor for inclusion in the Work by the copyright owner
or by an individual or Legal Entity authorized to submit on behalf of
the copyright owner. For the purposes of this definition, "submitted"
means any form of electronic, verbal, or written communication sent
to the Licensor or its representatives, including but not limited to
communication on electronic mailing lists, source code control systems,
and issue tracking systems that are managed by, or on behalf of, the
Licensor for the purpose of discussing and improving the Work, but
excluding communication that is conspicuously marked or otherwise
designated in writing by the copyright owner as "Not a Contribution."
"Contributor" shall mean Licensor and any individual or Legal Entity
on behalf of whom a Contribution has been received by Licensor and
subsequently incorporated within the Work.
2. Grant of Copyright License. Subject to the terms and conditions of
this License, each Contributor hereby grants to You a perpetual,
worldwide, non-exclusive, no-charge, royalty-free, irrevocable
copyright license to reproduce, prepare Derivative Works of,
publicly display, publicly perform, sublicense, and distribute the
Work and such Derivative Works in Source or Object form.
3. Grant of Patent License. Subject to the terms and conditions of
this License, each Contributor hereby grants to You a perpetual,
worldwide, non-exclusive, no-charge, royalty-free, irrevocable
(except as stated in this section) patent license to make, have made,
use, offer to sell, sell, import, and otherwise transfer the Work,
where such license applies only to those patent claims licensable
by such Contributor that are necessarily infringed by their
Contribution(s) alone or by combination of their Contribution(s)
with the Work to which such Contribution(s) was submitted. If You
institute patent litigation against any entity (including a
cross-claim or counterclaim in a lawsuit) alleging that the Work
or a Contribution incorporated within the Work constitutes direct
or contributory patent infringement, then any patent licenses
granted to You under this License for that Work shall terminate
as of the date such litigation is filed.
4. Redistribution. You may reproduce and distribute copies of the
Work or Derivative Works thereof in any medium, with or without
modifications, and in Source or Object form, provided that You
meet the following conditions:
(a) You must give any other recipients of the Work or
Derivative Works a copy of this License; and
(b) You must cause any modified files to carry prominent notices
stating that You changed the files; and
(c) You must retain, in the Source form of any Derivative Works
that You distribute, all copyright, patent, trademark, and
attribution notices from the Source form of the Work,
excluding those notices that do not pertain to any part of
the Derivative Works; and
(d) If the Work includes a "NOTICE" text file as part of its
distribution, then any Derivative Works that You distribute must
include a readable copy of the attribution notices contained
within such NOTICE file, excluding those notices that do not
pertain to any part of the Derivative Works, in at least one
of the following places: within a NOTICE text file distributed
as part of the Derivative Works; within the Source form or
documentation, if provided along with the Derivative Works; or,
within a display generated by the Derivative Works, if and
wherever such third-party notices normally appear. The contents
of the NOTICE file are for informational purposes only and
do not modify the License. You may add Your own attribution
notices within Derivative Works that You distribute, alongside
or as an addendum to the NOTICE text from the Work, provided
that such additional attribution notices cannot be construed
as modifying the License.
You may add Your own copyright statement to Your modifications and
may provide additional or different license terms and conditions
for use, reproduction, or distribution of Your modifications, or
for any such Derivative Works as a whole, provided Your use,
reproduction, and distribution of the Work otherwise complies with
the conditions stated in this License.
5. Submission of Contributions. Unless You explicitly state otherwise,
any Contribution intentionally submitted for inclusion in the Work
by You to the Licensor shall be under the terms and conditions of
this License, without any additional terms or conditions.
Notwithstanding the above, nothing herein shall supersede or modify
the terms of any separate license agreement you may have executed
with Licensor regarding such Contributions.
6. Trademarks. This License does not grant permission to use the trade
names, trademarks, service marks, or product names of the Licensor,
except as required for reasonable and customary use in describing the
origin of the Work and reproducing the content of the NOTICE file.
7. Disclaimer of Warranty. Unless required by applicable law or
agreed to in writing, Licensor provides the Work (and each
Contributor provides its Contributions) on an "AS IS" BASIS,
WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or
implied, including, without limitation, any warranties or conditions
of TITLE, NON-INFRINGEMENT, MERCHANTABILITY, or FITNESS FOR A
PARTICULAR PURPOSE. You are solely responsible for determining the
appropriateness of using or redistributing the Work and assume any
risks associated with Your exercise of permissions under this License.
8. Limitation of Liability. In no event and under no legal theory,
whether in tort (including negligence), contract, or otherwise,
unless required by applicable law (such as deliberate and grossly
negligent acts) or agreed to in writing, shall any Contributor be
liable to You for damages, including any direct, indirect, special,
incidental, or consequential damages of any character arising as a
result of this License or out of the use or inability to use the
Work (including but not limited to damages for loss of goodwill,
work stoppage, computer failure or malfunction, or any and all
other commercial damages or losses), even if such Contributor
has been advised of the possibility of such damages.
9. Accepting Warranty or Additional Liability. While redistributing
the Work or Derivative Works thereof, You may choose to offer,
and charge a fee for, acceptance of support, warranty, indemnity,
or other liability obligations and/or rights consistent with this
License. However, in accepting such obligations, You may act only
on Your own behalf and on Your sole responsibility, not on behalf
of any other Contributor, and only if You agree to indemnify,
defend, and hold each Contributor harmless for any liability
incurred by, or claims asserted against, such Contributor by reason
of your accepting any such warranty or additional liability.
END OF TERMS AND CONDITIONS
APPENDIX: How to apply the Apache License to your work.
To apply the Apache License to your work, attach the following
boilerplate notice, with the fields enclosed by brackets "[]"
replaced with your own identifying information. (Don't include
the brackets!) The text should be enclosed in the appropriate
comment syntax for the file format. We also recommend that a
file or class name and description of purpose be included on the
same "printed page" as the copyright notice for easier
identification within third-party archives.
Copyright [yyyy] [name of copyright owner]
Licensed under the Apache License, Version 2.0 (the "License");
you may not use this file except in compliance with the License.
You may obtain a copy of the License at
http://www.apache.org/licenses/LICENSE-2.0
Unless required by applicable law or agreed to in writing, software
distributed under the License is distributed on an "AS IS" BASIS,
WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
See the License for the specific language governing permissions and
limitations under the License.
================================================
FILE: README.md
================================================

# FineWeb 2
FineWeb 2 is the second iteration of the popular 🍷 FineWeb dataset, bringing high quality pretraining data to over 1000 🗣️ languages. For the actual data, please see the HuggingFace repository [https://huggingface.co/datasets/HuggingFaceFW/fineweb-2](https://huggingface.co/datasets/HuggingFaceFW/fineweb-2).
> [!NOTE]
> We have officially released our 📝 **research paper**: https://huggingface.co/papers/2506.20920
## Data Pipeline 🚀
The processing pipeline had to be heavily adapted for a multilingual setting. As each language has its own peculiarities, we **individually tuned each filter**, defining different thresholds and stopwords for each language. 📊
These thresholds and stopwords are available in `/configs/{iso3_lang}_{script}.yml`.
The starting point for our dataset was the non-English data (< 0.65 score in English) we obtained when processing the original FineWeb. 🌐
To this data, we applied the following processing steps:
1. Additional Language Identification and filtering 🔍
2. Deduplication per language 🔄
3. Filtering per language 🧹
4. PII Anonymization and fixes 🎭
### Language Identification 🌍
Performed using [GlotLID](https://github.com/cisnlp/GlotLID), which not only covers a wider variety of languages (2000+ available labels) compared to fasttext176 (used in the original FineWeb), as it also identifies the script used in each document. 📜
For each language, we defined *different minimum language classifier confidence scores* to keep a document.
### Deduplication 🗃️
Unlike in FineWeb, where data was deduplicated per CommonCrawl snapshot, in FineWeb 2, **data is deduplicated per language globally**. However, following our deduplication findings in the original FineWeb, while we remove all except one document from each duplicate cluster, we save the size of this cluster in the kept document's metadata, saved in `minhash_cluster_size`.
This allows us to "re-hydrate" the dataset: by upsampling documents based on their cluster size, we see clear performance improvements for some languages, particularly high resource ones. 📈
We did not extensively explore different upsampling weights, but observed promising results with the following weights:
- documents with no duplicates: 1 time
- documents from a cluster of size N=2 or N=3: document will be N times in the final dataset
- documents from a cluster of size N=4: document will be 3 times in the final dataset
- documents from a cluster of size N>=5 and N<100: document will be 5 times in the final dataset
- documents from a cluster of size N>=100: document will be 8 times in the final dataset
- documents from a cluster of size N>=1000: document will be 1 time in the final dataset (the assumption here is that very large clusters are lower quality)
Example "re-hydration" block:
```python
class Rehydrater(PipelineStep):
def run(self, data: DocumentsPipeline, rank: int = 0, world_size: int = 1) -> DocumentsPipeline:
import bisect
upsampling_weights = {1: 1, 2: 2, 3: 3, 5: 5, 100: 8, 1000: 1}
# Sorted keys
limits = sorted(upsampling_weights.keys())
for doc in data:
upsampling_weight = upsampling_weights[
limits[bisect.bisect_right(limits, doc.metadata["minhash_cluster_size"]) - 1]]
# repeat each document upsampling_weight times
for _ in range(upsampling_weight):
yield doc
```
### Data Filtering 🧹
We mostly keep the original FineWeb set of filters, and do not create new filters targeting individual languages. As such, we had to extensively ablate on different processes of adapting the English filters to all the languages we supported. 🔍
Based on the results of our experiments, we also disabled/changed global values of some specific filters:
- For FineWeb filters, we removed `short_line_thr` and changed `char_dup_ratio` from 0.01 to 0.1.
- Repetition filter: disabled paragraph related filters as trafilatura does not keep them ❌
- C4 filters: we did not include the C4 filters as they seemed to degrade performance in this multilingual setting 📉
### PII Anonymization and fixes 🎭
- PII Removal: Kept unchanged, emails and ip addresses are anonymized. ✉️
- We applied FTFY to fix encoding issues. 🔧
- Added some code to fix trafilatura created artifacts related to tables 🛠️
## Ablations code 🧪
Each design choice in the pipeline was carefully tested on our created evaluation suite [FineTasks](https://huggingface.co/spaces/HuggingFaceFW/blogpost-fine-tasks). After each pipeline step, we trained a 1.46B model for each language using a nanotron framework and then evaluated one of the tasks. For full transparency we provide both evaluation and training code. 📊
### [Evaluation code](ablations/evaluation) 📝
- `launch_evals.py` is the main scripts used to run evaluations for one specific model.
- `launch_random_evals.py` is a script used to asses a random baseline performance it uses dummy model producing random outputs. 🎲
- `run_all_missing_evals.py` runs evaluations for all checkpoints and models not yet evaluated. ✅
### [Training code](ablations/training) 🏋️♂️
- `train_model.py` is the main script used for training ablation models.
### [Tokenization code](ablations/tokenization) 🔠
- `tokenize_dataset.py` is the main script used for pre-tokenizing processed data.
## Misc 📚
### Word/Sentence Tokenization ✂️
Many parts of the pipeline rely on correct word and sentence tokenization, however for most of the languages there are no such tokenizers available. We have thus developed a method to automatically assign similar tokenizer based on language family. You can check the tokenizer for each language at [our space](https://huggingface.co/spaces/HuggingFaceFW-Dev/lang-word-tokenizers).
### Reference Datasets 📂
For full transparency, we provide code used to download and process reference datasets in [misc/reference_datasets](misc/reference_datasets).
### Tools versions 🛠️
- [Datatrove](https://github.com/huggingface/datatrove)
- [LightEval-Fork](https://github.com/hynky1999/lighteval) (branch: new-multi-lang-branch)
- [Nanotron](https://github.com/huggingface/nanotron)
## License 📜
The dataset retains the same license as the original FineWeb, which is Open Data Commons License Attribution family (ODC-By). The code in this repository is licensed under the Apache 2.0 License.
## Citation 📖
```bibtex
@misc{penedo2025fineweb2pipelinescale,
title={FineWeb2: One Pipeline to Scale Them All -- Adapting Pre-Training Data Processing to Every Language},
author={Guilherme Penedo and Hynek Kydlíček and Vinko Sabolčec and Bettina Messmer and Negar Foroutan and Amir Hossein Kargaran and Colin Raffel and Martin Jaggi and Leandro Von Werra and Thomas Wolf},
year={2025},
eprint={2506.20920},
archivePrefix={arXiv},
primaryClass={cs.CL},
url={https://arxiv.org/abs/2506.20920},
}
```
================================================
FILE: ablations/evaluation/launch_evals.py
================================================
import argparse
from datetime import datetime
import os
import re
import subprocess
import tempfile
from typing import Optional
from fsspec.core import url_to_fs
import itertools
from datatrove.io import get_datafolder
from loguru import logger
EVAL_LOGS_PATH = f"/path/to/eval-logs"
CPUS_PER_NODE = 88
GPUS_PER_NODE = 8
PARTITION = "partition"
NODES = 1
def parse_date(date_string: Optional[str]) -> Optional[datetime]:
if date_string is None:
return None
try:
return datetime.strptime(date_string, "%d-%m-%Y %H:%M:%S")
except ValueError:
raise ValueError("Invalid date format. Use 'DD-MM-YYYY HH:MM:SS'")
def checkpoint_exists(logging_dir: str, model_name: str, checkpoint: str, reference_date: Optional[datetime]) -> bool:
fs, path = url_to_fs(logging_dir)
try:
result_files = fs.glob(f"{path}/results/{model_name}/{checkpoint}/results_*.json")
except FileNotFoundError:
result_files = []
if len(result_files) == 0:
return False
if reference_date is None:
return True
timestamps = [datetime.strptime(re.search(r'results_(.*)\.json$', f).group(1), "%Y-%m-%dT%H-%M-%S.%f") for f in
result_files]
return any(timestamp > reference_date for timestamp in timestamps)
def launch_slurm_job(launch_file_contents, *args):
"""
Small helper function to save a sbatch script and call it.
Args:
launch_file_contents: Contents of the sbatch script
*args: any other arguments to pass to the sbatch command
Returns: the id of the launched slurm job
"""
with tempfile.NamedTemporaryFile("w") as f:
f.write(launch_file_contents)
f.flush()
try:
return subprocess.check_output(["sbatch", *args, f.name]).decode("utf-8").split()[-1]
except Exception as e:
print(launch_file_contents, flush=True)
raise e
def get_checkpoints_to_run(s3_path: str, model_name: str, checkpoints: str, logging_dir: str, overwrite: bool = False,
after_date: Optional[str] = None):
reference_date = parse_date(after_date)
df = get_datafolder(s3_path)
try:
avail_checkpoints = [i for i in sorted(df.ls("", detail=False)) if i != "latest.txt"]
except FileNotFoundError:
logger.error(f"No checkpoints found in {s3_path}")
avail_checkpoints = []
logger.info(f"Found {len(avail_checkpoints)} checkpoints")
selected_checkpoints = checkpoints.split(",") if checkpoints != "all" else avail_checkpoints
not_found_checkpoints = [ckpt for ckpt in selected_checkpoints if ckpt not in avail_checkpoints]
if len(not_found_checkpoints) > 0:
raise ValueError(f"Checkpoints not found in \"{s3_path}\": {not_found_checkpoints}")
if not overwrite:
# remove completed checkpoints
completed_checkpoints = [
ckpt for ckpt in selected_checkpoints
if checkpoint_exists(logging_dir, model_name, ckpt, reference_date)
]
completed = len(completed_checkpoints)
selected_checkpoints = list(set(selected_checkpoints) - set(completed_checkpoints))
if completed:
logger.info(f"Skipping {completed} already evaluated checkpoints.")
return selected_checkpoints
parser = argparse.ArgumentParser("Launch evals for a set of checkpoints.")
parser.add_argument(
"model_name", type=str,
help="Model name on s3. Example: 1p46G-control-english-fw-ft-bl-28BT-seed-6. Use commas for multiple models"
)
parser.add_argument(
"language", type=str, help="Language to run evals for. Example: zh"
)
parser.add_argument(
"--s3_prefix", type=str, help="s3://path/to/models/ by default",
default="s3://path/to/models/"
)
parser.add_argument(
"--checkpoints", "-ckpts", type=str, help="Comma separated list of checkpoints to run, or \"all\"",
default="all"
)
parser.add_argument(
"--model-template", type=str, help="Template to use for the model name",
default="{model_name}"
# default="{model_name}-{language}-29BT-seed-{seed}"
)
parser.add_argument("--tasks", type=str, help="Comma separated list of tasks to run, or \"all\"",
default="early-signals")
parser.add_argument(
"--offline-datasets", action="store_true", help="Turns off datasets downloading", default=True
)
parser.add_argument(
"--seed", help="Defines seeds to use in model template. Comma separated list of seeds", default="6"
)
parser.add_argument("--qos", type=str, default="normal", help="qos to use")
parser.add_argument("--time_limit", type=str, default="1:50:00", help="slurm time limit. 1:50:00 by default")
parser.add_argument("--parallel", "-p", type=int, default=5, help="How many eval tasks to run simultaneously")
# parser.add_argument("--batch_size", "-bs", type=int, default=8, help="Batch size")
parser.add_argument("--gpus", "-g", type=int, default=GPUS_PER_NODE, help="How many gpus to use")
parser.add_argument("--logging_dir", type=str, default="s3://path/to/evals/results",
help="Repo to push results to")
parser.add_argument("-d", help="dependency job", type=str, default=None)
parser.add_argument("--overwrite", "-ow", action="store_true", default=False,
help="Overwrite existing eval results. Will skip completed checkpoints by default")
parser.add_argument("--after-date", type=str, default=None,
help="Only consider checkpoints newer than this date (DD-MM-YYYY HH:MM:SS)")
parser.add_argument("--job-prefix", type=str, default="", help="Prefix to add to the job name")
if __name__ == "__main__":
args = parser.parse_args()
job_id = None
for model_name, seed in itertools.product(args.model_name.split(","), args.seed.split(",")):
model_name = args.model_template.format(model_name=model_name, language=args.language, seed=seed)
s3_path = args.s3_prefix.removesuffix("/") + "/" + model_name if not model_name.startswith(
"s3://") else model_name
selected_checkpoints = get_checkpoints_to_run(s3_path, model_name, args.checkpoints, args.logging_dir,
overwrite=args.overwrite, after_date=args.after_date)
logger.info(f"Found {len(selected_checkpoints)} checkpoints for {model_name}")
if not selected_checkpoints:
print("No checkpoints to run.")
continue
bash_ckpts_list = "(" + " ".join(
f'"{item}"' for item in sorted(map(int, selected_checkpoints), reverse=True)) + ")"
os.makedirs(f"{EVAL_LOGS_PATH}/{model_name}/{args.language}", exist_ok=True)
n_cpus = CPUS_PER_NODE // args.gpus
# Write the lightevalconf.yml file
with open(f"{EVAL_LOGS_PATH}/{model_name}/{args.language}.yml", "wt") as f:
f.write(f"""batch_size: {4 if args.language == "zh" else (6 if args.language in ("ar", "sw") else 8)}
checkpoints_path: null
generation: null
logging:
logging_dir: {args.logging_dir}
save_details: true
save_results: true
save_to_tensorboard: false
tensorboard_metric_prefix: e
parallelism:
dp: {args.gpus}
expert_parallel_size: 1
pp: 1
pp_engine: 1f1b
tp: 1
tp_linear_async_communication: false
tp_mode: ALL_REDUCE
tasks:
custom_tasks: lighteval.community_tasks.multilingual.configs.{args.language}
dataset_loading_processes: {n_cpus}
max_samples: 1000
multichoice_continuations_start_space: null
no_multichoice_continuations_start_space: null
num_fewshot_seeds: null
tasks: {args.tasks}""")
deps = []
if args.d:
deps.append(f"afterok:{args.d}")
if job_id:
deps.append(f"afterany:{job_id}")
launch_script = f"""#!/bin/bash
#SBATCH --job-name={args.job_prefix}eval-{model_name}
#SBATCH --nodes={NODES}
#SBATCH --ntasks-per-node=1
#SBATCH --partition={PARTITION}
{f'#SBATCH --qos={args.qos}' if args.qos else ''}
#SBATCH --array=0-{len(selected_checkpoints) - 1}%{args.parallel}
#SBATCH --gres=gpu:{args.gpus}
#SBATCH --time={args.time_limit}
#SBATCH --cpus-per-task={CPUS_PER_NODE}
#SBATCH --output={EVAL_LOGS_PATH}/{model_name}/{args.language}/eval-%A_%a.out
#SBATCH --error={EVAL_LOGS_PATH}/{model_name}/{args.language}/eval-%A_%a.out
{"#SBATCH --dependency=" + ",".join(deps) if deps else ""}
#SBATCH --requeue
###########################################
# [BEGINING] ADAPT TO YOUR ENVIRONMENT
source /path/to/.bashrc
source /path/to/miniconda3/etc/profile.d/conda.sh
conda activate /path/to/miniconda3/envs/exp/
BRRR_FOLDER=/path/to/brrr
# Ensure cache is on fsx not on admin
export HUGGINGFACE_HUB_CACHE=/path/to/.cache/huggingface
export HF_DATASETS_CACHE=/path/to/.cache/huggingface
export HF_MODULES_CACHE=/path/to/.cache/huggingface
export HF_HOME=/path/to/.cache/huggingface
export HF_DATASETS_OFFLINE={1 if args.offline_datasets else 0}
# [END] ADAPT TO YOUR ENVIRONMENT
###########################################
set -x -e
echo "START TIME: $(date)"
echo python3 version = `python3 --version`
# SLURM stuff
export HOSTNAMES=`scontrol show hostnames "$SLURM_JOB_NODELIST"`
export MASTER_ADDR=$(scontrol show hostnames "$SLURM_JOB_NODELIST" | head -n 1)
export MASTER_PORT=6000
export COUNT_NODE=`scontrol show hostnames "$SLURM_JOB_NODELIST" | wc -l`
export CUBLAS_WORKSPACE_CONFIG=":4096:8"
export CUDA_DEVICE_MAX_CONNECTIONS="1"
module load cuda/12.1
echo go $COUNT_NODE
echo $HOSTNAMES
CHECKPOINTS_LIST={bash_ckpts_list}
NSTEP=$((SLURM_ARRAY_TASK_ID))
STEP=${{CHECKPOINTS_LIST[$NSTEP]}}
export TMPDIR=/scratch/USER/{model_name}/{args.language}/$STEP
mkdir -p $TMPDIR
LOCAL_DOWNLOAD_CHECKPOINT_FOLDER=/scratch/USER/checkpoint/{model_name}/$STEP
# Copying checkpoint from s3 to the node on node
mkdir -p $LOCAL_DOWNLOAD_CHECKPOINT_FOLDER
s5cmd cp --exclude "optimizer/*" {s3_path}/$STEP/* $LOCAL_DOWNLOAD_CHECKPOINT_FOLDER
torch_dist_args="--nproc_per_node {args.gpus} \\
--nnodes $COUNT_NODE \\
--max_restarts 0 \\
--tee 3 \\
--node_rank $SLURM_PROCID \\
--role $SLURMD_NODENAME: "
launch_args="$torch_dist_args $BRRR_FOLDER/run_evals_nanotron.py \\
--checkpoint-config-path ${{LOCAL_DOWNLOAD_CHECKPOINT_FOLDER}}/config.yaml --lighteval-override {EVAL_LOGS_PATH}/{model_name}/{args.language}.yml"
sleep $((RANDOM % 60))
srun -u bash -c "python3 -u -m torch.distributed.run ${{launch_args}}" """
launched_id = launch_slurm_job(launch_script)
logger.success(
f"{model_name} evals with {args.gpus} gpus launched with id={launched_id}. Logs: {EVAL_LOGS_PATH}/{model_name}/{args.language}")
job_id = launched_id
"""
RUN MANUALLY:
conda activate exp
LOCAL_DOWNLOAD_CHECKPOINT_FOLDER=/scratch/$USER/checkpoint/modeltest
mkdir -p $LOCAL_DOWNLOAD_CHECKPOINT_FOLDER
s5cmd cp --exclude "optimizer/*" {s3_path}/$STEP/* $LOCAL_DOWNLOAD_CHECKPOINT_FOLDER
source /etc/profile.d/modules.sh
export HF_HOME=/path/to/.cache/huggingface
export HF_DATASETS_OFFLINE=1
module load cuda/12.1
python3 -u -m torch.distributed.run --standalone /path/to/brrr/run_evals_nanotron.py --checkpoint-config-path ${LOCAL_DOWNLOAD_CHECKPOINT_FOLDER}/config.yaml --lighteval-config /path/to/configs/testmlevals.yml
"""
================================================
FILE: ablations/evaluation/launch_random_evals.py
================================================
import argparse
import os
import subprocess
import tempfile
from loguru import logger
USER=os.environ["USER"]
def launch_slurm_job(launch_file_contents, *args):
"""
Small helper function to save a sbatch script and call it.
Args:
launch_file_contents: Contents of the sbatch script
*args: any other arguments to pass to the sbatch command
Returns: the id of the launched slurm job
"""
with tempfile.NamedTemporaryFile("w") as f:
f.write(launch_file_contents)
f.flush()
try:
return subprocess.check_output(["sbatch", *args, f.name]).decode("utf-8").split()[-1]
except Exception as e:
print(launch_file_contents, flush=True)
raise e
parser = argparse.ArgumentParser("Launch the original english evals for a set of checkpoints.")
parser.add_argument(
"language", type=str, help="Language to run evals for. Example: zh"
)
parser.add_argument(
"checkpoints", type=str, help="Checkpoints to run evals for. Example: 0,1,2", default=0
)
parser.add_argument(
"--offline-datasets", action="store_true", help="Turns off datasets downloading"
)
parser.add_argument("--qos", type=str, default="normal", help="qos to use")
parser.add_argument("--time_limit", type=str, default="01:20:00", help="slurm time limit. 15:00 by default")
parser.add_argument("--parallel", "-p",type=int, default=100, help="How many eval tasks to run simultaneously")
parser.add_argument("--logging_dir", type=str, default="/path/to/eval-results", help="Repo to push results to")
parser.add_argument("-d", help="dependency job", type=str, default=None)
parser.add_argument("--overwrite", "-ow", action="store_true",
help="Overwrite existing eval results. Will skip completed checkpoints by default")
parser.add_argument("--tasks", type=str, default="early-signals", help="Tasks to run. Example: all,m3exam")
parser.add_argument("--tokenizer", type=str, default="google/gemma-7b", help="Tokenizer to use for the model")
if __name__ == "__main__":
args = parser.parse_args()
job_id = None
model_name = f"dummy-{args.language}-"
selected_checkpoints = args.checkpoints.split(",")
bash_ckpts_list = "(" + " ".join(f'"{item}"' for item in sorted(map(int, selected_checkpoints), reverse=True)) + ")"
os.makedirs(f"/path/to/eval-logs/{model_name}/{args.language}", exist_ok=True)
deps = []
if args.d:
deps.append(f"afterok:{args.d}")
if job_id:
deps.append(f"afterany:{job_id}")
launch_script = f"""#!/bin/bash
#SBATCH --job-name=eval-{model_name}-{args.language}
#SBATCH --tasks=1
#SBATCH --partition=partition
#SBATCH --qos={args.qos}
#SBATCH --array=0-{len(selected_checkpoints)-1}%{args.parallel}
#SBATCH --time={args.time_limit}
#SBATCH --cpus-per-task=4
#SBATCH --output=/path/to/logs/train/multilingual/eval-logs/{model_name}/{args.language}/eval-%A_%a.out
#SBATCH --error=/path/to/logs/train/multilingual/eval-logs/{model_name}/{args.language}/eval-%A_%a.out
{"#SBATCH --dependency=" + ",".join(deps) if deps else ""}
#SBATCH --requeue
###########################################
# [BEGINING] ADAPT TO YOUR ENVIRONMENT
source /admin/home/{USER}/.bashrc
source /path/to/miniconda3/etc/profile.d/conda.sh
conda activate /path/to/miniconda3/envs/exp/
LIGHTEVAL_FOLDER=/path/to/ml-lighteval
export HUGGINGFACE_HUB_CACHE=/path/to/.cache/huggingface
export HF_DATASETS_CACHE=/path/to/.cache/huggingface
export HF_MODULES_CACHE=/path/to/.cache/huggingface
export HF_HOME=/path/to/.cache/huggingface
export HF_DATASETS_OFFLINE={1 if args.offline_datasets else 0}
# [END] ADAPT TO YOUR ENVIRONMENT
###########################################
set -x -e
echo "START TIME: $(date)"
echo python3 version = `python3 --version`
# SLURM stuff
export TMPDIR=/scratch/{USER}/{model_name}/{args.language}
mkdir -p $TMPDIR
CHECKPOINTS_LIST={bash_ckpts_list}
NSTEP=$((SLURM_ARRAY_TASK_ID))
STEP=${{CHECKPOINTS_LIST[$NSTEP]}}
launch_args="$LIGHTEVAL_FOLDER/run_evals_accelerate.py --model_args='dummy,name=dummy-{args.language}-/${{STEP}},tokenizer={args.tokenizer}' --max_samples=1000 --custom_tasks=lighteval.community_tasks.multilingual.configs.{args.language} --tasks={args.tasks} --save_results --logging_dir={args.logging_dir}"
sleep $((RANDOM % 60))
srun -u bash -c "python3 -u ${{launch_args}}" """
launched_id = launch_slurm_job(launch_script)
logger.success(f"{model_name} evals launched with id={launched_id}. Logs: /path/to/logs/train/multilingual/eval-logs/{model_name}/{args.language}")
job_id = launched_id
================================================
FILE: ablations/evaluation/run_all_missing_evals.sh
================================================
#!/bin/bash
LANGUAGES=("ru" "fr" "zh" "hi" "sw" "tr" "ar" "te" "th")
BUCKET="s3://path/to/bucket"
SCRIPT_PATH="./multilingual/launch_evals.py"
for LANG in "${LANGUAGES[@]}"; do
GREP_PATTERN=".*gemma.*-${LANG}-.*"
MODELS=$(aws s3 ls "$BUCKET" \
| grep -E -- "$GREP_PATTERN" \
| awk '{print $2}' \
| sed 's#/$##' \
| paste -sd ',')
echo "$LANG: $MODELS"
if [[ $MODELS = *[!\ ]* ]]; then
python "$SCRIPT_PATH" \
"$MODELS" \
"$LANG" \
--parallel=8 \
--offline-datasets
fi
done
================================================
FILE: ablations/tokenization/launch_tokenization.py
================================================
import argparse
parser = argparse.ArgumentParser("Quickly launch thom's style of tokenization.")
parser.add_argument(
"data_path", type=str, help="Path to the data to tokenize."
)
parser.add_argument(
"output_name", type=str, help="Output name."
)
parser.add_argument(
"--n_tasks", type=int, help="nb of tokenization tasks", default=1000
)
parser.add_argument(
"--max_toks", type=int, help="max tokens per file", default=1e8
)
parser.add_argument(
"--tokenizer", type=str, help="tokenizer to use", default="google/gemma-2b"
)
parser.add_argument(
"--text_key", type=str, default="text"
)
parser.add_argument(
"--sample", type=float, default=1.0
)
parser.add_argument("--qos", type=str, default="normal", help="qos to use")
parser.add_argument(
"--jsonl_output", "-jo", type=str, default=None, help="Path to optionally save the sampled data jsonl"
)
parser.add_argument("-d", help="dependency job", type=str, default=None)
if __name__ == "__main__":
args = parser.parse_args()
from datatrove.executor import SlurmPipelineExecutor
from datatrove.pipeline.filters import SamplerFilter
from datatrove.pipeline.readers import JsonlReader
from datatrove.pipeline.writers import JsonlWriter
from datatrove.pipeline.tokens.tokenizer import DocumentTokenizer
SlurmPipelineExecutor(
# job_name=f"nd-{DUMP_NUMBER}-{len(DUMPS)}",
job_name=f"tok-{args.output_name}",
pipeline=[
JsonlReader(
args.data_path,
text_key=args.text_key,
),
SamplerFilter(rate=args.sample),
*([JsonlWriter(args.jsonl_output)] if args.jsonl_output else []),
DocumentTokenizer(
output_folder=f"/path/to/tokenized/{args.output_name}",
local_working_dir=f"/scratch/$USER/multilingual/tok/{args.output_name}",
tokenizer_name_or_path=args.tokenizer,
eos_token=None,
batch_size=10000,
max_tokens_per_file=args.max_toks,
# Max 1 GT per file (i.e. btw 5 et 300 tokenized files per dump et about 100 dump extracts per merged file)
shuffle=True,
),
],
tasks=args.n_tasks,
time="2:00:00",
partition="hopper-cpu",
logging_dir=f"/path/to/logs/multilingual/toks/{args.output_name}",
cpus_per_task=32,
qos=args.qos,
mem_per_cpu_gb=3,
depends_job_id=args.d,
).run()
================================================
FILE: ablations/training/launch_exp.py
================================================
import os
from pathlib import Path
import subprocess
import sys
import tempfile
from datetime import datetime
from nanotron.logging import human_format
from nanotron.models.llama import LlamaConfig
from datatrove.io import get_datafolder
from nanotron.config import DatasetStageArgs, NanosetDatasetsArgs, S3UploadArgs
# Paths
LOCAL_TMP_PATH_ON_NODE = f"/scratch/{os.environ.get('USER')}"
LAUNCH_CONFIGS_PATH = f"path/to/launch-configs"
# Executables
NANOTRON_RUN_TRAIN_SCRIPT = f"path/to/run_train.py"
S5CMD_PATH = "path/to/s5cmd"
S3_CHECKPOINTS_PREFIX = "path/to/where_to_save_checkpoints"
# Logging parameters
LOGS_PATH = f"path/to/slurm-logs"
REPO_ID = f"id of the repo to use for logging"
PROJECT = "name of the project"
EMAIL = "email to send notifications to"
# Resources parameters
NUM_GPUS = 8
NUM_CPUS_IN_NODE = 88
CPUS_PER_GPU = NUM_CPUS_IN_NODE // NUM_GPUS
model_config = LlamaConfig(
# Config for a 1.46B model
bos_token_id=1,
eos_token_id=2,
hidden_act="silu",
hidden_size=2048,
initializer_range=0.02,
intermediate_size=8192,
max_position_embeddings=2048,
num_attention_heads=32,
num_hidden_layers=14,
num_key_value_heads=32,
pretraining_tp=1,
rms_norm_eps=1e-05,
rope_scaling=None,
tie_word_embeddings=True,
use_cache=True,
vocab_size=256008, # gemma tokenizer + some room
)
num_params = human_format(
model_config.vocab_size * model_config.hidden_size +
model_config.num_hidden_layers
* (
3 * model_config.hidden_size * model_config.intermediate_size
+ 4 * model_config.hidden_size * model_config.hidden_size
)
).replace(".", "p")
print(f"Model has {num_params} parameters")
def launch_slurm_job(launch_file_contents, *args):
"""
Small helper function to save a sbatch script and call it.
Args:
launch_file_contents: Contents of the sbatch script
*args: any other arguments to pass to the sbatch command
Returns: the id of the launched slurm job
"""
with tempfile.NamedTemporaryFile("w") as f:
f.write(launch_file_contents)
f.flush()
return subprocess.check_output(["sbatch", *args, f.name]).decode("utf-8").split()[-1]
if __name__ == "__main__":
import argparse
from dataclasses import fields, is_dataclass
from nanotron.config import get_config_from_file
parser = argparse.ArgumentParser()
parser.add_argument("data", help="dataset folder", type=str)
parser.add_argument("run_name", help="run name", type=str)
parser.add_argument("language", help="language", type=str)
parser.add_argument("-d", help="dependency job", type=str, default=None)
parser.add_argument("--seed", help="seed", type=int, default=6)
parser.add_argument("--train_steps", "-ts", help="training steps. Total_toks=seq_len*steps*micro_bs*batch_accum_per_replica*dp_size", type=int, default=14000)
parser.add_argument("--priority", "--qos", "-p", help="qos to use", type=str, default="normal")
args = parser.parse_args()
SEED = args.seed
dataset_name = run_name = args.run_name.replace(" ", "_")
# Specific name for this run (checkpoints/logs/tensorboard)
RUN = f"{num_params}-{dataset_name}-seed-{SEED}"
df = get_datafolder(f"{S3_CHECKPOINTS_PREFIX}/{RUN}")
if df.exists("latest.txt") and df.cat_file("latest.txt") == bytes(str(args.train_steps), "utf-8"):
print(f"Not launching as latest checkpoint is already {args.train_steps} steps")
sys.exit(0)
import torch
from nanotron.config import (
CheckpointsArgs,
Config,
DataArgs,
GeneralArgs,
LlamaConfig,
LoggingArgs,
LRSchedulerArgs,
ModelArgs,
OptimizerArgs,
ParallelismArgs,
RandomInit,
TokenizerArgs,
TokensArgs,
AdamWOptimizerArgs,
)
def print_differences(target, updates):
if not is_dataclass(target) or not is_dataclass(updates):
raise ValueError("Both target and updates should be dataclass instances")
for field in fields(target):
update_value = getattr(updates, field.name)
if update_value is not None:
if is_dataclass(update_value):
print_differences(getattr(target, field.name), update_value)
else:
target_value = getattr(target, field.name)
if update_value != target_value:
if update_value.__class__.__module__ != "builtins":
continue
print(f"{field.name}: {target_value} -> {update_value}")
data = [
DatasetStageArgs(
name="Training Stage",
start_training_step=1,
data=DataArgs(
seed=SEED,
num_loading_workers=0,
dataset=NanosetDatasetsArgs(
dataset_folder=args.data if not args.data.startswith("s3://") else f"{LOCAL_TMP_PATH_ON_NODE}/dataset/{RUN}/",
dataset_weights=None,
)
)
),
]
general = GeneralArgs(
project=PROJECT,
run=RUN,
ignore_sanity_checks=True,
seed=SEED,
)
checkpoints = CheckpointsArgs(
checkpoints_path=Path(f"{LOCAL_TMP_PATH_ON_NODE}/checkpoints/{RUN}"),
checkpoints_path_is_shared_file_system=False,
checkpoint_interval=500,
save_initial_state=True,
)
parallelism = ParallelismArgs(
dp=64,
pp=1,
tp=1,
pp_engine="1f1b",
tp_mode="REDUCE_SCATTER",
tp_linear_async_communication=True,
)
# num_nodes = int(os.environ.get("SLURM_JOB_NUM_NODES", 1))
# parallelism.dp=int(num_nodes*8//parallelism.pp//parallelism.tp), # How many remaining GPU when taking into account PP, TP and 8 GPUs per node
tokens = TokensArgs(
batch_accumulation_per_replica=4,
micro_batch_size=4,
sequence_length=2048,
train_steps=args.train_steps,
val_check_interval=-1,
)
model = ModelArgs(
model_config=model_config,
make_vocab_size_divisible_by=1,
init_method=RandomInit(
std=0.02
),
dtype=torch.bfloat16,
)
logging = LoggingArgs(
# 'debug', 'info', 'warning', 'error', 'critical' and 'passive'
log_level="info",
log_level_replica="info",
iteration_step_info_interval=1,
)
optimizer = OptimizerArgs(
accumulate_grad_in_fp32=True,
clip_grad=1.0,
weight_decay=0.1,
zero_stage=0,
learning_rate_scheduler=LRSchedulerArgs(
learning_rate=3e-4,
lr_warmup_steps=500,
lr_warmup_style="linear",
lr_decay_style="cosine",
min_decay_lr=3.0e-5
),
optimizer_factory=AdamWOptimizerArgs(
adam_beta1=0.9,
adam_beta2=0.95,
adam_eps=1.0e-8,
torch_adam_is_fused=True,
),
)
tokenizer = TokenizerArgs(
tokenizer_name_or_path="google/gemma-7b",
)
s3_upload = S3UploadArgs(
upload_s3_path=f"{S3_CHECKPOINTS_PREFIX}/{RUN}",
remove_after_upload=True,
s5cmd_numworkers=16,
s5cmd_concurrency=5,
s5cmd_path=S5CMD_PATH,
)
config = Config(
general=general,
checkpoints=checkpoints,
parallelism=parallelism,
model=model,
tokenizer=tokenizer,
logging=logging,
tokens=tokens,
optimizer=optimizer,
data_stages=data,
profiler=None,
s3_upload=s3_upload,
lighteval=None,
)
NODES = 8
#### DEBUG MODE
if os.environ.get("DEBUG_MODE", "0") != "0":
print("##### WARNING DEBUG MODE #####")
config.parallelism.dp = 2
config.parallelism.pp = 2
config.parallelism.tp = 2
config.tokens.micro_batch_size = 3
config.tokens.batch_accumulation_per_replica = 2
config.checkpoints.save_initial_state = True
NODES = 1
# Sanity check that we can load, save to YAML and reload the config
timestamp = datetime.now().strftime("%Y-%m-%d_%H-%M-%S")
os.makedirs(f"{LAUNCH_CONFIGS_PATH}/{run_name}", exist_ok=True)
config_path_yaml = f"{LAUNCH_CONFIGS_PATH}/{run_name}/{timestamp}.yaml"
config.save_as_yaml(config_path_yaml)
config2 = get_config_from_file(config_path_yaml, config_class=Config)
print_differences(config, config2)
os.makedirs(f"{LOGS_PATH}/{run_name}", exist_ok=True)
dataset_download_cmd = "" if not args.data.startswith("s3://") else f"srun --ntasks-per-node=1 rm -rf {LOCAL_TMP_PATH_ON_NODE}/dataset\nsrun --ntasks-per-node=1 s5cmd cp '{args.data.removesuffix('/')}/*' {LOCAL_TMP_PATH_ON_NODE}/dataset/{RUN}/"
job_name = f"{run_name}-{SEED}"
sbatch_script = f"""#!/bin/bash
#SBATCH --job-name={job_name}
#SBATCH --nodes={NODES}
#SBATCH --ntasks-per-node=1 # crucial - only 1 task per dist per node!
#SBATCH --cpus-per-task={NUM_CPUS_IN_NODE}
#SBATCH --gres=gpu:{NUM_GPUS}
#SBATCH --partition=hopper-prod
#SBATCH --output={LOGS_PATH}/{run_name}/train-{timestamp}-%x-%j
# #SBATCH --array=1-1%1
#SBATCH --qos={args.priority}
#SBATCH --begin=now+0minutes
#SBATCH --mail-type=ALL
#SBATCH --mail-user={EMAIL}
#SBATCH --requeue
{"#SBATCH --dependency=afterok:" + args.d if args.d else ""}
###########################################
# [BEGINING] ADAPT TO YOUR ENVIRONMENT
# [END] ADAPT TO YOUR ENVIRONMENT
###########################################
set -x -e
##### TO UPDATE #####
##### END TO UPDATE ######
echo "START TIME: $(date)"
secs_to_human(){{
echo "$(( ${{1}} / 3600 )):$(( (${{1}} / 60) % 60 )):$(( ${{1}} % 60 ))"
}}
start=$(date +%s)
echo "$(date -d @${{start}} "+%Y-%m-%d %H:%M:%S"): ${{SLURM_JOB_NAME}} start id=${{SLURM_JOB_ID}}\n"
{dataset_download_cmd}
# SLURM stuff
export HOSTNAMES=`scontrol show hostnames "$SLURM_JOB_NODELIST"`
export MASTER_ADDR=$(scontrol show hostnames "$SLURM_JOB_NODELIST" | head -n 1)
export MASTER_PORT=$((1024 + RANDOM % 64511))
export COUNT_NODE=`scontrol show hostnames "$SLURM_JOB_NODELIST" | wc -l`
export TMPDIR={LOCAL_TMP_PATH_ON_NODE}
export CUDA_DEVICE_MAX_CONNECTIONS="1"
module load cuda/12.1
echo go $COUNT_NODE
echo $HOSTNAMES
##### MOVE TO YAML ######
CMD=" \
{NANOTRON_RUN_TRAIN_SCRIPT} \
--config-file {config_path_yaml}
"
export LAUNCHER="python -u -m torch.distributed.run \
--nproc_per_node {NUM_GPUS} \
--nnodes $COUNT_NODE \
--rdzv-backend c10d \
--rdzv-endpoint $MASTER_ADDR:$MASTER_PORT \
--rdzv-id $SLURM_JOB_ID \
--node_rank $SLURM_PROCID \
--role $SLURMD_NODENAME: \
--max_restarts 0 \
--tee 3 \
"
# Wait a random number between 0 and 1000 (milliseconds) to avoid too many concurrent requests to the hub
random_milliseconds=$(( RANDOM % 1001 ))
sleep_time=$(bc <<< "scale=3; $random_milliseconds / 1000")
echo "Sleeping for $sleep_time seconds..."
sleep $sleep_time
launch_args="srun $SRUN_ARGS -u bash -c $LAUNCHER --node_rank $SLURM_PROCID --role $SLURMD_NODENAME: $CMD"
srun $SRUN_ARGS -u bash -c "$LAUNCHER --node_rank $SLURM_PROCID --role $SLURMD_NODENAME: $CMD"
echo "END TIME: $(date)"
{
"" if not args.data.startswith("s3://") else f"srun --ntasks-per-node=1 rm -rf {LOCAL_TMP_PATH_ON_NODE}/dataset/{RUN}/"
}
"""
id = launch_slurm_job(sbatch_script)
log_path = f"{LOGS_PATH}/{run_name}/train-{timestamp}-{job_name}-{id}"
print(f"Launched with Slurm job id={id}")
print(f"To view the logs, use the command: tail -f {log_path}")
================================================
FILE: configs/aai_Latn.yml
================================================
dup_line_frac: 0.387
dup_n_grams:
- - 5
- 0.384
- - 6
- 0.376
- - 7
- 0.364
- - 8
- 0.348
- - 9
- 0.329
- - 10
- 0.311
language_score: 0.755
line_punct_thr: -1
max_avg_word_length: 9
max_non_alpha_words_ratio: 0.8
min_avg_word_length: 3
new_line_ratio: 0.071
stopwords:
- i
- ana
- naatu
- boro
- men
- sabuw
- orot
- isan
- god
- ayu
- baise
- iti
- tur
- etei
- jesu
- kwa
- hai
- ta
- eo
- "na\u2019atube"
- anayabin
- o
- nati
top_n_grams:
- - 2
- 0.172
- - 3
- 0.17
- - 4
- 0.177
================================================
FILE: configs/aak_Latn.yml
================================================
dup_line_frac: 0.358
dup_n_grams:
- - 5
- 0.359
- - 6
- 0.35
- - 7
- 0.336
- - 8
- 0.32
- - 9
- 0.304
- - 10
- 0.285
language_score: 0.9
line_punct_thr: -1
max_avg_word_length: 11
max_non_alpha_words_ratio: 0.767
min_avg_word_length: 4
new_line_ratio: 0.059
stopwords:
- "n\xE1n\u0268"
- e
- "\xE1m\xE1"
- re
- "d\xE1n\u0268"
- "t\xED\u0335n\u0268"
- o
- "nion\u0268"
- "t\u0268\u0301n\u0268"
- "gor\u0268xo"
- "d\u0268\u014B\xED\u0335"
- "d\u0268\u014B\u0268\u0301"
- "w\xED"
top_n_grams:
- - 2
- 0.196
- - 3
- 0.183
- - 4
- 0.183
================================================
FILE: configs/aau_Latn.yml
================================================
dup_line_frac: 0.398
dup_n_grams:
- - 5
- 0.4
- - 6
- 0.393
- - 7
- 0.382
- - 8
- 0.368
- - 9
- 0.352
- - 10
- 0.334
language_score: 0.683
line_punct_thr: -1
max_avg_word_length: 6
max_non_alpha_words_ratio: 0.744
min_avg_word_length: 3
new_line_ratio: 0.038
stopwords:
- me
- ma
- mon
- so
- hiykwe
- senkin
- homkwe
- se
- uwr
- non
- o
- hiy
- god
- ok
- lwak
- sawk
- seyr
- sa
- mo
- kokwe
- ey
- kow
- hokwe
- aw
- uwrsa
- ko
- yor
- ar
top_n_grams:
- - 2
- 0.165
- - 3
- 0.168
- - 4
- 0.167
================================================
FILE: configs/aaz_Latn.yml
================================================
dup_line_frac: 0.328
dup_n_grams:
- - 5
- 0.303
- - 6
- 0.298
- - 7
- 0.289
- - 8
- 0.277
- - 9
- 0.262
- - 10
- 0.246
language_score: 0.704
line_punct_thr: -1
max_avg_word_length: 6
max_non_alpha_words_ratio: 0.788
min_avg_word_length: 3
new_line_ratio: 0.045
stopwords:
- in
- "re\uA78C"
- sin
- naan
- ma
- he
- ein
- "nai\uA78C"
- au
- uisneno
- fa
- es
- ka
- 'on'
- hi
- ee
- neu
- tuaf
- nok
- nak
- ia
- mes
top_n_grams:
- - 2
- 0.154
- - 3
- 0.154
- - 4
- 0.152
================================================
FILE: configs/aba_Latn.yml
================================================
dup_line_frac: 0.534
dup_n_grams:
- - 5
- 0.33
- - 6
- 0.315
- - 7
- 0.298
- - 8
- 0.28
- - 9
- 0.262
- - 10
- 0.239
language_score: 0.3
line_punct_thr: -1
max_avg_word_length: 8
max_non_alpha_words_ratio: 0.765
min_avg_word_length: 2
new_line_ratio: 0.1
stopwords:
- "n\u2019ye"
- "el\xEB"
- "k\xEB"
- "l\u025B"
- "f\xEB"
- "gh\xEB"
- "b\xEB"
- "\xEB\xEB"
- bu
- "n\xEB"
- "\xE9"
- "eb\xEB"
- "\xE1l\u025B"
- "\u0292oova"
- ofo
- "l\u025B\u0301"
- "bun\xEB"
- "el\u025B"
- gha
- "kel\xEB"
- "e\u0254s\u025B"
- ngiki
- eba
- "e\u0272\xEB"
- "\xE0l\u025B\u0301"
- "nt\u0254n\xEB"
top_n_grams:
- - 2
- 1.031
- - 3
- 1.017
- - 4
- 0.864
================================================
FILE: configs/abi_Latn.yml
================================================
dup_line_frac: 0.546
dup_n_grams:
- - 5
- 0.35
- - 6
- 0.344
- - 7
- 0.328
- - 8
- 0.312
- - 9
- 0.309
- - 10
- 0.277
language_score: 0.3
line_punct_thr: -1
max_avg_word_length: 6
max_non_alpha_words_ratio: 0.778
min_avg_word_length: 3
new_line_ratio: 0.053
stopwords:
- "\u03ADn\u0269"
- "\u025Bn\u025B\u025B"
- "l\u0254\u0302"
- "b\u025B"
- "m\u028B"
- "\u0254n\u028B"
- "\u025Bt\u0269"
- "nyat\u0269"
- "f\u025B\u0269n"
- kpan
- woju
- akpan
- "l\u0269"
- "obu\u025B"
- "\u025B"
- heni
- mu
- "l\u025B\u025B"
- jesi
top_n_grams:
- - 2
- 0.712
- - 3
- 0.483
- - 4
- 0.504
================================================
FILE: configs/abk_Cyrl.yml
================================================
dup_line_frac: 0.291
dup_n_grams:
- - 5
- 0.201
- - 6
- 0.204
- - 7
- 0.185
- - 8
- 0.18
- - 9
- 0.176
- - 10
- 0.132
language_score: 0.812
line_punct_thr: 0.0
max_avg_word_length: 15
max_non_alpha_words_ratio: 0.731
min_avg_word_length: 3
new_line_ratio: 1.875
stopwords:
- "\u0440\u044B\u0525\u0441\u04AD\u0430\u0437\u0430\u0430\u0440\u0430"
- "\u0438\u0430\u043B\u04B5\u0438\u0442"
- "\u0438\u0438\u0442"
- "\u043B\u0430\u04B5\u0430\u0440\u0430\u043C\u0437\u0430"
- "\u0445\u04D9\u0430\u0436\u04D9\u043A\u044B\u0440\u0430\u043C\u0437\u0430"
- "\u0436\u04D9\u0430\u0431\u0440\u0430\u043D\u043C\u0437\u0430"
- "\u0430\u0436\u044C\u044B\u0440\u043D\u044B\u04B3\u04D9\u0430\u043C\u0437\u0430"
- "\u0436\u044C\u04AD\u0430\u0430\u0440\u0430\u043C\u0437\u0430"
- "\u0525\u0445\u044B\u043D\u04B7\u043A\u04D9\u044B\u043D\u043C\u0437\u0430"
- "\u0446\u04D9\u044B\u0431\u0431\u0440\u0430\u043C\u0437\u0430"
- "\u0440\u0430\u0448\u04D9\u0430\u0440\u0430\u043C\u0437\u0430"
- "\u043D\u0430\u043D\u04B3\u04D9\u0430\u043C\u0437\u0430"
- "\u0430\u0431\u04B5\u0430\u0440\u0430\u043C\u0437\u0430"
- "\u0525\u0445\u044B\u043D\u0433\u04D9\u044B\u043C\u0437\u0430"
- "\u043C\u0448\u0430\u0525\u044B\u043C\u0437\u0430"
- "\u0430\u0445\u04AD\u044B\u0441\u049B\u0259\u0430"
- "\u0430\u0525\u0441\u043D\u044B"
top_n_grams:
- - 2
- 0.587
- - 3
- 0.322
- - 4
- 0.179
================================================
FILE: configs/abn_Latn.yml
================================================
dup_line_frac: 0.321
dup_n_grams:
- - 5
- 0.237
- - 6
- 0.219
- - 7
- 0.203
- - 8
- 0.191
- - 9
- 0.172
- - 10
- 0.157
language_score: 0.3
line_punct_thr: -1
max_avg_word_length: 9
max_non_alpha_words_ratio: 0.769
min_avg_word_length: 3
new_line_ratio: 0.1
stopwords:
- "ph\u1ECD"
- "b\u1ECD"
- "k\u1EE5"
- ni
- "m\u1ECD"
- "d\u1ECB"
- ghan
- "od\u1ECB"
- yira
- esi
- azihova
top_n_grams:
- - 2
- 1.262
- - 3
- 1.118
- - 4
- 0.869
================================================
FILE: configs/abq_Cyrl.yml
================================================
dup_line_frac: 0.098
dup_n_grams:
- - 5
- 0.096
- - 6
- 0.085
- - 7
- 0.073
- - 8
- 0.067
- - 9
- 0.058
- - 10
- 0.051
language_score: 0.876
line_punct_thr: -1
max_avg_word_length: 15
max_non_alpha_words_ratio: 0.778
min_avg_word_length: 4
new_line_ratio: 0.25
stopwords:
- "\u0430\u0443\u0438"
- "\u0441\u0430\u0440\u0430"
- "\u0439\u0445\u04CF\u044B\u0445\u0432\u0438\u0442\u0443"
- "\u0430\u0443\u0430\u0442"
- "\u0438\u043D\u0443\u0441"
- "\u0443\u0430\u0440\u0430"
- "\u0430\u2011\u043D\u0447\u0432\u0430"
- "\u0430\u0443\u0430\u0441\u0430"
- "\u0430\u0443\u0430\u044A\u0430"
- "\u0430\u0440\u0438"
- "\u0431\u0430\u044A\u0430\u043Fl"
- "\u0431\u0430\u0440\u0430"
- "\u043D\u0438\u043D\u0435\u0432\u0438\u044F"
- "\u0430\u043A\u044A\u0430\u043B\u0430"
- "\u043C\u0447\u044B\u0442\u0430"
- "\u0430\u0440\u0430\u044A\u0430"
- "\u0430\u0441\u0445\u044A\u0430\u043D"
- "\u043B\u0445i\u0432\u0430\u0434"
- "\u0430\u043F\u043D\u044B"
- "\u0441\u0430"
- "\u0441\u0433\u0432\u044B"
- "\u0443\u0439\u0441"
- "\u0442\u0430\u0440\u0448\u0438\u0448"
- "\u0430\u0431\u044B\u0433\u044A\u044C"
- "\u0433l\u0432\u0430\u0436\u044C\u043A\u0432\u0430"
top_n_grams:
- - 2
- 0.18
- - 3
- 0.177
- - 4
- 0.169
================================================
FILE: configs/abs_Latn.yml
================================================
dup_line_frac: 0.865
dup_n_grams:
- - 5
- 0.56
- - 6
- 0.531
- - 7
- 0.505
- - 8
- 0.481
- - 9
- 0.449
- - 10
- 0.42
language_score: 0.3
line_punct_thr: -1
max_avg_word_length: 9
max_non_alpha_words_ratio: 0.783
min_avg_word_length: 3
new_line_ratio: 0.1
stopwords:
- seng
- beta
- deng
- yang
- ada
- dapa
- pung
- di
- par
- akang
- lai
- su
- tu
- kamar
- mar
- kalo
- la
- ni
- sa
- se
- kaya
- bisa
- dar
- ka
- jadi
top_n_grams:
- - 2
- 0.772
- - 3
- 0.731
- - 4
- 0.632
================================================
FILE: configs/abt_Latn.yml
================================================
dup_line_frac: 0.35
dup_n_grams:
- - 5
- 0.353
- - 6
- 0.345
- - 7
- 0.333
- - 8
- 0.317
- - 9
- 0.301
- - 10
- 0.283
language_score: 0.9
line_punct_thr: -1
max_avg_word_length: 9
max_non_alpha_words_ratio: 0.803
min_avg_word_length: 3
new_line_ratio: 0.053
stopwords:
- du
- "d\xE9"
- wa
- de
- "gun\xE9"
- wani
- yo
- "mawul\xE9"
- yate
- "wun\xE9"
- "d\xE9ku"
- kudi
- nak
- gotna
- got
- kundi
- pulak
- wan
- "naan\xE9"
top_n_grams:
- - 2
- 0.183
- - 3
- 0.178
- - 4
- 0.175
================================================
FILE: configs/abx_Latn.yml
================================================
dup_line_frac: 0.416
dup_n_grams:
- - 5
- 0.423
- - 6
- 0.416
- - 7
- 0.404
- - 8
- 0.389
- - 9
- 0.372
- - 10
- 0.353
language_score: 0.782
line_punct_thr: -1
max_avg_word_length: 8
max_non_alpha_words_ratio: 0.735
min_avg_word_length: 3
new_line_ratio: 0.053
stopwords:
- si
- na
- i
- mga
- nga
- iya
- ngan
- kam
- bi
- diyos
- kon
- ako
- ga'i
- ko
top_n_grams:
- - 2
- 0.16
- - 3
- 0.159
- - 4
- 0.168
================================================
FILE: configs/aby_Latn.yml
================================================
dup_line_frac: 0.369
dup_n_grams:
- - 5
- 0.365
- - 6
- 0.358
- - 7
- 0.346
- - 8
- 0.331
- - 9
- 0.311
- - 10
- 0.295
language_score: 0.832
line_punct_thr: -1
max_avg_word_length: 8
max_non_alpha_words_ratio: 0.889
min_avg_word_length: 3
new_line_ratio: 0.059
stopwords:
- i
- eno
- wei
- wake
- nono
- ibake
- we
- danu
- ma
- me
- godinu
- moi
- orou
- ukeka
- yaisina
top_n_grams:
- - 2
- 0.233
- - 3
- 0.239
- - 4
- 0.234
================================================
FILE: configs/abz_Latn.yml
================================================
dup_line_frac: 0.215
dup_n_grams:
- - 5
- 0.169
- - 6
- 0.164
- - 7
- 0.143
- - 8
- 0.126
- - 9
- 0.114
- - 10
- 0.104
language_score: 0.3
line_punct_thr: -1
max_avg_word_length: 9
max_non_alpha_words_ratio: 0.733
min_avg_word_length: 2
new_line_ratio: 0.111
stopwords:
- ba
- de
- he
- ya
- mia
- ama
- na
- pi
- yehuwa
- hedi
- mu
- e
- allah
- kang
- wei
- wal
- hei
- rieling
- haba
- surah
top_n_grams:
- - 2
- 1.653
- - 3
- 1.411
- - 4
- 1.192
================================================
FILE: configs/aca_Latn.yml
================================================
dup_line_frac: 0.423
dup_n_grams:
- - 5
- 0.413
- - 6
- 0.405
- - 7
- 0.391
- - 8
- 0.372
- - 9
- 0.356
- - 10
- 0.337
language_score: 0.9
line_punct_thr: -1
max_avg_word_length: 11
max_non_alpha_words_ratio: 0.75
min_avg_word_length: 4
new_line_ratio: 0.077
stopwords:
- "li\xE1'a"
- ya
- "n\xE1a'a"
- ne
- dios
- "jes\xFAs"
- "quin\xEDnama"
- "n\xE9enee"
- "nal\xED"
- "j\xE1iwa"
top_n_grams:
- - 2
- 0.199
- - 3
- 0.201
- - 4
- 0.213
================================================
FILE: configs/acd_Latn.yml
================================================
dup_line_frac: 0.348
dup_n_grams:
- - 5
- 0.33
- - 6
- 0.325
- - 7
- 0.315
- - 8
- 0.302
- - 9
- 0.288
- - 10
- 0.271
language_score: 0.9
line_punct_thr: -1
max_avg_word_length: 6
max_non_alpha_words_ratio: 0.805
min_avg_word_length: 2
new_line_ratio: 0.042
stopwords:
- "m\u0254"
- ne
- "m\u025B"
- kya
- "wurubuaar\u025B"
- "y\u025B\u025B"
- de
- "\u0254"
- so
- i
- "d\u0254"
- ilaa
- gi
- sa
- "f\u025Bye"
- kyu
- "w\u0254ra"
- fo
- yesu
- laa
- "g\u025Bnen"
- me
- n
- "m\u0254m\u0254"
- a
- "f\u025B"
- "gy\u025B"
- "t\u0254g\u025B"
- "\u0254bono"
top_n_grams:
- - 2
- 0.144
- - 3
- 0.146
- - 4
- 0.148
================================================
FILE: configs/ace_Arab.yml
================================================
dup_line_frac: 0.235
dup_n_grams:
- - 5
- 0.19
- - 6
- 0.169
- - 7
- 0.141
- - 8
- 0.129
- - 9
- 0.117
- - 10
- 0.106
language_score: 0.3
line_punct_thr: -1
max_avg_word_length: 11
max_non_alpha_words_ratio: 0.8
min_avg_word_length: 2
new_line_ratio: 0.083
stopwords:
- "\u060C"
- "\u064A\u06A0"
- "\u06A0\u0646"
- "\u062C\u064A\u0647"
- "\u06BD\u0646"
- "\u0628\u0642"
- "\u062F\u0627\u0646"
- "\u062F"
- "\u0646\u0627"
- "\u062F\u0631\u064A"
- "\u06BD\u06A0"
top_n_grams:
- - 2
- 0.667
- - 3
- 0.709
- - 4
- 0.395
================================================
FILE: configs/ace_Latn.yml
================================================
dup_line_frac: 0.373
dup_n_grams:
- - 5
- 0.27
- - 6
- 0.224
- - 7
- 0.208
- - 8
- 0.178
- - 9
- 0.162
- - 10
- 0.144
language_score: 0.3
line_punct_thr: 0.125
max_avg_word_length: 12
max_non_alpha_words_ratio: 0.81
min_avg_word_length: 4
new_line_ratio: 0.273
stopwords:
- di
- nakeuh
- bak
- "ac\xE8h"
- nyoe
- "gamp\xF4ng"
- gunong
- data
- nyang
- lam
- laman
- "n\xE8"
- saboh
- nibak
- drosophila
- seuneubeuet
- na
- "kabupat\xE8n"
top_n_grams:
- - 2
- 0.83
- - 3
- 0.729
- - 4
- 0.55
================================================
FILE: configs/acf_Latn.yml
================================================
dup_line_frac: 0.75
dup_n_grams:
- - 5
- 0.507
- - 6
- 0.485
- - 7
- 0.468
- - 8
- 0.466
- - 9
- 0.453
- - 10
- 0.412
language_score: 0.3
line_punct_thr: -1
max_avg_word_length: 7
max_non_alpha_words_ratio: 0.774
min_avg_word_length: 2
new_line_ratio: 0.083
stopwords:
- an
- "s\xE9"
- ki
- ka
- yo
- "t\xE9"
- sa
- pou
- "\xE9pi"
- a
- i
- la
- mwen
- nou
- pa
- moun
- kay
- "bondy\xE9"
- "\xE8k"
- "f\xE8"
- ou
- ni
- di
- "z\xF2t"
- kon
- "j\xE9zi"
- tout
- sala
- "l\xE8"
top_n_grams:
- - 2
- 1.281
- - 3
- 1.361
- - 4
- 1.262
================================================
FILE: configs/ach_Latn.yml
================================================
dup_line_frac: 0.451
dup_n_grams:
- - 5
- 0.331
- - 6
- 0.321
- - 7
- 0.306
- - 8
- 0.294
- - 9
- 0.275
- - 10
- 0.261
language_score: 0.3
line_punct_thr: -1
max_avg_word_length: 7
max_non_alpha_words_ratio: 0.786
min_avg_word_length: 2
new_line_ratio: 0.091
stopwords:
- ma
- i
- ki
- me
- ni
- ka
- pe
- pa
- en
- jo
- gin
- pi
- lok
- dok
- tye
- ducu
- dano
top_n_grams:
- - 2
- 0.872
- - 3
- 0.603
- - 4
- 0.542
================================================
FILE: configs/acm_Arab.yml
================================================
dup_line_frac: 0.486
dup_n_grams:
- - 5
- 0.326
- - 6
- 0.305
- - 7
- 0.282
- - 8
- 0.264
- - 9
- 0.241
- - 10
- 0.216
language_score: 0.304
line_punct_thr: -1
max_avg_word_length: 12
max_non_alpha_words_ratio: 0.75
min_avg_word_length: 2
new_line_ratio: 0.25
stopwords:
- "\u060C"
- "\u0645\u0646"
- "\u0639\u0644\u0649"
- "\u0645\u0627"
- "\u0647\u0630\u0627"
- "\u0631\u062C\u0627\u0621\u0627"
- "\u0631\u0627\u062D"
- "\u0645\u0645\u0643\u0646"
- "\u0627\u0631\u064A\u062F"
- "\u0627\u0644\u0644\u064A"
- "\u0628\u0633"
- "\u0627\u064A"
top_n_grams:
- - 2
- 0.455
- - 3
- 0.41
- - 4
- 0.343
================================================
FILE: configs/acn_Latn.yml
================================================
dup_line_frac: 0.321
dup_n_grams:
- - 5
- 0.249
- - 6
- 0.241
- - 7
- 0.225
- - 8
- 0.213
- - 9
- 0.201
- - 10
- 0.185
language_score: 0.3
line_punct_thr: -1
max_avg_word_length: 7
max_non_alpha_words_ratio: 0.864
min_avg_word_length: 3
new_line_ratio: 0.056
stopwords:
- lyis
- gas
- dah
- zis
- mas
- nghuot
- las
- das
- ma
- yah
- eq
- nyang
- ge
- namoq
- cho
- ngos
- taiq
- nyeis
- hauh
- nyamoq
- bang
- mangso
- soeu
- lhyi
- los
- jens
top_n_grams:
- - 2
- 0.464
- - 3
- 0.453
- - 4
- 0.4
================================================
FILE: configs/acr_Latn.yml
================================================
dup_line_frac: 0.347
dup_n_grams:
- - 5
- 0.311
- - 6
- 0.303
- - 7
- 0.292
- - 8
- 0.28
- - 9
- 0.267
- - 10
- 0.25
language_score: 0.777
line_punct_thr: -1
max_avg_word_length: 8
max_non_alpha_words_ratio: 0.742
min_avg_word_length: 2
new_line_ratio: 0.056
stopwords:
- ri
- i
- che
- e
- na
- y
- dios
- chi
- re
- u
- ta
- wa
- pa
- ma
- jun
- yey
top_n_grams:
- - 2
- 0.249
- - 3
- 0.239
- - 4
- 0.22
================================================
FILE: configs/acu_Latn.yml
================================================
dup_line_frac: 0.332
dup_n_grams:
- - 5
- 0.307
- - 6
- 0.3
- - 7
- 0.286
- - 8
- 0.273
- - 9
- 0.258
- - 10
- 0.239
language_score: 0.681
line_punct_thr: -1
max_avg_word_length: 13
max_non_alpha_words_ratio: 0.742
min_avg_word_length: 4
new_line_ratio: 0.077
stopwords:
- tura
- aints
- ni
- ainau
- nu
- yus
- asamtai
- mash
- antsu
- yuse
- pengker
- nuka
- "w\xEDna"
- tu
- tuke
- nuna
top_n_grams:
- - 2
- 0.546
- - 3
- 0.523
- - 4
- 0.471
================================================
FILE: configs/ada_Latn.yml
================================================
dup_line_frac: 0.283
dup_n_grams:
- - 5
- 0.191
- - 6
- 0.171
- - 7
- 0.155
- - 8
- 0.141
- - 9
- 0.128
- - 10
- 0.117
language_score: 0.644
line_punct_thr: -1
max_avg_word_length: 7
max_non_alpha_words_ratio: 0.84
min_avg_word_length: 1
new_line_ratio: 0.071
stopwords:
- "n\u025B"
- "\u0254"
- a
- e
- "k\u025B"
- "ng\u025B"
- he
- mi
- wa
- kaa
- "n\u0254"
- ma
- maa
- o
- ha
- ke
- "n\xED"
- ko
- "ny\u025B"
- je
- pee
- se
top_n_grams:
- - 2
- 0.782
- - 3
- 0.656
- - 4
- 0.56
================================================
FILE: configs/ade_Latn.yml
================================================
dup_line_frac: 0.302
dup_n_grams:
- - 5
- 0.272
- - 6
- 0.259
- - 7
- 0.254
- - 8
- 0.244
- - 9
- 0.227
- - 10
- 0.214
language_score: 0.825
line_punct_thr: -1
max_avg_word_length: 6
max_non_alpha_words_ratio: 0.81
min_avg_word_length: 2
new_line_ratio: 0.048
stopwords:
- "f\xF4"
- "g\xE2t\xE2"
- "g\xE2"
- "\xE2"
- ma
- "b\xE2"
- di
- "wurubwar\xE2"
- koro
- e
- "w\xF4"
- "d\xF5"
- "m\xF4"
- "b\xE2n\xE6"
- ade
- be
- "t\xE2"
- n
- sa
- "m\xE2"
- "\xE6"
- yesu
- alan
top_n_grams:
- - 2
- 1.052
- - 3
- 1.202
- - 4
- 1.196
================================================
FILE: configs/adh_Latn.yml
================================================
dup_line_frac: 0.849
dup_n_grams:
- - 5
- 0.614
- - 6
- 0.62
- - 7
- 0.588
- - 8
- 0.521
- - 9
- 0.468
- - 10
- 0.431
language_score: 0.3
line_punct_thr: -1
max_avg_word_length: 8
max_non_alpha_words_ratio: 0.788
min_avg_word_length: 3
new_line_ratio: 0.077
stopwords:
- ma
- i
- to
- ni
- go
- gi
- were
- aka
- pa
- win
- ri
- kodi
- jo
- "kwo\u014B"
- yesu
- ji
top_n_grams:
- - 2
- 1.354
- - 3
- 1.457
- - 4
- 1.467
================================================
FILE: configs/adi_Latn.yml
================================================
dup_line_frac: 0.394
dup_n_grams:
- - 5
- 0.507
- - 6
- 0.332
- - 7
- 0.316
- - 8
- 0.3
- - 9
- 0.28
- - 10
- 0.259
language_score: 0.3
line_punct_thr: -1
max_avg_word_length: 9
max_non_alpha_words_ratio: 0.765
min_avg_word_length: 3
new_line_ratio: 0.091
stopwords:
- "b\xED"
- delokke
- delo
- ngo
- ruutum
- ami
- bulu
- emla
- "k\xEDd\xEDem"
- "b\xEDkke"
top_n_grams:
- - 2
- 1.412
- - 3
- 1.236
- - 4
- 1.096
================================================
FILE: configs/adj_Latn.yml
================================================
dup_line_frac: 0.4
dup_n_grams:
- - 5
- 0.357
- - 6
- 0.351
- - 7
- 0.341
- - 8
- 0.328
- - 9
- 0.314
- - 10
- 0.297
language_score: 0.3
line_punct_thr: -1
max_avg_word_length: 6
max_non_alpha_words_ratio: 0.83
min_avg_word_length: 2
new_line_ratio: 0.056
stopwords:
- a
- eke
- "\u025Bm"
- ab
- e
- nyam
- "\u025Bt\u014B"
- ow
- es
- ke
- low
- af
- "\u0254ny"
- in
- "ag\u014B"
- dad
- "\u025Bl"
- "w\u025Bl"
- "f\u025B\u014B"
- "\u025By"
- "\u025Bg\u014B"
- eci
- am
- "\u025Bs"
top_n_grams:
- - 2
- 0.221
- - 3
- 0.239
- - 4
- 0.205
================================================
FILE: configs/adl_Latn.yml
================================================
dup_line_frac: 0.535
dup_n_grams:
- - 5
- 0.833
- - 6
- 0.842
- - 7
- 0.835
- - 8
- 0.813
- - 9
- 0.803
- - 10
- 0.783
language_score: 0.353
line_punct_thr: -1
max_avg_word_length: 8
max_non_alpha_words_ratio: 0.838
min_avg_word_length: 3
new_line_ratio: 0.059
stopwords:
- "\xEBm"
- "b\xEB"
- "okk\xEB"
- "g\xEB"
- "\xEB"
- "b\xFC"
- "y\xFCrn\xEB"
- nyi
- "l\xEBga"
- lo
- yo
- "lok\xEB"
- ngo
- "\xEBmla"
- "b\xFCk"
- "n\xEB"
- bulu
- go
top_n_grams:
- - 2
- 2.823
- - 3
- 3.456
- - 4
- 3.887
================================================
FILE: configs/ady_Cyrl.yml
================================================
dup_line_frac: 0.624
dup_n_grams:
- - 5
- 0.342
- - 6
- 0.338
- - 7
- 0.317
- - 8
- 0.305
- - 9
- 0.273
- - 10
- 0.258
language_score: 0.324
line_punct_thr: 0.25
max_avg_word_length: 10
max_non_alpha_words_ratio: 0.685
min_avg_word_length: 4
new_line_ratio: 0.234
stopwords:
- "\u0438"
- "\u0430\u0434\u044B\u0433\u044D"
- "\u0430\u0449"
- "\u0438\u043B\u044A\u044D\u0441\u044B\u043C"
- "\u043D\u044D\u0431\u0433\u044B\u0440\u044D"
- "\u043C\u043B\u043D"
- main
- category
- "\u0442\u0430\u0440\u0438\u0445\u044A"
- "\u044B\u043Ai\u0438"
- "\u2194"
- "\u043C"
- "\u044F"
- "\u0438\u0442"
- "\u0433\u0435\u043E\u0433\u0440\u0430\u0444\u0438\u0435"
- "\u0430\u0440\u044B"
- "\u0430"
- "\u0449\u044D\u043F\u0441\u044D\u0443"
- "\u0445\u044D\u0433\u044A\u044D\u0433\u0443"
- "\u043A\u044A\u044D\u043B\u044D"
- "\u0444\u044D\u0434\u0438\u0437"
- "\u0430\u0440"
- "\u043A\u043C\xB2"
- "\u0430\u0449\u044B\u0449"
- "\u043Bi\u044B\u0448\u044A\u0445\u044C\u044D\u0440"
- "\u043A\u044A\u0435\u0445\u044A\u0443"
- "\u043A\u044A\u044D\u0440\u0430\u043B\u044B\u0433\u044A\u0443"
- "\u0435"
- "\u0438i\u044D\u0440"
- "\u0430\u0443"
- "\u0447i\u044B\u0440\u044D\u0443"
- "\u0445\u044D\u0433\u044D\u0433\u0443\u043C"
- "\u043C\u044B"
- "\u043A\u044A\u044D\u0440\u0430\u043B\u044B\u0433\u044A\u043E"
- "\u0440\u0435\u0441\u043F\u0443\u0431\u043B\u0438\u043A\u044D\u043C"
- "\u0437\u044B"
- "\u0449\u044B\u0442"
- "\u0446i\u044B\u0444\u044D\u0443"
- "\u043A\u044A\u044D\u0440\u0430\u043B"
top_n_grams:
- - 2
- 1.395
- - 3
- 1.514
- - 4
- 1.477
================================================
FILE: configs/adz_Latn.yml
================================================
dup_line_frac: 0.444
dup_n_grams:
- - 5
- 0.3
- - 6
- 0.289
- - 7
- 0.293
- - 8
- 0.28
- - 9
- 0.256
- - 10
- 0.227
language_score: 0.667
line_punct_thr: -1
max_avg_word_length: 7
max_non_alpha_words_ratio: 0.806
min_avg_word_length: 3
new_line_ratio: 0.071
stopwords:
- da
- i
- dzi
- "ara\u014Ban"
- garam
- u
- ini
- nam
- igi
- "gubu\u02BC"
- sib
- "bu\u014B\u02BC"
- gan
- "a\u014Bu"
top_n_grams:
- - 2
- 0.682
- - 3
- 0.587
- - 4
- 0.552
================================================
FILE: configs/aeb_Arab.yml
================================================
dup_line_frac: 0.387
dup_n_grams:
- - 5
- 0.329
- - 6
- 0.293
- - 7
- 0.255
- - 8
- 0.227
- - 9
- 0.203
- - 10
- 0.184
language_score: 0.316
line_punct_thr: -1
max_avg_word_length: 33
max_non_alpha_words_ratio: 0.75
min_avg_word_length: 2
new_line_ratio: 0.2
stopwords:
- "\u060C"
- "\u0641\u0650\u064A"
- "\u0645\u064E\u0627"
- "\u0628\u064E\u0627\u0634\u0652"
- "\u0641\u064A"
- "\u0627\u0644\u0651\u0650\u064A"
- "\u0639\u0652\u0644\u064E\u0649"
- "\u0627\u0644\u0650\u0651\u064A"
- "\u0648"
- "\u0645\u0646"
- "\u0622\u0645\u064E\u0627"
- "\u0645\u0650\u0646\u0652"
top_n_grams:
- - 2
- 0.475
- - 3
- 0.459
- - 4
- 0.407
================================================
FILE: configs/aer_Latn.yml
================================================
dup_line_frac: 0.614
dup_n_grams:
- - 5
- 0.436
- - 6
- 0.428
- - 7
- 0.407
- - 8
- 0.384
- - 9
- 0.366
- - 10
- 0.343
language_score: 0.3
line_punct_thr: -1
max_avg_word_length: 10
max_non_alpha_words_ratio: 0.708
min_avg_word_length: 5
new_line_ratio: 0.042
stopwords:
- arle
- re
- areye
- nhenge
- kenhe
- itne
- anteme
- renhe
- kele
- ayenge
- arrantherre
- kwenhe
- tyerrtye
- jesus
- aneme
- anthurre
- apeke
- alakenhe
- apmere
- anwerne
- ngkarte
- ikwere
- arrpenhe
- akngerre
- yanhe
top_n_grams:
- - 2
- 1.413
- - 3
- 1.367
- - 4
- 1.239
================================================
FILE: configs/aeu_Latn.yml
================================================
dup_line_frac: 0.375
dup_n_grams:
- - 5
- 0.38
- - 6
- 0.37
- - 7
- 0.357
- - 8
- 0.342
- - 9
- 0.324
- - 10
- 0.308
language_score: 0.695
line_punct_thr: -1
max_avg_word_length: 10
max_non_alpha_words_ratio: 0.766
min_avg_word_length: 3
new_line_ratio: 0.033
stopwords:
- nail
- bhai
- ngaol
- a
- dai
- khi
- juq
- aq
- ail
- mail
- neq
- gaq
- ge
- maq
- aivq
- ai
- tsaol
- bhiq
- nee
- ngal
- teevq
- al
- thaq
- nuljuq
- lal
- i
- phaq
- yaoq
- miqyail
- phao
top_n_grams:
- - 2
- 0.25
- - 3
- 0.253
- - 4
- 0.242
================================================
FILE: configs/aey_Latn.yml
================================================
dup_line_frac: 0.639
dup_n_grams:
- - 5
- 0.497
- - 6
- 0.46
- - 7
- 0.441
- - 8
- 0.405
- - 9
- 0.377
- - 10
- 0.343
language_score: 0.3
line_punct_thr: -1
max_avg_word_length: 9
max_non_alpha_words_ratio: 0.783
min_avg_word_length: 3
new_line_ratio: 0.067
stopwords:
- eu
- uqa
- age
- dana
- qee
- je
- odocob
- ija
- eunu
- anut
- oso
- ege
- me
- uqana
- odi
- cunug
- bahic
- agena
- jisas
top_n_grams:
- - 2
- 1.2
- - 3
- 1.143
- - 4
- 1.062
================================================
FILE: configs/afr_Latn.yml
================================================
dup_line_frac: 0.412
dup_n_grams:
- - 5
- 0.192
- - 6
- 0.162
- - 7
- 0.149
- - 8
- 0.128
- - 9
- 0.113
- - 10
- 0.101
language_score: 0.3
line_punct_thr: 0.053
max_avg_word_length: 11
max_non_alpha_words_ratio: 0.707
min_avg_word_length: 3
new_line_ratio: 0.209
stopwords:
- die
- van
- in
- en
- is
- n
- het
- wat
- sy
- op
- the
- word
top_n_grams:
- - 2
- 0.707
- - 3
- 0.557
- - 4
- 0.418
================================================
FILE: configs/agd_Latn.yml
================================================
dup_line_frac: 0.405
dup_n_grams:
- - 5
- 0.393
- - 6
- 0.387
- - 7
- 0.375
- - 8
- 0.361
- - 9
- 0.343
- - 10
- 0.322
language_score: 0.728
line_punct_thr: -1
max_avg_word_length: 7
max_non_alpha_words_ratio: 0.87
min_avg_word_length: 3
new_line_ratio: 0.056
stopwords:
- ma
- mai
- ano
- mino
- "\xEDda"
- banta
- "v\xE1"
- van
- kayo
- "m\xE1an"
- mi
- "m\xE1a"
- ankan
- nanin
- "m\xE1"
top_n_grams:
- - 2
- 0.299
- - 3
- 0.305
- - 4
- 0.3
================================================
FILE: configs/agg_Latn.yml
================================================
dup_line_frac: 0.375
dup_n_grams:
- - 5
- 0.389
- - 6
- 0.381
- - 7
- 0.367
- - 8
- 0.349
- - 9
- 0.333
- - 10
- 0.314
language_score: 0.878
line_punct_thr: -1
max_avg_word_length: 11
max_non_alpha_words_ratio: 0.75
min_avg_word_length: 4
new_line_ratio: 0.056
stopwords:
- ai
- asu
- nindou
- ra
- "\u014Bga"
- se
- "hohoan\u0268mo"
- "hoaf\u0268"
- ranai
- ro
- "ran\u0268"
- ana
- "ahand\u0268"
- ranahambo
- god
- "moat\xFCkun\u0268"
top_n_grams:
- - 2
- 0.178
- - 3
- 0.176
- - 4
- 0.181
================================================
FILE: configs/agm_Latn.yml
================================================
dup_line_frac: 0.21
dup_n_grams:
- - 5
- 0.041
- - 6
- 0.034
- - 7
- 0.032
- - 8
- 0.029
- - 9
- 0.026
- - 10
- 0.024
language_score: 0.841
line_punct_thr: -1
max_avg_word_length: 29
max_non_alpha_words_ratio: 0.818
min_avg_word_length: 5
new_line_ratio: 0.056
stopwords:
- "am\u0268"
- "is\u0268hiya"
- "p\u0268w\u0268ha"
- "sah\u0268"
- "n\u0268n\u0268"
- "autaahaat\u0268ho"
- "w\u0268nd\u0268"
- "kom\u0268"
- ko
- "aih\u0268"
- "iyataat\u0268"
- "net\u0268"
- kiya
- "autaahaat\u0268hom\u0268"
- "nyah\u0268"
top_n_grams:
- - 2
- 0.146
- - 3
- 0.118
- - 4
- 0.096
================================================
FILE: configs/agn_Latn.yml
================================================
dup_line_frac: 0.329
dup_n_grams:
- - 5
- 0.261
- - 6
- 0.251
- - 7
- 0.234
- - 8
- 0.222
- - 9
- 0.2
- - 10
- 0.192
language_score: 0.652
line_punct_thr: -1
max_avg_word_length: 8
max_non_alpha_words_ratio: 0.8
min_avg_word_length: 3
new_line_ratio: 0.053
stopwords:
- ang
- ong
- tang
- mga
- ig
- na
- ta
- nira
- si
- dios
- ni
- taw
- indi
- mi
- ka
- tenged
top_n_grams:
- - 2
- 0.53
- - 3
- 0.48
- - 4
- 0.414
================================================
FILE: configs/agr_Latn.yml
================================================
dup_line_frac: 0.373
dup_n_grams:
- - 5
- 0.184
- - 6
- 0.179
- - 7
- 0.169
- - 8
- 0.156
- - 9
- 0.145
- - 10
- 0.128
language_score: 0.3
line_punct_thr: -1
max_avg_word_length: 12
max_non_alpha_words_ratio: 0.737
min_avg_word_length: 4
new_line_ratio: 0.083
stopwords:
- "apaju\xED"
- aents
- nuna
- "ash\xED"
- "nun\xFA"
- aidau
- shiig
- tusa
- duka
- mina
top_n_grams:
- - 2
- 0.948
- - 3
- 0.842
- - 4
- 0.691
================================================
FILE: configs/agt_Latn.yml
================================================
dup_line_frac: 0.4
dup_n_grams:
- - 5
- 0.36
- - 6
- 0.357
- - 7
- 0.344
- - 8
- 0.335
- - 9
- 0.314
- - 10
- 0.298
language_score: 0.751
line_punct_thr: -1
max_avg_word_length: 7
max_non_alpha_words_ratio: 0.84
min_avg_word_length: 2
new_line_ratio: 0.05
stopwords:
- na
- ta
- a
- ya
- te
- kiden
- hapa
- nga
- da
- muy
- en
- namaratu
- am
- sangaw
- ikid
- ni
- ammi
- la
- kid
- hesus
- gafu
top_n_grams:
- - 2
- 0.324
- - 3
- 0.295
- - 4
- 0.247
================================================
FILE: configs/agu_Latn.yml
================================================
dup_line_frac: 0.127
dup_n_grams:
- - 5
- 0.144
- - 6
- 0.13
- - 7
- 0.106
- - 8
- 0.094
- - 9
- 0.084
- - 10
- 0.076
language_score: 0.842
line_punct_thr: -1
max_avg_word_length: 9
max_non_alpha_words_ratio: 0.729
min_avg_word_length: 3
new_line_ratio: 0.05
stopwords:
- yi
- na
- tan
- nin
- e
- jun
- tetz
- i
- te
- ryos
- at
- tu
- tzun
- poro
top_n_grams:
- - 2
- 0.108
- - 3
- 0.11
- - 4
- 0.101
================================================
FILE: configs/agw_Latn.yml
================================================
dup_line_frac: 0.676
dup_n_grams:
- - 5
- 0.488
- - 6
- 0.481
- - 7
- 0.459
- - 8
- 0.445
- - 9
- 0.436
- - 10
- 0.416
language_score: 0.3
line_punct_thr: -1
max_avg_word_length: 7
max_non_alpha_words_ratio: 0.803
min_avg_word_length: 2
new_line_ratio: 0.056
stopwords:
- na
- ki
- ma
- i
- ka
- vi
- o
- ni
- "ig\xEA"
- ga
- enoni
- ngaia
- me
- "in\xEA"
- page
- god
top_n_grams:
- - 2
- 0.923
- - 3
- 0.84
- - 4
- 0.732
================================================
FILE: configs/agx_Cyrl.yml
================================================
dup_line_frac: 0.456
dup_n_grams:
- - 5
- 0.231
- - 6
- 0.242
- - 7
- 0.248
- - 8
- 0.202
- - 9
- 0.16
- - 10
- 0.145
language_score: 0.324
line_punct_thr: -1
max_avg_word_length: 9
max_non_alpha_words_ratio: 0.714
min_avg_word_length: 4
new_line_ratio: 0.091
stopwords:
- "\u043F\u0443\u043D\u0430\u044F"
- "\u0445\u044C\u0443\u043D\u0430\u044F"
- "\u044D"
- "\u0437\u0443\u043D"
- "\u0433\u0435"
- "\u0441\u0430"
- "\u0430\u043B\u043B\u0430\u0433\u044C\u0434\u0438\u043D"
- "\u0443\u0447\u0438\u043D"
- "\u0447\u0443\u043D"
- "\u0432\u0443\u043D"
- "\u0447\u0432\u0430\u0441"
- "\u0456\u0438\u0441\u0430\u0439\u0438"
- "\u04CF\u0438\u0441\u0430\u0439\u0438"
- "\u0433\u0435\u0431\u0443\u0440\u0438\u0441"
top_n_grams:
- - 2
- 0.41
- - 3
- 0.466
- - 4
- 0.41
================================================
FILE: configs/aha_Latn.yml
================================================
dup_line_frac: 0.331
dup_n_grams:
- - 5
- 0.209
- - 6
- 0.196
- - 7
- 0.194
- - 8
- 0.178
- - 9
- 0.17
- - 10
- 0.146
language_score: 0.3
line_punct_thr: -1
max_avg_word_length: 10
max_non_alpha_words_ratio: 0.778
min_avg_word_length: 2
new_line_ratio: 0.1
stopwords:
- "n\u0269"
- "y\u0269"
- "m\u0254\u0254"
- "k\u025B\u025B"
- "y\u025B"
- a
- nu
- "w\u0254"
- "nw\u028B"
- na
- "z\u028B"
- "n\u0269\u0269"
- gyehova
- "b\u025B"
- be
- yi
- "w\u028B"
- "nyam\u0269nl\u0269"
top_n_grams:
- - 2
- 0.543
- - 3
- 0.365
- - 4
- 0.286
================================================
FILE: configs/ahk_Latn.yml
================================================
dup_line_frac: 0.112
dup_n_grams:
- - 5
- 0.159
- - 6
- 0.135
- - 7
- 0.114
- - 8
- 0.1
- - 9
- 0.088
- - 10
- 0.077
language_score: 0.776
line_punct_thr: -1
max_avg_word_length: 19
max_non_alpha_words_ratio: 0.819
min_avg_word_length: 2
new_line_ratio: 0.083
stopwords:
- "a\u02EC"
- meh
- "ma\u02EC"
- neh
- ma
- "je\u02EC"
- "ga\u02C7"
- "k\u02BCoe\u02C7"
- eu
- "na\u02C7"
- yaw
- "leh\u02C7"
- "tsaw\u02C7"
- "eh\u02C7"
- "deu\u02EC"
- dui
- "yaw\uA788"
- "mi\u02C7"
- ni
- "ti\u02EC"
- "ha\u02EC"
- "g\u02BCa\u02EC"
top_n_grams:
- - 2
- 0.197
- - 3
- 0.192
- - 4
- 0.14
================================================
FILE: configs/aia_Latn.yml
================================================
dup_line_frac: 0.247
dup_n_grams:
- - 5
- 0.239
- - 6
- 0.231
- - 7
- 0.218
- - 8
- 0.203
- - 9
- 0.194
- - 10
- 0.176
language_score: 0.805
line_punct_thr: -1
max_avg_word_length: 8
max_non_alpha_words_ratio: 0.696
min_avg_word_length: 3
new_line_ratio: 0.053
stopwords:
- na
- a
- na'i
- god
- ma
- anai
- mana
- sae
- moi
- i
- ia
- rau
- ra
- jisas
- nei
- ai'a
- inia
top_n_grams:
- - 2
- 0.558
- - 3
- 0.527
- - 4
- 0.475
================================================
FILE: configs/aii_Syrc.yml
================================================
dup_line_frac: 0.321
dup_n_grams:
- - 5
- 0.167
- - 6
- 0.159
- - 7
- 0.149
- - 8
- 0.14
- - 9
- 0.132
- - 10
- 0.122
language_score: 0.678
line_punct_thr: -1
max_avg_word_length: 11
max_non_alpha_words_ratio: 0.769
min_avg_word_length: 3
new_line_ratio: 0.111
stopwords:
- "\u060C"
- "\u0720\u0739\u0717"
- "\u0721\u0323\u0722"
- "\u0720\u0717\u0718\u073F\u0722"
- "\u0712\u0738\u072C"
- "\u0723\u0735\u0712\u0735\u0712"
- "\u0710\u071D\u073C\u0722\u0735\u0710"
- "\u071D\u0720\u0739\u0717"
- "\u071F\u0739\u0710"
- "\u0720\u0739\u0710"
- "\u0720\u0735\u0710"
top_n_grams:
- - 2
- 0.66
- - 3
- 0.706
- - 4
- 0.663
================================================
FILE: configs/aim_Latn.yml
================================================
dup_line_frac: 0.913
dup_n_grams:
- - 5
- 0.419
- - 6
- 0.412
- - 7
- 0.343
- - 8
- 0.321
- - 9
- 0.297
- - 10
- 0.281
language_score: 0.3
line_punct_thr: -1
max_avg_word_length: 7
max_non_alpha_words_ratio: 0.851
min_avg_word_length: 2
new_line_ratio: 0.062
stopwords:
- a
- ha
- na
- an
- ning
- kan
- om
- han
- nang
- jiang
- ka
- pathian
- rang
- ani
- tak
- jui
- lui
- le
- hong
- man
- hale
- nan
- ni
- khat
- ama
- chong
- in
- hi
top_n_grams:
- - 2
- 1.002
- - 3
- 0.88
- - 4
- 0.792
================================================
FILE: configs/ain_Latn.yml
================================================
dup_line_frac: 0.416
dup_n_grams:
- - 5
- 0.335
- - 6
- 0.323
- - 7
- 0.296
- - 8
- 0.273
- - 9
- 0.247
- - 10
- 0.229
language_score: 0.3
line_punct_thr: -1
max_avg_word_length: 8
max_non_alpha_words_ratio: 0.811
min_avg_word_length: 2
new_line_ratio: 0.067
stopwords:
- ne
- gusu
- utara
- ruwe
- an
- anak
- 'no'
- nei
- wa
- koro
- echi
- orowa
- ku
- ambe
- otta
- na
- shinuma
- kuni
- nisa
- itak
- kamui
- guru
- ki
- okai
- yakka
top_n_grams:
- - 2
- 0.492
- - 3
- 0.432
- - 4
- 0.401
================================================
FILE: configs/ajg_Latn.yml
================================================
dup_line_frac: 0.374
dup_n_grams:
- - 5
- 0.237
- - 6
- 0.218
- - 7
- 0.206
- - 8
- 0.191
- - 9
- 0.183
- - 10
- 0.167
language_score: 0.3
line_punct_thr: -1
max_avg_word_length: 9
max_non_alpha_words_ratio: 0.8
min_avg_word_length: 2
new_line_ratio: 0.091
stopwords:
- "y\xED"
- "n\u0254"
- le
- "m\u0254"
- ci
- "m\u025B"
- "l\u0254"
- nu
- "ko\u0256o"
- do
- ji
- yehowa
- ciwo
- nyi
- yi
- "m\xEC"
- "l\xE9"
- so
top_n_grams:
- - 2
- 1.063
- - 3
- 1.392
- - 4
- 0.974
================================================
FILE: configs/aji_Latn.yml
================================================
dup_line_frac: 0.314
dup_n_grams:
- - 5
- 0.3
- - 6
- 0.295
- - 7
- 0.286
- - 8
- 0.274
- - 9
- 0.261
- - 10
- 0.245
language_score: 0.876
line_punct_thr: -1
max_avg_word_length: 6
max_non_alpha_words_ratio: 0.769
min_avg_word_length: 2
new_line_ratio: 0.059
stopwords:
- na
- "y\xE8"
- i
- "m\xE2"
- vi
- "p\xE2r\u0302\xE2"
- "r\xE9"
- "r\xF6"
- ka
- "b\xF6r\u0302i"
- "\xEAr\u0302\xEA"
- e
- "w\xE8"
- "a\xE8"
- "k\xE2m\xF6"
- "t\xF6"
- "c\xE9r\u0302\xE9"
- "r\u0302\xE9"
- da
- "k\xE9"
- "\xE9"
- "w\xEA"
- xi
- "p\xE8"
- "v\xE8"
- "x\xE8"
- ve
- ki
top_n_grams:
- - 2
- 0.154
- - 3
- 0.151
- - 4
- 0.15
================================================
FILE: configs/ajz_Latn.yml
================================================
dup_line_frac: 0.532
dup_n_grams:
- - 5
- 0.095
- - 6
- 0.092
- - 7
- 0.073
- - 8
- 0.068
- - 9
- 0.063
- - 10
- 0.058
language_score: 0.668
line_punct_thr: -1
max_avg_word_length: 8
max_non_alpha_words_ratio: 0.763
min_avg_word_length: 3
new_line_ratio: 0.067
stopwords:
- aro
- anang
- yok
- hel
- nali
- ne
- tene
- po
- labang
- ke
- anali
- long
- arnam
- do
- pu
- nang
- kido
- manta
- la
- arleng
- piyok
- para
top_n_grams:
- - 2
- 0.261
- - 3
- 0.269
- - 4
- 0.265
================================================
FILE: configs/akb_Latn.yml
================================================
dup_line_frac: 0.431
dup_n_grams:
- - 5
- 0.329
- - 6
- 0.316
- - 7
- 0.301
- - 8
- 0.273
- - 9
- 0.256
- - 10
- 0.235
language_score: 0.624
line_punct_thr: -1
max_avg_word_length: 8
max_non_alpha_words_ratio: 0.812
min_avg_word_length: 3
new_line_ratio: 0.059
stopwords:
- na
- i
- ma
- ni
- do
- tu
- di
- halahi
- hamu
- ia
- angka
- halak
- dohot
- si
- jana
- debata
- sian
- jesus
- dung
- au
- songon
- nada
top_n_grams:
- - 2
- 0.781
- - 3
- 0.764
- - 4
- 0.682
================================================
FILE: configs/ake_Latn.yml
================================================
dup_line_frac: 0.392
dup_n_grams:
- - 5
- 0.394
- - 6
- 0.389
- - 7
- 0.379
- - 8
- 0.364
- - 9
- 0.346
- - 10
- 0.329
language_score: 0.9
line_punct_thr: -1
max_avg_word_length: 10
max_non_alpha_words_ratio: 0.657
min_avg_word_length: 3
new_line_ratio: 0.059
stopwords:
- pe
- uya
- "m\u0268r\u0268"
- "r\u0268"
- kon
- "p\u0268"
- to
- "p\u0289ra"
- "awonsi'k\u0268"
- "am\u0289"
- yau
- iya
- ton
- papa
- "ta'p\u0289"
- esi
- iyesi
- "n\u0268"
- e'tane
- "m\u0268r\u0268pan"
- "ser\u0268"
- sises
- a'tai
top_n_grams:
- - 2
- 0.154
- - 3
- 0.16
- - 4
- 0.162
================================================
FILE: configs/akh_Latn.yml
================================================
dup_line_frac: 0.206
dup_n_grams:
- - 5
- 0.229
- - 6
- 0.209
- - 7
- 0.183
- - 8
- 0.162
- - 9
- 0.147
- - 10
- 0.131
language_score: 0.647
line_punct_thr: -1
max_avg_word_length: 7
max_non_alpha_words_ratio: 0.902
min_avg_word_length: 3
new_line_ratio: 0.036
stopwords:
- ora
- ngo
- bor
- ngub
- nao
- di
- ko
- bu
- sao
- tomb
- aol
- ub
- o
- baeben
- tenaol
- obu
- aondao
- was
- obum
- angal
- kakl
top_n_grams:
- - 2
- 0.762
- - 3
- 0.72
- - 4
- 0.658
================================================
FILE: configs/akp_Latn.yml
================================================
dup_line_frac: 0.236
dup_n_grams:
- - 5
- 0.215
- - 6
- 0.212
- - 7
- 0.206
- - 8
- 0.196
- - 9
- 0.182
- - 10
- 0.172
language_score: 0.834
line_punct_thr: -1
max_avg_word_length: 8
max_non_alpha_words_ratio: 0.812
min_avg_word_length: 2
new_line_ratio: 0.067
stopwords:
- i
- ne
- "s\u0254"
- ma
- ame
- "g\u0254"
- "\u0263aa"
- "fi\u025B"
- iso
- mi
- si
- "\u0254\u0303"
- gu
- "w\u0169"
- "\u0263\u025B\u025B"
- "\u0254so"
- yesu
- ara
top_n_grams:
- - 2
- 0.147
- - 3
- 0.16
- - 4
- 0.172
================================================
FILE: configs/ald_Latn.yml
================================================
dup_line_frac: 0.01
dup_n_grams:
- - 5
- 0.041
- - 6
- 0.023
- - 7
- 0.012
- - 8
- 0.006
- - 9
- 0.005
- - 10
- 0.003
language_score: 0.3
line_punct_thr: -1
max_avg_word_length: 7
max_non_alpha_words_ratio: 0.769
min_avg_word_length: 2
new_line_ratio: 0.05
stopwords:
- "l\u0254"
- "m\u025B\u0300n"
- "n\u0254n"
- "l\xE9yi"
- "d\xFA"
- le
- "y\u0254"
- "n\u025B\u0300n"
- "k\u025B"
- "k\u0269"
- "b\u0254\u0300"
- ke
- "h\xE1n"
- "h\u0254\u0300n"
- "\u0254w\u0254"
- "m\xE1n"
- "ny\u025B\u0301n"
- "ank\xE0"
- "n\u025B\u0301n"
- "t\xE1n"
- "s\u0269\u0300"
- "d\u0254\u0301"
- "l\u025B"
top_n_grams:
- - 2
- 0.281
- - 3
- 0.142
- - 4
- 0.159
================================================
FILE: configs/alj_Latn.yml
================================================
dup_line_frac: 0.573
dup_n_grams:
- - 5
- 0.579
- - 6
- 0.565
- - 7
- 0.546
- - 8
- 0.525
- - 9
- 0.503
- - 10
- 0.479
language_score: 0.3
line_punct_thr: -1
max_avg_word_length: 9
max_non_alpha_words_ratio: 0.818
min_avg_word_length: 3
new_line_ratio: 0.071
stopwords:
- in
- sa
- mga
- wa
- kansiyo
- keyen
- siyo
- osai
- diyos
- pag
- kangay
- kay
- batay
- ina
- yewed
- na
- kanyo
- siro
- isos
- 'no'
- mangyan
- ako
- kamo
- boo
top_n_grams:
- - 2
- 1.877
- - 3
- 2.12
- - 4
- 2.103
================================================
FILE: configs/aln_Latn.yml
================================================
dup_line_frac: 0.587
dup_n_grams:
- - 5
- 0.427
- - 6
- 0.425
- - 7
- 0.421
- - 8
- 0.412
- - 9
- 0.4
- - 10
- 0.386
language_score: 0.337
line_punct_thr: -1
max_avg_word_length: 10
max_non_alpha_words_ratio: 0.786
min_avg_word_length: 2
new_line_ratio: 0.071
stopwords:
- "t\xEB"
- e
- dhe
- i
- "n\xEB"
- "q\xEB"
- do
- me
- "p\xEBr"
- u
- "nj\xEB"
- nga
- edhe
- nuk
top_n_grams:
- - 2
- 0.242
- - 3
- 0.21
- - 4
- 0.176
================================================
FILE: configs/alp_Latn.yml
================================================
dup_line_frac: 0.462
dup_n_grams:
- - 5
- 0.407
- - 6
- 0.399
- - 7
- 0.387
- - 8
- 0.372
- - 9
- 0.351
- - 10
- 0.334
language_score: 0.656
line_punct_thr: -1
max_avg_word_length: 7
max_non_alpha_words_ratio: 0.84
min_avg_word_length: 3
new_line_ratio: 0.062
stopwords:
- esi
- kai
- rebe
- kena
- tamata
- imi
- mere
- au
- eni
- alla
- be
- bei
- mo
- loko
- ete
- hoko
- yesuse
- le
- eleki
- po
- ite
- leke
- me
top_n_grams:
- - 2
- 0.608
- - 3
- 0.595
- - 4
- 0.536
================================================
FILE: configs/alq_Latn.yml
================================================
dup_line_frac: 0.429
dup_n_grams:
- - 5
- 0.442
- - 6
- 0.433
- - 7
- 0.417
- - 8
- 0.399
- - 9
- 0.377
- - 10
- 0.349
language_score: 0.3
line_punct_thr: -1
max_avg_word_length: 13
max_non_alpha_words_ratio: 0.765
min_avg_word_length: 3
new_line_ratio: 0.067
stopwords:
- ka
- kidji
- dac
- in
- acitc
- e
- kije
- ogi
- ki
- kitci
- ka8
- iji
- manido
- kagi
- jesos
- mi
- ega
- kakina
- adi
- odji
- apitc
top_n_grams:
- - 2
- 0.937
- - 3
- 0.823
- - 4
- 0.719
================================================
FILE: configs/als_Latn.yml
================================================
dup_line_frac: 0.241
dup_n_grams:
- - 5
- 0.131
- - 6
- 0.122
- - 7
- 0.113
- - 8
- 0.105
- - 9
- 0.096
- - 10
- 0.087
language_score: 0.757
line_punct_thr: 0.066
max_avg_word_length: 14
max_non_alpha_words_ratio: 0.788
min_avg_word_length: 1
new_line_ratio: 0.273
stopwords:
- "t\xEB"
- e
- "n\xEB"
- dhe
- i
- "nj\xEB"
- me
- nga
- "p\xEBr"
- "\xEBsht\xEB"
- "q\xEB"
- "m\xEB"
- u
- si
top_n_grams:
- - 2
- 0.152
- - 3
- 0.136
- - 4
- 0.116
================================================
FILE: configs/alt_Cyrl.yml
================================================
dup_line_frac: 0.7
dup_n_grams:
- - 5
- 0.412
- - 6
- 0.402
- - 7
- 0.386
- - 8
- 0.365
- - 9
- 0.348
- - 10
- 0.317
language_score: 0.3
line_punct_thr: 0.286
max_avg_word_length: 9
max_non_alpha_words_ratio: 0.671
min_avg_word_length: 4
new_line_ratio: 0.182
stopwords:
- "\u043B\u0430"
- "\u043B\u0435"
- "\u0434\u0435\u043F"
- "\u0458\u044B\u043B\u0434\u0430"
- "\u0431\u043E\u043B\u0433\u043E\u043D"
- "\u0430\u0439\u0434\u044B\u04A5"
- "\u0430\u043B\u0442\u0430\u0439"
- "\u0458\u044B\u043B\u0434\u044B\u04A5"
- "\u043A\u04F1\u043D\u0438"
- "\u0458\u0443\u0440\u0442"
- "\u0431\u0443"
- "\u0458\u0430\u0430\u043D"
- "\u0430\u0430\u0439\u044B\u043D\u0447\u0430"
- "\u0458\u0435\u0442\u0438\u0440\u0435"
- "\u0441"
- "\u043A\u04E7\u043F"
- "\u0441\u0443\u0443"
- "\u0430\u043B\u0430"
- "\u0458.\u0447\u044B\u043A"
- "\xB0"
- "\u0440\u0435\u0441\u043F\u0443\u0431\u043B\u0438\u043A\u0430\u043D\u044B\u04A5"
- "\u043E\u0440\u0443\u0441"
top_n_grams:
- - 2
- 1.337
- - 3
- 1.339
- - 4
- 1.217
================================================
FILE: configs/aly_Latn.yml
================================================
dup_line_frac: 0.244
dup_n_grams:
- - 5
- 0.884
- - 6
- 0.943
- - 7
- 0.955
- - 8
- 0.924
- - 9
- 0.854
- - 10
- 0.746
language_score: 0.3
line_punct_thr: -1
max_avg_word_length: 12
max_non_alpha_words_ratio: 0.623
min_avg_word_length: 4
new_line_ratio: 0.062
stopwords:
- rnem
- renh
- warl
- ikwer
- ra
- rernem
- anem
- angenh
- jesus
- kenh
- ingwer
- artwa
- antey
- then
- angkwarr
- arrantherr
- el
- apmer
- ilek
- altyerr
- angka
top_n_grams:
- - 2
- 3.264
- - 3
- 3.942
- - 4
- 4.401
================================================
FILE: configs/alz_Latn.yml
================================================
dup_line_frac: 0.444
dup_n_grams:
- - 5
- 0.422
- - 6
- 0.406
- - 7
- 0.379
- - 8
- 0.358
- - 9
- 0.334
- - 10
- 0.309
language_score: 0.3
line_punct_thr: -1
max_avg_word_length: 8
max_non_alpha_words_ratio: 0.765
min_avg_word_length: 2
new_line_ratio: 0.1
stopwords:
- ma
- i
- ku
- mi
- man
- nia
- lembe
- ni
- ngo
- yehova
- pa
- dhanu
- de
- moko
- pi
- kum
top_n_grams:
- - 2
- 1.086
- - 3
- 1.098
- - 4
- 1.048
================================================
FILE: configs/ame_Latn.yml
================================================
dup_line_frac: 0.293
dup_n_grams:
- - 5
- 0.208
- - 6
- 0.202
- - 7
- 0.192
- - 8
- 0.179
- - 9
- 0.167
- - 10
- 0.153
language_score: 0.3
line_punct_thr: -1
max_avg_word_length: 15
max_non_alpha_words_ratio: 0.667
min_avg_word_length: 3
new_line_ratio: 0.2
stopwords:
- "\xF1e\xF1t\u0303"
- "e'\xF1e"
- o'ch
- "\xF1e\xF1th"
- "atet\u0303"
- ama
- yompor
- ateth
- "\xF1amha"
- "\xF1am\u0303a"
- o
- ama't
- atarr
- "a\xF1"
- "\xF1erra'm"
- all
- amach
- "\xBF"
- "e\u02BC\xF1e"
- allempo
top_n_grams:
- - 2
- 1.681
- - 3
- 1.495
- - 4
- 1.367
================================================
FILE: configs/amf_Latn.yml
================================================
dup_line_frac: 0.583
dup_n_grams:
- - 5
- 0.406
- - 6
- 0.376
- - 7
- 0.351
- - 8
- 0.311
- - 9
- 0.287
- - 10
- 0.261
language_score: 0.3
line_punct_thr: -1
max_avg_word_length: 11
max_non_alpha_words_ratio: 0.778
min_avg_word_length: 4
new_line_ratio: 0.083
stopwords:
- ki
- ko
- ke
- kinin
- hamade
- hamayse
- kiam
- kina
- kena
- kenin
- eedi
- barjosa
- yisa
- yesus
- barjo
- inin
- kisa
- eena
- konin
- yenin
- wul
- inta
- kinka
- yena
- yin
- yer
- woylamin
- yinin
- ida
- ta
- isa
- yedi
- ogo
- dahade
- koda
- keam
- wodanka
- i
- dahaannaar
- kida
- peen
- imbaa
- yesa
- ea
- barjodar
- wonin
- pir
- harrna
- iam
- giyade
- yeam
- dohon
- hambhidianna
- hanna
- kesa
- ogonante
- kalaa
top_n_grams:
- - 2
- 0.795
- - 3
- 0.739
- - 4
- 0.613
================================================
FILE: configs/amh_Ethi.yml
================================================
dup_line_frac: 0.672
dup_n_grams:
- - 5
- 0.273
- - 6
- 0.242
- - 7
- 0.228
- - 8
- 0.205
- - 9
- 0.183
- - 10
- 0.157
language_score: 0.3
line_punct_thr: 0.0
max_avg_word_length: 24
max_non_alpha_words_ratio: 0.824
min_avg_word_length: 1
new_line_ratio: 0.417
stopwords:
- "\u1363"
- "\u1290\u12CD"
- "\u12A5\u1293"
- "\u1361"
- "\u121D\u1233\u120C"
- "\u120B\u12ED"
- "\u1364"
- "\u1290\u1260\u122D"
- "\u12CD\u1235\u1325"
- "\u130D\u1295"
- "\u12C8\u12F0"
- "\u120D\u1306\u127D"
- "\u12A5\u1295\u12F0"
- "\u12E8\u12A0\u121B\u122D\u129B"
- "\u12C8\u12ED\u121D"
- "\u1290\u1308\u122D"
- "\u1260\u128B\u120B"
- "\u130A\u12DC"
- "\u1240\u1295"
- "\u1232\u1206\u1295"
- "\u130B\u122D"
- "\u12D8\u1218\u1295"
- "\u12D3.\u121D."
- "\u12A5\u1235\u12A8"
- "\u12ED\u1205"
- "\u1275\u122D\u1309\u1219"
- "\u12E8\u12A2\u1275\u12EE\u1335\u12EB"
- "\u1366"
top_n_grams:
- - 2
- 0.535
- - 3
- 0.433
- - 4
- 0.388
================================================
FILE: configs/ami_Latn.yml
================================================
dup_line_frac: 0.938
dup_n_grams:
- - 5
- 0.397
- - 6
- 0.361
- - 7
- 0.338
- - 8
- 0.313
- - 9
- 0.292
- - 10
- 0.268
language_score: 0.3
line_punct_thr: 0.23
max_avg_word_length: 50
max_non_alpha_words_ratio: 0.667
min_avg_word_length: 3
new_line_ratio: 0.156
stopwords:
- a
- 'no'
- ko
- i
- to
- o
- tamdaw
- ato
- kitakit
- ira
- miheca
top_n_grams:
- - 2
- 1.183
- - 3
- 1.213
- - 4
- 1.122
================================================
FILE: configs/amk_Latn.yml
================================================
dup_line_frac: 0.543
dup_n_grams:
- - 5
- 0.461
- - 6
- 0.431
- - 7
- 0.414
- - 8
- 0.394
- - 9
- 0.357
- - 10
- 0.335
language_score: 0.3
line_punct_thr: -1
max_avg_word_length: 9
max_non_alpha_words_ratio: 0.812
min_avg_word_length: 3
new_line_ratio: 0.059
stopwords:
- we
- na
- ne
- tuti
- fo
- mani
- kaha
- allai
- inontarai
- foi
- mea
- weo
- wiro
- kariri
- ambori
- fosa
- mano
- kontai
- yesusi
top_n_grams:
- - 2
- 1.407
- - 3
- 1.38
- - 4
- 1.258
================================================
FILE: configs/amm_Latn.yml
================================================
dup_line_frac: 0.329
dup_n_grams:
- - 5
- 0.69
- - 6
- 0.684
- - 7
- 0.667
- - 8
- 0.647
- - 9
- 0.627
- - 10
- 0.591
language_score: 0.597
line_punct_thr: -1
max_avg_word_length: 11
max_non_alpha_words_ratio: 0.743
min_avg_word_length: 3
new_line_ratio: 0.053
stopwords:
- mo
- na
- 'no'
- monoi
- noko
- imo
- mulu
- ulai
- pa
- nokota
- yo
- kotoni
- hani
- molo
top_n_grams:
- - 2
- 1.198
- - 3
- 1.216
- - 4
- 1.147
================================================
FILE: configs/amn_Latn.yml
================================================
dup_line_frac: 0.523
dup_n_grams:
- - 5
- 0.326
- - 6
- 0.306
- - 7
- 0.285
- - 8
- 0.265
- - 9
- 0.245
- - 10
- 0.223
language_score: 0.3
line_punct_thr: -1
max_avg_word_length: 9
max_non_alpha_words_ratio: 0.826
min_avg_word_length: 3
new_line_ratio: 0.067
stopwords:
- afa
- el
- mo
- eba
- asa
- ka
- enaig
- ne
- enag
- sa
- ehe
- mas
- eso
- og
- elim
- godna
- god
- nem
top_n_grams:
- - 2
- 1.053
- - 3
- 0.97
- - 4
- 0.766
================================================
FILE: configs/amp_Latn.yml
================================================
dup_line_frac: 0.756
dup_n_grams:
- - 5
- 0.424
- - 6
- 0.433
- - 7
- 0.403
- - 8
- 0.401
- - 9
- 0.346
- - 10
- 0.334
language_score: 0.3
line_punct_thr: -1
max_avg_word_length: 9
max_non_alpha_words_ratio: 0.778
min_avg_word_length: 4
new_line_ratio: 0.062
stopwords:
- nd
- bro
- kfo
- nhai
- be
- tfit
- wom
- inji
- bi
- yimam
- yima
- na
- to
- nkifrar
- yak
- mrokfom
top_n_grams:
- - 2
- 0.897
- - 3
- 0.869
- - 4
- 0.781
================================================
FILE: configs/amr_Latn.yml
================================================
dup_line_frac: 0.106
dup_n_grams:
- - 5
- 0.096
- - 6
- 0.069
- - 7
- 0.047
- - 8
- 0.05
- - 9
- 0.036
- - 10
- 0.025
language_score: 0.63
line_punct_thr: -1
max_avg_word_length: 15
max_non_alpha_words_ratio: 0.69
min_avg_word_length: 5
new_line_ratio: 0.091
stopwords:
- diosa
- konig
- diosen
- "kenpa\u02BCti"
- kenda
- diostaj
- ken
- huairi
- "dakhuea\u02BC"
top_n_grams:
- - 2
- 0.349
- - 3
- 0.244
- - 4
- 0.153
================================================
FILE: configs/amu_Latn.yml
================================================
dup_line_frac: 0.22
dup_n_grams:
- - 5
- 0.197
- - 6
- 0.191
- - 7
- 0.18
- - 8
- 0.169
- - 9
- 0.158
- - 10
- 0.147
language_score: 0.82
line_punct_thr: -1
max_avg_word_length: 11
max_non_alpha_words_ratio: 0.667
min_avg_word_length: 3
new_line_ratio: 0.059
stopwords:
- na
- ndo
- "nn'a\u207F"
- jo
- "jnda\u0331"
- "ty'o\u0331o\u0331ts'om"
- quia
- cantyja
- ee
- cwii
- "\xF1equio"
- "sa\u0331a\u0331"
- "\xF1'oom"
- "ts'a\u207F"
- juu
- jom
top_n_grams:
- - 2
- 0.178
- - 3
- 0.187
- - 4
- 0.187
================================================
FILE: configs/amx_Latn.yml
================================================
dup_line_frac: 0.6
dup_n_grams:
- - 5
- 0.432
- - 6
- 0.414
- - 7
- 0.401
- - 8
- 0.373
- - 9
- 0.355
- - 10
- 0.334
language_score: 0.3
line_punct_thr: -1
max_avg_word_length: 10
max_non_alpha_words_ratio: 0.682
min_avg_word_length: 4
new_line_ratio: 0.062
stopwords:
- rang
- tjerrtj
- inang
- renh
- jesu
- itja
- warn
- map
- arrantherr
- angketj
- anem
- inenh
- henh
- apek
- altjerr
- ilek
- nhenh
- kwer
- kaltj
- ntwang
- arrpenh
- artwang
- lakenh
- el
top_n_grams:
- - 2
- 1.489
- - 3
- 1.471
- - 4
- 1.408
================================================
FILE: configs/ang_Latn.yml
================================================
dup_line_frac: 0.628
dup_n_grams:
- - 5
- 0.472
- - 6
- 0.444
- - 7
- 0.405
- - 8
- 0.356
- - 9
- 0.341
- - 10
- 0.288
language_score: 0.3
line_punct_thr: 0.111
max_avg_word_length: 15
max_non_alpha_words_ratio: 0.804
min_avg_word_length: 2
new_line_ratio: 0.2
stopwords:
- and
- is
- in
- 'on'
- se
- of
- "\xFE\u01E3m"
- "\xFE\xE6s"
- his
- "\xFEe"
- "\xFE\xE6t"
- "\u01BF\xE6s"
top_n_grams:
- - 2
- 0.724
- - 3
- 0.581
- - 4
- 0.538
================================================
FILE: configs/anm_Latn.yml
================================================
dup_line_frac: 0.34
dup_n_grams:
- - 5
- 0.249
- - 6
- 0.221
- - 7
- 0.21
- - 8
- 0.196
- - 9
- 0.181
- - 10
- 0.162
language_score: 0.3
line_punct_thr: -1
max_avg_word_length: 9
max_non_alpha_words_ratio: 0.8
min_avg_word_length: 3
new_line_ratio: 0.077
stopwords:
- tuwng
- to
- tuthal
- hin
- ki
- hinto
- thung
- "pu\u0331ruwng"
- ru
- ama
- "asapav\u0101n"
top_n_grams:
- - 2
- 1.076
- - 3
- 1.086
- - 4
- 0.848
================================================
FILE: configs/ann_Latn.yml
================================================
dup_line_frac: 0.473
dup_n_grams:
- - 5
- 0.296
- - 6
- 0.28
- - 7
- 0.259
- - 8
- 0.24
- - 9
- 0.223
- - 10
- 0.204
language_score: 0.743
line_punct_thr: -1
max_avg_word_length: 7
max_non_alpha_words_ratio: 0.806
min_avg_word_length: 3
new_line_ratio: 0.056
stopwords:
- me
- "m\xE8"
- ebi
- ya
- lek
- ibe
- inu
- ogwu
- inyi
- awaji
- enyi
- ene
- "mgb\u1ECD"
- ema
- ke
- ire
- eyi
- "\xECre"
- "\u1ECDm\u1ECD"
- eji
- "kan\u0304"
- si
- "jis\u1ECDs"
- geelek
- mije
top_n_grams:
- - 2
- 1.289
- - 3
- 1.275
- - 4
- 1.14
================================================
FILE: configs/anp_Deva.yml
================================================
dup_line_frac: 0.939
dup_n_grams:
- - 5
- 0.385
- - 6
- 0.364
- - 7
- 0.341
- - 8
- 0.318
- - 9
- 0.295
- - 10
- 0.273
language_score: 0.325
line_punct_thr: 0.0
max_avg_word_length: 21
max_non_alpha_words_ratio: 0.864
min_avg_word_length: 2
new_line_ratio: 0.593
stopwords:
- "\u0915\u0947"
- "\u092E\u0947\u0902"
- "\u0939\u0948"
- "\u0915\u0940"
- "\u0914\u0930"
- "\u0915\u093E"
- "\u0938\u0947"
- "\u091B\u0948"
- "\u0915\u094B"
- "\u0939\u0948\u0902"
- "\u090F\u0915"
top_n_grams:
- - 2
- 1.967
- - 3
- 1.614
- - 4
- 0.953
================================================
FILE: configs/anv_Latn.yml
================================================
dup_line_frac: 0.162
dup_n_grams:
- - 5
- 0.163
- - 6
- 0.14
- - 7
- 0.12
- - 8
- 0.112
- - 9
- 0.095
- - 10
- 0.097
language_score: 0.767
line_punct_thr: -1
max_avg_word_length: 8
max_non_alpha_words_ratio: 0.824
min_avg_word_length: 3
new_line_ratio: 0.062
stopwords:
- ne
- "b\u0254\u0254\u0301"
- "\u025Bs\u0254w\u0254"
- ji
- "nno\u0301"
- "ne\u0301"
- ayi
- "\u025Bbw\u0254\u0301"
- me
- "jis\u0254s"
- "n\xE9"
- "nn\xF3"
- "\u025Bnyu\u0301"
- "nd\u025Bre"
- abi
- "muu\u0301"
- "f\u0254\u0301"
top_n_grams:
- - 2
- 0.366
- - 3
- 0.217
- - 4
- 0.155
================================================
FILE: configs/any_Latn.yml
================================================
dup_line_frac: 0.619
dup_n_grams:
- - 5
- 0.44
- - 6
- 0.425
- - 7
- 0.455
- - 8
- 0.405
- - 9
- 0.346
- - 10
- 0.288
language_score: 0.748
line_punct_thr: -1
max_avg_word_length: 7
max_non_alpha_words_ratio: 0.795
min_avg_word_length: 2
new_line_ratio: 0.05
stopwords:
- "m\u0254"
- "\u0254"
- "y\u0269\u0301"
- "b\u025B"
- "k\u025B"
- man
- "k\u0254"
- "n\u0269n"
- "b\u025B\u0301"
- "\u025Bm\u0254"
- a
- "nyanm\u0269an"
- "m\u0269n"
- "t\u0269"
- "m'\u0254"
- "n\u028Bn"
- "m\u0269\u0301n"
- "y\u025B\u0301"
- anun
- nun
- "nw\u028Bn"
top_n_grams:
- - 2
- 1.262
- - 3
- 1.229
- - 4
- 1.081
================================================
FILE: configs/aoi_Latn.yml
================================================
dup_line_frac: 0.007
dup_n_grams:
- - 5
- 0.119
- - 6
- 0.098
- - 7
- 0.079
- - 8
- 0.065
- - 9
- 0.06
- - 10
- 0.051
language_score: 0.888
line_punct_thr: -1
max_avg_word_length: 12
max_non_alpha_words_ratio: 0.647
min_avg_word_length: 4
new_line_ratio: 0.048
stopwords:
- langwa
- manja
- wa
- nakina
- akwa
- kembirra
- ni
- ka
- yama
- da
- umba
- warnumamalya
- wurrakina
- ayakwa
- jesus
- yada
- arakba
- akina
- eneja
- nara
- ngayuwa
- ngawa
- angalya
- neningikarrawara
- ena
- biya
top_n_grams:
- - 2
- 0.202
- - 3
- 0.219
- - 4
- 0.144
================================================
FILE: configs/aoj_Latn.yml
================================================
dup_line_frac: 0.332
dup_n_grams:
- - 5
- 0.299
- - 6
- 0.291
- - 7
- 0.278
- - 8
- 0.263
- - 9
- 0.248
- - 10
- 0.233
language_score: 0.622
line_punct_thr: -1
max_avg_word_length: 8
max_non_alpha_words_ratio: 0.727
min_avg_word_length: 4
new_line_ratio: 0.059
stopwords:
- "ea\uA78C"
- ma
- basef
- esis
- ina
- waf
- ea
- amam
- anama
- god
- "owa\uA78C"
- epes
- "ae\uA78C"
- amama
- "dei\uA78C"
- godi
top_n_grams:
- - 2
- 0.405
- - 3
- 0.386
- - 4
- 0.312
================================================
FILE: configs/aom_Latn.yml
================================================
dup_line_frac: 0.365
dup_n_grams:
- - 5
- 0.365
- - 6
- 0.357
- - 7
- 0.344
- - 8
- 0.329
- - 9
- 0.311
- - 10
- 0.294
language_score: 0.691
line_punct_thr: -1
max_avg_word_length: 10
max_non_alpha_words_ratio: 0.839
min_avg_word_length: 4
new_line_ratio: 0.062
stopwords:
- god
- "\xEBhi"
- hesi
- bogo
- "h\xF6jo"
- are
- mae
- ae
- "r\xF6hu"
- "j\xF6ho"
- ma
- ro
- na
- "\xEB"
- hu
- a
- mu
- "j\xF6"
top_n_grams:
- - 2
- 0.22
- - 3
- 0.222
- - 4
- 0.226
================================================
FILE: configs/aoz_Latn.yml
================================================
dup_line_frac: 0.536
dup_n_grams:
- - 5
- 0.346
- - 6
- 0.332
- - 7
- 0.314
- - 8
- 0.295
- - 9
- 0.278
- - 10
- 0.256
language_score: 0.3
line_punct_thr: -1
max_avg_word_length: 6
max_non_alpha_words_ratio: 0.8
min_avg_word_length: 2
new_line_ratio: 0.062
stopwords:
- ma
- in
- sin
- neu
- le
- nane
- atoni
- au
- lasi
- ka
- nai
- uisneno
- nak
- he
- mes
- hi
- ale
- te
- anbi
- yesus
- neno
- fun
- fa
- bi
- na'ko
- nok
- es
top_n_grams:
- - 2
- 0.949
- - 3
- 0.964
- - 4
- 0.867
================================================
FILE: configs/apb_Latn.yml
================================================
dup_line_frac: 0.422
dup_n_grams:
- - 5
- 0.326
- - 6
- 0.313
- - 7
- 0.292
- - 8
- 0.274
- - 9
- 0.258
- - 10
- 0.241
language_score: 0.67
line_punct_thr: -1
max_avg_word_length: 7
max_non_alpha_words_ratio: 0.833
min_avg_word_length: 3
new_line_ratio: 0.044
stopwords:
- e
- aana
- oto
- a
- na
- ko
- mo
- i
- kire
- ke
- nge
- uri
- hunie
- nga
- omu
- mola
- god
- lae
- ngeena
- ni
- iini
- kei
- "ta\uA78Ce"
- ola
- "lo\uA78Cu"
top_n_grams:
- - 2
- 1.417
- - 3
- 1.428
- - 4
- 1.311
================================================
FILE: configs/apc_Arab.yml
================================================
dup_line_frac: 0.334
dup_n_grams:
- - 5
- 0.248
- - 6
- 0.23
- - 7
- 0.208
- - 8
- 0.192
- - 9
- 0.174
- - 10
- 0.159
language_score: 0.3
line_punct_thr: -1
max_avg_word_length: 8
max_non_alpha_words_ratio: 0.857
min_avg_word_length: 2
new_line_ratio: 0.25
stopwords:
- "\u0648"
- "\u0645\u0627"
- "\u0645\u0646"
- "\u0639\u0644\u0649"
- "\u0628\u0633"
- "\u0627\u0646\u0627"
- "\u0641\u064A"
- "\u0639\u0645"
- "\u0634\u0648"
top_n_grams:
- - 2
- 0.722
- - 3
- 0.471
- - 4
- 0.408
================================================
FILE: configs/ape_Latn.yml
================================================
dup_line_frac: 0.422
dup_n_grams:
- - 5
- 0.378
- - 6
- 0.365
- - 7
- 0.345
- - 8
- 0.328
- - 9
- 0.312
- - 10
- 0.292
language_score: 0.3
line_punct_thr: -1
max_avg_word_length: 8
max_non_alpha_words_ratio: 0.833
min_avg_word_length: 4
new_line_ratio: 0.05
stopwords:
- douk
- aria
- um
- ali
- iri
- umu
- ipak
- ta
- anan
- iruhin
- uli
- ananin
- baraen
top_n_grams:
- - 2
- 0.661
- - 3
- 0.583
- - 4
- 0.521
================================================
FILE: configs/apn_Latn.yml
================================================
dup_line_frac: 0.704
dup_n_grams:
- - 5
- 0.281
- - 6
- 0.222
- - 7
- 0.21
- - 8
- 0.181
- - 9
- 0.167
- - 10
- 0.139
language_score: 0.3
line_punct_thr: -1
max_avg_word_length: 6
max_non_alpha_words_ratio: 0.889
min_avg_word_length: 2
new_line_ratio: 0.037
stopwords:
- "m\u1EBD"
- "n\u1EBD"
- "amnh\u0129"
- o
- pa
- kot
- "nh\u0169m"
- "k\xE3m"
- ri
- ho
- na
- "\xE3"
- "h\xE3"
- "t\u0129rt\u0169m"
- "nh\u0129p\xEAx"
- "h\xE3mri"
- to
- "tanhm\xE3"
- "k\xEAt"
- "an\u1EBD"
- mex
- "t\xE3"
- "m\xE3"
- "kap\u1EBDr"
- "hk\xF4t"
top_n_grams:
- - 2
- 0.438
- - 3
- 0.456
- - 4
- 0.373
================================================
FILE: configs/apr_Latn.yml
================================================
dup_line_frac: 0.346
dup_n_grams:
- - 5
- 0.331
- - 6
- 0.323
- - 7
- 0.313
- - 8
- 0.301
- - 9
- 0.284
- - 10
- 0.27
language_score: 0.73
line_punct_thr: -1
max_avg_word_length: 6
max_non_alpha_words_ratio: 0.849
min_avg_word_length: 3
new_line_ratio: 0.037
stopwords:
- ngan
- ye
- nga
- yo
- di
- le
- be
- a
- ke
- in
- nen
- pang
- inbe
- tooltool
- i
- maro
- tiap
- la
- dook
- tool
- ole
- mai
- tani
- so
- betanga
- tina
- bong
top_n_grams:
- - 2
- 0.178
- - 3
- 0.176
- - 4
- 0.162
================================================
FILE: configs/apt_Latn.yml
================================================
dup_line_frac: 0.569
dup_n_grams:
- - 5
- 0.534
- - 6
- 0.521
- - 7
- 0.508
- - 8
- 0.487
- - 9
- 0.456
- - 10
- 0.432
language_score: 0.3
line_punct_thr: -1
max_avg_word_length: 9
max_non_alpha_words_ratio: 0.788
min_avg_word_length: 3
new_line_ratio: 0.071
stopwords:
- ho
- mi
- ka
- mo
- ngo
- niimpalukoda
- hiila
- hojalo
- "ata\xF1"
- hii
- mohmi
- pinii
- mohka
- nunu
- mohlu
top_n_grams:
- - 2
- 2.045
- - 3
- 2.157
- - 4
- 2.051
================================================
FILE: configs/apu_Latn.yml
================================================
dup_line_frac: 0.263
dup_n_grams:
- - 5
- 0.206
- - 6
- 0.196
- - 7
- 0.189
- - 8
- 0.185
- - 9
- 0.163
- - 10
- 0.152
language_score: 0.603
line_punct_thr: -1
max_avg_word_length: 15
max_non_alpha_words_ratio: 0.698
min_avg_word_length: 4
new_line_ratio: 0.083
stopwords:
- teoso
- iua
- "inini\xE3"
- xesosi
- ninoa
- "s\xE3kire"
- "k\xE3kiti"
- "\u0129kapani"
- atoko
- kotxi
- ikara
- "h\u0129te"
- kona
- nota
- erekari
- itxa
- iuasaaki
- maerekati
top_n_grams:
- - 2
- 1.2
- - 3
- 0.848
- - 4
- 0.761
================================================
FILE: configs/apw_Latn.yml
================================================
dup_line_frac: 0.513
dup_n_grams:
- - 5
- 0.398
- - 6
- 0.384
- - 7
- 0.372
- - 8
- 0.33
- - 9
- 0.307
- - 10
- 0.295
language_score: 0.3
line_punct_thr: -1
max_avg_word_length: 13
max_non_alpha_words_ratio: 0.692
min_avg_word_length: 4
new_line_ratio: 0.083
stopwords:
- doo
- da
- "bik\u2019ehgo\u2019ihi\u2019\u1E49a\u0144"
- "n\u1E49ee"
- "\u0142a\u2019\xED\xED"
- "bigh\u0105"
- bee
- jesus
- baa
- "\xE1\xED"
- "bi\u0142"
- "\xE1\xEDk\u2019ehgo"
- ndi
- "dolee\u0142"
- "n\u2019\xED\xED"
- "k\u2019ehgo"
top_n_grams:
- - 2
- 1.148
- - 3
- 1.049
- - 4
- 0.92
================================================
FILE: configs/apy_Latn.yml
================================================
dup_line_frac: 0.611
dup_n_grams:
- - 5
- 0.489
- - 6
- 0.469
- - 7
- 0.448
- - 8
- 0.426
- - 9
- 0.385
- - 10
- 0.352
language_score: 0.3
line_punct_thr: -1
max_avg_word_length: 11
max_non_alpha_words_ratio: 0.75
min_avg_word_length: 3
new_line_ratio: 0.071
stopwords:
- "riton\xF5po"
- toto
- xine
- a
- "t\xF5"
- mana
- roropa
- eya
- poko
- pyra
- tykase
- ase
- "m\xE3"
- mame
- ahtao
- ynara
- jezu
- maro
- "rok\u1EBD"
- ropa
- yrome
top_n_grams:
- - 2
- 1.342
- - 3
- 1.363
- - 4
- 1.235
================================================
FILE: configs/apz_Latn.yml
================================================
dup_line_frac: 0.504
dup_n_grams:
- - 5
- 0.359
- - 6
- 0.344
- - 7
- 0.327
- - 8
- 0.312
- - 9
- 0.295
- - 10
- 0.27
language_score: 0.3
line_punct_thr: -1
max_avg_word_length: 13
max_non_alpha_words_ratio: 0.842
min_avg_word_length: 5
new_line_ratio: 0.067
stopwords:
- kako
- a'amu
- oso
- hungkuno
- sekwo
- somo
- hwe
- ose
- "hof\u0268ko"
- "an\u0268tu"
- ngko
- huno
- kakoe
- sohwo
- engo
- "an\u0268tuye"
- "s\u0268meho"
- nakwo
- jisas
- "a\uA78Camu"
- so'no
- ole
- wonyo
top_n_grams:
- - 2
- 1.101
- - 3
- 1.12
- - 4
- 0.992
================================================
FILE: configs/aqz_Latn.yml
================================================
dup_line_frac: 0.079
dup_n_grams:
- - 5
- 0.063
- - 6
- 0.065
- - 7
- 0.061
- - 8
- 0.052
- - 9
- 0.05
- - 10
- 0.045
language_score: 0.3
line_punct_thr: -1
max_avg_word_length: 10
max_non_alpha_words_ratio: 0.667
min_avg_word_length: 2
new_line_ratio: 0.5
stopwords:
- te
- 'on'
- en
- nom
- "j\u1EBD"
- koa
- "t\u0283e"
- "aram\u0129ra"
- ete
- "et\u0283e"
- ata
- "\u0268k\u0268"
- ke
- "\xE3ka"
- kom
- "\u1EBD"
- pupak
- "et\u0268"
- ka
- aparapia
- pe
- konibu
- "n\xF5m"
- pi
- put
- tara
- ebapa
- nia
- "awawa\u02A7o"
- oike
- pero
- "\xF5jpe"
- ko
- otak
top_n_grams:
- - 2
- 1.319
- - 3
- 1.361
- - 4
- 1.846
================================================
FILE: configs/arb_Arab.yml
================================================
dup_line_frac: 0.304
dup_n_grams:
- - 5
- 0.165
- - 6
- 0.153
- - 7
- 0.142
- - 8
- 0.131
- - 9
- 0.12
- - 10
- 0.109
language_score: 0.711
line_punct_thr: 0.143
max_avg_word_length: 9
max_non_alpha_words_ratio: 0.787
min_avg_word_length: 2
new_line_ratio: 0.189
stopwords:
- "\u060C"
- "\u0641\u064A"
- "\u0645\u0646"
- "\u0639\u0644\u0649"
- "\u0625\u0644\u0649"
- "\u0639\u0627\u0645"
- "\u0623\u0646"
- "\u0645\u0639"
- "\u0623\u0648"
- "\u0647\u0648"
- "\u0639\u0646"
- "\u0627\u0644\u062A\u064A"
- "\u0643\u0627\u0646"
- "\u0628\u064A\u0646"
- "\u0645\u0627"
- "\u0643\u0627\u0646\u062A"
- "\u0647\u064A"
- "\u0627\u0644\u0645\u062A\u062D\u062F\u0629"
- "\u0628\u0639\u062F"
top_n_grams:
- - 2
- 0.197
- - 3
- 0.172
- - 4
- 0.146
================================================
FILE: configs/arb_Latn.yml
================================================
dup_line_frac: 0.629
dup_n_grams:
- - 5
- 0.452
- - 6
- 0.428
- - 7
- 0.407
- - 8
- 0.364
- - 9
- 0.334
- - 10
- 0.298
language_score: 0.3
line_punct_thr: -1
max_avg_word_length: 8
max_non_alpha_words_ratio: 0.852
min_avg_word_length: 3
new_line_ratio: 0.067
stopwords:
- al-
- al
- wa
- fi
- min
- 3ala
- li
- bi
- ila
- aw
- lil
- wal
- fil
- ma
top_n_grams:
- - 2
- 0.858
- - 3
- 0.751
- - 4
- 0.534
================================================
FILE: configs/are_Latn.yml
================================================
dup_line_frac: 0.68
dup_n_grams:
- - 5
- 0.441
- - 6
- 0.427
- - 7
- 0.39
- - 8
- 0.385
- - 9
- 0.341
- - 10
- 0.329
language_score: 0.44
line_punct_thr: -1
max_avg_word_length: 13
max_non_alpha_words_ratio: 0.72
min_avg_word_length: 4
new_line_ratio: 0.083
stopwords:
- era
- relha
- turta
- etna
- erinha
- itja
- rrangkarra
- kala
- nama
- nhanha
- pula
- etnanha
- artwa
- altjirraka
- yinga
- nurna
- angkatja
- arrpunha
top_n_grams:
- - 2
- 2.168
- - 3
- 1.999
- - 4
- 1.855
================================================
FILE: configs/arg_Latn.yml
================================================
dup_line_frac: 0.449
dup_n_grams:
- - 5
- 0.272
- - 6
- 0.255
- - 7
- 0.233
- - 8
- 0.209
- - 9
- 0.185
- - 10
- 0.163
language_score: 0.3
line_punct_thr: 0.167
max_avg_word_length: 13
max_non_alpha_words_ratio: 0.811
min_avg_word_length: 3
new_line_ratio: 0.184
stopwords:
- de
- en
- a
- y
- o
- que
- ye
- d'o
- d'a
- una
- la
- con
- un
- se
- os
top_n_grams:
- - 2
- 0.527
- - 3
- 0.476
- - 4
- 0.415
================================================
FILE: configs/arl_Latn.yml
================================================
dup_line_frac: 0.122
dup_n_grams:
- - 5
- 0.061
- - 6
- 0.05
- - 7
- 0.04
- - 8
- 0.037
- - 9
- 0.033
- - 10
- 0.03
language_score: 0.674
line_punct_thr: -1
max_avg_word_length: 15
max_non_alpha_words_ratio: 0.739
min_avg_word_length: 5
new_line_ratio: 0.062
stopwords:
- na
- nia
- pueyaso
- cua
- nojori
- pa
- pueya
- naa
- puetunu
- cuno
- jaara
- quia
- maninia
- maja
- majaari
- nojoriiri
- canaa
top_n_grams:
- - 2
- 0.307
- - 3
- 0.228
- - 4
- 0.148
================================================
FILE: configs/arn_Latn.yml
================================================
dup_line_frac: 0.206
dup_n_grams:
- - 5
- 0.171
- - 6
- 0.165
- - 7
- 0.153
- - 8
- 0.142
- - 9
- 0.13
- - 10
- 0.118
language_score: 0.3
line_punct_thr: -1
max_avg_word_length: 12
max_non_alpha_words_ratio: 0.727
min_avg_word_length: 3
new_line_ratio: 0.111
stopwords:
- "\xF1i"
- ta
- pu
- "ta\xF1i"
- ka
- mew
- mu
- tati
- dungu
- "tai\xF1"
- ti
- fey
- che
- "\xBF"
- rume
- "eng\xFCn"
- chem
- jewba
- "ki\xF1e"
- "ng\xFCnechen"
- femngechi
- "k\xFCme"
- tami
top_n_grams:
- - 2
- 1.308
- - 3
- 0.961
- - 4
- 0.666
================================================
FILE: configs/arp_Latn.yml
================================================
dup_line_frac: 0.432
dup_n_grams:
- - 5
- 0.316
- - 6
- 0.285
- - 7
- 0.274
- - 8
- 0.259
- - 9
- 0.245
- - 10
- 0.226
language_score: 0.3
line_punct_thr: -1
max_avg_word_length: 18
max_non_alpha_words_ratio: 0.7
min_avg_word_length: 5
new_line_ratio: 0.111
stopwords:
- nau
- henee
- hau
- hanau
- nuu
- nananena
- vahee
- heee
- nananene
- heau
- henane
- hehethee
- daun
- nananenith
- jea
- hena
- hayauhuhau
- hesee
top_n_grams:
- - 2
- 0.938
- - 3
- 0.794
- - 4
- 0.714
================================================
FILE: configs/arq_Arab.yml
================================================
dup_line_frac: 0.422
dup_n_grams:
- - 5
- 0.377
- - 6
- 0.37
- - 7
- 0.355
- - 8
- 0.337
- - 9
- 0.306
- - 10
- 0.284
language_score: 0.305
line_punct_thr: -1
max_avg_word_length: 11
max_non_alpha_words_ratio: 0.75
min_avg_word_length: 2
new_line_ratio: 0.25
stopwords:
- "\u0648"
- "\u0645\u0627"
- "\u0641\u064A"
- "\u0645\u0646"
- "\u062A\u0627\u0639"
- "\u0639\u0644\u0649"
- "\u0627\u0644\u0644\u0651\u0670\u0647"
- "\u0627\u0644\u0644\u0651\u064A"
- "\u0628\u0627\u0634"
- "\u0648\u0627\u0634"
- "\u060C"
- "\u0647\u0627\u062F"
- "\u0627\u0644\u0643\u062A\u0627\u0628"
- "\u0643\u064A"
- "\u062A\u0648\u0645"
- "\u200F"
- "\u0631\u0627\u064A\u062D"
- "\u0647\u0648"
- "\u0643\u0627\u0646"
- "\u0628\u0644\u0651\u064A"
- "\u06A4\u0627\u0639"
- "\u0648\u0627\u062D\u062F"
top_n_grams:
- - 2
- 1.647
- - 3
- 1.676
- - 4
- 1.596
================================================
FILE: configs/arr_Latn.yml
================================================
dup_line_frac: 0.034
dup_n_grams:
- - 5
- 0.013
- - 6
- 0.012
- - 7
- 0.013
- - 8
- 0.011
- - 9
- 0.01
- - 10
- 0.01
language_score: 0.616
line_punct_thr: -1
max_avg_word_length: 10
max_non_alpha_words_ratio: 1.0
min_avg_word_length: 2
new_line_ratio: 0.5
stopwords:
- "\xF5n"
- at
- "i\u0294ke"
- "ahy\u0259"
- "p\xE9\u014B"
- wat
- "ka\u0294a"
- "\u014Ba"
- "ma\u0294p\u0259y"
- "n\xE3n"
- "pe\u0294"
- "\u0294et"
- "m\xE3yg\xE3ra"
- "c\xFA"
- "\u0294a"
- "a\u0294toy"
- "ma\u0294w\u0268t"
- "\u1EBDn"
- "ag\xF3a\u0294p\u0259t"
- ip
- "to\u0294wa"
- "iy\xF5m"
- "kan\xE3"
- "m\xE3m"
- yat
- wayo
- "ow\u1EBD"
- "a\u0294w\u0129n"
- "n\xE3nin"
- toat
- "p\xFA\u014B"
- wet
- "kan\xE3p"
- "w\u0129n"
top_n_grams:
- - 2
- 1.54
- - 3
- 1.584
- - 4
- 1.681
================================================
FILE: configs/ars_Arab.yml
================================================
dup_line_frac: 0.356
dup_n_grams:
- - 5
- 0.204
- - 6
- 0.192
- - 7
- 0.18
- - 8
- 0.166
- - 9
- 0.153
- - 10
- 0.141
language_score: 0.407
line_punct_thr: -1
max_avg_word_length: 55
max_non_alpha_words_ratio: 0.75
min_avg_word_length: 2
new_line_ratio: 0.25
stopwords:
- "\u0641\u064A"
- "\u0645\u0646"
- "\u060C"
- "\u0639\u0644\u0649"
- "\u0645\u0627"
- "\u0644\u0648"
- "\u0633\u0645\u062D\u062A"
- "\u0627\u0644\u0644\u0647"
- "\u0627\u0644\u0644\u064A"
top_n_grams:
- - 2
- 0.328
- - 3
- 0.299
- - 4
- 0.273
================================================
FILE: configs/ary_Arab.yml
================================================
dup_line_frac: 0.32
dup_n_grams:
- - 5
- 0.196
- - 6
- 0.183
- - 7
- 0.169
- - 8
- 0.157
- - 9
- 0.145
- - 10
- 0.13
language_score: 0.418
line_punct_thr: 0.111
max_avg_word_length: 7
max_non_alpha_words_ratio: 0.743
min_avg_word_length: 3
new_line_ratio: 0.162
stopwords:
- "\u060C"
- "\u0641"
- "\u062F"
- "\u0648"
- "\u062F\u064A\u0627\u0644"
- "\u0645\u0646"
- "\u0624"
- "\u0646\u0633\u0628\u0629"
- "\u0627\u0644\u0644\u064A"
- "\u0644"
- "\u0639\u0644\u0649"
- "\u0644\u064A"
- "\u0628"
top_n_grams:
- - 2
- 0.245
- - 3
- 0.224
- - 4
- 0.197
================================================
FILE: configs/arz_Arab.yml
================================================
dup_line_frac: 0.368
dup_n_grams:
- - 5
- 0.223
- - 6
- 0.207
- - 7
- 0.19
- - 8
- 0.174
- - 9
- 0.158
- - 10
- 0.143
language_score: 0.339
line_punct_thr: 0.188
max_avg_word_length: 8
max_non_alpha_words_ratio: 0.83
min_avg_word_length: 3
new_line_ratio: 0.308
stopwords:
- "\u0641\u0649"
- "\u0648"
- "\u0645\u0646"
- "\u0644\u064A\u0646\u0643\u0627\u062A"
- "\u0647\u064A\u0627"
- "\u0627\u0644\u0644\u0649"
- "\u0628\u0631\u0627\u0646\u064A\u0647"
- "\u064A\u0648\u0645"
- "\u0645\u0648\u0627\u0644\u064A\u062F"
- "\u062D\u064A\u0627\u062A\u0647"
- "\u0643\u0627\u0646"
top_n_grams:
- - 2
- 0.269
- - 3
- 0.249
- - 4
- 0.225
================================================
FILE: configs/asg_Latn.yml
================================================
dup_line_frac: 0.492
dup_n_grams:
- - 5
- 0.183
- - 6
- 0.166
- - 7
- 0.154
- - 8
- 0.143
- - 9
- 0.136
- - 10
- 0.126
language_score: 0.728
line_punct_thr: -1
max_avg_word_length: 6
max_non_alpha_words_ratio: 0.839
min_avg_word_length: 2
new_line_ratio: 0.05
stopwords:
- a
- u
- na
- n
- i
- "\u0257a"
- "ta\u0331"
- "a\u0331"
- ka
- tsu
- ili
- "ka\u0331shile"
- adama
- ni
- ba
- o
- e
- le
- yi
- uma
- wi
- ci
top_n_grams:
- - 2
- 0.239
- - 3
- 0.219
- - 4
- 0.199
================================================
FILE: configs/asm_Beng.yml
================================================
dup_line_frac: 0.211
dup_n_grams:
- - 5
- 0.119
- - 6
- 0.108
- - 7
- 0.101
- - 8
- 0.09
- - 9
- 0.082
- - 10
- 0.074
language_score: 0.699
line_punct_thr: 0.094
max_avg_word_length: 19
max_non_alpha_words_ratio: 0.812
min_avg_word_length: 3
new_line_ratio: 0.125
stopwords:
- "\u0986\u09F0\u09C1"
- "\u09B9\u09AF\u09BC"
- "\u0995\u09F0\u09BE"
- "\u0995\u09F0\u09C7"
- "\u098F\u0987"
- "\u09A4\u09C7\u0993\u0981"
- "\u09AA\u09F0\u09BE"
- "\u09AC\u09BE\u09AC\u09C7"
- "\u099A\u09A8\u09A4"
- "\u0995\u09F0\u09BF\u099B\u09BF\u09B2"
- "\u0986\u099B\u09BF\u09B2"
- "\u09B9\u09C8\u099B\u09C7"
- "\u0995\u09F0\u09BF"
- "\u09B9\u09C8\u099B\u09BF\u09B2"
- "\u09A4\u09C7\u0993\u0981\u09F0"
- "\u09AC\u09BE"
- "\u099A\u09A8\u09F0"
- "\u0987\u09AF\u09BC\u09BE\u09F0"
- "\u09B9\u09BF\u099A\u09BE\u09AA\u09C7"
- "\u098F\u0995"
- "\u098F\u099F\u09BE"
- "\u09B9\u09C8"
- "\u09AC\u09C1\u09B2\u09BF"
- "\u09B2\u09BE\u09AD"
- "\u09F0"
- "\u0986\u099B\u09C7"
top_n_grams:
- - 2
- 0.176
- - 3
- 0.153
- - 4
- 0.133
================================================
FILE: configs/asm_Latn.yml
================================================
dup_line_frac: 0.613
dup_n_grams:
- - 5
- 0.387
- - 6
- 0.36
- - 7
- 0.331
- - 8
- 0.308
- - 9
- 0.284
- - 10
- 0.261
language_score: 0.3
line_punct_thr: -1
max_avg_word_length: 13
max_non_alpha_words_ratio: 0.8
min_avg_word_length: 3
new_line_ratio: 0.167
stopwords:
- aru
- ei
- kora
- hoi
- pora
- kori
- je
- kore
- hoise
- babe
- hobo
- korise
- koribo
- aji
- korar
- buli
- logote
- totha
- axomor
- axom
top_n_grams:
- - 2
- 0.918
- - 3
- 0.915
- - 4
- 0.838
================================================
FILE: configs/aso_Latn.yml
================================================
dup_line_frac: 0.359
dup_n_grams:
- - 5
- 0.291
- - 6
- 0.274
- - 7
- 0.258
- - 8
- 0.233
- - 9
- 0.216
- - 10
- 0.187
language_score: 0.667
line_punct_thr: -1
max_avg_word_length: 8
max_non_alpha_words_ratio: 0.684
min_avg_word_length: 3
new_line_ratio: 0.043
stopwords:
- nene
- lo
- ve
- ma
- do
- li
- ido
- ogo
- o
- ne'mine
- gamazi
- igi
- a'mine
- di
top_n_grams:
- - 2
- 0.964
- - 3
- 0.846
- - 4
- 0.738
================================================
FILE: configs/ast_Latn.yml
================================================
dup_line_frac: 0.679
dup_n_grams:
- - 5
- 0.412
- - 6
- 0.379
- - 7
- 0.328
- - 8
- 0.313
- - 9
- 0.306
- - 10
- 0.287
language_score: 0.3
line_punct_thr: 0.195
max_avg_word_length: 10
max_non_alpha_words_ratio: 0.824
min_avg_word_length: 3
new_line_ratio: 0.167
stopwords:
- de
- la
- y
- a
- del
- en
- los
- que
- el
- les
- so
- una
- un
top_n_grams:
- - 2
- 1.597
- - 3
- 1.59
- - 4
- 1.469
================================================
FILE: configs/ata_Latn.yml
================================================
dup_line_frac: 0.35
dup_n_grams:
- - 5
- 0.331
- - 6
- 0.325
- - 7
- 0.314
- - 8
- 0.299
- - 9
- 0.281
- - 10
- 0.262
language_score: 0.782
line_punct_thr: -1
max_avg_word_length: 8
max_non_alpha_words_ratio: 0.812
min_avg_word_length: 3
new_line_ratio: 0.056
stopwords:
- la
- sou
- 'no'
- anu
- ne
- ta
- mo
- ane
- lexe
- noxou
- uasi
- mitema
- aloxo
- xe
- lataua
- ia
- eni
- vile
- "\uA78Co"
- ngingi
top_n_grams:
- - 2
- 0.332
- - 3
- 0.299
- - 4
- 0.247
================================================
FILE: configs/atb_Latn.yml
================================================
dup_line_frac: 0.226
dup_n_grams:
- - 5
- 0.163
- - 6
- 0.153
- - 7
- 0.138
- - 8
- 0.129
- - 9
- 0.12
- - 10
- 0.11
language_score: 0.3
line_punct_thr: -1
max_avg_word_length: 5
max_non_alpha_words_ratio: 0.786
min_avg_word_length: 2
new_line_ratio: 0.04
stopwords:
- "\xE9"
- "l\xE9"
- gi
- nghut
- ri
- "m\xE1"
- "ha\xFB"
- "r\xE2"
- a
- "lh\xEA"
- le
- "m\xF9"
- eq
- "hky\xF4"
- yhang
- "p\xE9"
- nungmoq
- "lu\xEE"
- "w\xF3"
top_n_grams:
- - 2
- 0.287
- - 3
- 0.249
- - 4
- 0.21
================================================
FILE: configs/atd_Latn.yml
================================================
dup_line_frac: 0.68
dup_n_grams:
- - 5
- 0.585
- - 6
- 0.558
- - 7
- 0.524
- - 8
- 0.487
- - 9
- 0.453
- - 10
- 0.408
language_score: 0.3
line_punct_thr: -1
max_avg_word_length: 7
max_non_alpha_words_ratio: 0.824
min_avg_word_length: 3
new_line_ratio: 0.045
stopwords:
- to
- 'no'
- ka
- mgo
- woy
- 'on'
- sikan
- din
- magboboot
- ian
- otow
- ko
- dio
- su
- ku
- hisus
- dan
- si
- ta
- kono
- ni
- now
- duon
- di
- ki
top_n_grams:
- - 2
- 1.538
- - 3
- 1.63
- - 4
- 1.572
================================================
FILE: configs/atg_Latn.yml
================================================
dup_line_frac: 0.052
dup_n_grams:
- - 5
- 0.098
- - 6
- 0.09
- - 7
- 0.082
- - 8
- 0.074
- - 9
- 0.067
- - 10
- 0.062
language_score: 0.81
line_punct_thr: -1
max_avg_word_length: 6
max_non_alpha_words_ratio: 0.811
min_avg_word_length: 2
new_line_ratio: 0.056
stopwords:
- "\u1ECD"
- ni
- khi
- a
- e
- o
- ya
- "\u1EB9"
- li
- ri
- "r\u1ECD"
- na
- shi
- mhi
- ali
- "\u1EB9shin\u1EB9gba"
- abi
- "\u1EB9gb\u1ECD"
- oyi
- "\u1ECDli"
- eni
- la
- "w\u1EB9"
top_n_grams:
- - 2
- 0.302
- - 3
- 0.277
- - 4
- 0.222
================================================
FILE: configs/ati_Latn.yml
================================================
dup_line_frac: 0.721
dup_n_grams:
- - 5
- 0.591
- - 6
- 0.571
- - 7
- 0.536
- - 8
- 0.519
- - 9
- 0.493
- - 10
- 0.459
language_score: 0.3
line_punct_thr: -1
max_avg_word_length: 8
max_non_alpha_words_ratio: 0.81
min_avg_word_length: 2
new_line_ratio: 0.1
stopwords:
- "\u02C8e"
- "\u02C8ba"
- -le
- "\u02C8yi"
- "\u02C8o"
- "\u02C8kun"
- "\u02C8la"
- "\u02C8k\u025B"
- "s\u025B"
- "n\u025Bn"
- "b\u025Bn"
- "-k\u025B"
- man
- "\u02C8a"
- -o
- -a
- -ba
- -e
- joova
- "\u02C8nun"
- "-z\xF6"
- "-y\u025B"
- dzhi
- "\u02C8ze"
- bu
- maan
- "tsabi\u025B"
- tsa
- "f\u025Bn"
- "n\u0254n"
- "\u02C8w\u025Bn"
- "\u02C8\u02C8\u0272an"
- "nanm\u025B"
- sa
top_n_grams:
- - 2
- 1.213
- - 3
- 1.252
- - 4
- 1.245
================================================
FILE: configs/atj_Latn.yml
================================================
dup_line_frac: 0.58
dup_n_grams:
- - 5
- 0.42
- - 6
- 0.255
- - 7
- 0.229
- - 8
- 0.201
- - 9
- 0.18
- - 10
- 0.157
language_score: 0.3
line_punct_thr: 0.049
max_avg_word_length: 13
max_non_alpha_words_ratio: 0.781
min_avg_word_length: 4
new_line_ratio: 0.269
stopwords:
- e
- ka
- ki
- ici
- kitci
- kaie
- micta
- matcectakaniwok
- kirika
- manawan
- actew
- wemotaci
- kanata
- tca
top_n_grams:
- - 2
- 0.519
- - 3
- 0.466
- - 4
- 0.493
================================================
FILE: configs/atq_Latn.yml
================================================
dup_line_frac: 0.738
dup_n_grams:
- - 5
- 0.558
- - 6
- 0.548
- - 7
- 0.525
- - 8
- 0.499
- - 9
- 0.468
- - 10
- 0.442
language_score: 0.3
line_punct_thr: -1
max_avg_word_length: 12
max_non_alpha_words_ratio: 0.68
min_avg_word_length: 3
new_line_ratio: 0.056
stopwords:
- di
- ang
- anna
- la
- puang
- yato
- aka
- tau
- to
- alataala
- dai
- pano
- yesus
- ya
- ampo
- yaling
- aha
- sika
- "ingk\xE4nna"
- naoatee
- inde
top_n_grams:
- - 2
- 1.355
- - 3
- 1.422
- - 4
- 1.319
================================================
FILE: configs/att_Latn.yml
================================================
dup_line_frac: 0.4
dup_n_grams:
- - 5
- 0.381
- - 6
- 0.375
- - 7
- 0.364
- - 8
- 0.352
- - 9
- 0.333
- - 10
- 0.317
language_score: 0.726
line_punct_thr: -1
max_avg_word_length: 7
max_non_alpha_words_ratio: 0.821
min_avg_word_length: 3
new_line_ratio: 0.045
stopwords:
- nga
- ta
- "y\xF9"
- "\xE1"
- na
- ira
- "s\xF9"
- ni
- "namar\xF2"
- da
- apu
- naw
- "\xE1nna"
- kesu
- "nay\xF9"
- "k\xE2"
- ari
- tam
- nu
- ku
- si
top_n_grams:
- - 2
- 0.226
- - 3
- 0.216
- - 4
- 0.211
================================================
FILE: configs/auc_Latn.yml
================================================
dup_line_frac: 0.104
dup_n_grams:
- - 5
- 0.074
- - 6
- 0.043
- - 7
- 0.039
- - 8
- 0.03
- - 9
- 0.021
- - 10
- 0.02
language_score: 0.838
line_punct_thr: -1
max_avg_word_length: 10
max_non_alpha_words_ratio: 0.818
min_avg_word_length: 4
new_line_ratio: 0.053
stopwords:
- ante
- "n\xEB"
- "bot\xF6"
- "t\xF6meng\xE4"
- "w\xE6ngongu\xEF"
- "ed\xE6"
- inte
- "\xEF\xF1\xF6m\xF6"
- "m\xEFnit\xF6"
- "ba\xEF"
- ingante
- "m\xF6n\xF6"
- "ay\xE6\u0308"
- "n\xE4ni"
- "w\xE6\xE6t\xEB"
- "n\xE4n\xF6"
- itota
- "t\xF6m\xEBn\xE4ni"
- "bit\xF6"
- "inc\xE6"
top_n_grams:
- - 2
- 0.4
- - 3
- 0.355
- - 4
- 0.318
================================================
FILE: configs/aui_Latn.yml
================================================
dup_line_frac: 0.264
dup_n_grams:
- - 5
- 0.199
- - 6
- 0.195
- - 7
- 0.189
- - 8
- 0.167
- - 9
- 0.148
- - 10
- 0.134
language_score: 0.3
line_punct_thr: -1
max_avg_word_length: 11
max_non_alpha_words_ratio: 0.765
min_avg_word_length: 4
new_line_ratio: 0.071
stopwords:
- bi
- da
- na
- god
- bo
- wawaya
- yana
- gegha
- yadi
- kana
- yawe
- wasina
- noko
- biidi
- damdi
top_n_grams:
- - 2
- 1.062
- - 3
- 0.958
- - 4
- 0.835
================================================
FILE: configs/auy_Latn.yml
================================================
dup_line_frac: 0.208
dup_n_grams:
- - 5
- 0.177
- - 6
- 0.17
- - 7
- 0.159
- - 8
- 0.15
- - 9
- 0.135
- - 10
- 0.12
language_score: 0.709
line_punct_thr: -1
max_avg_word_length: 12
max_non_alpha_words_ratio: 0.771
min_avg_word_length: 4
new_line_ratio: 0.083
stopwords:
- "\xEDmba"
- "s\xE9na"
- "\xEDsu"
- "man\xEDk\xF3"
- aai
- "s\xE9sa"
- waasi
- "s\xE1w\xED"
- "man\xEDk\xF3n"
- "wen\xED"
- "\xFAmai"
- "man\xEDk\xF3n\xED"
- "\xEDmbo"
- "wa\xE1si"
- "k\xEDsau"
- iye
- "miy\xE1"
- "siy\xE1iye"
- "\xE9sa"
- "mo\xF3r\xE1"
- "\xE9na"
- "im\xE1y\xE1a"
- "kawe\uA78C"
- "tuw\xEDmbai"
- "\xE9\uA78Ca"
- kwaasi
- "kes\xED"
- "s\xFAwana"
- "\xFAwoi"
- "y\xFAndaa"
- "min\xE1\xE1\xED"
- "p\xF3na"
- "\xF3raa\uA78C"
- "s\xE9\uA78Ca"
- "s\xFAne"
- "miw\xED"
- aaimo
top_n_grams:
- - 2
- 0.617
- - 3
- 0.543
- - 4
- 0.494
================================================
FILE: configs/ava_Cyrl.yml
================================================
dup_line_frac: 0.617
dup_n_grams:
- - 5
- 0.309
- - 6
- 0.289
- - 7
- 0.277
- - 8
- 0.26
- - 9
- 0.238
- - 10
- 0.21
language_score: 0.714
line_punct_thr: 0.0
max_avg_word_length: 13
max_non_alpha_words_ratio: 0.718
min_avg_word_length: 3
new_line_ratio: 0.4
stopwords:
- "\u0432\u0430"
- "\u0431\u0443\u0433\u043E"
- "\u043A\u043A\u043E\u043B\u0430"
- "\u0431\u0443\u0433\u0435\u0431"
- "\u0433\u044C\u0435\u0431"
- "\u0440\u043E\u0441\u0443"
- "\u0441\u043E\u043D\u0430\u043B\u044A"
- "\u043C\u0443\u0445\u044A\u0430\u043B\u044A\u0443\u043B"
- "\u0446\u043E"
- "\u0434\u0430\u0433\u044A\u0438\u0441\u0442\u0430\u043D\u0430\u043B\u044A\u0443\u043B"
- "\u0440\u043E\u0441\u0434\u0430\u043B"
- "\u043A\u044A\u043E"
- "\u0440\u0435\u043A\u044A\u043E\u043D"
- "\u0440\u0443\u0433\u043E"
- "\u0430\u0432\u0430\u0440"
- "\u0440\u043E\u0441\u0430\u0431\u0438"
- "\u0441\u043E\u043D\u0430\u043B\u044A\u0443\u043B"
top_n_grams:
- - 2
- 0.727
- - 3
- 0.71
- - 4
- 0.655
================================================
FILE: configs/avk_Latn.yml
================================================
dup_line_frac: 0.51
dup_n_grams:
- - 5
- 0.349
- - 6
- 0.335
- - 7
- 0.318
- - 8
- 0.302
- - 9
- 0.284
- - 10
- 0.261
language_score: 0.3
line_punct_thr: 0.024
max_avg_word_length: 16
max_non_alpha_words_ratio: 0.606
min_avg_word_length: 3
new_line_ratio: 0.314
stopwords:
- vuest-
- en
- ke
- of
- tir
- is
- va
- katca
- bak
- koe
top_n_grams:
- - 2
- 1.696
- - 3
- 1.796
- - 4
- 1.757
================================================
FILE: configs/avn_Latn.yml
================================================
dup_line_frac: 0.379
dup_n_grams:
- - 5
- 0.276
- - 6
- 0.274
- - 7
- 0.238
- - 8
- 0.22
- - 9
- 0.197
- - 10
- 0.178
language_score: 0.3
line_punct_thr: -1
max_avg_word_length: 6
max_non_alpha_words_ratio: 0.833
min_avg_word_length: 2
new_line_ratio: 0.056
stopwords:
- "l\u025B"
- gi
- "\u025B"
- si
- "y\u025B"
- "m\u025B"
- ba
- "n\xED"
- ni
- aya
- "ni\u0301"
- "ml\u0254"
- e
- "a\u028Ba"
- xe
- "t\u0254"
- ya
top_n_grams:
- - 2
- 0.522
- - 3
- 0.447
- - 4
- 0.338
================================================
FILE: configs/avt_Latn.yml
================================================
dup_line_frac: 0.085
dup_n_grams:
- - 5
- 0.099
- - 6
- 0.087
- - 7
- 0.071
- - 8
- 0.053
- - 9
- 0.051
- - 10
- 0.045
language_score: 0.688
line_punct_thr: -1
max_avg_word_length: 8
max_non_alpha_words_ratio: 0.825
min_avg_word_length: 3
new_line_ratio: 0.056
stopwords:
- "m\u0268t"
- "h\u0268rak"
- menmen
- "h\u0268r"
- te
- god
- yi
- me
- han
- hi
- "h\u0268m"
- au
- "m\u0268t\u0268k"
- haiu
- ap
- ke
- kerek
- iuwe
- im
- "h\u0268ram"
- enum
- wit
- werek
top_n_grams:
- - 2
- 0.334
- - 3
- 0.26
- - 4
- 0.177
================================================
FILE: configs/avu_Latn.yml
================================================
dup_line_frac: 0.194
dup_n_grams:
- - 5
- 0.188
- - 6
- 0.164
- - 7
- 0.136
- - 8
- 0.123
- - 9
- 0.119
- - 10
- 0.107
language_score: 0.9
line_punct_thr: -1
max_avg_word_length: 6
max_non_alpha_words_ratio: 0.854
min_avg_word_length: 2
new_line_ratio: 0.036
stopwords:
- "r\xEE"
- "dr\xED"
- "t\xE3"
- "\u02BCb\xE1"
- "y\xEE"
- "g\xF3l\xE2"
- "tr\xE1"
- "r\xF3"
- "b\xEA"
- "g\xF5\u02BCd\xE1"
- "g\xF3l\u0129y\xEE"
- "k\xE2"
- "\xF5j\xEDl\xE3"
- "\xF4v\xE2r\xED"
- "n\u0129"
- "s\u0129"
- "\u02BCd\u0129"
- "\xE3n\xEE"
- "l\xE2"
- "y\xE9s\u0169"
- "m\xE1"
- "k\xF4"
- "k\u0129"
- "\u02BC\xE1"
- "\uA78Cb\xE1"
- "kp\xE1"
- "\u0129t\xED"
top_n_grams:
- - 2
- 0.131
- - 3
- 0.183
- - 4
- 0.156
================================================
FILE: configs/awa_Deva.yml
================================================
dup_line_frac: 0.827
dup_n_grams:
- - 5
- 0.594
- - 6
- 0.569
- - 7
- 0.545
- - 8
- 0.495
- - 9
- 0.465
- - 10
- 0.436
language_score: 0.344
line_punct_thr: 0.2
max_avg_word_length: 27
max_non_alpha_words_ratio: 0.857
min_avg_word_length: 2
new_line_ratio: 0.214
stopwords:
- "\u0915\u092F"
- "\u0915\u0947"
- "\u092E\u0947\u0902"
- "\u0939\u094B\u092F"
- "\u0938\u0947"
- "\u0939\u0948"
- "\u092E\u093E"
- "\u090F\u0915\u094D\u0920\u0941"
- "\u091C\u093F\u0932\u093E"
- "\u092D\u093E\u0930\u0924"
- "\u0915\u093E"
- "\u0914"
top_n_grams:
- - 2
- 1.784
- - 3
- 1.775
- - 4
- 1.622
================================================
FILE: configs/awb_Latn.yml
================================================
dup_line_frac: 0.289
dup_n_grams:
- - 5
- 0.21
- - 6
- 0.204
- - 7
- 0.196
- - 8
- 0.185
- - 9
- 0.174
- - 10
- 0.16
language_score: 0.74
line_punct_thr: -1
max_avg_word_length: 11
max_non_alpha_words_ratio: 0.839
min_avg_word_length: 4
new_line_ratio: 0.083
stopwords:
- "\xEDre"
- "m\xF3"
- mi
- peh
- aiq
- ehweh
- "manik\xE1nka"
- ite
- "s\xEDsa"
- "keg\xE1"
- "manik\xE1ne"
- wene
- itene
top_n_grams:
- - 2
- 0.977
- - 3
- 0.994
- - 4
- 0.899
================================================
FILE: configs/awi_Latn.yml
================================================
dup_line_frac: 0.461
dup_n_grams:
- - 5
- 0.355
- - 6
- 0.352
- - 7
- 0.348
- - 8
- 0.326
- - 9
- 0.294
- - 10
- 0.272
language_score: 0.3
line_punct_thr: -1
max_avg_word_length: 7
max_non_alpha_words_ratio: 0.833
min_avg_word_length: 2
new_line_ratio: 0.067
stopwords:
- ko
- ma
- ya
- yo
- dima
- wike
- hamo
- 'no'
- god
- gyo
- kru
- ka
- swa
- ho
- yesu
- kyo
- me
- hokan
- gu
top_n_grams:
- - 2
- 0.553
- - 3
- 0.547
- - 4
- 0.517
================================================
FILE: configs/awx_Latn.yml
================================================
dup_line_frac: 0.471
dup_n_grams:
- - 5
- 0.321
- - 6
- 0.314
- - 7
- 0.3
- - 8
- 0.283
- - 9
- 0.265
- - 10
- 0.24
language_score: 0.33
line_punct_thr: -1
max_avg_word_length: 9
max_non_alpha_words_ratio: 0.688
min_avg_word_length: 4
new_line_ratio: 0.091
stopwords:
- yang
- "tiw\xE4n"
- using
- inikut
- "hikng\xE4"
- "nan\xE4"
- ge
- yangu
- "puy\xE4"
- "tiw\xE4n\xE4"
top_n_grams:
- - 2
- 0.843
- - 3
- 0.85
- - 4
- 0.732
================================================
FILE: configs/ayo_Latn.yml
================================================
dup_line_frac: 0.673
dup_n_grams:
- - 5
- 0.639
- - 6
- 0.6
- - 7
- 0.616
- - 8
- 0.598
- - 9
- 0.536
- - 10
- 0.493
language_score: 0.315
line_punct_thr: -1
max_avg_word_length: 9
max_non_alpha_words_ratio: 0.833
min_avg_word_length: 3
new_line_ratio: 0.053
stopwords:
- ore
- uje
- enga
- ome
- ujetiga
- dupade
- iji
- mu
- chi
- u
- "j\xE9"
- a
- to
- ga
- jesus
- jne
- que
- aja
- "ut\xE9"
- "r\u0129"
- udore
- uaque
- ca
- cucha
top_n_grams:
- - 2
- 1.266
- - 3
- 1.251
- - 4
- 1.26
================================================
FILE: configs/ayp_Arab.yml
================================================
dup_line_frac: 0.672
dup_n_grams:
- - 5
- 0.706
- - 6
- 0.707
- - 7
- 0.676
- - 8
- 0.667
- - 9
- 0.663
- - 10
- 0.64
language_score: 0.311
line_punct_thr: -1
max_avg_word_length: 10
max_non_alpha_words_ratio: 0.769
min_avg_word_length: 3
new_line_ratio: 0.111
stopwords:
- "\u060C"
- "\u0644\u064E"
- "\u0645\u0646\u0652"
- "\u062A\u064E"
- "\u0641"
- "\u0645\u0648\u064F"
- "\u0627\u064E\u0644\u0644\u0647"
- "\u0643\u0627\u0646\u0652"
- "\u0639\u064E\u0644\u0649"
- "\u0641\u064E"
- "\u0634\u064A"
- "\u0645\u0627"
- "\u0648\u0627\u0650"
top_n_grams:
- - 2
- 0.485
- - 3
- 0.463
- - 4
- 0.361
================================================
FILE: configs/ayr_Latn.yml
================================================
dup_line_frac: 0.594
dup_n_grams:
- - 5
- 0.222
- - 6
- 0.196
- - 7
- 0.177
- - 8
- 0.16
- - 9
- 0.143
- - 10
- 0.127
language_score: 0.3
line_punct_thr: 0.059
max_avg_word_length: 34
max_non_alpha_words_ratio: 0.655
min_avg_word_length: 3
new_line_ratio: 0.394
stopwords:
- jisk'a
- suyu
- t'aqa
- de
- piruw
- jach'a
- jaqinaka
- marka
- mara
- la
- asu
top_n_grams:
- - 2
- 0.788
- - 3
- 0.69
- - 4
- 0.568
================================================
FILE: configs/azb_Arab.yml
================================================
dup_line_frac: 0.379
dup_n_grams:
- - 5
- 0.225
- - 6
- 0.2
- - 7
- 0.179
- - 8
- 0.16
- - 9
- 0.144
- - 10
- 0.129
language_score: 0.3
line_punct_thr: 0.111
max_avg_word_length: 14
max_non_alpha_words_ratio: 0.719
min_avg_word_length: 3
new_line_ratio: 0.25
stopwords:
- "\u060C"
- "\u0648"
- "\u0627\u06CC\u0646\u06AF\u06CC\u0644\u06CC\u0633\u062C\u0647"
- "\u0628\u06CC\u0631"
- "\u0642\u0627\u06CC\u0646\u0627\u0642\u200C\u0644\u0627\u0631"
- "\u062A\u0627\u0631\u06CC\u062E\u06CC\u0646\u062F\u0647"
- "\u0637\u0631\u0641\u06CC\u0646\u062F\u0646"
- "\u0627\u06CC\u0634\u0644\u062F\u0646\u0644\u0631\u06CC"
- "\u0645\u0642\u0627\u0644\u0647\u200C\u0633\u06CC\u0646\u062F\u0646"
- "\u06AF\u0624\u062A\u0648\u0631\u0648\u0644\u0648\u0628\u062F\u0648\u0631"
- "\u0648\u06CC\u06A9\u06CC\u200C\u067E\u062F\u06CC\u0627\u0633\u06CC\u200C\u0646\u06CC\
\u0646"
- "\u06CC\u0648\u0652\u062E\u0644\u0627\u0646\u06CC\u0644\u06CC\u0628\u062F\u06CC\u0631\
)."
- "\u062F\u06CC\u0631"
- "\u0628\u06C7"
top_n_grams:
- - 2
- 0.403
- - 3
- 0.33
- - 4
- 0.245
================================================
FILE: configs/azg_Latn.yml
================================================
dup_line_frac: 0.696
dup_n_grams:
- - 5
- 0.344
- - 6
- 0.346
- - 7
- 0.3
- - 8
- 0.163
- - 9
- 0.147
- - 10
- 0.134
language_score: 0.3
line_punct_thr: -1
max_avg_word_length: 9
max_non_alpha_words_ratio: 0.667
min_avg_word_length: 3
new_line_ratio: 0.043
stopwords:
- na
- jon
- juu
- ndo
- nn'an
- yo
- ntyja
- nquii
- "j\xF1'oon"
- tyo'ts'on
- nnon
- "jnd\xEB"
- vaa
- naan
top_n_grams:
- - 2
- 0.543
- - 3
- 0.436
- - 4
- 0.395
================================================
FILE: configs/azj_Cyrl.yml
================================================
dup_line_frac: 0.297
dup_n_grams:
- - 5
- 0.15
- - 6
- 0.144
- - 7
- 0.137
- - 8
- 0.13
- - 9
- 0.12
- - 10
- 0.111
language_score: 0.891
line_punct_thr: -1
max_avg_word_length: 12
max_non_alpha_words_ratio: 0.714
min_avg_word_length: 3
new_line_ratio: 0.1
stopwords:
- "\u0432\u04D9"
- "\u043E"
- "\u0431\u0443"
- "\u0431\u0438\u0440"
- "\u043A\u0438"
- "\u0434\u04D9"
- "\u0458\u0435\u04BB\u043E\u0432\u0430"
- "\u04AF\u0447\u04AF\u043D"
top_n_grams:
- - 2
- 0.257
- - 3
- 0.266
- - 4
- 0.231
================================================
FILE: configs/azj_Latn.yml
================================================
dup_line_frac: 0.879
dup_n_grams:
- - 5
- 0.3
- - 6
- 0.271
- - 7
- 0.252
- - 8
- 0.227
- - 9
- 0.202
- - 10
- 0.179
language_score: 0.3
line_punct_thr: 0.188
max_avg_word_length: 13
max_non_alpha_words_ratio: 0.725
min_avg_word_length: 3
new_line_ratio: 0.179
stopwords:
- "v\u0259"
- "il\u0259"
- "ild\u0259"
- bir
- bu
- "az\u0259rbaycan"
- olan
- "\xFC\xE7\xFCn"
- sonra
- "d\u0259"
- kimi
- il
- "is\u0259"
- o
- "g\xF6r\u0259"
- da
- "t\u0259r\u0259find\u0259n"
- "\xE7ox"
- ki
- onun
- edir
- idi
top_n_grams:
- - 2
- 0.514
- - 3
- 0.475
- - 4
- 0.405
================================================
FILE: configs/azz_Latn.yml
================================================
dup_line_frac: 0.756
dup_n_grams:
- - 5
- 0.476
- - 6
- 0.451
- - 7
- 0.405
- - 8
- 0.386
- - 9
- 0.372
- - 10
- 0.326
language_score: 0.3
line_punct_thr: -1
max_avg_word_length: 11
max_non_alpha_words_ratio: 0.854
min_avg_word_length: 4
new_line_ratio: 0.053
stopwords:
- huan
- in
- ne
- de
- ten
- dios
- ya
- amo
- ica
- que
- 'no'
- "ijc\xF3n"
- ma
- nochi
- "jes\xFAs"
- se
- "por\xEDn"
- "ijcuac\xF3n"
- para
- yejuan
- cuac
- queme
- "ijcu\xEDn"
- tech
top_n_grams:
- - 2
- 1.041
- - 3
- 1.044
- - 4
- 0.915
================================================
FILE: configs/bak_Cyrl.yml
================================================
dup_line_frac: 0.217
dup_n_grams:
- - 5
- 0.128
- - 6
- 0.12
- - 7
- 0.103
- - 8
- 0.092
- - 9
- 0.084
- - 10
- 0.077
language_score: 0.9
line_punct_thr: 0.222
max_avg_word_length: 11
max_non_alpha_words_ratio: 0.72
min_avg_word_length: 3
new_line_ratio: 0.134
stopwords:
- "\u04BB\u04D9\u043C"
- "\u0431\u0443\u0439\u044B\u043D\u0441\u0430"
- "\u04BB\u044B\u0443"
- "\u043C\u0435\u043D\u04D9\u043D"
- "\u0439\u044B\u043B\u0493\u0430"
- "\u0439\u044B\u043B\u0434\u0430"
- "\u0431\u0430\u0441\u0441\u0435\u0439\u043D\u044B"
- "\u0439\u044B\u043B\u0434\u044B\u04A3"
- "\u0440\u04D9\u0441\u04D9\u0439"
- "\u0434\u04D9\u04AF\u043B\u04D9\u0442"
- "\u0442\u0438\u043A\u043B\u0435\u043C"
- "\u0431\u0443\u043B\u0430"
- "\u043A\u043E\u0434\u044B"
- "\u04E9\u0441\u04E9\u043D"
- "\u0431\u0435\u0440"
- "\u0433\u04E9"
- "\u043A\u043C"
- "\u0431\u044B\u043B"
- "\u0443\u043B"
- "\u0443\u04A1"
- "\u0439\u044B\u043B"
- "\u0443\u043D\u044B\u04A3"
- "\u0443\u0440\u044B\u043D\u043B\u0430\u0448\u04A1\u0430\u043D"
- "\u0445\u0430\u043B\u044B\u04A1"
- "\u0442\u0438\u043F"
top_n_grams:
- - 2
- 0.221
- - 3
- 0.171
- - 4
- 0.133
================================================
FILE: configs/bam_Latn.yml
================================================
dup_line_frac: 0.632
dup_n_grams:
- - 5
- 0.431
- - 6
- 0.332
- - 7
- 0.386
- - 8
- 0.325
- - 9
- 0.342
- - 10
- 0.333
language_score: 0.3
line_punct_thr: 0.0
max_avg_word_length: 17
max_non_alpha_words_ratio: 0.826
min_avg_word_length: 2
new_line_ratio: 0.25
stopwords:
- ye
- ka
- a
- ni
- la
- "b\u025B"
- na
- min
- ani
- o
- kan
- san
- dugu
top_n_grams:
- - 2
- 0.882
- - 3
- 0.781
- - 4
- 0.716
================================================
FILE: configs/ban_Latn.yml
================================================
dup_line_frac: 0.69
dup_n_grams:
- - 5
- 0.431
- - 6
- 0.422
- - 7
- 0.39
- - 8
- 0.352
- - 9
- 0.357
- - 10
- 0.296
language_score: 0.3
line_punct_thr: 0.056
max_avg_word_length: 11
max_non_alpha_words_ratio: 0.799
min_avg_word_length: 2
new_line_ratio: 0.367
stopwords:
- ring
- punika
- "san\xE9"
- inggih
- miwah
- kecamatan
- "d\xE9sa"
- bali
- puniki
- silih
- tunggil
- "indon\xE9sia"
- "kabupat\xE9n"
- aksara
- saking
top_n_grams:
- - 2
- 1.088
- - 3
- 0.979
- - 4
- 1.0
================================================
FILE: configs/bao_Latn.yml
================================================
dup_line_frac: 0.306
dup_n_grams:
- - 5
- 0.223
- - 6
- 0.204
- - 7
- 0.187
- - 8
- 0.178
- - 9
- 0.159
- - 10
- 0.148
language_score: 0.739
line_punct_thr: -1
max_avg_word_length: 9
max_non_alpha_words_ratio: 0.761
min_avg_word_length: 3
new_line_ratio: 0.056
stopwords:
- ca
- "c\u0289\u0303"
- biro
- to
- "y\u0289"
- "c\u0289\u0303ja"
- "m\u0289ja"
- "\u0129i"
- "\u0289m\u0289reco"
- tii
- "pac\u0289"
- nii
- "c\u0289\u0303re"
- pea
- mena
- bii
- o
top_n_grams:
- - 2
- 0.483
- - 3
- 0.44
- - 4
- 0.364
================================================
FILE: configs/bar_Latn.yml
================================================
dup_line_frac: 0.591
dup_n_grams:
- - 5
- 0.38
- - 6
- 0.356
- - 7
- 0.326
- - 8
- 0.301
- - 9
- 0.274
- - 10
- 0.247
language_score: 0.3
line_punct_thr: 0.0
max_avg_word_length: 17
max_non_alpha_words_ratio: 0.772
min_avg_word_length: 2
new_line_ratio: 0.25
stopwords:
- da
- de
- und
- in
- vo
- a
- is
- im
- des
- hod
top_n_grams:
- - 2
- 0.681
- - 3
- 0.635
- - 4
- 0.529
================================================
FILE: configs/bas_Latn.yml
================================================
dup_line_frac: 0.487
dup_n_grams:
- - 5
- 0.295
- - 6
- 0.27
- - 7
- 0.247
- - 8
- 0.228
- - 9
- 0.209
- - 10
- 0.194
language_score: 0.3
line_punct_thr: -1
max_avg_word_length: 7
max_non_alpha_words_ratio: 0.8
min_avg_word_length: 2
new_line_ratio: 0.091
stopwords:
- i
- a
- ba
- bi
- le
- ni
- "b\xE9"
- di
- "y\xE9"
- u
- ma
- inyu
- "y\xE9h\xF4va"
- li
- "ng\xE9da"
- "b\xF4t"
- me
top_n_grams:
- - 2
- 1.295
- - 3
- 1.161
- - 4
- 1.074
================================================
FILE: configs/bav_Latn.yml
================================================
dup_line_frac: 0.326
dup_n_grams:
- - 5
- 0.301
- - 6
- 0.256
- - 7
- 0.237
- - 8
- 0.223
- - 9
- 0.201
- - 10
- 0.204
language_score: 0.658
line_punct_thr: -1
max_avg_word_length: 6
max_non_alpha_words_ratio: 0.767
min_avg_word_length: 2
new_line_ratio: 0.05
stopwords:
- "n\u0259"
- "fa\u014B"
- "\u014Bw\u0259"
- laa
- nwi
- "v\u0259\u014B"
- "v\u0268\u0268"
- "vi\u014B"
- maa
- "t\u0268\u0301"
- "k\u0268"
- me
- taa
- nu
- "m\u0259"
- "f\u0268"
- kee
- luu
- "w\u0259"
- "l\xF9u"
- "gh\u0254"
- baa
- "v\u0268"
- yeso
top_n_grams:
- - 2
- 0.756
- - 3
- 0.768
- - 4
- 0.617
================================================
FILE: configs/bba_Latn.yml
================================================
dup_line_frac: 0.098
dup_n_grams:
- - 5
- 0.086
- - 6
- 0.082
- - 7
- 0.069
- - 8
- 0.065
- - 9
- 0.06
- - 10
- 0.053
language_score: 0.709
line_punct_thr: -1
max_avg_word_length: 7
max_non_alpha_words_ratio: 0.841
min_avg_word_length: 2
new_line_ratio: 0.071
stopwords:
- u
- ka
- ba
- n
- "k\u0251"
- bu
- i
- "b\u0251"
- ye
- win
- "s\u0254\u0254"
- ma
- "n\u025B\u025B"
- wi
- be
- "m\u025B"
- "gusun\u0254"
- koo
- yinni
- a
- ko
top_n_grams:
- - 2
- 0.208
- - 3
- 0.212
- - 4
- 0.203
================================================
FILE: configs/bbb_Latn.yml
================================================
dup_line_frac: 0.196
dup_n_grams:
- - 5
- 0.108
- - 6
- 0.097
- - 7
- 0.089
- - 8
- 0.085
- - 9
- 0.073
- - 10
- 0.068
language_score: 0.662
line_punct_thr: -1
max_avg_word_length: 7
max_non_alpha_words_ratio: 0.912
min_avg_word_length: 3
new_line_ratio: 0.05
stopwords:
- ije
- e
- fu
- bu
- ro
- ijia
- ijadufuo
- na
- ijiege
- una
- vua
- ja
- kuae
- fuone
- ma
- 'no'
- godi
- boeje
- ire
- fune
- areme
top_n_grams:
- - 2
- 0.466
- - 3
- 0.415
- - 4
- 0.333
================================================
FILE: configs/bbc_Latn.yml
================================================
dup_line_frac: 0.429
dup_n_grams:
- - 5
- 0.295
- - 6
- 0.286
- - 7
- 0.274
- - 8
- 0.258
- - 9
- 0.243
- - 10
- 0.228
language_score: 0.778
line_punct_thr: -1
max_avg_word_length: 9
max_non_alpha_words_ratio: 0.769
min_avg_word_length: 3
new_line_ratio: 0.1
stopwords:
- na
- do
- ni
- ma
- i
- tu
- di
- si
- jala
- ibana
- nasida
- dohot
- sian
- halak
- jahowa
- angka
- hamu
- songon
top_n_grams:
- - 2
- 0.674
- - 3
- 0.559
- - 4
- 0.445
================================================
FILE: configs/bbj_Latn.yml
================================================
dup_line_frac: 0.623
dup_n_grams:
- - 5
- 0.259
- - 6
- 0.248
- - 7
- 0.234
- - 8
- 0.212
- - 9
- 0.192
- - 10
- 0.178
language_score: 0.3
line_punct_thr: -1
max_avg_word_length: 6
max_non_alpha_words_ratio: 0.792
min_avg_word_length: 1
new_line_ratio: 0.059
stopwords:
- a
- "n\u0259"
- e
- "b\u0251"
- "p\u0251"
- "g\u0251"
- "l\u0259"
- "y\u0259"
- pu
- bi
- wap
- po
- pa
- "t\u0259"
- "g\u0254"
- si
- m
- "p\u0251\u0301"
- mo
- "py\u0259"
- "p\u0254"
- ba
- "s\u0254"
- "yw\u0259"
top_n_grams:
- - 2
- 0.375
- - 3
- 0.362
- - 4
- 0.311
================================================
FILE: configs/bbk_Latn.yml
================================================
dup_line_frac: 0.216
dup_n_grams:
- - 5
- 0.188
- - 6
- 0.182
- - 7
- 0.168
- - 8
- 0.158
- - 9
- 0.141
- - 10
- 0.132
language_score: 0.3
line_punct_thr: -1
max_avg_word_length: 6
max_non_alpha_words_ratio: 0.871
min_avg_word_length: 2
new_line_ratio: 0.05
stopwords:
- a
- "\u0259"
- la
- "gh\u0259\u0300"
- "gh\u0259\u0300\u014B"
- "v\u0259"
- "k\u0259"
- "vi\u02BCi"
- "di\u02BC"
- "nyi\u0300ngo\u0300\u014B"
- wen
- "v\u0259wen\u0259"
- "n\u0259\u0300"
- to
- 'no'
- ko
- li
- "a\u0300"
- "\u0259\u0300"
- "s\u0259"
- fa
- ando
- be
top_n_grams:
- - 2
- 0.263
- - 3
- 0.244
- - 4
- 0.082
================================================
FILE: configs/bbo_Latn.yml
================================================
dup_line_frac: 0.773
dup_n_grams:
- - 5
- 0.572
- - 6
- 0.58
- - 7
- 0.531
- - 8
- 0.509
- - 9
- 0.476
- - 10
- 0.446
language_score: 0.3
line_punct_thr: -1
max_avg_word_length: 6
max_non_alpha_words_ratio: 0.852
min_avg_word_length: 2
new_line_ratio: 0.062
stopwords:
- na
- "h\xF5"
- ma
- ye
- a
- ta
- "ngw\xF5"
- da
- ka
- "k\u0254"
- ne
- "m\u025B"
- ga
- wuro
- ngwona
- mane
- "ngw\u0129"
- "s\u0254ma"
- ya
- ha
- "nem\u025B"
- pepe
- yesu
- be
- ti
top_n_grams:
- - 2
- 1.148
- - 3
- 1.355
- - 4
- 0.962
================================================
FILE: configs/bbr_Latn.yml
================================================
dup_line_frac: 0.363
dup_n_grams:
- - 5
- 0.357
- - 6
- 0.351
- - 7
- 0.341
- - 8
- 0.325
- - 9
- 0.31
- - 10
- 0.291
language_score: 0.666
line_punct_thr: -1
max_avg_word_length: 7
max_non_alpha_words_ratio: 0.762
min_avg_word_length: 3
new_line_ratio: 0.053
stopwords:
- kiro
- ak
- ko
- anut
- wa
- "\xE4m\xE4n"
- roasiret
- nukan
- akan
- is
- kon
- roat
- onok
- nukas
- ro
- pak
- opok
- orip
- jisas
- ik
- aru
- akas
- karauk
- epar
- kar
- eposek
top_n_grams:
- - 2
- 0.315
- - 3
- 0.311
- - 4
- 0.296
================================================
FILE: configs/bch_Latn.yml
================================================
dup_line_frac: 0.108
dup_n_grams:
- - 5
- 0.149
- - 6
- 0.125
- - 7
- 0.096
- - 8
- 0.086
- - 9
- 0.079
- - 10
- 0.067
language_score: 0.663
line_punct_thr: -1
max_avg_word_length: 7
max_non_alpha_words_ratio: 0.821
min_avg_word_length: 3
new_line_ratio: 0.056
stopwords:
- ngan
- ga
- ta
- toa
- be
- gid
- mao
- ei
- aea
- deo
- ele
- panua
- ne
- gimi
- posanga
- pade
- kadonga
- oa
- gau
- eaba
- eine
- ede
- mambe
top_n_grams:
- - 2
- 0.449
- - 3
- 0.349
- - 4
- 0.307
================================================
FILE: configs/bci_Latn.yml
================================================
dup_line_frac: 0.393
dup_n_grams:
- - 5
- 0.244
- - 6
- 0.234
- - 7
- 0.215
- - 8
- 0.2
- - 9
- 0.18
- - 10
- 0.167
language_score: 0.671
line_punct_thr: -1
max_avg_word_length: 7
max_non_alpha_words_ratio: 0.8
min_avg_word_length: 2
new_line_ratio: 0.077
stopwords:
- be
- i
- "\u0254"
- "k\u025B"
- e
- su
- nga
- "y\u025B"
- ti
- nun
- nin
- "\u0272anmi\u025Bn"
- sa
- sran
- yo
- naan
- "b\xE9"
- wun
top_n_grams:
- - 2
- 0.779
- - 3
- 0.71
- - 4
- 0.624
================================================
FILE: configs/bcl_Latn.yml
================================================
dup_line_frac: 0.292
dup_n_grams:
- - 5
- 0.198
- - 6
- 0.185
- - 7
- 0.167
- - 8
- 0.147
- - 9
- 0.132
- - 10
- 0.119
language_score: 0.3
line_punct_thr: 0.078
max_avg_word_length: 12
max_non_alpha_words_ratio: 0.826
min_avg_word_length: 3
new_line_ratio: 0.245
stopwords:
- sa
- na
- an
- kan
- mga
- nin
- asin
- sarong
- si
- iyo
top_n_grams:
- - 2
- 0.821
- - 3
- 0.682
- - 4
- 0.571
================================================
FILE: configs/bco_Latn.yml
================================================
dup_line_frac: 0.001
dup_n_grams:
- - 5
- 0.021
- - 6
- 0.016
- - 7
- 0.012
- - 8
- 0.009
- - 9
- 0.008
- - 10
- 0.007
language_score: 0.871
line_punct_thr: -1
max_avg_word_length: 10
max_non_alpha_words_ratio: 0.794
min_avg_word_length: 4
new_line_ratio: 0.059
stopwords:
- "a\uA789no\uA789"
- kalu
- "ko\uA789lo\uA789"
- e
- to
- "amio\uA789"
- "o\uA789lia\uA789"
- "a\uA789la\uA789ta\uA789ga\uA789"
- "a\uA789na"
- "eyo\uA789"
- man
- "godeya\uA789"
- "kaluka\uA789isale"
- "iyo\uA789"
- ne
- "ko\uA789sega"
top_n_grams:
- - 2
- 0.067
- - 3
- 0.071
- - 4
- 0.033
================================================
FILE: configs/bcw_Latn.yml
================================================
dup_line_frac: 0.129
dup_n_grams:
- - 5
- 0.169
- - 6
- 0.109
- - 7
- 0.093
- - 8
- 0.086
- - 9
- 0.075
- - 10
- 0.074
language_score: 0.806
line_punct_thr: -1
max_avg_word_length: 7
max_non_alpha_words_ratio: 0.812
min_avg_word_length: 3
new_line_ratio: 0.042
stopwords:
- na
- va
- ka
- tsa
- "kw\u0259ma"
- ma
- "mb\u0259"
- ta
- "ghw\u0259y"
- "k\u0259"
- "gh\u0259shi"
- dza
- hyala
- "l\u0259"
- shi
- sa
- "mb\u0259zli"
- mba'a
- a
- "t\u0259"
- "nd\u0259"
- kaa
- "yes\u0259w"
- nza
- ya
- niy
- "ts\u0259gha"
- kwa
top_n_grams:
- - 2
- 0.203
- - 3
- 0.297
- - 4
- 0.253
================================================
FILE: configs/bdd_Latn.yml
================================================
dup_line_frac: 0.277
dup_n_grams:
- - 5
- 0.173
- - 6
- 0.165
- - 7
- 0.158
- - 8
- 0.153
- - 9
- 0.125
- - 10
- 0.119
language_score: 0.783
line_punct_thr: -1
max_avg_word_length: 11
max_non_alpha_words_ratio: 0.643
min_avg_word_length: 4
new_line_ratio: 0.071
stopwords:
- ma
- ta
- weyahina
- wete
- yehoba
- geya
- yesu
- ina
- bewa
- oina
- oinega
- hesi
- "\uA78Cina"
- coinega
- tauna
- "\uA78Coina"
top_n_grams:
- - 2
- 0.837
- - 3
- 0.813
- - 4
- 0.719
================================================
FILE: configs/bdh_Latn.yml
================================================
dup_line_frac: 0.41
dup_n_grams:
- - 5
- 0.396
- - 6
- 0.39
- - 7
- 0.381
- - 8
- 0.366
- - 9
- 0.35
- - 10
- 0.332
language_score: 0.832
line_punct_thr: -1
max_avg_word_length: 7
max_non_alpha_words_ratio: 0.833
min_avg_word_length: 2
new_line_ratio: 0.045
stopwords:
- "b\u0268"
- "n\xED"
- ledre
- "z\u0268\u0301"
- "g\u0268"
- "\uA78Cy\u1ECB"
- e
- "k\u0268\u0301"
- "\uA78Cb\u0268"
- "n\xE9e"
- ga
- "s\u0268m\u0268"
- lomo
- "z\u0268\u0301a"
- go
- "w\xE1"
- "n\u0268"
- do
- "k\u0268\u0301d\xED"
- ro
- a
- "y\xE9s\u1EE5"
- "en\xE9"
- "k\xF3o"
- "k\xE1a"
- "z\u0268\u0301ye"
top_n_grams:
- - 2
- 0.144
- - 3
- 0.149
- - 4
- 0.155
================================================
FILE: configs/bdq_Latn.yml
================================================
dup_line_frac: 0.552
dup_n_grams:
- - 5
- 0.418
- - 6
- 0.4
- - 7
- 0.373
- - 8
- 0.354
- - 9
- 0.335
- - 10
- 0.308
language_score: 0.3
line_punct_thr: -1
max_avg_word_length: 6
max_non_alpha_words_ratio: 0.736
min_avg_word_length: 2
new_line_ratio: 0.042
stopwords:
- "\u0306"
- "k\u01A1"
- "s\u01B0"
- lu
- "b\u01A1ngai"
- n
- "t\u01A1drong"
- ng
- inh
- "b\u01A1"
- "i\u0115m"
- noh
- bok kei
- dei
- "m\u0103"
- "w\u0103"
- na
- "\u01B0h"
- "t\u01A1"
- thoi
- khan
- "p\u01A1m"
- m
- "p\u0103ng"
top_n_grams:
- - 2
- 0.821
- - 3
- 0.822
- - 4
- 0.752
================================================
FILE: configs/bea_Latn.yml
================================================
dup_line_frac: 0.436
dup_n_grams:
- - 5
- 0.265
- - 6
- 0.242
- - 7
- 0.224
- - 8
- 0.215
- - 9
- 0.192
- - 10
- 0.177
language_score: 0.3
line_punct_thr: -1
max_avg_word_length: 12
max_non_alpha_words_ratio: 0.759
min_avg_word_length: 4
new_line_ratio: 0.091
stopwords:
- kahchu
- chu
- atu
- kwa
- ihe
- ayi
- ooli
- tsi
- yehti
- tane
- toowe
- otsi
- ahwole
- jesus
- oochu
- gha
- ate
top_n_grams:
- - 2
- 1.41
- - 3
- 1.221
- - 4
- 1.024
================================================
FILE: configs/bef_Latn.yml
================================================
dup_line_frac: 0.98
dup_n_grams:
- - 5
- 0.753
- - 6
- 0.749
- - 7
- 0.735
- - 8
- 0.712
- - 9
- 0.684
- - 10
- 0.652
language_score: 0.3
line_punct_thr: -1
max_avg_word_length: 10
max_non_alpha_words_ratio: 0.88
min_avg_word_length: 4
new_line_ratio: 0.059
stopwords:
- to
- huto
- luto
- ya
- yabe
- lu
- ai
- ya'ma
- hiti
- bo
- enali
- lite
- ana
- li
- hite
- lenali
- ma
- ka
top_n_grams:
- - 2
- 3.16
- - 3
- 3.364
- - 4
- 3.316
================================================
FILE: configs/bel_Cyrl.yml
================================================
dup_line_frac: 0.261
dup_n_grams:
- - 5
- 0.124
- - 6
- 0.116
- - 7
- 0.103
- - 8
- 0.094
- - 9
- 0.084
- - 10
- 0.075
language_score: 0.892
line_punct_thr: 0.143
max_avg_word_length: 11
max_non_alpha_words_ratio: 0.72
min_avg_word_length: 3
new_line_ratio: 0.216
stopwords:
- "\u0456"
- "\u0443"
- "\u045E"
- "\u0437"
- "\u043D\u0430"
- "\u0433\u043E\u0434\u0430"
- "\u0434\u0430"
- "\u0433\u043E\u0434\u0437\u0435"
- "\u043F\u0430"
- "\u0430\u0434"
- "\u0437\u0430"
- "\u0431\u044B\u045E"
- "\u043D\u0435"
- "\u0448\u0442\u043E"
- "\u0433."
- "\u0434\u043B\u044F"
- "\u0442\u0430\u043A\u0441\u0430\u043C\u0430"
- "\u0430"
- "\u044F\u0433\u043E"
- "\u044F\u043A"
- "\u0432\u043E\u0431\u043B\u0430\u0441\u0446\u0456"
- "\u043F\u0430\u0441\u043B\u044F"
top_n_grams:
- - 2
- 0.196
- - 3
- 0.153
- - 4
- 0.135
================================================
FILE: configs/bem_Latn.yml
================================================
dup_line_frac: 0.335
dup_n_grams:
- - 5
- 0.215
- - 6
- 0.205
- - 7
- 0.189
- - 8
- 0.174
- - 9
- 0.16
- - 10
- 0.145
language_score: 0.3
line_punct_thr: -1
max_avg_word_length: 13
max_non_alpha_words_ratio: 0.75
min_avg_word_length: 3
new_line_ratio: 0.111
stopwords:
- mu
- pa
- na
- ku
- kuti
- 'no'
- kwa
- ukuti
- kabili
- ya
- nga
- wa
- yehova
- lesa
- ca
- e
- ne
top_n_grams:
- - 2
- 1.376
- - 3
- 1.081
- - 4
- 0.946
================================================
FILE: configs/ben_Beng.yml
================================================
dup_line_frac: 0.203
dup_n_grams:
- - 5
- 0.118
- - 6
- 0.108
- - 7
- 0.099
- - 8
- 0.09
- - 9
- 0.082
- - 10
- 0.073
language_score: 0.872
line_punct_thr: 0.125
max_avg_word_length: 24
max_non_alpha_words_ratio: 0.8
min_avg_word_length: 3
new_line_ratio: 0.171
stopwords:
- "\u098F\u09AC\u0982"
- "\u0993"
- "\u09B9\u09AF\u09BC"
- "\u0995\u09B0\u09C7"
- "\u098F\u0995\u099F\u09BF"
- "\u09A4\u09BF\u09A8\u09BF"
- "\u0995\u09B0\u09BE"
- "\u09A5\u09C7\u0995\u09C7"
top_n_grams:
- - 2
- 0.177
- - 3
- 0.158
- - 4
- 0.147
================================================
FILE: configs/ben_Latn.yml
================================================
dup_line_frac: 0.47
dup_n_grams:
- - 5
- 0.331
- - 6
- 0.31
- - 7
- 0.286
- - 8
- 0.266
- - 9
- 0.245
- - 10
- 0.222
language_score: 0.3
line_punct_thr: -1
max_avg_word_length: 14
max_non_alpha_words_ratio: 0.8
min_avg_word_length: 3
new_line_ratio: 0.143
stopwords:
- o
- ebong
- hoy
- kore
- tini
- koren
- ei
- ekti
- er
- kora
- theke
- saale
- tar
- jonno
top_n_grams:
- - 2
- 1.06
- - 3
- 0.886
- - 4
- 0.735
================================================
FILE: configs/beq_Latn.yml
================================================
dup_line_frac: 0.828
dup_n_grams:
- - 5
- 0.578
- - 6
- 0.563
- - 7
- 0.554
- - 8
- 0.515
- - 9
- 0.504
- - 10
- 0.49
language_score: 0.3
line_punct_thr: -1
max_avg_word_length: 9
max_non_alpha_words_ratio: 0.75
min_avg_word_length: 3
new_line_ratio: 0.071
stopwords:
- mu
- na
- ti
- kuri
- me
- nde
- ngo
- beenu
- nzaambi
- bo
- ha
- ko
- ku
- bu
- ya
- yesu
- ma
top_n_grams:
- - 2
- 0.748
- - 3
- 0.813
- - 4
- 0.813
================================================
FILE: configs/bew_Latn.yml
================================================
dup_line_frac: 0.517
dup_n_grams:
- - 5
- 0.311
- - 6
- 0.29
- - 7
- 0.27
- - 8
- 0.248
- - 9
- 0.229
- - 10
- 0.209
language_score: 0.411
line_punct_thr: -1
max_avg_word_length: 12
max_non_alpha_words_ratio: 0.8
min_avg_word_length: 3
new_line_ratio: 0.077
stopwords:
- nyang
- di
- yang
- aye
- dan
- kagak
- orang
- kalo
- buat
- kite
- dari
- ntu
top_n_grams:
- - 2
- 0.381
- - 3
- 0.346
- - 4
- 0.298
================================================
FILE: configs/bex_Latn.yml
================================================
dup_line_frac: 0.18
dup_n_grams:
- - 5
- 0.226
- - 6
- 0.166
- - 7
- 0.15
- - 8
- 0.15
- - 9
- 0.133
- - 10
- 0.116
language_score: 0.83
line_punct_thr: -1
max_avg_word_length: 6
max_non_alpha_words_ratio: 0.829
min_avg_word_length: 2
new_line_ratio: 0.056
stopwords:
- ma
- "r\u0254"
- bo
- ti
- ne
- "m\xEF"
- "\uA78Cba"
- kina
- ga
- "\u014Bg\xEF"
- na
- mo
- "b\u0254"
- ame
- lende
- "g\u0254"
- te
- "l\xEFj\xEB"
- "\uA78Cdeni"
- "d\u0254"
- nima
- di
- nime
- tine
- "b\u0254ko\uA78Cba"
- zi
- "d\xEB"
- ba
top_n_grams:
- - 2
- 0.175
- - 3
- 0.292
- - 4
- 0.256
================================================
FILE: configs/bfd_Latn.yml
================================================
dup_line_frac: 0.231
dup_n_grams:
- - 5
- 0.206
- - 6
- 0.183
- - 7
- 0.151
- - 8
- 0.143
- - 9
- 0.132
- - 10
- 0.124
language_score: 0.882
line_punct_thr: -1
max_avg_word_length: 6
max_non_alpha_words_ratio: 0.857
min_avg_word_length: 2
new_line_ratio: 0.048
stopwords:
- a
- "m\u0259"
- aa
- "l\u025B"
- "n\u0268"
- "b\u0268"
- bo
- "n\u0268\u0302"
- "\xE0"
- mbo
- "a\u0300"
- "n\u0268\u0300"
- ka
- "m\u0259\u0300"
- "\u0268"
- kaa
- ghu
- "y\xECi"
- "yi\u0300i"
- yi
top_n_grams:
- - 2
- 0.139
- - 3
- 0.19
- - 4
- 0.162
================================================
FILE: configs/bfo_Latn.yml
================================================
dup_line_frac: 0.519
dup_n_grams:
- - 5
- 0.349
- - 6
- 0.392
- - 7
- 0.184
- - 8
- 0.175
- - 9
- 0.166
- - 10
- 0.154
language_score: 0.635
line_punct_thr: -1
max_avg_word_length: 5
max_non_alpha_words_ratio: 0.81
min_avg_word_length: 2
new_line_ratio: 0.05
stopwords:
- a
- na
- "\u028B"
- "\u0269\u0303"
- "n\u0269"
- ba
- "\u0269"
- wa
- "ny\u0269"
- ma
- "naa\u014Bm\u0269n"
- ala
- "s\u0269"
- be
- "l\u025B"
- "m\u0269"
- yel
top_n_grams:
- - 2
- 1.558
- - 3
- 1.999
- - 4
- 2.181
================================================
FILE: configs/bgr_Latn.yml
================================================
dup_line_frac: 0.234
dup_n_grams:
- - 5
- 0.187
- - 6
- 0.184
- - 7
- 0.166
- - 8
- 0.159
- - 9
- 0.148
- - 10
- 0.138
language_score: 0.712
line_punct_thr: -1
max_avg_word_length: 7
max_non_alpha_words_ratio: 0.8
min_avg_word_length: 2
new_line_ratio: 0.059
stopwords:
- a
- hen
- chun
- chu
- an
- tla
- mi
- nih
- le
- ka
- ah
- ti
- asi
- nan
- lo
- na
- ding
- sinah
- leh
- hawng
- um
- rawh
- hi
- pathian
- lai
- kan
- thu
top_n_grams:
- - 2
- 0.263
- - 3
- 0.224
- - 4
- 0.208
================================================
FILE: configs/bgs_Latn.yml
================================================
dup_line_frac: 0.401
dup_n_grams:
- - 5
- 0.402
- - 6
- 0.395
- - 7
- 0.383
- - 8
- 0.367
- - 9
- 0.352
- - 10
- 0.329
language_score: 0.3
line_punct_thr: -1
max_avg_word_length: 9
max_non_alpha_words_ratio: 0.8
min_avg_word_length: 3
new_line_ratio: 0.059
stopwords:
- "t\xF4"
- na
- ka
- "kat\xF4"
- mga
- ta
- tun
- asta
- din
- dan
- manama
- si
- "manub\xF9"
- ku
- sikandin
- su
- yu
- asal
- "\xE1nd\xE0"
- "k\xF3"
- ki
top_n_grams:
- - 2
- 0.592
- - 3
- 0.592
- - 4
- 0.542
================================================
FILE: configs/bgt_Latn.yml
================================================
dup_line_frac: 0.943
dup_n_grams:
- - 5
- 0.829
- - 6
- 0.827
- - 7
- 0.851
- - 8
- 0.751
- - 9
- 0.806
- - 10
- 0.744
language_score: 0.3
line_punct_thr: -1
max_avg_word_length: 8
max_non_alpha_words_ratio: 0.846
min_avg_word_length: 3
new_line_ratio: 0.05
stopwords:
- na
- ke
- a
- komi
- kena
- kori
- eigna
- god
- keda
- tinoni
- boi
- imanea
- inau
- ma
- fata
- me
- gi
- ku
- eia
- iangeni
- mono
top_n_grams:
- - 2
- 3.47
- - 3
- 3.78
- - 4
- 3.803
================================================
FILE: configs/bgz_Latn.yml
================================================
dup_line_frac: 0.678
dup_n_grams:
- - 5
- 0.562
- - 6
- 0.563
- - 7
- 0.561
- - 8
- 0.54
- - 9
- 0.534
- - 10
- 0.521
language_score: 0.616
line_punct_thr: -1
max_avg_word_length: 10
max_non_alpha_words_ratio: 0.767
min_avg_word_length: 4
new_line_ratio: 0.067
stopwords:
- doi
- tukon
- mo
- mian
- yana
- bisa
- yanila
- yaku
- komuyu
- yesus
- komian
- aki
- kona
- doiya
- do
- ko
- maka
- koidan
- bai
- sabab
- daano
- komo
- sulano
- naikon
- sasaibino
top_n_grams:
- - 2
- 1.187
- - 3
- 0.803
- - 4
- 0.759
================================================
FILE: configs/bhg_Latn.yml
================================================
dup_line_frac: 0.29
dup_n_grams:
- - 5
- 0.953
- - 6
- 0.939
- - 7
- 0.946
- - 8
- 0.908
- - 9
- 0.871
- - 10
- 0.846
language_score: 0.3
line_punct_thr: -1
max_avg_word_length: 8
max_non_alpha_words_ratio: 0.778
min_avg_word_length: 3
new_line_ratio: 0.059
stopwords:
- edo
- awa
- embo
- da
- ainda
- ango
- yai
- ge
- mi
- yesu
- god
- ae
- sisina
- imo
- de
- ari
- ata
- ami
- iji
- na
top_n_grams:
- - 2
- 1.858
- - 3
- 2.133
- - 4
- 2.299
================================================
FILE: configs/bhl_Latn.yml
================================================
dup_line_frac: 0.285
dup_n_grams:
- - 5
- 0.47
- - 6
- 0.454
- - 7
- 0.434
- - 8
- 0.409
- - 9
- 0.388
- - 10
- 0.363
language_score: 0.631
line_punct_thr: -1
max_avg_word_length: 9
max_non_alpha_words_ratio: 0.732
min_avg_word_length: 3
new_line_ratio: 0.038
stopwords:
- e
- te
- em
- kunum
- so
- be
- dim
- weng
- kale
- mak
- alik
- sunbin
- fian
- got
- ibolow
- kawtiw
- i
- elo
- kuw
- beem
- ding
- kasike
- yu
- keko
- waneng
- im
top_n_grams:
- - 2
- 1.094
- - 3
- 1.065
- - 4
- 0.917
================================================
FILE: configs/bho_Deva.yml
================================================
dup_line_frac: 0.294
dup_n_grams:
- - 5
- 0.163
- - 6
- 0.143
- - 7
- 0.131
- - 8
- 0.12
- - 9
- 0.111
- - 10
- 0.1
language_score: 0.315
line_punct_thr: 0.143
max_avg_word_length: 13
max_non_alpha_words_ratio: 0.849
min_avg_word_length: 2
new_line_ratio: 0.212
stopwords:
- "\u0915\u0947"
- "\u092E\u0947\u0902"
- "\u0906"
- "\u0938\u0947"
- "\u092C\u093E"
- "\u0908"
- "\u092C\u093E\u091F\u0947"
- "\u0938\u092D"
- "\u090F\u0917\u094B"
top_n_grams:
- - 2
- 0.333
- - 3
- 0.274
- - 4
- 0.237
================================================
FILE: configs/bhp_Latn.yml
================================================
dup_line_frac: 0.65
dup_n_grams:
- - 5
- 0.474
- - 6
- 0.453
- - 7
- 0.418
- - 8
- 0.376
- - 9
- 0.351
- - 10
- 0.323
language_score: 0.3
line_punct_thr: -1
max_avg_word_length: 9
max_non_alpha_words_ratio: 0.78
min_avg_word_length: 3
new_line_ratio: 0.067
stopwords:
- "\xAFdi"
- dou
- "\xAFba"
- ma
- ruma
- ede
- ro
- ra
- nahu
- sia
- "nggomi\xAFdoho"
- "sia\xAFdoho"
- wati
- hatalla
- isa
- la
- ade
- kai
- "\xAFbara"
- ake
top_n_grams:
- - 2
- 0.815
- - 3
- 0.809
- - 4
- 0.728
================================================
FILE: configs/bhw_Latn.yml
================================================
dup_line_frac: 0.237
dup_n_grams:
- - 5
- 0.191
- - 6
- 0.176
- - 7
- 0.17
- - 8
- 0.159
- - 9
- 0.148
- - 10
- 0.134
language_score: 0.3
line_punct_thr: -1
max_avg_word_length: 9
max_non_alpha_words_ratio: 0.769
min_avg_word_length: 3
new_line_ratio: 0.1
stopwords:
- ro
- ma
- fa
- na
- yahwe
- "\u1E07e"
- faro
- "\u1E07a"
- roi
- kaku
- ya
- i
- kuker
- rosai
- snonkaku
- sya
- nari
- allah
- kwar
top_n_grams:
- - 2
- 1.736
- - 3
- 1.51
- - 4
- 1.339
================================================
FILE: configs/bhz_Latn.yml
================================================
dup_line_frac: 0.381
dup_n_grams:
- - 5
- 0.284
- - 6
- 0.259
- - 7
- 0.236
- - 8
- 0.211
- - 9
- 0.189
- - 10
- 0.165
language_score: 0.3
line_punct_thr: -1
max_avg_word_length: 10
max_non_alpha_words_ratio: 0.621
min_avg_word_length: 3
new_line_ratio: 0.062
stopwords:
- i
- to
- iti
- pue
- hai
- tauna
- ala
- iesu
- ina
- kai
- ti'ara
- upu
- "ag\xE1i\xE1n\xE1"
- "l\xE1wi"
- lia
- hane'i
- ara
- bona
top_n_grams:
- - 2
- 0.675
- - 3
- 0.505
- - 4
- 0.291
================================================
FILE: configs/bib_Latn.yml
================================================
dup_line_frac: 0.245
dup_n_grams:
- - 5
- 0.242
- - 6
- 0.192
- - 7
- 0.16
- - 8
- 0.153
- - 9
- 0.145
- - 10
- 0.134
language_score: 0.9
line_punct_thr: -1
max_avg_word_length: 7
max_non_alpha_words_ratio: 0.8
min_avg_word_length: 1
new_line_ratio: 0.053
stopwords:
- a
- "b\u0269"
- "\u028B"
- m
- n
- "\u014B"
- "w\u0254\u0254"
- ma
- "k\u028B"
- k'a
- an
- "n\u0269"
- "m\u0254\u0254"
- "\u028A"
- "k\u0269"
- kan
- ba
- woso
- "aw\u0254\u0254"
- ka
- "\u0269"
- da
- n'a
- y'a
top_n_grams:
- - 2
- 0.18
- - 3
- 0.301
- - 4
- 0.268
================================================
FILE: configs/big_Latn.yml
================================================
dup_line_frac: 0.238
dup_n_grams:
- - 5
- 0.231
- - 6
- 0.214
- - 7
- 0.187
- - 8
- 0.179
- - 9
- 0.166
- - 10
- 0.149
language_score: 0.637
line_punct_thr: -1
max_avg_word_length: 9
max_non_alpha_words_ratio: 0.878
min_avg_word_length: 4
new_line_ratio: 0.056
stopwords:
- logo
- keya
- purik
- ono
- miza
- puwili
- mizi
- ne
- pi
- ini
- pelik
- ngago
- kapura
top_n_grams:
- - 2
- 0.974
- - 3
- 0.824
- - 4
- 0.652
================================================
FILE: configs/bim_Latn.yml
================================================
dup_line_frac: 0.352
dup_n_grams:
- - 5
- 0.297
- - 6
- 0.274
- - 7
- 0.261
- - 8
- 0.243
- - 9
- 0.232
- - 10
- 0.213
language_score: 0.741
line_punct_thr: -1
max_avg_word_length: 7
max_non_alpha_words_ratio: 0.812
min_avg_word_length: 2
new_line_ratio: 0.067
stopwords:
- ki
- na
- nan
- a
- u
- nba
- n
- tee
- bi
- ni
- yennu
- li
- i
- saa
- din
- "\u014Baan"
- kur
- paak
- be
top_n_grams:
- - 2
- 0.717
- - 3
- 0.631
- - 4
- 0.562
================================================
FILE: configs/bin_Latn.yml
================================================
dup_line_frac: 0.95
dup_n_grams:
- - 5
- 0.643
- - 6
- 0.608
- - 7
- 0.587
- - 8
- 0.565
- - 9
- 0.541
- - 10
- 0.508
language_score: 0.3
line_punct_thr: -1
max_avg_word_length: 8
max_non_alpha_words_ratio: 0.8
min_avg_word_length: 2
new_line_ratio: 0.083
stopwords:
- ne
- vbe
- gha
- na
- ya
- "\u1ECD"
- ima
- "n\u1ECD"
- iran
- "\u1EB9re"
- "w\u1EB9\u1EB9"
- e
- ma
- emwi
- ru
- ghi
- "mw\u1EB9"
- "\u1ECDghe"
- emwa
- jehova
- ye
- keghi
- ni
- i
- khian
- rre
top_n_grams:
- - 2
- 1.046
- - 3
- 1.054
- - 4
- 0.992
================================================
FILE: configs/bis_Latn.yml
================================================
dup_line_frac: 0.41
dup_n_grams:
- - 5
- 0.447
- - 6
- 0.432
- - 7
- 0.415
- - 8
- 0.398
- - 9
- 0.377
- - 10
- 0.352
language_score: 0.516
line_punct_thr: 0.25
max_avg_word_length: 10
max_non_alpha_words_ratio: 0.87
min_avg_word_length: 3
new_line_ratio: 0.25
stopwords:
- blong
- i
- long
- ol
- hem
- wan
- stet
- mo
- yunaeted
- em
- bin
- pipol
- stap
- man
- akta
- amerika
- we
- singsing
top_n_grams:
- - 2
- 1.695
- - 3
- 1.722
- - 4
- 1.649
================================================
FILE: configs/biu_Latn.yml
================================================
dup_line_frac: 0.603
dup_n_grams:
- - 5
- 0.573
- - 6
- 0.549
- - 7
- 0.541
- - 8
- 0.516
- - 9
- 0.487
- - 10
- 0.46
language_score: 0.3
line_punct_thr: -1
max_avg_word_length: 8
max_non_alpha_words_ratio: 0.8
min_avg_word_length: 2
new_line_ratio: 0.062
stopwords:
- a
- an
- nit
- chu
- khah
- khan
- ti
- nin
- ki
- neh
- "t\xE2k"
- mi
- pathian
- om
- ni
- kha
- ziangah
- rang
top_n_grams:
- - 2
- 2.066
- - 3
- 2.192
- - 4
- 2.149
================================================
FILE: configs/biv_Latn.yml
================================================
dup_line_frac: 0.157
dup_n_grams:
- - 5
- 0.206
- - 6
- 0.128
- - 7
- 0.106
- - 8
- 0.101
- - 9
- 0.096
- - 10
- 0.085
language_score: 0.822
line_punct_thr: -1
max_avg_word_length: 7
max_non_alpha_words_ratio: 0.8
min_avg_word_length: 2
new_line_ratio: 0.056
stopwords:
- a
- na
- ba
- "l\u025B"
- "w\u028B"
- ka
- "y\u0269"
- "\u025B"
- "\u0269"
- "n\u0269"
- "y\u025Br"
- "n\xE3a\u014Bm\u0269n"
- naa
- jaa
- n
- "p\u0254"
- wa
- be
- "s\u0269"
- "t\u0269"
- "\u0269ka"
- "l\u0254"
- ma
top_n_grams:
- - 2
- 0.221
- - 3
- 0.352
- - 4
- 0.312
================================================
FILE: configs/bjn_Arab.yml
================================================
dup_line_frac: 0.63
dup_n_grams:
- - 5
- 0.499
- - 6
- 0.476
- - 7
- 0.458
- - 8
- 0.426
- - 9
- 0.396
- - 10
- 0.361
language_score: 0.3
line_punct_thr: -1
max_avg_word_length: 9
max_non_alpha_words_ratio: 0.771
min_avg_word_length: 3
new_line_ratio: 0.091
stopwords:
- "\u060C"
- "\u0646\u06A0"
- "\u0648\u0627\u0646"
- "\u0644\u0627\u0648\u0646"
- "\u062F"
- "\u062F\u064A"
- "\u062F\u0627\u0644\u0645"
- "\u062F\u0631\u064A"
- "\u0643\u0627\u062F\u0627"
- "\u0646\u0627\u06A0"
top_n_grams:
- - 2
- 1.108
- - 3
- 1.168
- - 4
- 1.086
================================================
FILE: configs/bjn_Latn.yml
================================================
dup_line_frac: 0.856
dup_n_grams:
- - 5
- 0.497
- - 6
- 0.406
- - 7
- 0.388
- - 8
- 0.355
- - 9
- 0.327
- - 10
- 0.303
language_score: 0.3
line_punct_thr: 0.25
max_avg_word_length: 15
max_non_alpha_words_ratio: 0.778
min_avg_word_length: 3
new_line_ratio: 0.18
stopwords:
- di
- nang
- wan
- adalah
- kacamatan
- indunisia
- kampung
- prupinsi
- kabupatin
- kalimantan
- lawan
- matan
- dalam
- sabuah
top_n_grams:
- - 2
- 0.703
- - 3
- 0.685
- - 4
- 0.598
================================================
FILE: configs/bjp_Latn.yml
================================================
dup_line_frac: 0.349
dup_n_grams:
- - 5
- 0.512
- - 6
- 0.499
- - 7
- 0.493
- - 8
- 0.476
- - 9
- 0.456
- - 10
- 0.433
language_score: 0.3
line_punct_thr: -1
max_avg_word_length: 6
max_non_alpha_words_ratio: 0.809
min_avg_word_length: 2
new_line_ratio: 0.056
stopwords:
- ka
- i
- na
- ri
- le
- ke
- ae
- u
- foron
- gam
- biil
- ta
- ma
- isi
- e
- la
- iesu
- in
- tom
- ia
- lo
- ini
- aragii
- iau
- fanu
top_n_grams:
- - 2
- 2.227
- - 3
- 2.477
- - 4
- 2.503
================================================
FILE: configs/bjr_Latn.yml
================================================
dup_line_frac: 0.089
dup_n_grams:
- - 5
- 0.09
- - 6
- 0.084
- - 7
- 0.078
- - 8
- 0.071
- - 9
- 0.066
- - 10
- 0.057
language_score: 0.841
line_punct_thr: -1
max_avg_word_length: 11
max_non_alpha_words_ratio: 0.862
min_avg_word_length: 4
new_line_ratio: 0.067
stopwords:
- faqa
- "s\xEDa"
- mi
- ufa
- "min\xE1"
- "mis\xE1"
- "nar\xED"
- "qin\xE9e"
- "\xEDnnee"
- "maas\xE1"
- kai
- "faiq\xED"
- "\xE1nutuna"
- "m\xE1ridanoo"
- "qin\xED"
- fee
- "q\xEDmasee"
top_n_grams:
- - 2
- 0.129
- - 3
- 0.114
- - 4
- 0.094
================================================
FILE: configs/bjv_Latn.yml
================================================
dup_line_frac: 0.177
dup_n_grams:
- - 5
- 0.149
- - 6
- 0.144
- - 7
- 0.12
- - 8
- 0.112
- - 9
- 0.105
- - 10
- 0.096
language_score: 0.787
line_punct_thr: -1
max_avg_word_length: 6
max_non_alpha_words_ratio: 0.786
min_avg_word_length: 2
new_line_ratio: 0.048
stopwords:
- "k\u0268"
- "t\u0268"
- je
- "\u0259"
- "kad\u0268"
- e
- ta
- "k\u0268n"
- m
- a
- "n\u0259"
- "luw\u0259"
- al
- "ne\u0330"
- me
- "d\u0254"
- "d\u0268je"
- "n\u0268ng\u0259"
- "l\u0259"
- ra
- "ad\u0268"
- "d\u0259w"
top_n_grams:
- - 2
- 0.15
- - 3
- 0.224
- - 4
- 0.119
================================================
FILE: configs/bkd_Latn.yml
================================================
dup_line_frac: 0.297
dup_n_grams:
- - 5
- 0.302
- - 6
- 0.282
- - 7
- 0.284
- - 8
- 0.26
- - 9
- 0.252
- - 10
- 0.237
language_score: 0.334
line_punct_thr: -1
max_avg_word_length: 7
max_non_alpha_words_ratio: 0.857
min_avg_word_length: 3
new_line_ratio: 0.062
stopwords:
- ha
- hu
- sa
- daw
- ta
- mga
- ku
- din
- duun
- en
- dios
- gayed
- ba
- iyan
- su
- nuy
- si
- daan
- "har\xEC"
- dan
- "diy\xE0"
- etaw
- haena
- sidan
- hi
top_n_grams:
- - 2
- 1.005
- - 3
- 0.909
- - 4
- 0.744
================================================
FILE: configs/bkl_Latn.yml
================================================
dup_line_frac: 0.521
dup_n_grams:
- - 5
- 0.359
- - 6
- 0.332
- - 7
- 0.314
- - 8
- 0.293
- - 9
- 0.273
- - 10
- 0.255
language_score: 0.3
line_punct_thr: -1
max_avg_word_length: 9
max_non_alpha_words_ratio: 0.793
min_avg_word_length: 3
new_line_ratio: 0.045
stopwords:
- jei
- ga
- angtane
- aa
- ane
- jeiserem
- ai
- jam
- uwa
- aamei
- gam
- jes
- ne
- ge
- jem
- temawer
- yesus
- sanbagiri
- taterisi
- seyafter
top_n_grams:
- - 2
- 0.88
- - 3
- 0.804
- - 4
- 0.605
================================================
FILE: configs/bkq_Latn.yml
================================================
dup_line_frac: 0.033
dup_n_grams:
- - 5
- 0.027
- - 6
- 0.026
- - 7
- 0.025
- - 8
- 0.024
- - 9
- 0.022
- - 10
- 0.02
language_score: 0.3
line_punct_thr: -1
max_avg_word_length: 10
max_non_alpha_words_ratio: 0.722
min_avg_word_length: 4
new_line_ratio: 0.062
stopwords:
- deus
- modo
- "war\xE2"
- jesus
- myani
- ise
- "w\xE2g\xE2"
- "ol\xE2"
- awyly
- xina
- ara
- "m\xE2k\xE2"
- kely
- "lel\xE2"
- aguely
- "ur\xE2"
top_n_grams:
- - 2
- 0.119
- - 3
- 0.116
- - 4
- 0.109
================================================
FILE: configs/bku_Latn.yml
================================================
dup_line_frac: 0.405
dup_n_grams:
- - 5
- 0.309
- - 6
- 0.297
- - 7
- 0.271
- - 8
- 0.258
- - 9
- 0.236
- - 10
- 0.221
language_score: 0.3
line_punct_thr: -1
max_avg_word_length: 9
max_non_alpha_words_ratio: 0.81
min_avg_word_length: 3
new_line_ratio: 0.062
stopwords:
- manga
- ka
- fag
- ha
- is
- taw
- diyos
- 'no'
- has
- in
- wa
- hanggan
- hisos
- kitay
- hanya
- ham
- it
- hayo
- wan
- yadi
- idwa
- dapat
- ta
- angko
- tam
top_n_grams:
- - 2
- 0.944
- - 3
- 0.777
- - 4
- 0.662
================================================
FILE: configs/bkv_Latn.yml
================================================
dup_line_frac: 0.426
dup_n_grams:
- - 5
- 0.493
- - 6
- 0.463
- - 7
- 0.451
- - 8
- 0.429
- - 9
- 0.422
- - 10
- 0.376
language_score: 0.3
line_punct_thr: -1
max_avg_word_length: 6
max_non_alpha_words_ratio: 0.808
min_avg_word_length: 2
new_line_ratio: 0.053
stopwords:
- e
- a
- dee
- yi
- i
- he
- eni
- ba
- ngin
- ka
- amin
- abe
- iyem
- re
- atabuchi
- imin
- "\xE8"
- kung
- angin
- ne
- shi
- woo
- be
- ab'e
- mang
top_n_grams:
- - 2
- 1.973
- - 3
- 2.015
- - 4
- 1.854
================================================
FILE: configs/bla_Latn.yml
================================================
dup_line_frac: 0.455
dup_n_grams:
- - 5
- 0.917
- - 6
- 0.917
- - 7
- 0.914
- - 8
- 0.907
- - 9
- 0.897
- - 10
- 0.885
language_score: 0.505
line_punct_thr: -1
max_avg_word_length: 21
max_non_alpha_words_ratio: 0.667
min_avg_word_length: 4
new_line_ratio: 0.143
stopwords:
- ki
- jesus
- "ann\u014Fk"
- an'iu
- spots'im
- nin'a
- annik
- "an'\u012Dstsiuax"
- matap'pix
- okku'i
- an'iau
- anniks'isk
- "n\u012Dn'au"
- "an'\u012Dstsiuaie"
top_n_grams:
- - 2
- 3.919
- - 3
- 5.521
- - 4
- 6.787
================================================
FILE: configs/blh_Latn.yml
================================================
dup_line_frac: 0.204
dup_n_grams:
- - 5
- 0.169
- - 6
- 0.165
- - 7
- 0.138
- - 8
- 0.129
- - 9
- 0.122
- - 10
- 0.111
language_score: 0.9
line_punct_thr: -1
max_avg_word_length: 6
max_non_alpha_words_ratio: 0.848
min_avg_word_length: 2
new_line_ratio: 0.053
stopwords:
- "d\xE8"
- "w\u0254\u0300"
- "w\u0254"
- "n\u025B\u0300"
- "\xE8"
- "n\xF9"
- "w\xF2"
- "n\xE0"
- e
- "\u014Bg\xE0la"
- wo
- "w\u0254\u0300l\u0254\u0301"
- de
- "gb\u01D0n"
- ve
- "\xE8\xEC"
- "jis\u025B\u0300"
- "s\u025Bl\u025B"
- "d\xED"
- "d\u0254\u0300\u0254\u0300"
- na
- "\u014Bw\xF9n\xF9"
- "m\xE1"
top_n_grams:
- - 2
- 0.184
- - 3
- 0.26
- - 4
- 0.129
================================================
FILE: configs/blk_Mymr.yml
================================================
dup_line_frac: 0.848
dup_n_grams:
- - 5
- 0.198
- - 6
- 0.187
- - 7
- 0.171
- - 8
- 0.15
- - 9
- 0.141
- - 10
- 0.12
language_score: 0.529
line_punct_thr: 0.381
max_avg_word_length: 20
max_non_alpha_words_ratio: 0.734
min_avg_word_length: 4
new_line_ratio: 0.13
stopwords:
- "\uAA7B"
- "\u108F"
- "\u1000"
- "\u1000\u102D\u102F"
- "\u1010\u1032\u1037"
- "\u1004\u102B"
- "\u1011\u102D\u102F"
- "\u1015\u102B"
- "\u101E\u103D\u1030"
top_n_grams:
- - 2
- 0.432
- - 3
- 0.418
- - 4
- 0.38
================================================
FILE: configs/blt_Latn.yml
================================================
dup_line_frac: 0.487
dup_n_grams:
- - 5
- 0.427
- - 6
- 0.413
- - 7
- 0.403
- - 8
- 0.375
- - 9
- 0.357
- - 10
- 0.322
language_score: 0.3
line_punct_thr: -1
max_avg_word_length: 10
max_non_alpha_words_ratio: 0.571
min_avg_word_length: 3
new_line_ratio: 0.04
stopwords:
- "ch\u1EA3u"
- "ph\u1EE7"
- "h\u1EA3\u01B0"
- "c\u1ECD"
- "\u0111\u1EA3y"
- "c\u1ED1n"
- "p\xEAn"
- "n\u1EB7n"
- tan
- "ch\xED"
- "p\u1EE9ng"
- "m\xED"
- pua
- "m\xE1"
- "gi\xEA\u2011'su"
- "ph\u1EA1"
- "h\xE1u"
- "n\u1ECDng"
- "ch\u1EAFng"
- "s\u01B0\u1EDBng"
- "kh\u1ECFi"
- pay
- "l\u1EB9o"
- "qu\xE1m"
- au
- "d\xFA"
- sau
- "cha\u01B0"
- "d\u1EC7t"
top_n_grams:
- - 2
- 1.096
- - 3
- 1.08
- - 4
- 0.418
================================================
FILE: configs/blw_Latn.yml
================================================
dup_line_frac: 0.63
dup_n_grams:
- - 5
- 0.54
- - 6
- 0.52
- - 7
- 0.492
- - 8
- 0.46
- - 9
- 0.427
- - 10
- 0.394
language_score: 0.3
line_punct_thr: -1
max_avg_word_length: 7
max_non_alpha_words_ratio: 0.805
min_avg_word_length: 3
new_line_ratio: 0.05
stopwords:
- hen
- way
- an
- ah
- yag
- anchi
- ya
- "ag\xE9"
- te
- apudyus
- wat
- anchichay
- cha
- ammag
- ta
- hiya
top_n_grams:
- - 2
- 1.1
- - 3
- 1.135
- - 4
- 1.046
================================================
FILE: configs/blz_Latn.yml
================================================
dup_line_frac: 0.129
dup_n_grams:
- - 5
- 0.139
- - 6
- 0.127
- - 7
- 0.113
- - 8
- 0.105
- - 9
- 0.095
- - 10
- 0.085
language_score: 0.875
line_punct_thr: -1
max_avg_word_length: 9
max_non_alpha_words_ratio: 0.695
min_avg_word_length: 3
new_line_ratio: 0.056
stopwords:
- men
- i
- na
- ka
- mian
- ia
- iya'a
- a
- raaya'a
- kuu
- alaata'ala
- yaku
- bo
- yesus
- sian
- kasee
- se
- koi
- upa
- gause
- tia
top_n_grams:
- - 2
- 0.139
- - 3
- 0.138
- - 4
- 0.128
================================================
FILE: configs/bmh_Latn.yml
================================================
dup_line_frac: 0.481
dup_n_grams:
- - 5
- 0.354
- - 6
- 0.341
- - 7
- 0.334
- - 8
- 0.31
- - 9
- 0.282
- - 10
- 0.266
language_score: 0.3
line_punct_thr: -1
max_avg_word_length: 8
max_non_alpha_words_ratio: 0.765
min_avg_word_length: 3
new_line_ratio: 0.053
stopwords:
- go
- ag
- ze
- nug
- uwait
- duailel
- nugau
- gonugau
- du
- iz
- igul
- dudu
- ebu
- agal
- i
- mui
- yesus
- ig
- eg
- en
- ipal
- petak
- tam
- tub
- naliu
top_n_grams:
- - 2
- 1.553
- - 3
- 1.534
- - 4
- 1.427
================================================
FILE: configs/bmk_Latn.yml
================================================
dup_line_frac: 0.62
dup_n_grams:
- - 5
- 0.472
- - 6
- 0.464
- - 7
- 0.45
- - 8
- 0.433
- - 9
- 0.415
- - 10
- 0.388
language_score: 0.3
line_punct_thr: -1
max_avg_word_length: 8
max_non_alpha_words_ratio: 0.75
min_avg_word_length: 3
new_line_ratio: 0.071
stopwords:
- ma
- ina
- da
- na
- yesu
- ivi
- rava
- iya
- ku
- touna
- bade
- ivavo
- meimeituwa
- sago
- ita
- bo
- nuke
- asi
- kubina
top_n_grams:
- - 2
- 2.283
- - 3
- 2.377
- - 4
- 2.286
================================================
FILE: configs/bmq_Latn.yml
================================================
dup_line_frac: 0.611
dup_n_grams:
- - 5
- 0.511
- - 6
- 0.483
- - 7
- 0.469
- - 8
- 0.453
- - 9
- 0.441
- - 10
- 0.423
language_score: 0.3
line_punct_thr: -1
max_avg_word_length: 7
max_non_alpha_words_ratio: 0.821
min_avg_word_length: 2
new_line_ratio: 0.062
stopwords:
- a
- lo
- mi
- "\u0253a"
- "n\u025B"
- ma
- mu
- "\u0253\u025B\u025B"
- li
- ho
- wa
- na
- un
- bun
- yi
- we
- han
- "dee\u0253enu"
- o
- waa
- wo
- biyo
top_n_grams:
- - 2
- 1.3
- - 3
- 1.257
- - 4
- 1.142
================================================
FILE: configs/bmr_Latn.yml
================================================
dup_line_frac: 0.312
dup_n_grams:
- - 5
- 0.336
- - 6
- 0.309
- - 7
- 0.294
- - 8
- 0.303
- - 9
- 0.271
- - 10
- 0.273
language_score: 0.3
line_punct_thr: -1
max_avg_word_length: 15
max_non_alpha_words_ratio: 0.75
min_avg_word_length: 5
new_line_ratio: 0.1
stopwords:
- bu
- moocaani
- icano
- "am\u0268\u0268hai"
- nooboro
- uujoho
- jaanegui
- "m\u0268\u0268ro"
- "jaanot\u0268"
- "\xBF"
- jaabo
- imino
- jesu
- diiboco
- "jill\u0268"
- "sihid\u0268"
- "am\u0268\u0268haico"
- "pary\u0268"
top_n_grams:
- - 2
- 1.229
- - 3
- 1.326
- - 4
- 1.303
================================================
FILE: configs/bmu_Latn.yml
================================================
dup_line_frac: 0.218
dup_n_grams:
- - 5
- 0.071
- - 6
- 0.057
- - 7
- 0.053
- - 8
- 0.048
- - 9
- 0.04
- - 10
- 0.034
language_score: 0.859
line_punct_thr: -1
max_avg_word_length: 9
max_non_alpha_words_ratio: 0.795
min_avg_word_length: 4
new_line_ratio: 0.062
stopwords:
- mi
- "m\xF6n\xF6"
- "mew\xF6"
- aka
- "qah\xF6"
- keu
- "kew\xF6"
- dop
- ambazip
top_n_grams:
- - 2
- 0.227
- - 3
- 0.193
- - 4
- 0.163
================================================
FILE: configs/bmv_Latn.yml
================================================
dup_line_frac: 0.37
dup_n_grams:
- - 5
- 0.341
- - 6
- 0.336
- - 7
- 0.338
- - 8
- 0.321
- - 9
- 0.296
- - 10
- 0.265
language_score: 0.34
line_punct_thr: -1
max_avg_word_length: 7
max_non_alpha_words_ratio: 0.862
min_avg_word_length: 2
new_line_ratio: 0.053
stopwords:
- a
- na
- hi
- yi
- ha
- "gha\u0300n"
- "a\u0300"
- mu
- "wu\u0300"
- "k\u0259"
- "mo\u0302"
- "gh\u0268"
- ma
- "gh\u0268na"
- "ni\u0300"
- wu
- ni
- gha
- "gh\u0268t"
- te
- "hi\u0300"
- "wu\u0302n"
- "wu\u0300t"
- "mo\u0300"
- "na\u0302"
top_n_grams:
- - 2
- 0.577
- - 3
- 0.505
- - 4
- 0.494
================================================
FILE: configs/bnj_Latn.yml
================================================
dup_line_frac: 0.775
dup_n_grams:
- - 5
- 0.407
- - 6
- 0.432
- - 7
- 0.407
- - 8
- 0.43
- - 9
- 0.347
- - 10
- 0.278
language_score: 0.3
line_punct_thr: -1
max_avg_word_length: 7
max_non_alpha_words_ratio: 0.8
min_avg_word_length: 3
new_line_ratio: 0.056
stopwords:
- at
- ay
- fag
- taw
- nu
- ngay
- sa
- te
- sik
- sas
- funbalugu
- e
- isus
- am
- ban
- anway
- ku
- anya
- kanya
- tam
- laman
- tuwa
- wa
- ka
top_n_grams:
- - 2
- 0.864
- - 3
- 0.957
- - 4
- 0.941
================================================
FILE: configs/bno_Latn.yml
================================================
dup_line_frac: 0.593
dup_n_grams:
- - 5
- 0.451
- - 6
- 0.431
- - 7
- 0.419
- - 8
- 0.396
- - 9
- 0.376
- - 10
- 0.355
language_score: 0.3
line_punct_thr: -1
max_avg_word_length: 9
max_non_alpha_words_ratio: 0.821
min_avg_word_length: 3
new_line_ratio: 0.05
stopwords:
- sa
- it
- nak
- kag
- ay
- ag
- mga
- ako
- ida
- o
- dios
- inro
- sida
- ra
- inra
- dahil
top_n_grams:
- - 2
- 1.288
- - 3
- 1.349
- - 4
- 1.282
================================================
FILE: configs/bnp_Latn.yml
================================================
dup_line_frac: 0.176
dup_n_grams:
- - 5
- 0.174
- - 6
- 0.151
- - 7
- 0.122
- - 8
- 0.11
- - 9
- 0.101
- - 10
- 0.089
language_score: 0.896
line_punct_thr: -1
max_avg_word_length: 6
max_non_alpha_words_ratio: 0.812
min_avg_word_length: 2
new_line_ratio: 0.056
stopwords:
- a
- i
- e
- na
- ri
- huriki
- ne
- ni
- ge
- vona
- mu
- bakovi
- mua
- vure
- o
- ria
- uka
- ma
- pali
- ta
- lakea
- bara
- dagi
- gi
top_n_grams:
- - 2
- 0.198
- - 3
- 0.176
- - 4
- 0.138
================================================
FILE: configs/boa_Latn.yml
================================================
dup_line_frac: 0.114
dup_n_grams:
- - 5
- 0.046
- - 6
- 0.041
- - 7
- 0.031
- - 8
- 0.03
- - 9
- 0.028
- - 10
- 0.023
language_score: 0.656
line_punct_thr: -1
max_avg_word_length: 14
max_non_alpha_words_ratio: 0.8
min_avg_word_length: 4
new_line_ratio: 0.1
stopwords:
- "muur\xE1"
- o
- "\xE1muha"
- "ts\xE1"
- dibye
- "d\xED\xEDbyeke"
- ditye
- "\xE1m\xFAhakye"
- "\xF3"
- ihdyu
top_n_grams:
- - 2
- 0.37
- - 3
- 0.338
- - 4
- 0.234
================================================
FILE: configs/bod_Tibt.yml
================================================
dup_line_frac: 0.261
dup_n_grams:
- - 5
- 0.174
- - 6
- 0.153
- - 7
- 0.14
- - 8
- 0.129
- - 9
- 0.115
- - 10
- 0.102
language_score: 0.682
line_punct_thr: 0.0
max_avg_word_length: 23
max_non_alpha_words_ratio: 0.824
min_avg_word_length: 1
new_line_ratio: 0.417
stopwords:
- "\u0F0D"
- "\u0F51\u0F44\u0F0B"
- "\u0F0D \u0F0D"
- "\u0F63\u0F0B"
- "\u0F40\u0FB1\u0F72\u0F0B"
- "\u0F51\u0F74\u0F0B"
- "\u0F53\u0F66\u0F0B"
- "\u0F42\u0F72\u0F0B"
- "\u0F42\u0FB1\u0F72\u0F0B"
- "\u0F53\u0F72\u0F0B"
top_n_grams:
- - 2
- 0.206
- - 3
- 0.205
- - 4
- 0.175
================================================
FILE: configs/boj_Latn.yml
================================================
dup_line_frac: 0.353
dup_n_grams:
- - 5
- 0.283
- - 6
- 0.264
- - 7
- 0.241
- - 8
- 0.227
- - 9
- 0.199
- - 10
- 0.186
language_score: 0.407
line_punct_thr: -1
max_avg_word_length: 9
max_non_alpha_words_ratio: 0.821
min_avg_word_length: 3
new_line_ratio: 0.053
stopwords:
- "na\u014Bgi"
- di
- a
- tamo
- na
- aqa
- "ni\u014Bgi"
- qotei
- e
- anjam
- deqa
- qaji
- yesus
- iga
- qa
- ti
- "na\u014Bgo"
- bei
- bole
- segi
- ni
- kumbra
- koba
- kalil
top_n_grams:
- - 2
- 0.768
- - 3
- 0.711
- - 4
- 0.604
================================================
FILE: configs/bom_Latn.yml
================================================
dup_line_frac: 0.45
dup_n_grams:
- - 5
- 0.283
- - 6
- 0.276
- - 7
- 0.266
- - 8
- 0.248
- - 9
- 0.223
- - 10
- 0.208
language_score: 0.3
line_punct_thr: -1
max_avg_word_length: 6
max_non_alpha_words_ratio: 0.826
min_avg_word_length: 2
new_line_ratio: 0.045
stopwords:
- a
- e
- de
- na
- ko
- "s\xE9"
- ba
- ra
- yin
- dagwi
- "y\u025Bn"
- "w\u025Bt"
- o
- yaga
- be
- me
- "m\u025B"
- mo
- wot
- bemat
- ma
- "y\u025B"
top_n_grams:
- - 2
- 0.613
- - 3
- 0.566
- - 4
- 0.509
================================================
FILE: configs/bon_Latn.yml
================================================
dup_line_frac: 0.655
dup_n_grams:
- - 5
- 0.488
- - 6
- 0.4
Showing preview only (276K chars total). Download the full file or copy to clipboard to get everything.
gitextract_xum9dop4/
├── LICENSE
├── README.md
├── ablations/
│ ├── evaluation/
│ │ ├── launch_evals.py
│ │ ├── launch_random_evals.py
│ │ └── run_all_missing_evals.sh
│ ├── tokenization/
│ │ └── launch_tokenization.py
│ └── training/
│ └── launch_exp.py
├── configs/
│ ├── aai_Latn.yml
│ ├── aak_Latn.yml
│ ├── aau_Latn.yml
│ ├── aaz_Latn.yml
│ ├── aba_Latn.yml
│ ├── abi_Latn.yml
│ ├── abk_Cyrl.yml
│ ├── abn_Latn.yml
│ ├── abq_Cyrl.yml
│ ├── abs_Latn.yml
│ ├── abt_Latn.yml
│ ├── abx_Latn.yml
│ ├── aby_Latn.yml
│ ├── abz_Latn.yml
│ ├── aca_Latn.yml
│ ├── acd_Latn.yml
│ ├── ace_Arab.yml
│ ├── ace_Latn.yml
│ ├── acf_Latn.yml
│ ├── ach_Latn.yml
│ ├── acm_Arab.yml
│ ├── acn_Latn.yml
│ ├── acr_Latn.yml
│ ├── acu_Latn.yml
│ ├── ada_Latn.yml
│ ├── ade_Latn.yml
│ ├── adh_Latn.yml
│ ├── adi_Latn.yml
│ ├── adj_Latn.yml
│ ├── adl_Latn.yml
│ ├── ady_Cyrl.yml
│ ├── adz_Latn.yml
│ ├── aeb_Arab.yml
│ ├── aer_Latn.yml
│ ├── aeu_Latn.yml
│ ├── aey_Latn.yml
│ ├── afr_Latn.yml
│ ├── agd_Latn.yml
│ ├── agg_Latn.yml
│ ├── agm_Latn.yml
│ ├── agn_Latn.yml
│ ├── agr_Latn.yml
│ ├── agt_Latn.yml
│ ├── agu_Latn.yml
│ ├── agw_Latn.yml
│ ├── agx_Cyrl.yml
│ ├── aha_Latn.yml
│ ├── ahk_Latn.yml
│ ├── aia_Latn.yml
│ ├── aii_Syrc.yml
│ ├── aim_Latn.yml
│ ├── ain_Latn.yml
│ ├── ajg_Latn.yml
│ ├── aji_Latn.yml
│ ├── ajz_Latn.yml
│ ├── akb_Latn.yml
│ ├── ake_Latn.yml
│ ├── akh_Latn.yml
│ ├── akp_Latn.yml
│ ├── ald_Latn.yml
│ ├── alj_Latn.yml
│ ├── aln_Latn.yml
│ ├── alp_Latn.yml
│ ├── alq_Latn.yml
│ ├── als_Latn.yml
│ ├── alt_Cyrl.yml
│ ├── aly_Latn.yml
│ ├── alz_Latn.yml
│ ├── ame_Latn.yml
│ ├── amf_Latn.yml
│ ├── amh_Ethi.yml
│ ├── ami_Latn.yml
│ ├── amk_Latn.yml
│ ├── amm_Latn.yml
│ ├── amn_Latn.yml
│ ├── amp_Latn.yml
│ ├── amr_Latn.yml
│ ├── amu_Latn.yml
│ ├── amx_Latn.yml
│ ├── ang_Latn.yml
│ ├── anm_Latn.yml
│ ├── ann_Latn.yml
│ ├── anp_Deva.yml
│ ├── anv_Latn.yml
│ ├── any_Latn.yml
│ ├── aoi_Latn.yml
│ ├── aoj_Latn.yml
│ ├── aom_Latn.yml
│ ├── aoz_Latn.yml
│ ├── apb_Latn.yml
│ ├── apc_Arab.yml
│ ├── ape_Latn.yml
│ ├── apn_Latn.yml
│ ├── apr_Latn.yml
│ ├── apt_Latn.yml
│ ├── apu_Latn.yml
│ ├── apw_Latn.yml
│ ├── apy_Latn.yml
│ ├── apz_Latn.yml
│ ├── aqz_Latn.yml
│ ├── arb_Arab.yml
│ ├── arb_Latn.yml
│ ├── are_Latn.yml
│ ├── arg_Latn.yml
│ ├── arl_Latn.yml
│ ├── arn_Latn.yml
│ ├── arp_Latn.yml
│ ├── arq_Arab.yml
│ ├── arr_Latn.yml
│ ├── ars_Arab.yml
│ ├── ary_Arab.yml
│ ├── arz_Arab.yml
│ ├── asg_Latn.yml
│ ├── asm_Beng.yml
│ ├── asm_Latn.yml
│ ├── aso_Latn.yml
│ ├── ast_Latn.yml
│ ├── ata_Latn.yml
│ ├── atb_Latn.yml
│ ├── atd_Latn.yml
│ ├── atg_Latn.yml
│ ├── ati_Latn.yml
│ ├── atj_Latn.yml
│ ├── atq_Latn.yml
│ ├── att_Latn.yml
│ ├── auc_Latn.yml
│ ├── aui_Latn.yml
│ ├── auy_Latn.yml
│ ├── ava_Cyrl.yml
│ ├── avk_Latn.yml
│ ├── avn_Latn.yml
│ ├── avt_Latn.yml
│ ├── avu_Latn.yml
│ ├── awa_Deva.yml
│ ├── awb_Latn.yml
│ ├── awi_Latn.yml
│ ├── awx_Latn.yml
│ ├── ayo_Latn.yml
│ ├── ayp_Arab.yml
│ ├── ayr_Latn.yml
│ ├── azb_Arab.yml
│ ├── azg_Latn.yml
│ ├── azj_Cyrl.yml
│ ├── azj_Latn.yml
│ ├── azz_Latn.yml
│ ├── bak_Cyrl.yml
│ ├── bam_Latn.yml
│ ├── ban_Latn.yml
│ ├── bao_Latn.yml
│ ├── bar_Latn.yml
│ ├── bas_Latn.yml
│ ├── bav_Latn.yml
│ ├── bba_Latn.yml
│ ├── bbb_Latn.yml
│ ├── bbc_Latn.yml
│ ├── bbj_Latn.yml
│ ├── bbk_Latn.yml
│ ├── bbo_Latn.yml
│ ├── bbr_Latn.yml
│ ├── bch_Latn.yml
│ ├── bci_Latn.yml
│ ├── bcl_Latn.yml
│ ├── bco_Latn.yml
│ ├── bcw_Latn.yml
│ ├── bdd_Latn.yml
│ ├── bdh_Latn.yml
│ ├── bdq_Latn.yml
│ ├── bea_Latn.yml
│ ├── bef_Latn.yml
│ ├── bel_Cyrl.yml
│ ├── bem_Latn.yml
│ ├── ben_Beng.yml
│ ├── ben_Latn.yml
│ ├── beq_Latn.yml
│ ├── bew_Latn.yml
│ ├── bex_Latn.yml
│ ├── bfd_Latn.yml
│ ├── bfo_Latn.yml
│ ├── bgr_Latn.yml
│ ├── bgs_Latn.yml
│ ├── bgt_Latn.yml
│ ├── bgz_Latn.yml
│ ├── bhg_Latn.yml
│ ├── bhl_Latn.yml
│ ├── bho_Deva.yml
│ ├── bhp_Latn.yml
│ ├── bhw_Latn.yml
│ ├── bhz_Latn.yml
│ ├── bib_Latn.yml
│ ├── big_Latn.yml
│ ├── bim_Latn.yml
│ ├── bin_Latn.yml
│ ├── bis_Latn.yml
│ ├── biu_Latn.yml
│ ├── biv_Latn.yml
│ ├── bjn_Arab.yml
│ ├── bjn_Latn.yml
│ ├── bjp_Latn.yml
│ ├── bjr_Latn.yml
│ ├── bjv_Latn.yml
│ ├── bkd_Latn.yml
│ ├── bkl_Latn.yml
│ ├── bkq_Latn.yml
│ ├── bku_Latn.yml
│ ├── bkv_Latn.yml
│ ├── bla_Latn.yml
│ ├── blh_Latn.yml
│ ├── blk_Mymr.yml
│ ├── blt_Latn.yml
│ ├── blw_Latn.yml
│ ├── blz_Latn.yml
│ ├── bmh_Latn.yml
│ ├── bmk_Latn.yml
│ ├── bmq_Latn.yml
│ ├── bmr_Latn.yml
│ ├── bmu_Latn.yml
│ ├── bmv_Latn.yml
│ ├── bnj_Latn.yml
│ ├── bno_Latn.yml
│ ├── bnp_Latn.yml
│ ├── boa_Latn.yml
│ ├── bod_Tibt.yml
│ ├── boj_Latn.yml
│ ├── bom_Latn.yml
│ ├── bon_Latn.yml
│ ├── bor_Latn.yml
│ ├── bos_Latn.yml
│ ├── bov_Latn.yml
│ ├── box_Latn.yml
│ ├── bpr_Latn.yml
│ ├── bps_Latn.yml
│ ├── bpy_Beng.yml
│ ├── bqc_Latn.yml
│ ├── bqj_Latn.yml
│ ├── bqp_Latn.yml
│ ├── bre_Latn.yml
│ ├── brh_Arab.yml
│ ├── bru_Latn.yml
│ ├── brx_Deva.yml
│ ├── brx_Latn.yml
│ ├── bsc_Latn.yml
│ ├── bsn_Latn.yml
│ ├── bsp_Latn.yml
│ ├── bsq_Latn.yml
│ ├── bss_Latn.yml
│ ├── btd_Latn.yml
│ ├── bth_Latn.yml
│ ├── bts_Latn.yml
│ ├── btt_Latn.yml
│ ├── btx_Latn.yml
│ ├── bud_Latn.yml
│ ├── bug_Latn.yml
│ ├── buk_Latn.yml
│ ├── bul_Cyrl.yml
│ ├── bum_Latn.yml
│ ├── bus_Latn.yml
│ ├── bvc_Latn.yml
│ ├── bvd_Latn.yml
│ ├── bvr_Latn.yml
│ ├── bvz_Latn.yml
│ ├── bwd_Latn.yml
│ ├── bwi_Latn.yml
│ ├── bwq_Latn.yml
│ ├── bwu_Latn.yml
│ ├── bxh_Latn.yml
│ ├── bxr_Cyrl.yml
│ ├── byr_Latn.yml
│ ├── byv_Latn.yml
│ ├── byx_Latn.yml
│ ├── bzd_Latn.yml
│ ├── bzh_Latn.yml
│ ├── bzi_Thai.yml
│ ├── bzj_Latn.yml
│ ├── caa_Latn.yml
│ ├── cab_Latn.yml
│ ├── cac_Latn.yml
│ ├── caf_Latn.yml
│ ├── cag_Latn.yml
│ ├── cak_Latn.yml
│ ├── cao_Latn.yml
│ ├── cap_Latn.yml
│ ├── caq_Latn.yml
│ ├── car_Latn.yml
│ ├── cas_Latn.yml
│ ├── cat_Latn.yml
│ ├── cav_Latn.yml
│ ├── cax_Latn.yml
│ ├── cbc_Latn.yml
│ ├── cbi_Latn.yml
│ ├── cbk_Latn.yml
│ ├── cbr_Latn.yml
│ ├── cbs_Latn.yml
│ ├── cbt_Latn.yml
│ ├── cbu_Latn.yml
│ ├── cbv_Latn.yml
│ ├── cce_Latn.yml
│ ├── cco_Latn.yml
│ ├── ccp_Latn.yml
│ ├── cdf_Latn.yml
│ ├── ceb_Latn.yml
│ ├── ceg_Latn.yml
│ ├── cek_Latn.yml
│ ├── ces_Latn.yml
│ ├── cfm_Latn.yml
│ ├── cgc_Latn.yml
│ ├── cgg_Latn.yml
│ ├── cha_Latn.yml
│ ├── chd_Latn.yml
│ ├── che_Cyrl.yml
│ ├── chf_Latn.yml
│ ├── chj_Latn.yml
│ ├── chk_Latn.yml
│ ├── cho_Latn.yml
│ ├── chq_Latn.yml
│ ├── chr_Cher.yml
│ ├── chr_Latn.yml
│ ├── chu_Cyrl.yml
│ ├── chv_Cyrl.yml
│ ├── chw_Latn.yml
│ ├── chz_Latn.yml
│ ├── cjk_Latn.yml
│ ├── cjo_Latn.yml
│ ├── cjp_Latn.yml
│ ├── cjs_Cyrl.yml
│ ├── cjv_Latn.yml
│ ├── ckb_Arab.yml
│ ├── cko_Latn.yml
│ ├── ckt_Cyrl.yml
│ ├── cle_Latn.yml
│ ├── clu_Latn.yml
│ ├── cly_Latn.yml
│ ├── cme_Latn.yml
│ ├── cmn_Hani.yml
│ ├── cmo_Khmr.yml
│ ├── cmo_Latn.yml
│ ├── cmr_Latn.yml
│ ├── cnh_Latn.yml
│ ├── cni_Latn.yml
│ ├── cnk_Latn.yml
│ ├── cnl_Latn.yml
│ ├── cnt_Latn.yml
│ ├── cnw_Latn.yml
│ ├── coe_Latn.yml
│ ├── cof_Latn.yml
│ ├── cok_Latn.yml
│ ├── con_Latn.yml
│ ├── cop_Copt.yml
│ ├── cor_Latn.yml
│ ├── cos_Latn.yml
│ ├── cot_Latn.yml
│ ├── cou_Latn.yml
│ ├── cpa_Latn.yml
│ ├── cpb_Latn.yml
│ ├── cpc_Latn.yml
│ ├── cpu_Latn.yml
│ ├── cpy_Latn.yml
│ ├── crh_Cyrl.yml
│ ├── crh_Latn.yml
│ ├── cri_Latn.yml
│ ├── crj_Cans.yml
│ ├── crk_Cans.yml
│ ├── crk_Latn.yml
│ ├── crl_Cans.yml
│ ├── crm_Cans.yml
│ ├── crn_Latn.yml
│ ├── crs_Latn.yml
│ ├── crt_Latn.yml
│ ├── crx_Latn.yml
│ ├── csb_Latn.yml
│ ├── csk_Latn.yml
│ ├── cso_Latn.yml
│ ├── csw_Latn.yml
│ ├── csy_Latn.yml
│ ├── cta_Latn.yml
│ ├── ctd_Latn.yml
│ ├── cto_Latn.yml
│ ├── ctp_Latn.yml
│ ├── ctu_Latn.yml
│ ├── cub_Latn.yml
│ ├── cuc_Latn.yml
│ ├── cui_Latn.yml
│ ├── cuk_Latn.yml
│ ├── cul_Latn.yml
│ ├── cut_Latn.yml
│ ├── cux_Latn.yml
│ ├── cwe_Latn.yml
│ ├── cwt_Latn.yml
│ ├── cya_Latn.yml
│ ├── cym_Latn.yml
│ ├── czt_Latn.yml
│ ├── daa_Latn.yml
│ ├── dad_Latn.yml
│ ├── daf_Latn.yml
│ ├── dag_Latn.yml
│ ├── dah_Latn.yml
│ ├── dak_Latn.yml
│ ├── dan_Latn.yml
│ ├── dar_Cyrl.yml
│ ├── dbq_Latn.yml
│ ├── ddg_Latn.yml
│ ├── ddn_Latn.yml
│ ├── ded_Latn.yml
│ ├── des_Latn.yml
│ ├── deu_Latn.yml
│ ├── dga_Latn.yml
│ ├── dgc_Latn.yml
│ ├── dgi_Latn.yml
│ ├── dgr_Latn.yml
│ ├── dgz_Latn.yml
│ ├── dhg_Latn.yml
│ ├── dhm_Latn.yml
│ ├── dhv_Latn.yml
│ ├── did_Latn.yml
│ ├── dig_Latn.yml
│ ├── dik_Latn.yml
│ ├── dip_Latn.yml
│ ├── diq_Latn.yml
│ ├── dis_Latn.yml
│ ├── diu_Latn.yml
│ ├── div_Thaa.yml
│ ├── dje_Latn.yml
│ ├── djk_Latn.yml
│ ├── djr_Latn.yml
│ ├── dks_Latn.yml
│ ├── dln_Latn.yml
│ ├── dng_Cyrl.yml
│ ├── dnj_Latn.yml
│ ├── dnw_Latn.yml
│ ├── dob_Latn.yml
│ ├── doi_Deva.yml
│ ├── dop_Latn.yml
│ ├── dos_Latn.yml
│ ├── dow_Latn.yml
│ ├── drg_Latn.yml
│ ├── dru_Latn.yml
│ ├── dsb_Latn.yml
│ ├── dsh_Latn.yml
│ ├── dtb_Latn.yml
│ ├── dtp_Latn.yml
│ ├── dts_Latn.yml
│ ├── dty_Deva.yml
│ ├── dua_Latn.yml
│ ├── due_Latn.yml
│ ├── dug_Latn.yml
│ ├── duo_Latn.yml
│ ├── dur_Latn.yml
│ ├── dwr_Latn.yml
│ ├── dww_Latn.yml
│ ├── dyi_Latn.yml
│ ├── dyo_Latn.yml
│ ├── dyu_Latn.yml
│ ├── dzo_Tibt.yml
│ ├── ebk_Latn.yml
│ ├── efi_Latn.yml
│ ├── eka_Latn.yml
│ ├── ekk_Latn.yml
│ ├── eko_Latn.yml
│ ├── ell_Grek.yml
│ ├── eme_Latn.yml
│ ├── emi_Latn.yml
│ ├── eml_Latn.yml
│ ├── emp_Latn.yml
│ ├── enb_Latn.yml
│ ├── enl_Latn.yml
│ ├── enm_Latn.yml
│ ├── enq_Latn.yml
│ ├── enx_Latn.yml
│ ├── epo_Latn.yml
│ ├── eri_Latn.yml
│ ├── ese_Latn.yml
│ ├── esi_Latn.yml
│ ├── esk_Latn.yml
│ ├── ess_Latn.yml
│ ├── esu_Latn.yml
│ ├── eto_Latn.yml
│ ├── etr_Latn.yml
│ ├── etu_Latn.yml
│ ├── eus_Latn.yml
│ ├── eve_Cyrl.yml
│ ├── ewe_Latn.yml
│ ├── ewo_Latn.yml
│ ├── ext_Latn.yml
│ ├── eza_Latn.yml
│ ├── faa_Latn.yml
│ ├── fad_Latn.yml
│ ├── fai_Latn.yml
│ ├── fal_Latn.yml
│ ├── fan_Latn.yml
│ ├── fao_Latn.yml
│ ├── far_Latn.yml
│ ├── fas_Arab.yml
│ ├── fat_Latn.yml
│ ├── ffm_Latn.yml
│ ├── fij_Latn.yml
│ ├── fil_Latn.yml
│ ├── fin_Latn.yml
│ ├── fit_Latn.yml
│ ├── fkv_Latn.yml
│ ├── fmu_Deva.yml
│ ├── fon_Latn.yml
│ ├── for_Latn.yml
│ ├── fra_Latn.yml
│ ├── frd_Latn.yml
│ ├── fro_Latn.yml
│ ├── frp_Latn.yml
│ ├── frr_Latn.yml
│ ├── fry_Latn.yml
│ ├── fub_Latn.yml
│ ├── fud_Latn.yml
│ ├── fue_Latn.yml
│ ├── fuf_Latn.yml
│ ├── fuh_Latn.yml
│ ├── fuq_Latn.yml
│ ├── fur_Latn.yml
│ ├── fuv_Arab.yml
│ ├── fuv_Latn.yml
│ ├── gaa_Latn.yml
│ ├── gag_Cyrl.yml
│ ├── gag_Latn.yml
│ ├── gah_Latn.yml
│ ├── gai_Latn.yml
│ ├── gam_Latn.yml
│ ├── gaw_Latn.yml
│ ├── gaz_Latn.yml
│ ├── gbi_Latn.yml
│ ├── gbo_Latn.yml
│ ├── gbr_Latn.yml
│ ├── gcf_Latn.yml
│ ├── gcr_Latn.yml
│ ├── gde_Latn.yml
│ ├── gdg_Latn.yml
│ ├── gdn_Latn.yml
│ ├── gdr_Latn.yml
│ ├── geb_Latn.yml
│ ├── gej_Latn.yml
│ ├── gfk_Latn.yml
│ ├── ghe_Deva.yml
│ ├── ghs_Latn.yml
│ ├── gid_Latn.yml
│ ├── gil_Latn.yml
│ ├── giz_Latn.yml
│ ├── gjn_Latn.yml
│ ├── gkn_Latn.yml
│ ├── gla_Latn.yml
│ ├── gle_Latn.yml
│ ├── glg_Latn.yml
│ ├── glk_Arab.yml
│ ├── glv_Latn.yml
│ ├── gmh_Latn.yml
│ ├── gmv_Ethi.yml
│ ├── gmv_Latn.yml
│ ├── gna_Latn.yml
│ ├── gnb_Latn.yml
│ ├── gnd_Latn.yml
│ ├── gng_Latn.yml
│ ├── gnn_Latn.yml
│ ├── gnw_Latn.yml
│ ├── goa_Latn.yml
│ ├── gof_Ethi.yml
│ ├── gof_Latn.yml
│ ├── gog_Latn.yml
│ ├── goh_Latn.yml
│ ├── gom_Deva.yml
│ ├── gom_Latn.yml
│ ├── gor_Latn.yml
│ ├── gos_Latn.yml
│ ├── got_Goth.yml
│ ├── got_Latn.yml
│ ├── gqr_Latn.yml
│ ├── grc_Grek.yml
│ ├── grt_Beng.yml
│ ├── gso_Latn.yml
│ ├── gsw_Latn.yml
│ ├── gub_Latn.yml
│ ├── guc_Latn.yml
│ ├── gud_Latn.yml
│ ├── gug_Latn.yml
│ ├── guh_Latn.yml
│ ├── gui_Latn.yml
│ ├── guj_Gujr.yml
│ ├── guj_Latn.yml
│ ├── guk_Ethi.yml
│ ├── gul_Latn.yml
│ ├── gum_Latn.yml
│ ├── gun_Latn.yml
│ ├── guo_Latn.yml
│ ├── guq_Latn.yml
│ ├── gur_Latn.yml
│ ├── guu_Latn.yml
│ ├── guw_Latn.yml
│ ├── gux_Latn.yml
│ ├── guz_Latn.yml
│ ├── gvc_Latn.yml
│ ├── gvf_Latn.yml
│ ├── gvl_Latn.yml
│ ├── gvn_Latn.yml
│ ├── gwi_Latn.yml
│ ├── gwr_Latn.yml
│ ├── gya_Latn.yml
│ ├── gym_Latn.yml
│ ├── gyr_Latn.yml
│ ├── hac_Arab.yml
│ ├── hae_Latn.yml
│ ├── hag_Latn.yml
│ ├── hak_Hani.yml
│ ├── hak_Latn.yml
│ ├── hat_Latn.yml
│ ├── hau_Latn.yml
│ ├── hav_Latn.yml
│ ├── haw_Latn.yml
│ ├── hay_Latn.yml
│ ├── hbo_Hebr.yml
│ ├── hch_Latn.yml
│ ├── heb_Hebr.yml
│ ├── heg_Latn.yml
│ ├── heh_Latn.yml
│ ├── her_Latn.yml
│ ├── hif_Latn.yml
│ ├── hig_Latn.yml
│ ├── hil_Latn.yml
│ ├── hin_Deva.yml
│ ├── hin_Latn.yml
│ ├── hix_Latn.yml
│ ├── hla_Latn.yml
│ ├── hlt_Latn.yml
│ ├── hmo_Latn.yml
│ ├── hmr_Latn.yml
│ ├── hne_Deva.yml
│ ├── hnj_Latn.yml
│ ├── hnn_Latn.yml
│ ├── hns_Latn.yml
│ ├── hoc_Latn.yml
│ ├── hoc_Wara.yml
│ ├── hop_Latn.yml
│ ├── hot_Latn.yml
│ ├── hra_Latn.yml
│ ├── hrv_Latn.yml
│ ├── hrx_Latn.yml
│ ├── hsb_Latn.yml
│ ├── hto_Latn.yml
│ ├── hub_Latn.yml
│ ├── hui_Latn.yml
│ ├── hun_Latn.yml
│ ├── hus_Latn.yml
│ ├── huu_Latn.yml
│ ├── huv_Latn.yml
│ ├── hvn_Latn.yml
│ ├── hwc_Latn.yml
│ ├── hye_Armn.yml
│ ├── hyw_Armn.yml
│ ├── ian_Latn.yml
│ ├── iba_Latn.yml
│ ├── ibg_Latn.yml
│ ├── ibo_Latn.yml
│ ├── icr_Latn.yml
│ ├── ido_Latn.yml
│ ├── idu_Latn.yml
│ ├── ifa_Latn.yml
│ ├── ifb_Latn.yml
│ ├── ife_Latn.yml
│ ├── ifk_Latn.yml
│ ├── ifu_Latn.yml
│ ├── ify_Latn.yml
│ ├── ige_Latn.yml
│ ├── ign_Latn.yml
│ ├── ike_Cans.yml
│ ├── ikk_Latn.yml
│ ├── ikt_Latn.yml
│ ├── ikw_Latn.yml
│ ├── ilb_Latn.yml
│ ├── ile_Latn.yml
│ ├── ilo_Latn.yml
│ ├── imo_Latn.yml
│ ├── ina_Latn.yml
│ ├── inb_Latn.yml
│ ├── ind_Latn.yml
│ ├── inh_Cyrl.yml
│ ├── ino_Latn.yml
│ ├── iou_Latn.yml
│ ├── ipi_Latn.yml
│ ├── iqw_Latn.yml
│ ├── iri_Latn.yml
│ ├── irk_Latn.yml
│ ├── iry_Latn.yml
│ ├── isd_Latn.yml
│ ├── ish_Latn.yml
│ ├── isl_Latn.yml
│ ├── iso_Latn.yml
│ ├── ita_Latn.yml
│ ├── itl_Cyrl.yml
│ ├── itv_Latn.yml
│ ├── ium_Latn.yml
│ ├── ivb_Latn.yml
│ ├── ivv_Latn.yml
│ ├── iws_Latn.yml
│ ├── ixl_Latn.yml
│ ├── izr_Latn.yml
│ ├── izz_Latn.yml
│ ├── jaa_Latn.yml
│ ├── jac_Latn.yml
│ ├── jae_Latn.yml
│ ├── jam_Latn.yml
│ ├── jav_Latn.yml
│ ├── jbo_Latn.yml
│ ├── jbu_Latn.yml
│ ├── jic_Latn.yml
│ ├── jiv_Latn.yml
│ ├── jmc_Latn.yml
│ ├── jpn_Jpan.yml
│ ├── jra_Latn.yml
│ ├── jun_Orya.yml
│ ├── jvn_Latn.yml
│ ├── kaa_Cyrl.yml
│ ├── kaa_Latn.yml
│ ├── kab_Latn.yml
│ ├── kac_Latn.yml
│ ├── kak_Latn.yml
│ ├── kal_Latn.yml
│ ├── kam_Latn.yml
│ ├── kan_Knda.yml
│ ├── kan_Latn.yml
│ ├── kao_Latn.yml
│ ├── kap_Cyrl.yml
│ ├── kaq_Latn.yml
│ ├── kas_Arab.yml
│ ├── kas_Deva.yml
│ ├── kas_Latn.yml
│ ├── kat_Geor.yml
│ ├── kaz_Cyrl.yml
│ ├── kbc_Latn.yml
│ ├── kbd_Cyrl.yml
│ ├── kbh_Latn.yml
│ ├── kbm_Latn.yml
│ ├── kbo_Latn.yml
│ ├── kbp_Latn.yml
│ ├── kbq_Latn.yml
│ ├── kbr_Latn.yml
│ ├── kby_Latn.yml
│ ├── kca_Cyrl.yml
│ ├── kcg_Latn.yml
│ ├── kck_Latn.yml
│ ├── kdc_Latn.yml
│ ├── kde_Latn.yml
│ ├── kdh_Latn.yml
│ ├── kdi_Latn.yml
│ ├── kdj_Latn.yml
│ ├── kdl_Latn.yml
│ ├── kdr_Latn.yml
│ ├── kea_Latn.yml
│ ├── kei_Latn.yml
│ ├── kek_Latn.yml
│ ├── ken_Latn.yml
│ ├── keo_Latn.yml
│ ├── ker_Latn.yml
│ ├── kew_Latn.yml
│ ├── kex_Deva.yml
│ ├── kez_Latn.yml
│ ├── kff_Telu.yml
│ ├── kgf_Latn.yml
│ ├── kgk_Latn.yml
│ ├── kgp_Latn.yml
│ ├── kgr_Latn.yml
│ ├── kha_Latn.yml
│ ├── khk_Cyrl.yml
│ ├── khm_Khmr.yml
│ ├── khq_Latn.yml
│ ├── khs_Latn.yml
│ ├── khy_Latn.yml
│ ├── khz_Latn.yml
│ ├── kia_Latn.yml
│ ├── kij_Latn.yml
│ ├── kik_Latn.yml
│ ├── kin_Latn.yml
│ ├── kir_Cyrl.yml
│ ├── kiu_Latn.yml
│ ├── kix_Latn.yml
│ ├── kjb_Latn.yml
│ ├── kje_Latn.yml
│ ├── kjh_Cyrl.yml
│ ├── kjs_Latn.yml
│ ├── kkc_Latn.yml
│ ├── kki_Latn.yml
│ ├── kkj_Latn.yml
│ ├── kkl_Latn.yml
│ ├── kle_Deva.yml
│ ├── klt_Latn.yml
│ ├── klv_Latn.yml
│ ├── kma_Latn.yml
│ ├── kmb_Latn.yml
│ ├── kmd_Latn.yml
│ ├── kmg_Latn.yml
│ ├── kmh_Latn.yml
│ ├── kmk_Latn.yml
│ ├── kmm_Latn.yml
│ ├── kmo_Latn.yml
│ ├── kmr_Cyrl.yml
│ ├── kmr_Latn.yml
│ ├── kms_Latn.yml
│ ├── kmu_Latn.yml
│ ├── kmy_Latn.yml
│ ├── knc_Arab.yml
│ ├── knc_Latn.yml
│ ├── kne_Latn.yml
│ ├── knf_Latn.yml
│ ├── kng_Latn.yml
│ ├── knj_Latn.yml
│ ├── knk_Latn.yml
│ ├── kno_Latn.yml
│ ├── knv_Latn.yml
│ ├── knx_Latn.yml
│ ├── kny_Latn.yml
│ ├── kog_Latn.yml
│ ├── koi_Cyrl.yml
│ ├── koo_Latn.yml
│ ├── kor_Hang.yml
│ ├── kos_Latn.yml
│ ├── kpe_Latn.yml
│ ├── kpf_Latn.yml
│ ├── kpg_Latn.yml
│ ├── kpj_Latn.yml
│ ├── kpq_Latn.yml
│ ├── kpr_Latn.yml
│ ├── kpv_Cyrl.yml
│ ├── kpw_Latn.yml
│ ├── kpx_Latn.yml
│ ├── kpz_Latn.yml
│ ├── kqa_Latn.yml
│ ├── kqc_Latn.yml
│ ├── kqe_Latn.yml
│ ├── kqf_Latn.yml
│ ├── kql_Latn.yml
│ ├── kqn_Latn.yml
│ ├── kqo_Latn.yml
│ ├── kqp_Latn.yml
│ ├── kqs_Latn.yml
│ ├── kqw_Latn.yml
│ ├── kqy_Ethi.yml
│ ├── krc_Cyrl.yml
│ ├── kri_Latn.yml
│ ├── krj_Latn.yml
│ ├── krl_Latn.yml
│ ├── kru_Deva.yml
│ ├── krx_Latn.yml
│ ├── ksb_Latn.yml
│ ├── ksc_Latn.yml
│ ├── ksd_Latn.yml
│ ├── ksf_Latn.yml
│ ├── ksh_Latn.yml
│ ├── ksj_Latn.yml
│ ├── ksp_Latn.yml
│ ├── ksr_Latn.yml
│ ├── kss_Latn.yml
│ ├── ksw_Mymr.yml
│ ├── ktb_Ethi.yml
│ ├── ktj_Latn.yml
│ ├── ktm_Latn.yml
│ ├── kto_Latn.yml
│ ├── ktu_Latn.yml
│ ├── ktz_Latn.yml
│ ├── kua_Latn.yml
│ ├── kub_Latn.yml
│ ├── kud_Latn.yml
│ ├── kue_Latn.yml
│ ├── kuj_Latn.yml
│ ├── kum_Cyrl.yml
│ ├── kup_Latn.yml
│ ├── kus_Latn.yml
│ ├── kvg_Latn.yml
│ ├── kvj_Latn.yml
│ ├── kvn_Latn.yml
│ ├── kwd_Latn.yml
│ ├── kwf_Latn.yml
│ ├── kwi_Latn.yml
│ ├── kwj_Latn.yml
│ ├── kwn_Latn.yml
│ ├── kwy_Latn.yml
│ ├── kxc_Ethi.yml
│ ├── kxm_Thai.yml
│ ├── kxw_Latn.yml
│ ├── kyc_Latn.yml
│ ├── kyf_Latn.yml
│ ├── kyg_Latn.yml
│ ├── kyq_Latn.yml
│ ├── kyu_Kali.yml
│ ├── kyu_Latn.yml
│ ├── kyu_Mymr.yml
│ ├── kyz_Latn.yml
│ ├── kze_Latn.yml
│ ├── kzf_Latn.yml
│ ├── kzj_Latn.yml
│ ├── kzn_Latn.yml
│ ├── lac_Latn.yml
│ ├── lad_Hebr.yml
│ ├── lad_Latn.yml
│ ├── lai_Latn.yml
│ ├── laj_Latn.yml
│ ├── lam_Latn.yml
│ ├── lao_Laoo.yml
│ ├── lap_Latn.yml
│ ├── las_Latn.yml
│ ├── lat_Latn.yml
│ ├── law_Latn.yml
│ ├── lbb_Latn.yml
│ ├── lbe_Cyrl.yml
│ ├── lbj_Tibt.yml
│ ├── lbk_Latn.yml
│ ├── lcm_Latn.yml
│ ├── lcp_Thai.yml
│ ├── ldi_Latn.yml
│ ├── ldn_Latn.yml
│ ├── lea_Latn.yml
│ ├── led_Latn.yml
│ ├── lee_Latn.yml
│ ├── lef_Latn.yml
│ ├── leh_Latn.yml
│ ├── lem_Latn.yml
│ ├── leu_Latn.yml
│ ├── lew_Latn.yml
│ ├── lex_Latn.yml
│ ├── lez_Cyrl.yml
│ ├── lfn_Cyrl.yml
│ ├── lfn_Latn.yml
│ ├── lgg_Latn.yml
│ ├── lgl_Latn.yml
│ ├── lgm_Latn.yml
│ ├── lhi_Latn.yml
│ ├── lhu_Latn.yml
│ ├── lia_Latn.yml
│ ├── lid_Latn.yml
│ ├── lif_Deva.yml
│ ├── lif_Limb.yml
│ ├── lij_Latn.yml
│ ├── lim_Latn.yml
│ ├── lin_Latn.yml
│ ├── lip_Latn.yml
│ ├── lis_Lisu.yml
│ ├── lit_Latn.yml
│ ├── liv_Latn.yml
│ ├── ljp_Latn.yml
│ ├── lki_Arab.yml
│ ├── llb_Latn.yml
│ ├── lld_Latn.yml
│ ├── llg_Latn.yml
│ ├── lln_Latn.yml
│ ├── lmk_Latn.yml
│ ├── lmo_Latn.yml
│ ├── lmp_Latn.yml
│ ├── lnd_Latn.yml
│ ├── lob_Latn.yml
│ ├── loe_Latn.yml
│ ├── log_Latn.yml
│ ├── lok_Latn.yml
│ ├── lol_Latn.yml
│ ├── lom_Latn.yml
│ ├── loq_Latn.yml
│ ├── loz_Latn.yml
│ ├── lrc_Arab.yml
│ ├── lsi_Latn.yml
│ ├── lsm_Latn.yml
│ ├── ltg_Latn.yml
│ ├── ltz_Latn.yml
│ ├── lua_Latn.yml
│ ├── lub_Latn.yml
│ ├── luc_Latn.yml
│ ├── lud_Latn.yml
│ ├── lue_Latn.yml
│ ├── lug_Latn.yml
│ ├── lun_Latn.yml
│ ├── luo_Latn.yml
│ ├── lus_Latn.yml
│ ├── lvs_Latn.yml
│ ├── lwg_Latn.yml
│ ├── lwo_Latn.yml
│ ├── lww_Latn.yml
│ ├── lzh_Hani.yml
│ ├── maa_Latn.yml
│ ├── mad_Latn.yml
│ ├── maf_Latn.yml
│ ├── mag_Deva.yml
│ ├── mah_Latn.yml
│ ├── mai_Deva.yml
│ ├── maj_Latn.yml
│ ├── mak_Latn.yml
│ ├── mal_Latn.yml
│ ├── mal_Mlym.yml
│ ├── mam_Latn.yml
│ ├── maq_Latn.yml
│ ├── mar_Deva.yml
│ ├── mar_Latn.yml
│ ├── mas_Latn.yml
│ ├── mau_Latn.yml
│ ├── mav_Latn.yml
│ ├── maw_Latn.yml
│ ├── max_Latn.yml
│ ├── maz_Latn.yml
│ ├── mbb_Latn.yml
│ ├── mbc_Latn.yml
│ ├── mbd_Latn.yml
│ ├── mbf_Latn.yml
│ ├── mbh_Latn.yml
│ ├── mbi_Latn.yml
│ ├── mbj_Latn.yml
│ ├── mbl_Latn.yml
│ ├── mbs_Latn.yml
│ ├── mbt_Latn.yml
│ ├── mca_Latn.yml
│ ├── mcb_Latn.yml
│ ├── mcd_Latn.yml
│ ├── mcf_Latn.yml
│ ├── mck_Latn.yml
│ ├── mcn_Latn.yml
│ ├── mco_Latn.yml
│ ├── mcp_Latn.yml
│ ├── mcq_Latn.yml
│ ├── mcu_Latn.yml
│ ├── mda_Latn.yml
│ ├── mdf_Cyrl.yml
│ ├── mdy_Ethi.yml
│ ├── med_Latn.yml
│ ├── mee_Latn.yml
│ ├── mej_Latn.yml
│ ├── mek_Latn.yml
│ ├── men_Latn.yml
│ ├── meq_Latn.yml
│ ├── mer_Latn.yml
│ ├── met_Latn.yml
│ ├── meu_Latn.yml
│ ├── mev_Latn.yml
│ ├── mfe_Latn.yml
│ ├── mfg_Latn.yml
│ ├── mfh_Latn.yml
│ ├── mfi_Latn.yml
│ ├── mfk_Latn.yml
│ ├── mfq_Latn.yml
│ ├── mfy_Latn.yml
│ ├── mfz_Latn.yml
│ ├── mgc_Latn.yml
│ ├── mgh_Latn.yml
│ ├── mgm_Latn.yml
│ ├── mgo_Latn.yml
│ ├── mgr_Latn.yml
│ ├── mhi_Latn.yml
│ ├── mhl_Latn.yml
│ ├── mhr_Cyrl.yml
│ ├── mhw_Latn.yml
│ ├── mhx_Latn.yml
│ ├── mhy_Latn.yml
│ ├── mib_Latn.yml
│ ├── mic_Latn.yml
│ ├── mie_Latn.yml
│ ├── mif_Latn.yml
│ ├── mig_Latn.yml
│ ├── mih_Latn.yml
│ ├── mil_Latn.yml
│ ├── mim_Latn.yml
│ ├── min_Arab.yml
│ ├── min_Latn.yml
│ ├── mio_Latn.yml
│ ├── mip_Latn.yml
│ ├── miq_Latn.yml
│ ├── mir_Latn.yml
│ ├── mit_Latn.yml
│ ├── miy_Latn.yml
│ ├── miz_Latn.yml
│ ├── mjc_Latn.yml
│ ├── mjw_Latn.yml
│ ├── mkd_Cyrl.yml
│ ├── mkl_Latn.yml
│ ├── mkn_Latn.yml
│ ├── mks_Latn.yml
│ ├── mkz_Latn.yml
│ ├── mlh_Latn.yml
│ ├── mlp_Latn.yml
│ ├── mlt_Latn.yml
│ ├── mlu_Latn.yml
│ ├── mmn_Latn.yml
│ ├── mmo_Latn.yml
│ ├── mmx_Latn.yml
│ ├── mna_Latn.yml
│ ├── mnb_Latn.yml
│ ├── mnf_Latn.yml
│ ├── mni_Beng.yml
│ ├── mni_Latn.yml
│ ├── mni_Mtei.yml
│ ├── mnk_Latn.yml
│ ├── mns_Cyrl.yml
│ ├── mnw_Mymr.yml
│ ├── mnx_Latn.yml
│ ├── mny_Latn.yml
│ ├── moa_Latn.yml
│ ├── moc_Latn.yml
│ ├── mog_Latn.yml
│ ├── moh_Latn.yml
│ ├── mop_Latn.yml
│ ├── mor_Latn.yml
│ ├── mos_Latn.yml
│ ├── mox_Latn.yml
│ ├── mpg_Latn.yml
│ ├── mph_Latn.yml
│ ├── mpm_Latn.yml
│ ├── mpp_Latn.yml
│ ├── mps_Latn.yml
│ ├── mpt_Latn.yml
│ ├── mpx_Latn.yml
│ ├── mqb_Latn.yml
│ ├── mqj_Latn.yml
│ ├── mqy_Latn.yml
│ ├── mrg_Latn.yml
│ ├── mri_Latn.yml
│ ├── mrj_Cyrl.yml
│ ├── mrq_Latn.yml
│ ├── mrv_Latn.yml
│ ├── mrw_Latn.yml
│ ├── msb_Latn.yml
│ ├── msc_Latn.yml
│ ├── mse_Latn.yml
│ ├── msk_Latn.yml
│ ├── msy_Latn.yml
│ ├── mta_Latn.yml
│ ├── mtg_Latn.yml
│ ├── mti_Latn.yml
│ ├── mtj_Latn.yml
│ ├── mto_Latn.yml
│ ├── mtp_Latn.yml
│ ├── mua_Latn.yml
│ ├── mug_Latn.yml
│ ├── muh_Latn.yml
│ ├── mui_Latn.yml
│ ├── mup_Deva.yml
│ ├── mur_Latn.yml
│ ├── mus_Latn.yml
│ ├── mux_Latn.yml
│ ├── muy_Latn.yml
│ ├── mva_Latn.yml
│ ├── mvn_Latn.yml
│ ├── mvp_Latn.yml
│ ├── mwc_Latn.yml
│ ├── mwf_Latn.yml
│ ├── mwl_Latn.yml
│ ├── mwm_Latn.yml
│ ├── mwn_Latn.yml
│ ├── mwp_Latn.yml
│ ├── mwq_Latn.yml
│ ├── mwv_Latn.yml
│ ├── mww_Latn.yml
│ ├── mxb_Latn.yml
│ ├── mxp_Latn.yml
│ ├── mxq_Latn.yml
│ ├── mxt_Latn.yml
│ ├── mxv_Latn.yml
│ ├── mya_Mymr.yml
│ ├── myb_Latn.yml
│ ├── myk_Latn.yml
│ ├── myu_Latn.yml
│ ├── myv_Cyrl.yml
│ ├── myw_Latn.yml
│ ├── myx_Latn.yml
│ ├── myy_Latn.yml
│ ├── mza_Latn.yml
│ ├── mzh_Latn.yml
│ ├── mzk_Latn.yml
│ ├── mzl_Latn.yml
│ ├── mzm_Latn.yml
│ ├── mzn_Arab.yml
│ ├── mzw_Latn.yml
│ ├── mzz_Latn.yml
│ ├── nab_Latn.yml
│ ├── naf_Latn.yml
│ ├── nah_Latn.yml
│ ├── nak_Latn.yml
│ ├── nan_Latn.yml
│ ├── nap_Latn.yml
│ ├── naq_Latn.yml
│ ├── nas_Latn.yml
│ ├── nav_Latn.yml
│ ├── naw_Latn.yml
│ ├── nba_Latn.yml
│ ├── nbc_Latn.yml
│ ├── nbe_Latn.yml
│ ├── nbl_Latn.yml
│ ├── nbq_Latn.yml
│ ├── nbu_Latn.yml
│ ├── nca_Latn.yml
│ ├── nch_Latn.yml
│ ├── ncj_Latn.yml
│ ├── ncl_Latn.yml
│ ├── ncq_Laoo.yml
│ ├── nct_Latn.yml
│ ├── ncu_Latn.yml
│ ├── ncx_Latn.yml
│ ├── ndc_Latn.yml
│ ├── nde_Latn.yml
│ ├── ndh_Latn.yml
│ ├── ndi_Latn.yml
│ ├── ndj_Latn.yml
│ ├── ndo_Latn.yml
│ ├── ndp_Latn.yml
│ ├── nds_Latn.yml
│ ├── ndy_Latn.yml
│ ├── ndz_Latn.yml
│ ├── neb_Latn.yml
│ ├── new_Deva.yml
│ ├── nfa_Latn.yml
│ ├── nfr_Latn.yml
│ ├── ngb_Latn.yml
│ ├── ngc_Latn.yml
│ ├── ngl_Latn.yml
│ ├── ngp_Latn.yml
│ ├── ngu_Latn.yml
│ ├── nhd_Latn.yml
│ ├── nhe_Latn.yml
│ ├── nhg_Latn.yml
│ ├── nhi_Latn.yml
│ ├── nhk_Latn.yml
│ ├── nho_Latn.yml
│ ├── nhr_Latn.yml
│ ├── nhu_Latn.yml
│ ├── nhw_Latn.yml
│ ├── nhx_Latn.yml
│ ├── nhy_Latn.yml
│ ├── nia_Latn.yml
│ ├── nif_Latn.yml
│ ├── nii_Latn.yml
│ ├── nij_Latn.yml
│ ├── nim_Latn.yml
│ ├── nin_Latn.yml
│ ├── nio_Cyrl.yml
│ ├── niq_Latn.yml
│ ├── niu_Latn.yml
│ ├── niy_Latn.yml
│ ├── njb_Latn.yml
│ ├── njm_Latn.yml
│ ├── njn_Latn.yml
│ ├── njo_Latn.yml
│ ├── njz_Latn.yml
│ ├── nkf_Latn.yml
│ ├── nki_Latn.yml
│ ├── nko_Latn.yml
│ ├── nla_Latn.yml
│ ├── nlc_Latn.yml
│ ├── nld_Latn.yml
│ ├── nlg_Latn.yml
│ ├── nma_Latn.yml
│ ├── nmf_Latn.yml
│ ├── nmh_Latn.yml
│ ├── nmo_Latn.yml
│ ├── nmw_Latn.yml
│ ├── nmz_Latn.yml
│ ├── nnb_Latn.yml
│ ├── nng_Latn.yml
│ ├── nnh_Latn.yml
│ ├── nnl_Latn.yml
│ ├── nno_Latn.yml
│ ├── nnp_Latn.yml
│ ├── nnq_Latn.yml
│ ├── nnw_Latn.yml
│ ├── noa_Latn.yml
│ ├── nob_Latn.yml
│ ├── nod_Thai.yml
│ ├── nog_Cyrl.yml
│ ├── non_Latn.yml
│ ├── nop_Latn.yml
│ ├── not_Latn.yml
│ ├── nou_Latn.yml
│ ├── nov_Latn.yml
│ ├── nph_Latn.yml
│ ├── npi_Deva.yml
│ ├── npi_Latn.yml
│ ├── npl_Latn.yml
│ ├── npo_Latn.yml
│ ├── npy_Latn.yml
│ ├── nqo_Nkoo.yml
│ ├── nre_Latn.yml
│ ├── nrf_Latn.yml
│ ├── nri_Latn.yml
│ ├── nrm_Latn.yml
│ ├── nsa_Latn.yml
│ ├── nse_Latn.yml
│ ├── nsm_Latn.yml
│ ├── nsn_Latn.yml
│ ├── nso_Latn.yml
│ ├── nss_Latn.yml
│ ├── nst_Latn.yml
│ ├── nsu_Latn.yml
│ ├── ntp_Latn.yml
│ ├── ntr_Latn.yml
│ ├── ntu_Latn.yml
│ ├── nuj_Latn.yml
│ ├── nus_Latn.yml
│ ├── nuy_Latn.yml
│ ├── nuz_Latn.yml
│ ├── nvm_Latn.yml
│ ├── nwb_Latn.yml
│ ├── nwi_Latn.yml
│ ├── nwx_Deva.yml
│ ├── nxd_Latn.yml
│ ├── nya_Latn.yml
│ ├── nyf_Latn.yml
│ ├── nyk_Latn.yml
│ ├── nyn_Latn.yml
│ ├── nyo_Latn.yml
│ ├── nyu_Latn.yml
│ ├── nyy_Latn.yml
│ ├── nza_Latn.yml
│ ├── nzi_Latn.yml
│ ├── nzm_Latn.yml
│ ├── obo_Latn.yml
│ ├── oci_Latn.yml
│ ├── ogo_Latn.yml
│ ├── ojb_Cans.yml
│ ├── ojb_Latn.yml
│ ├── oke_Latn.yml
│ ├── oku_Latn.yml
│ ├── okv_Latn.yml
│ ├── old_Latn.yml
│ ├── olo_Latn.yml
│ ├── omb_Latn.yml
│ ├── omw_Latn.yml
│ ├── ong_Latn.yml
│ ├── ons_Latn.yml
│ ├── ood_Latn.yml
│ ├── opm_Latn.yml
│ ├── orv_Cyrl.yml
│ ├── ory_Latn.yml
│ ├── ory_Orya.yml
│ ├── oss_Cyrl.yml
│ ├── ota_Arab.yml
│ ├── otd_Latn.yml
│ ├── ote_Latn.yml
│ ├── otm_Latn.yml
│ ├── otn_Latn.yml
│ ├── oto_Latn.yml
│ ├── otq_Latn.yml
│ ├── ots_Latn.yml
│ ├── otw_Latn.yml
│ ├── oym_Latn.yml
│ ├── ozm_Latn.yml
│ ├── pab_Latn.yml
│ ├── pad_Latn.yml
│ ├── pag_Latn.yml
│ ├── pah_Latn.yml
│ ├── pam_Latn.yml
│ ├── pan_Guru.yml
│ ├── pan_Latn.yml
│ ├── pao_Latn.yml
│ ├── pap_Latn.yml
│ ├── pau_Latn.yml
│ ├── pbb_Latn.yml
│ ├── pbc_Latn.yml
│ ├── pbi_Latn.yml
│ ├── pbt_Arab.yml
│ ├── pcd_Latn.yml
│ ├── pck_Latn.yml
│ ├── pcm_Latn.yml
│ ├── pdc_Latn.yml
│ ├── pdt_Latn.yml
│ ├── pem_Latn.yml
│ ├── pfe_Latn.yml
│ ├── pfl_Latn.yml
│ ├── phm_Latn.yml
│ ├── pib_Latn.yml
│ ├── pio_Latn.yml
│ ├── pir_Latn.yml
│ ├── pis_Latn.yml
│ ├── pjt_Latn.yml
│ ├── pkb_Latn.yml
│ ├── plg_Latn.yml
│ ├── pls_Latn.yml
│ ├── plt_Latn.yml
│ ├── plu_Latn.yml
│ ├── plw_Latn.yml
│ ├── pma_Latn.yml
│ ├── pmf_Latn.yml
│ ├── pmq_Latn.yml
│ ├── pms_Latn.yml
│ ├── pmx_Latn.yml
│ ├── pnb_Arab.yml
│ ├── pne_Latn.yml
│ ├── pnt_Grek.yml
│ ├── pny_Latn.yml
│ ├── poe_Latn.yml
│ ├── poh_Latn.yml
│ ├── poi_Latn.yml
│ ├── pol_Latn.yml
│ ├── pon_Latn.yml
│ ├── por_Latn.yml
│ ├── pos_Latn.yml
│ ├── pot_Latn.yml
│ ├── pov_Latn.yml
│ ├── poy_Latn.yml
│ ├── ppk_Latn.yml
│ ├── ppo_Latn.yml
│ ├── pps_Latn.yml
│ ├── prf_Latn.yml
│ ├── prg_Latn.yml
│ ├── pri_Latn.yml
│ ├── prq_Latn.yml
│ ├── pse_Latn.yml
│ ├── pss_Latn.yml
│ ├── ptp_Latn.yml
│ ├── ptu_Latn.yml
│ ├── pua_Latn.yml
│ ├── pui_Latn.yml
│ ├── pwg_Latn.yml
│ ├── pwn_Latn.yml
│ ├── pww_Thai.yml
│ ├── pxm_Latn.yml
│ ├── qub_Latn.yml
│ ├── quc_Latn.yml
│ ├── quf_Latn.yml
│ ├── qug_Latn.yml
│ ├── quh_Latn.yml
│ ├── qul_Latn.yml
│ ├── qup_Latn.yml
│ ├── qus_Latn.yml
│ ├── quw_Latn.yml
│ ├── quy_Latn.yml
│ ├── quz_Latn.yml
│ ├── qva_Latn.yml
│ ├── qvc_Latn.yml
│ ├── qve_Latn.yml
│ ├── qvh_Latn.yml
│ ├── qvi_Latn.yml
│ ├── qvm_Latn.yml
│ ├── qvn_Latn.yml
│ ├── qvo_Latn.yml
│ ├── qvs_Latn.yml
│ ├── qvw_Latn.yml
│ ├── qvz_Latn.yml
│ ├── qwh_Latn.yml
│ ├── qxh_Latn.yml
│ ├── qxl_Latn.yml
│ ├── qxn_Latn.yml
│ ├── qxo_Latn.yml
│ ├── qxr_Latn.yml
│ ├── rad_Latn.yml
│ ├── rai_Latn.yml
│ ├── rap_Latn.yml
│ ├── rar_Latn.yml
│ ├── rav_Deva.yml
│ ├── raw_Latn.yml
│ ├── rcf_Latn.yml
│ ├── rej_Latn.yml
│ ├── rel_Latn.yml
│ ├── rgu_Latn.yml
│ ├── rhg_Latn.yml
│ ├── ria_Latn.yml
│ ├── rim_Latn.yml
│ ├── rjs_Deva.yml
│ ├── rkb_Latn.yml
│ ├── rmc_Latn.yml
│ ├── rme_Latn.yml
│ ├── rml_Latn.yml
│ ├── rmn_Cyrl.yml
│ ├── rmn_Grek.yml
│ ├── rmn_Latn.yml
│ ├── rmo_Latn.yml
│ ├── rmq_Latn.yml
│ ├── rmy_Cyrl.yml
│ ├── rmy_Latn.yml
│ ├── rnd_Latn.yml
│ ├── rng_Latn.yml
│ ├── rnl_Latn.yml
│ ├── roh_Latn.yml
│ ├── ron_Cyrl.yml
│ ├── ron_Latn.yml
│ ├── roo_Latn.yml
│ ├── rop_Latn.yml
│ ├── row_Latn.yml
│ ├── rro_Latn.yml
│ ├── rtm_Latn.yml
│ ├── rub_Latn.yml
│ ├── rue_Cyrl.yml
│ ├── ruf_Latn.yml
│ ├── rug_Latn.yml
│ ├── run_Latn.yml
│ ├── rup_Latn.yml
│ ├── rus_Cyrl.yml
│ ├── rwo_Latn.yml
│ ├── sab_Latn.yml
│ ├── sag_Latn.yml
│ ├── sah_Cyrl.yml
│ ├── saj_Latn.yml
│ ├── san_Deva.yml
│ ├── san_Latn.yml
│ ├── sas_Latn.yml
│ ├── sat_Latn.yml
│ ├── sat_Olck.yml
│ ├── say_Latn.yml
│ ├── sba_Latn.yml
│ ├── sbd_Latn.yml
│ ├── sbe_Latn.yml
│ ├── sbl_Latn.yml
│ ├── sbs_Latn.yml
│ ├── sby_Latn.yml
│ ├── sck_Deva.yml
│ ├── scn_Latn.yml
│ ├── sco_Latn.yml
│ ├── sda_Latn.yml
│ ├── sdc_Latn.yml
│ ├── sdh_Arab.yml
│ ├── sdo_Latn.yml
│ ├── sdq_Latn.yml
│ ├── seh_Latn.yml
│ ├── sel_Cyrl.yml
│ ├── ses_Latn.yml
│ ├── sey_Latn.yml
│ ├── sfw_Latn.yml
│ ├── sgb_Latn.yml
│ ├── sgc_Latn.yml
│ ├── sgh_Cyrl.yml
│ ├── sgs_Latn.yml
│ ├── sgw_Ethi.yml
│ ├── sgz_Latn.yml
│ ├── shi_Latn.yml
│ ├── shk_Latn.yml
│ ├── shn_Mymr.yml
│ ├── shp_Latn.yml
│ ├── shu_Arab.yml
│ ├── sid_Latn.yml
│ ├── sig_Latn.yml
│ ├── sil_Latn.yml
│ ├── sim_Latn.yml
│ ├── sin_Sinh.yml
│ ├── sja_Latn.yml
│ ├── sjo_Mong.yml
│ ├── sju_Latn.yml
│ ├── skg_Latn.yml
│ ├── skr_Arab.yml
│ ├── sld_Latn.yml
│ ├── slk_Latn.yml
│ ├── sll_Latn.yml
│ ├── slv_Latn.yml
│ ├── sma_Latn.yml
│ ├── sme_Latn.yml
│ ├── smj_Latn.yml
│ ├── smk_Latn.yml
│ ├── sml_Latn.yml
│ ├── smn_Latn.yml
│ ├── smo_Latn.yml
│ ├── sms_Latn.yml
│ ├── smt_Latn.yml
│ ├── sna_Latn.yml
│ ├── snc_Latn.yml
│ ├── snd_Arab.yml
│ ├── snd_Deva.yml
│ ├── snd_Latn.yml
│ ├── snf_Latn.yml
│ ├── snn_Latn.yml
│ ├── snp_Latn.yml
│ ├── snw_Latn.yml
│ ├── sny_Latn.yml
│ ├── soe_Latn.yml
│ ├── som_Latn.yml
│ ├── sop_Latn.yml
│ ├── soq_Latn.yml
│ ├── sot_Latn.yml
│ ├── soy_Latn.yml
│ ├── spa_Latn.yml
│ ├── spl_Latn.yml
│ ├── spm_Latn.yml
│ ├── spp_Latn.yml
│ ├── sps_Latn.yml
│ ├── spy_Latn.yml
│ ├── srd_Latn.yml
│ ├── sri_Latn.yml
│ ├── srm_Latn.yml
│ ├── srn_Latn.yml
│ ├── srp_Cyrl.yml
│ ├── srp_Latn.yml
│ ├── srq_Latn.yml
│ ├── srr_Latn.yml
│ ├── ssd_Latn.yml
│ ├── ssg_Latn.yml
│ ├── ssw_Latn.yml
│ ├── ssx_Latn.yml
│ ├── stn_Latn.yml
│ ├── stp_Latn.yml
│ ├── stq_Latn.yml
│ ├── sua_Latn.yml
│ ├── suc_Latn.yml
│ ├── sue_Latn.yml
│ ├── suk_Latn.yml
│ ├── sun_Latn.yml
│ ├── sur_Latn.yml
│ ├── sus_Arab.yml
│ ├── sus_Latn.yml
│ ├── suz_Deva.yml
│ ├── swb_Latn.yml
│ ├── swc_Latn.yml
│ ├── swe_Latn.yml
│ ├── swg_Latn.yml
│ ├── swh_Latn.yml
│ ├── swk_Latn.yml
│ ├── swp_Latn.yml
│ ├── sxb_Latn.yml
│ ├── sxn_Latn.yml
│ ├── syb_Latn.yml
│ ├── syc_Syrc.yml
│ ├── syl_Beng.yml
│ ├── syl_Latn.yml
│ ├── szb_Latn.yml
│ ├── szl_Latn.yml
│ ├── szy_Latn.yml
│ ├── tab_Cyrl.yml
│ ├── tac_Latn.yml
│ ├── tah_Latn.yml
│ ├── taj_Deva.yml
│ ├── tam_Latn.yml
│ ├── tam_Taml.yml
│ ├── tap_Latn.yml
│ ├── taq_Latn.yml
│ ├── taq_Tfng.yml
│ ├── tar_Latn.yml
│ ├── tat_Cyrl.yml
│ ├── tat_Latn.yml
│ ├── tav_Latn.yml
│ ├── taw_Latn.yml
│ ├── tay_Latn.yml
│ ├── tbc_Latn.yml
│ ├── tbg_Latn.yml
│ ├── tbk_Latn.yml
│ ├── tbl_Latn.yml
│ ├── tbo_Latn.yml
│ ├── tbw_Latn.yml
│ ├── tby_Latn.yml
│ ├── tbz_Latn.yml
│ ├── tca_Latn.yml
│ ├── tcc_Latn.yml
│ ├── tcf_Latn.yml
│ ├── tcs_Latn.yml
│ ├── tcy_Knda.yml
│ ├── tcz_Latn.yml
│ ├── tdx_Latn.yml
│ ├── ted_Latn.yml
│ ├── tee_Latn.yml
│ ├── tel_Latn.yml
│ ├── tel_Telu.yml
│ ├── tem_Latn.yml
│ ├── teo_Latn.yml
│ ├── ter_Latn.yml
│ ├── tet_Latn.yml
│ ├── tew_Latn.yml
│ ├── tfr_Latn.yml
│ ├── tgk_Cyrl.yml
│ ├── tgo_Latn.yml
│ ├── tgp_Latn.yml
│ ├── tha_Thai.yml
│ ├── thk_Latn.yml
│ ├── thl_Deva.yml
│ ├── thv_Latn.yml
│ ├── tif_Latn.yml
│ ├── tig_Ethi.yml
│ ├── tih_Latn.yml
│ ├── tik_Latn.yml
│ ├── tim_Latn.yml
│ ├── tir_Ethi.yml
│ ├── tiv_Latn.yml
│ ├── tiy_Latn.yml
│ ├── tke_Latn.yml
│ ├── tkl_Latn.yml
│ ├── tkr_Cyrl.yml
│ ├── tku_Latn.yml
│ ├── tlb_Latn.yml
│ ├── tlf_Latn.yml
│ ├── tlh_Latn.yml
│ ├── tlj_Latn.yml
│ ├── tll_Latn.yml
│ ├── tly_Latn.yml
│ ├── tmc_Latn.yml
│ ├── tmd_Latn.yml
│ ├── tna_Latn.yml
│ ├── tnc_Latn.yml
│ ├── tnk_Latn.yml
│ ├── tnn_Latn.yml
│ ├── tnp_Latn.yml
│ ├── tnr_Latn.yml
│ ├── tob_Latn.yml
│ ├── toc_Latn.yml
│ ├── tod_Latn.yml
│ ├── tog_Latn.yml
│ ├── toh_Latn.yml
│ ├── toi_Latn.yml
│ ├── toj_Latn.yml
│ ├── tok_Latn.yml
│ ├── ton_Latn.yml
│ ├── too_Latn.yml
│ ├── top_Latn.yml
│ ├── tos_Latn.yml
│ ├── tpa_Latn.yml
│ ├── tpi_Latn.yml
│ ├── tpm_Latn.yml
│ ├── tpn_Latn.yml
│ ├── tpp_Latn.yml
│ ├── tpt_Latn.yml
│ ├── tpw_Latn.yml
│ ├── tpz_Latn.yml
│ ├── tqo_Latn.yml
│ ├── trc_Latn.yml
│ ├── trn_Latn.yml
│ ├── tro_Latn.yml
│ ├── trp_Latn.yml
│ ├── trq_Latn.yml
│ ├── trs_Latn.yml
│ ├── trv_Latn.yml
│ ├── tsc_Latn.yml
│ ├── tsg_Latn.yml
│ ├── tsn_Latn.yml
│ ├── tso_Latn.yml
│ ├── tsw_Latn.yml
│ ├── tsz_Latn.yml
│ ├── ttc_Latn.yml
│ ├── tte_Latn.yml
│ ├── ttj_Latn.yml
│ ├── ttq_Latn.yml
│ ├── ttq_Tfng.yml
│ ├── tuc_Latn.yml
│ ├── tue_Latn.yml
│ ├── tuf_Latn.yml
│ ├── tui_Latn.yml
│ ├── tuk_Arab.yml
│ ├── tuk_Cyrl.yml
│ ├── tuk_Latn.yml
│ ├── tul_Latn.yml
│ ├── tum_Latn.yml
│ ├── tuo_Latn.yml
│ ├── tur_Latn.yml
│ ├── tuv_Latn.yml
│ ├── tvk_Latn.yml
│ ├── tvl_Latn.yml
│ ├── twb_Latn.yml
│ ├── twi_Latn.yml
│ ├── twu_Latn.yml
│ ├── twx_Latn.yml
│ ├── txq_Latn.yml
│ ├── txu_Latn.yml
│ ├── tyv_Cyrl.yml
│ ├── tzh_Latn.yml
│ ├── tzj_Latn.yml
│ ├── tzl_Latn.yml
│ ├── tzm_Tfng.yml
│ ├── tzo_Latn.yml
│ ├── ubr_Latn.yml
│ ├── ubu_Latn.yml
│ ├── udm_Cyrl.yml
│ ├── udu_Latn.yml
│ ├── uig_Arab.yml
│ ├── uig_Cyrl.yml
│ ├── uig_Latn.yml
│ ├── ukr_Cyrl.yml
│ ├── umb_Latn.yml
│ ├── upv_Latn.yml
│ ├── ura_Latn.yml
│ ├── urb_Latn.yml
│ ├── urd_Arab.yml
│ ├── urd_Latn.yml
│ ├── urh_Latn.yml
│ ├── uri_Latn.yml
│ ├── urk_Thai.yml
│ ├── urt_Latn.yml
│ ├── urw_Latn.yml
│ ├── ury_Latn.yml
│ ├── usa_Latn.yml
│ ├── usp_Latn.yml
│ ├── uth_Latn.yml
│ ├── uvh_Latn.yml
│ ├── uvl_Latn.yml
│ ├── uzn_Cyrl.yml
│ ├── uzn_Latn.yml
│ ├── uzs_Arab.yml
│ ├── vag_Latn.yml
│ ├── vap_Latn.yml
│ ├── var_Latn.yml
│ ├── vec_Latn.yml
│ ├── ven_Latn.yml
│ ├── vep_Latn.yml
│ ├── vid_Latn.yml
│ ├── vie_Latn.yml
│ ├── viv_Latn.yml
│ ├── vls_Latn.yml
│ ├── vmk_Latn.yml
│ ├── vmw_Latn.yml
│ ├── vmy_Latn.yml
│ ├── vol_Latn.yml
│ ├── vot_Latn.yml
│ ├── vro_Latn.yml
│ ├── vun_Latn.yml
│ ├── vut_Latn.yml
│ ├── waj_Latn.yml
│ ├── wal_Ethi.yml
│ ├── wal_Latn.yml
│ ├── wap_Latn.yml
│ ├── war_Latn.yml
│ ├── wat_Latn.yml
│ ├── way_Latn.yml
│ ├── wba_Latn.yml
│ ├── wbm_Latn.yml
│ ├── wbp_Latn.yml
│ ├── wed_Latn.yml
│ ├── wer_Latn.yml
│ ├── wes_Latn.yml
│ ├── wew_Latn.yml
│ ├── whg_Latn.yml
│ ├── whk_Latn.yml
│ ├── wib_Latn.yml
│ ├── wim_Latn.yml
│ ├── wiu_Latn.yml
│ ├── wln_Latn.yml
│ ├── wls_Latn.yml
│ ├── wlv_Latn.yml
│ ├── wlx_Latn.yml
│ ├── wmt_Latn.yml
│ ├── wmw_Latn.yml
│ ├── wnc_Latn.yml
│ ├── wnu_Latn.yml
│ ├── wob_Latn.yml
│ ├── wol_Latn.yml
│ ├── wos_Latn.yml
│ ├── wrk_Latn.yml
│ ├── wrs_Latn.yml
│ ├── wsg_Telu.yml
│ ├── wsk_Latn.yml
│ ├── wuu_Hani.yml
│ ├── wuv_Latn.yml
│ ├── wwa_Latn.yml
│ ├── xal_Cyrl.yml
│ ├── xav_Latn.yml
│ ├── xbi_Latn.yml
│ ├── xbr_Latn.yml
│ ├── xed_Latn.yml
│ ├── xho_Latn.yml
│ ├── xla_Latn.yml
│ ├── xmf_Geor.yml
│ ├── xmm_Latn.yml
│ ├── xmv_Latn.yml
│ ├── xnn_Latn.yml
│ ├── xog_Latn.yml
│ ├── xon_Latn.yml
│ ├── xrb_Latn.yml
│ ├── xsb_Latn.yml
│ ├── xsi_Latn.yml
│ ├── xsm_Latn.yml
│ ├── xsr_Deva.yml
│ ├── xsu_Latn.yml
│ ├── xtd_Latn.yml
│ ├── xtm_Latn.yml
│ ├── xtn_Latn.yml
│ ├── xum_Latn.yml
│ ├── xuo_Latn.yml
│ ├── yaa_Latn.yml
│ ├── yad_Latn.yml
│ ├── yal_Latn.yml
│ ├── yam_Latn.yml
│ ├── yan_Latn.yml
│ ├── yao_Latn.yml
│ ├── yap_Latn.yml
│ ├── yaq_Latn.yml
│ ├── yas_Latn.yml
│ ├── yat_Latn.yml
│ ├── yaz_Latn.yml
│ ├── ybb_Latn.yml
│ ├── yby_Latn.yml
│ ├── ycn_Latn.yml
│ ├── ydd_Hebr.yml
│ ├── yim_Latn.yml
│ ├── yka_Latn.yml
│ ├── yle_Latn.yml
│ ├── yli_Latn.yml
│ ├── yml_Latn.yml
│ ├── yom_Latn.yml
│ ├── yon_Latn.yml
│ ├── yor_Latn.yml
│ ├── yrb_Latn.yml
│ ├── yre_Latn.yml
│ ├── yrk_Cyrl.yml
│ ├── yrl_Latn.yml
│ ├── yss_Latn.yml
│ ├── yua_Latn.yml
│ ├── yue_Hani.yml
│ ├── yuj_Latn.yml
│ ├── yup_Latn.yml
│ ├── yut_Latn.yml
│ ├── yuw_Latn.yml
│ ├── yuz_Latn.yml
│ ├── yva_Latn.yml
│ ├── zaa_Latn.yml
│ ├── zab_Latn.yml
│ ├── zac_Latn.yml
│ ├── zad_Latn.yml
│ ├── zae_Latn.yml
│ ├── zai_Latn.yml
│ ├── zam_Latn.yml
│ ├── zao_Latn.yml
│ ├── zar_Latn.yml
│ ├── zas_Latn.yml
│ ├── zat_Latn.yml
│ ├── zav_Latn.yml
│ ├── zaw_Latn.yml
│ ├── zca_Latn.yml
│ ├── zdj_Latn.yml
│ ├── zea_Latn.yml
│ ├── zgh_Tfng.yml
│ ├── zia_Latn.yml
│ ├── ziw_Latn.yml
│ ├── zne_Latn.yml
│ ├── zoc_Latn.yml
│ ├── zom_Latn.yml
│ ├── zos_Latn.yml
│ ├── zpa_Latn.yml
│ ├── zpc_Latn.yml
│ ├── zpg_Latn.yml
│ ├── zpi_Latn.yml
│ ├── zpj_Latn.yml
│ ├── zpl_Latn.yml
│ ├── zpm_Latn.yml
│ ├── zpo_Latn.yml
│ ├── zpq_Latn.yml
│ ├── zpt_Latn.yml
│ ├── zpu_Latn.yml
│ ├── zpv_Latn.yml
│ ├── zpz_Latn.yml
│ ├── zsm_Arab.yml
│ ├── zsm_Latn.yml
│ ├── zsr_Latn.yml
│ ├── ztq_Latn.yml
│ ├── zty_Latn.yml
│ ├── zul_Latn.yml
│ ├── zyb_Latn.yml
│ └── zyp_Latn.yml
├── fineweb-2-pipeline.py
├── fineweb2-language-distribution.csv
└── misc/
├── precision_filtering/
│ ├── README.md
│ ├── audits/
│ │ ├── ary_Arab.tsv
│ │ ├── bar_Latn.tsv
│ │ ├── glk_Arab.tsv
│ │ ├── pcm_Latn.csv
│ │ └── pcm_Latn.tsv
│ ├── cont_scores.json
│ ├── count_common.py
│ ├── run_precision_filtering.py
│ ├── slurm_count_word.py
│ ├── url_whitelist.json
│ ├── wordlist_gen.py
│ ├── wordlist_score.py
│ ├── wordlists-0.85/
│ │ ├── aai_Latn.txt
│ │ ├── aak_Latn.txt
│ │ ├── aau_Latn.txt
│ │ ├── aaz_Latn.txt
│ │ ├── aba_Latn.txt
│ │ ├── abi_Latn.txt
│ │ ├── abk_Cyrl.txt
│ │ ├── abn_Latn.txt
│ │ ├── abq_Cyrl.txt
│ │ ├── abs_Latn.txt
│ │ ├── abt_Latn.txt
│ │ ├── abx_Latn.txt
│ │ ├── aby_Latn.txt
│ │ ├── abz_Latn.txt
│ │ ├── aca_Latn.txt
│ │ ├── acd_Latn.txt
│ │ ├── ace_Arab.txt
│ │ ├── ace_Latn.txt
│ │ ├── acf_Latn.txt
│ │ ├── ach_Latn.txt
│ │ ├── acm_Arab.txt
│ │ ├── acn_Latn.txt
│ │ ├── acr_Latn.txt
│ │ ├── acu_Latn.txt
│ │ ├── ada_Latn.txt
│ │ ├── ade_Latn.txt
│ │ ├── adh_Latn.txt
│ │ ├── adi_Latn.txt
│ │ ├── adj_Latn.txt
│ │ ├── adl_Latn.txt
│ │ ├── ady_Cyrl.txt
│ │ ├── adz_Latn.txt
│ │ ├── aeb_Arab.txt
│ │ ├── aer_Latn.txt
│ │ ├── aeu_Latn.txt
│ │ ├── aey_Latn.txt
│ │ ├── afr_Latn.txt
│ │ ├── agd_Latn.txt
│ │ ├── agg_Latn.txt
│ │ ├── agm_Latn.txt
│ │ ├── agn_Latn.txt
│ │ ├── agr_Latn.txt
│ │ ├── agt_Latn.txt
│ │ ├── agu_Latn.txt
│ │ ├── agw_Latn.txt
│ │ ├── agx_Cyrl.txt
│ │ ├── aha_Latn.txt
│ │ ├── ahk_Latn.txt
│ │ ├── aia_Latn.txt
│ │ ├── aii_Syrc.txt
│ │ ├── aim_Latn.txt
│ │ ├── ain_Latn.txt
│ │ ├── ajg_Latn.txt
│ │ ├── aji_Latn.txt
│ │ ├── ajz_Latn.txt
│ │ ├── akb_Latn.txt
│ │ ├── ake_Latn.txt
│ │ ├── akh_Latn.txt
│ │ ├── akp_Latn.txt
│ │ ├── ald_Latn.txt
│ │ ├── alj_Latn.txt
│ │ ├── aln_Latn.txt
│ │ ├── alp_Latn.txt
│ │ ├── alq_Latn.txt
│ │ ├── als_Latn.txt
│ │ ├── alt_Cyrl.txt
│ │ ├── aly_Latn.txt
│ │ ├── alz_Latn.txt
│ │ ├── ame_Latn.txt
│ │ ├── amf_Latn.txt
│ │ ├── amh_Ethi.txt
│ │ ├── ami_Latn.txt
│ │ ├── amk_Latn.txt
│ │ ├── amm_Latn.txt
│ │ ├── amn_Latn.txt
│ │ ├── amp_Latn.txt
│ │ ├── amr_Latn.txt
│ │ ├── amu_Latn.txt
│ │ ├── amx_Latn.txt
│ │ ├── ang_Latn.txt
│ │ ├── anm_Latn.txt
│ │ ├── ann_Latn.txt
│ │ ├── anp_Deva.txt
│ │ ├── anv_Latn.txt
│ │ ├── any_Latn.txt
│ │ ├── aoi_Latn.txt
│ │ ├── aoj_Latn.txt
│ │ ├── aom_Latn.txt
│ │ ├── aoz_Latn.txt
│ │ ├── apb_Latn.txt
│ │ ├── apc_Arab.txt
│ │ ├── ape_Latn.txt
│ │ ├── apn_Latn.txt
│ │ ├── apr_Latn.txt
│ │ ├── apt_Latn.txt
│ │ ├── apu_Latn.txt
│ │ ├── apw_Latn.txt
│ │ ├── apy_Latn.txt
│ │ ├── apz_Latn.txt
│ │ ├── aqz_Latn.txt
│ │ ├── arb_Arab.txt
│ │ ├── arb_Latn.txt
│ │ ├── are_Latn.txt
│ │ ├── arg_Latn.txt
│ │ ├── arl_Latn.txt
│ │ ├── arn_Latn.txt
│ │ ├── arp_Latn.txt
│ │ ├── arq_Arab.txt
│ │ ├── arr_Latn.txt
│ │ ├── ars_Arab.txt
│ │ ├── ary_Arab.txt
│ │ ├── arz_Arab.txt
│ │ ├── asg_Latn.txt
│ │ ├── asm_Beng.txt
│ │ ├── asm_Latn.txt
│ │ ├── aso_Latn.txt
│ │ ├── ast_Latn.txt
│ │ ├── ata_Latn.txt
│ │ ├── atb_Latn.txt
│ │ ├── atd_Latn.txt
│ │ ├── atg_Latn.txt
│ │ ├── ati_Latn.txt
│ │ ├── atj_Latn.txt
│ │ ├── atq_Latn.txt
│ │ ├── att_Latn.txt
│ │ ├── auc_Latn.txt
│ │ ├── aui_Latn.txt
│ │ ├── auy_Latn.txt
│ │ ├── ava_Cyrl.txt
│ │ ├── avk_Latn.txt
│ │ ├── avn_Latn.txt
│ │ ├── avt_Latn.txt
│ │ ├── avu_Latn.txt
│ │ ├── awa_Deva.txt
│ │ ├── awb_Latn.txt
│ │ ├── awi_Latn.txt
│ │ ├── awx_Latn.txt
│ │ ├── ayo_Latn.txt
│ │ ├── ayp_Arab.txt
│ │ ├── ayr_Latn.txt
│ │ ├── azb_Arab.txt
│ │ ├── azg_Latn.txt
│ │ ├── azj_Cyrl.txt
│ │ ├── azj_Latn.txt
│ │ ├── azz_Latn.txt
│ │ ├── bak_Cyrl.txt
│ │ ├── bal_Arab.txt
│ │ ├── bam_Latn.txt
│ │ ├── ban_Latn.txt
│ │ ├── bao_Latn.txt
│ │ ├── bar_Latn.txt
│ │ ├── bas_Latn.txt
│ │ ├── bav_Latn.txt
│ │ ├── bba_Latn.txt
│ │ ├── bbb_Latn.txt
│ │ ├── bbc_Latn.txt
│ │ ├── bbj_Latn.txt
│ │ ├── bbk_Latn.txt
│ │ ├── bbo_Latn.txt
│ │ ├── bbr_Latn.txt
│ │ ├── bcc_Arab.txt
│ │ ├── bch_Latn.txt
│ │ ├── bci_Latn.txt
│ │ ├── bcl_Latn.txt
│ │ ├── bco_Latn.txt
│ │ ├── bcw_Latn.txt
│ │ ├── bdd_Latn.txt
│ │ ├── bdh_Latn.txt
│ │ ├── bdq_Latn.txt
│ │ ├── bea_Latn.txt
│ │ ├── bef_Latn.txt
│ │ ├── bel_Cyrl.txt
│ │ ├── bem_Latn.txt
│ │ ├── ben_Beng.txt
│ │ ├── ben_Latn.txt
│ │ ├── beq_Latn.txt
│ │ ├── bew_Latn.txt
│ │ ├── bex_Latn.txt
│ │ ├── bfd_Latn.txt
│ │ ├── bfo_Latn.txt
│ │ ├── bgr_Latn.txt
│ │ ├── bgs_Latn.txt
│ │ ├── bgt_Latn.txt
│ │ ├── bgz_Latn.txt
│ │ ├── bhg_Latn.txt
│ │ ├── bhl_Latn.txt
│ │ ├── bho_Deva.txt
│ │ ├── bhp_Latn.txt
│ │ ├── bhw_Latn.txt
│ │ ├── bhz_Latn.txt
│ │ ├── bib_Latn.txt
│ │ ├── big_Latn.txt
│ │ ├── bim_Latn.txt
│ │ ├── bin_Latn.txt
│ │ ├── bis_Latn.txt
│ │ ├── biu_Latn.txt
│ │ ├── biv_Latn.txt
│ │ ├── bjn_Arab.txt
│ │ ├── bjn_Latn.txt
│ │ ├── bjp_Latn.txt
│ │ ├── bjr_Latn.txt
│ │ ├── bjv_Latn.txt
│ │ ├── bkd_Latn.txt
│ │ ├── bkl_Latn.txt
│ │ ├── bkq_Latn.txt
│ │ ├── bku_Latn.txt
│ │ ├── bkv_Latn.txt
│ │ ├── bla_Latn.txt
│ │ ├── blh_Latn.txt
│ │ ├── blk_Mymr.txt
│ │ ├── blt_Latn.txt
│ │ ├── blw_Latn.txt
│ │ ├── blz_Latn.txt
│ │ ├── bmh_Latn.txt
│ │ ├── bmk_Latn.txt
│ │ ├── bmq_Latn.txt
│ │ ├── bmr_Latn.txt
│ │ ├── bmu_Latn.txt
│ │ ├── bmv_Latn.txt
│ │ ├── bnj_Latn.txt
│ │ ├── bno_Latn.txt
│ │ ├── bnp_Latn.txt
│ │ ├── boa_Latn.txt
│ │ ├── bod_Tibt.txt
│ │ ├── boj_Latn.txt
│ │ ├── bom_Latn.txt
│ │ ├── bon_Latn.txt
│ │ ├── bor_Latn.txt
│ │ ├── bov_Latn.txt
│ │ ├── box_Latn.txt
│ │ ├── bpr_Latn.txt
│ │ ├── bps_Latn.txt
│ │ ├── bpy_Beng.txt
│ │ ├── bqc_Latn.txt
│ │ ├── bqj_Latn.txt
│ │ ├── bqp_Latn.txt
│ │ ├── bre_Latn.txt
│ │ ├── brh_Arab.txt
│ │ ├── bru_Latn.txt
│ │ ├── brx_Deva.txt
│ │ ├── brx_Latn.txt
│ │ ├── bsc_Latn.txt
│ │ ├── bsn_Latn.txt
│ │ ├── bsp_Latn.txt
│ │ ├── bsq_Latn.txt
│ │ ├── bss_Latn.txt
│ │ ├── btd_Latn.txt
│ │ ├── bth_Latn.txt
│ │ ├── bts_Latn.txt
│ │ ├── btt_Latn.txt
│ │ ├── btx_Latn.txt
│ │ ├── bud_Latn.txt
│ │ ├── bug_Latn.txt
│ │ ├── buk_Latn.txt
│ │ ├── bul_Cyrl.txt
│ │ ├── bum_Latn.txt
│ │ ├── bus_Latn.txt
│ │ ├── bvc_Latn.txt
│ │ ├── bvd_Latn.txt
│ │ ├── bvr_Latn.txt
│ │ ├── bvz_Latn.txt
│ │ ├── bwd_Latn.txt
│ │ ├── bwi_Latn.txt
│ │ ├── bwq_Latn.txt
│ │ ├── bwu_Latn.txt
│ │ ├── bxh_Latn.txt
│ │ ├── bxr_Cyrl.txt
│ │ ├── byr_Latn.txt
│ │ ├── byv_Latn.txt
│ │ ├── byx_Latn.txt
│ │ ├── bzd_Latn.txt
│ │ ├── bzh_Latn.txt
│ │ ├── bzi_Thai.txt
│ │ ├── bzj_Latn.txt
│ │ ├── caa_Latn.txt
│ │ ├── cab_Latn.txt
│ │ ├── cac_Latn.txt
│ │ ├── caf_Latn.txt
│ │ ├── cag_Latn.txt
│ │ ├── cak_Latn.txt
│ │ ├── cao_Latn.txt
│ │ ├── cap_Latn.txt
│ │ ├── caq_Latn.txt
│ │ ├── car_Latn.txt
│ │ ├── cas_Latn.txt
│ │ ├── cat_Latn.txt
│ │ ├── cav_Latn.txt
│ │ ├── cax_Latn.txt
│ │ ├── cbc_Latn.txt
│ │ ├── cbi_Latn.txt
│ │ ├── cbk_Latn.txt
│ │ ├── cbr_Latn.txt
│ │ ├── cbs_Latn.txt
│ │ ├── cbt_Latn.txt
│ │ ├── cbu_Latn.txt
│ │ ├── cbv_Latn.txt
│ │ ├── cce_Latn.txt
│ │ ├── cco_Latn.txt
│ │ ├── ccp_Latn.txt
│ │ ├── cdf_Latn.txt
│ │ ├── ceb_Latn.txt
│ │ ├── ceg_Latn.txt
│ │ ├── cek_Latn.txt
│ │ ├── ces_Latn.txt
│ │ ├── cfm_Latn.txt
│ │ ├── cgc_Latn.txt
│ │ ├── cgg_Latn.txt
│ │ ├── cha_Latn.txt
│ │ ├── chd_Latn.txt
│ │ ├── che_Cyrl.txt
│ │ ├── chf_Latn.txt
│ │ ├── chj_Latn.txt
│ │ ├── chk_Latn.txt
│ │ ├── cho_Latn.txt
│ │ ├── chq_Latn.txt
│ │ ├── chr_Cher.txt
│ │ ├── chr_Latn.txt
│ │ ├── chu_Cyrl.txt
│ │ ├── chv_Cyrl.txt
│ │ ├── chw_Latn.txt
│ │ ├── chz_Latn.txt
│ │ ├── cjk_Latn.txt
│ │ ├── cjo_Latn.txt
│ │ ├── cjp_Latn.txt
│ │ ├── cjs_Cyrl.txt
│ │ ├── cjv_Latn.txt
│ │ ├── ckb_Arab.txt
│ │ ├── cko_Latn.txt
│ │ ├── ckt_Cyrl.txt
│ │ ├── cle_Latn.txt
│ │ ├── clu_Latn.txt
│ │ ├── cly_Latn.txt
│ │ ├── cme_Latn.txt
│ │ ├── cmn_Hani.txt
│ │ ├── cmo_Khmr.txt
│ │ ├── cmo_Latn.txt
│ │ ├── cmr_Latn.txt
│ │ ├── cnh_Latn.txt
│ │ ├── cni_Latn.txt
│ │ ├── cnk_Latn.txt
│ │ ├── cnl_Latn.txt
│ │ ├── cnt_Latn.txt
│ │ ├── cnw_Latn.txt
│ │ ├── coe_Latn.txt
│ │ ├── cof_Latn.txt
│ │ ├── cok_Latn.txt
│ │ ├── con_Latn.txt
│ │ ├── cop_Copt.txt
│ │ ├── cor_Latn.txt
│ │ ├── cos_Latn.txt
│ │ ├── cot_Latn.txt
│ │ ├── cou_Latn.txt
│ │ ├── cpa_Latn.txt
│ │ ├── cpb_Latn.txt
│ │ ├── cpc_Latn.txt
│ │ ├── cpu_Latn.txt
│ │ ├── cpy_Latn.txt
│ │ ├── crh_Cyrl.txt
│ │ ├── crh_Latn.txt
│ │ ├── cri_Latn.txt
│ │ ├── crj_Cans.txt
│ │ ├── crk_Cans.txt
│ │ ├── crk_Latn.txt
│ │ ├── crl_Cans.txt
│ │ ├── crm_Cans.txt
│ │ ├── crn_Latn.txt
│ │ ├── crs_Latn.txt
│ │ ├── crt_Latn.txt
│ │ ├── crx_Latn.txt
│ │ ├── csb_Latn.txt
│ │ ├── csk_Latn.txt
│ │ ├── cso_Latn.txt
│ │ ├── csw_Latn.txt
│ │ ├── csy_Latn.txt
│ │ ├── cta_Latn.txt
│ │ ├── ctd_Latn.txt
│ │ ├── cto_Latn.txt
│ │ ├── ctp_Latn.txt
│ │ ├── ctu_Latn.txt
│ │ ├── cub_Latn.txt
│ │ ├── cuc_Latn.txt
│ │ ├── cui_Latn.txt
│ │ ├── cuk_Latn.txt
│ │ ├── cul_Latn.txt
│ │ ├── cut_Latn.txt
│ │ ├── cux_Latn.txt
│ │ ├── cwd_Cans.txt
│ │ ├── cwe_Latn.txt
│ │ ├── cwt_Latn.txt
│ │ ├── cya_Latn.txt
│ │ ├── cym_Latn.txt
│ │ ├── czt_Latn.txt
│ │ ├── daa_Latn.txt
│ │ ├── dad_Latn.txt
│ │ ├── daf_Latn.txt
│ │ ├── dag_Latn.txt
│ │ ├── dah_Latn.txt
│ │ ├── dak_Latn.txt
│ │ ├── dan_Latn.txt
│ │ ├── dar_Cyrl.txt
│ │ ├── dbq_Latn.txt
│ │ ├── ddg_Latn.txt
│ │ ├── ddn_Latn.txt
│ │ ├── ded_Latn.txt
│ │ ├── des_Latn.txt
│ │ ├── deu_Latn.txt
│ │ ├── dga_Latn.txt
│ │ ├── dgc_Latn.txt
│ │ ├── dgi_Latn.txt
│ │ ├── dgr_Latn.txt
│ │ ├── dgz_Latn.txt
│ │ ├── dhg_Latn.txt
│ │ ├── dhm_Latn.txt
│ │ ├── dhv_Latn.txt
│ │ ├── did_Latn.txt
│ │ ├── dig_Latn.txt
│ │ ├── dik_Latn.txt
│ │ ├── dip_Latn.txt
│ │ ├── diq_Latn.txt
│ │ ├── dis_Latn.txt
│ │ ├── diu_Latn.txt
│ │ ├── div_Thaa.txt
│ │ ├── dje_Latn.txt
│ │ ├── djk_Latn.txt
│ │ ├── djr_Latn.txt
│ │ ├── dks_Latn.txt
│ │ ├── dln_Latn.txt
│ │ ├── dng_Cyrl.txt
│ │ ├── dnj_Latn.txt
│ │ ├── dnw_Latn.txt
│ │ ├── dob_Latn.txt
│ │ ├── doi_Deva.txt
│ │ ├── dop_Latn.txt
│ │ ├── dos_Latn.txt
│ │ ├── dow_Latn.txt
│ │ ├── drg_Latn.txt
│ │ ├── dru_Latn.txt
│ │ ├── dsb_Latn.txt
│ │ ├── dsh_Latn.txt
│ │ ├── dtb_Latn.txt
│ │ ├── dtp_Latn.txt
│ │ ├── dts_Latn.txt
│ │ ├── dty_Deva.txt
│ │ ├── dua_Latn.txt
│ │ ├── due_Latn.txt
│ │ ├── dug_Latn.txt
│ │ ├── duo_Latn.txt
│ │ ├── dur_Latn.txt
│ │ ├── dwr_Latn.txt
│ │ ├── dww_Latn.txt
│ │ ├── dyi_Latn.txt
│ │ ├── dyo_Latn.txt
│ │ ├── dyu_Latn.txt
│ │ ├── dzo_Tibt.txt
│ │ ├── ebk_Latn.txt
│ │ ├── efi_Latn.txt
│ │ ├── eka_Latn.txt
│ │ ├── ekk_Latn.txt
│ │ ├── eko_Latn.txt
│ │ ├── ell_Grek.txt
│ │ ├── eme_Latn.txt
│ │ ├── emi_Latn.txt
│ │ ├── eml_Latn.txt
│ │ ├── emp_Latn.txt
│ │ ├── enb_Latn.txt
│ │ ├── eng_Latn.txt
│ │ ├── enl_Latn.txt
│ │ ├── enm_Latn.txt
│ │ ├── enq_Latn.txt
│ │ ├── enx_Latn.txt
│ │ ├── epo_Latn.txt
│ │ ├── eri_Latn.txt
│ │ ├── ese_Latn.txt
│ │ ├── esi_Latn.txt
│ │ ├── esk_Latn.txt
│ │ ├── ess_Latn.txt
│ │ ├── esu_Latn.txt
│ │ ├── eto_Latn.txt
│ │ ├── etr_Latn.txt
│ │ ├── etu_Latn.txt
│ │ ├── eus_Latn.txt
│ │ ├── eve_Cyrl.txt
│ │ ├── ewe_Latn.txt
│ │ ├── ewo_Latn.txt
│ │ ├── ext_Latn.txt
│ │ ├── eza_Latn.txt
│ │ ├── faa_Latn.txt
│ │ ├── fad_Latn.txt
│ │ ├── fai_Latn.txt
│ │ ├── fal_Latn.txt
│ │ ├── fan_Latn.txt
│ │ ├── fao_Latn.txt
│ │ ├── far_Latn.txt
│ │ ├── fas_Arab.txt
│ │ ├── fat_Latn.txt
│ │ ├── ffm_Latn.txt
│ │ ├── fij_Latn.txt
│ │ ├── fil_Latn.txt
│ │ ├── fin_Latn.txt
│ │ ├── fit_Latn.txt
│ │ ├── fkv_Latn.txt
│ │ ├── fmu_Deva.txt
│ │ ├── fon_Latn.txt
│ │ ├── for_Latn.txt
│ │ ├── fra_Latn.txt
│ │ ├── frd_Latn.txt
│ │ ├── fro_Latn.txt
│ │ ├── frp_Latn.txt
│ │ ├── frr_Latn.txt
│ │ ├── fry_Latn.txt
│ │ ├── fub_Latn.txt
│ │ ├── fud_Latn.txt
│ │ ├── fue_Latn.txt
│ │ ├── fuf_Latn.txt
│ │ ├── fuh_Latn.txt
│ │ ├── fuq_Latn.txt
│ │ ├── fur_Latn.txt
│ │ ├── fuv_Arab.txt
│ │ ├── fuv_Latn.txt
│ │ ├── gaa_Latn.txt
│ │ ├── gag_Cyrl.txt
│ │ ├── gag_Latn.txt
│ │ ├── gah_Latn.txt
│ │ ├── gai_Latn.txt
│ │ ├── gam_Latn.txt
│ │ ├── gaw_Latn.txt
│ │ ├── gaz_Latn.txt
│ │ ├── gbi_Latn.txt
│ │ ├── gbo_Latn.txt
│ │ ├── gbr_Latn.txt
│ │ ├── gcf_Latn.txt
│ │ ├── gcr_Latn.txt
│ │ ├── gde_Latn.txt
│ │ ├── gdg_Latn.txt
│ │ ├── gdn_Latn.txt
│ │ ├── gdr_Latn.txt
│ │ ├── geb_Latn.txt
│ │ ├── gej_Latn.txt
│ │ ├── gfk_Latn.txt
│ │ ├── ghe_Deva.txt
│ │ ├── ghs_Latn.txt
│ │ ├── gid_Latn.txt
│ │ ├── gil_Latn.txt
│ │ ├── giz_Latn.txt
│ │ ├── gjn_Latn.txt
│ │ ├── gkn_Latn.txt
│ │ ├── gla_Latn.txt
│ │ ├── gle_Latn.txt
│ │ ├── glg_Latn.txt
│ │ ├── glk_Arab.txt
│ │ ├── glv_Latn.txt
│ │ ├── gmh_Latn.txt
│ │ ├── gmv_Ethi.txt
│ │ ├── gmv_Latn.txt
│ │ ├── gna_Latn.txt
│ │ ├── gnb_Latn.txt
│ │ ├── gnd_Latn.txt
│ │ ├── gng_Latn.txt
│ │ ├── gnn_Latn.txt
│ │ ├── gnw_Latn.txt
│ │ ├── goa_Latn.txt
│ │ ├── gof_Ethi.txt
│ │ ├── gof_Latn.txt
│ │ ├── gog_Latn.txt
│ │ ├── goh_Latn.txt
│ │ ├── gom_Deva.txt
│ │ ├── gom_Latn.txt
│ │ ├── gor_Latn.txt
│ │ ├── gos_Latn.txt
│ │ ├── got_Goth.txt
│ │ ├── got_Latn.txt
│ │ ├── gqr_Latn.txt
│ │ ├── grc_Grek.txt
│ │ ├── grt_Beng.txt
│ │ ├── gso_Latn.txt
│ │ ├── gsw_Latn.txt
│ │ ├── gub_Latn.txt
│ │ ├── guc_Latn.txt
│ │ ├── gud_Latn.txt
│ │ ├── gug_Latn.txt
│ │ ├── guh_Latn.txt
│ │ ├── gui_Latn.txt
│ │ ├── guj_Gujr.txt
│ │ ├── guj_Latn.txt
│ │ ├── guk_Ethi.txt
│ │ ├── gul_Latn.txt
│ │ ├── gum_Latn.txt
│ │ ├── gun_Latn.txt
│ │ ├── guo_Latn.txt
│ │ ├── guq_Latn.txt
│ │ ├── gur_Latn.txt
│ │ ├── guu_Latn.txt
│ │ ├── guw_Latn.txt
│ │ ├── gux_Latn.txt
│ │ ├── guz_Latn.txt
│ │ ├── gvc_Latn.txt
│ │ ├── gvf_Latn.txt
│ │ ├── gvl_Latn.txt
│ │ ├── gvn_Latn.txt
│ │ ├── gwi_Latn.txt
│ │ ├── gwr_Latn.txt
│ │ ├── gya_Latn.txt
│ │ ├── gym_Latn.txt
│ │ ├── gyr_Latn.txt
│ │ ├── hac_Arab.txt
│ │ ├── hae_Latn.txt
│ │ ├── hag_Latn.txt
│ │ ├── hak_Hani.txt
│ │ ├── hak_Latn.txt
│ │ ├── hat_Latn.txt
│ │ ├── hau_Latn.txt
│ │ ├── hav_Latn.txt
│ │ ├── haw_Latn.txt
│ │ ├── hay_Latn.txt
│ │ ├── hbo_Hebr.txt
│ │ ├── hbs_Latn.txt
│ │ ├── hch_Latn.txt
│ │ ├── heb_Hebr.txt
│ │ ├── heg_Latn.txt
│ │ ├── heh_Latn.txt
│ │ ├── her_Latn.txt
│ │ ├── hif_Latn.txt
│ │ ├── hig_Latn.txt
│ │ ├── hil_Latn.txt
│ │ ├── hin_Deva.txt
│ │ ├── hin_Latn.txt
│ │ ├── hix_Latn.txt
│ │ ├── hla_Latn.txt
│ │ ├── hlt_Latn.txt
│ │ ├── hmo_Latn.txt
│ │ ├── hmr_Latn.txt
│ │ ├── hne_Deva.txt
│ │ ├── hnj_Latn.txt
│ │ ├── hnn_Latn.txt
│ │ ├── hns_Latn.txt
│ │ ├── hoc_Latn.txt
│ │ ├── hoc_Wara.txt
│ │ ├── hop_Latn.txt
│ │ ├── hot_Latn.txt
│ │ ├── hra_Latn.txt
│ │ ├── hrv_Latn.txt
│ │ ├── hrx_Latn.txt
│ │ ├── hsb_Latn.txt
│ │ ├── hto_Latn.txt
│ │ ├── hub_Latn.txt
│ │ ├── hui_Latn.txt
│ │ ├── hun_Latn.txt
│ │ ├── hus_Latn.txt
│ │ ├── huu_Latn.txt
│ │ ├── huv_Latn.txt
│ │ ├── hvn_Latn.txt
│ │ ├── hwc_Latn.txt
│ │ ├── hye_Armn.txt
│ │ ├── hyw_Armn.txt
│ │ ├── ian_Latn.txt
│ │ ├── iba_Latn.txt
│ │ ├── ibg_Latn.txt
│ │ ├── ibo_Latn.txt
│ │ ├── icr_Latn.txt
│ │ ├── ido_Latn.txt
│ │ ├── idu_Latn.txt
│ │ ├── ifa_Latn.txt
│ │ ├── ifb_Latn.txt
│ │ ├── ife_Latn.txt
│ │ ├── ifk_Latn.txt
│ │ ├── ifu_Latn.txt
│ │ ├── ify_Latn.txt
│ │ ├── ige_Latn.txt
│ │ ├── ign_Latn.txt
│ │ ├── ike_Cans.txt
│ │ ├── ikk_Latn.txt
│ │ ├── ikt_Latn.txt
│ │ ├── ikw_Latn.txt
│ │ ├── ilb_Latn.txt
│ │ ├── ile_Latn.txt
│ │ ├── ilo_Latn.txt
│ │ ├── imo_Latn.txt
│ │ ├── ina_Latn.txt
│ │ ├── inb_Latn.txt
│ │ ├── ind_Latn.txt
│ │ ├── inh_Cyrl.txt
│ │ ├── ino_Latn.txt
│ │ ├── iou_Latn.txt
│ │ ├── ipi_Latn.txt
│ │ ├── iqw_Latn.txt
│ │ ├── iri_Latn.txt
│ │ ├── irk_Latn.txt
│ │ ├── iry_Latn.txt
│ │ ├── isd_Latn.txt
│ │ ├── ish_Latn.txt
│ │ ├── isl_Latn.txt
│ │ ├── iso_Latn.txt
│ │ ├── ita_Latn.txt
│ │ ├── itl_Cyrl.txt
│ │ ├── itv_Latn.txt
│ │ ├── ium_Latn.txt
│ │ ├── ivb_Latn.txt
│ │ ├── ivv_Latn.txt
│ │ ├── iws_Latn.txt
│ │ ├── ixl_Latn.txt
│ │ ├── izr_Latn.txt
│ │ ├── izz_Latn.txt
│ │ ├── jaa_Latn.txt
│ │ ├── jac_Latn.txt
│ │ ├── jae_Latn.txt
│ │ ├── jam_Latn.txt
│ │ ├── jav_Latn.txt
│ │ ├── jbo_Latn.txt
│ │ ├── jbu_Latn.txt
│ │ ├── jic_Latn.txt
│ │ ├── jiv_Latn.txt
│ │ ├── jmc_Latn.txt
│ │ ├── jpn_Jpan.txt
│ │ ├── jra_Latn.txt
│ │ ├── jun_Orya.txt
│ │ ├── jvn_Latn.txt
│ │ ├── kaa_Cyrl.txt
│ │ ├── kaa_Latn.txt
│ │ ├── kab_Latn.txt
│ │ ├── kac_Latn.txt
│ │ ├── kak_Latn.txt
│ │ ├── kal_Latn.txt
│ │ ├── kam_Latn.txt
│ │ ├── kan_Knda.txt
│ │ ├── kan_Latn.txt
│ │ ├── kao_Latn.txt
│ │ ├── kap_Cyrl.txt
│ │ ├── kaq_Latn.txt
│ │ ├── kas_Arab.txt
│ │ ├── kas_Deva.txt
│ │ ├── kas_Latn.txt
│ │ ├── kat_Geor.txt
│ │ ├── kaz_Cyrl.txt
│ │ ├── kbc_Latn.txt
│ │ ├── kbd_Cyrl.txt
│ │ ├── kbh_Latn.txt
│ │ ├── kbm_Latn.txt
│ │ ├── kbo_Latn.txt
│ │ ├── kbp_Latn.txt
│ │ ├── kbq_Latn.txt
│ │ ├── kbr_Latn.txt
│ │ ├── kby_Latn.txt
│ │ ├── kca_Cyrl.txt
│ │ ├── kcg_Latn.txt
│ │ ├── kck_Latn.txt
│ │ ├── kdc_Latn.txt
│ │ ├── kde_Latn.txt
│ │ ├── kdh_Latn.txt
│ │ ├── kdi_Latn.txt
│ │ ├── kdj_Latn.txt
│ │ ├── kdl_Latn.txt
│ │ ├── kdr_Latn.txt
│ │ ├── kea_Latn.txt
│ │ ├── kei_Latn.txt
│ │ ├── kek_Latn.txt
│ │ ├── ken_Latn.txt
│ │ ├── keo_Latn.txt
│ │ ├── ker_Latn.txt
│ │ ├── kew_Latn.txt
│ │ ├── kex_Deva.txt
│ │ ├── kez_Latn.txt
│ │ ├── kff_Telu.txt
│ │ ├── kgf_Latn.txt
│ │ ├── kgk_Latn.txt
│ │ ├── kgp_Latn.txt
│ │ ├── kgr_Latn.txt
│ │ ├── kha_Latn.txt
│ │ ├── khk_Cyrl.txt
│ │ ├── khm_Khmr.txt
│ │ ├── khq_Latn.txt
│ │ ├── khs_Latn.txt
│ │ ├── khy_Latn.txt
│ │ ├── khz_Latn.txt
│ │ ├── kia_Latn.txt
│ │ ├── kij_Latn.txt
│ │ ├── kik_Latn.txt
│ │ ├── kin_Latn.txt
│ │ ├── kir_Cyrl.txt
│ │ ├── kiu_Latn.txt
│ │ ├── kix_Latn.txt
│ │ ├── kjb_Latn.txt
│ │ ├── kje_Latn.txt
│ │ ├── kjh_Cyrl.txt
│ │ ├── kjs_Latn.txt
│ │ ├── kkc_Latn.txt
│ │ ├── kki_Latn.txt
│ │ ├── kkj_Latn.txt
│ │ ├── kkl_Latn.txt
│ │ ├── kle_Deva.txt
│ │ ├── klt_Latn.txt
│ │ ├── klv_Latn.txt
│ │ ├── kma_Latn.txt
│ │ ├── kmb_Latn.txt
│ │ ├── kmd_Latn.txt
│ │ ├── kmg_Latn.txt
│ │ ├── kmh_Latn.txt
│ │ ├── kmk_Latn.txt
│ │ ├── kmm_Latn.txt
│ │ ├── kmo_Latn.txt
│ │ ├── kmr_Cyrl.txt
│ │ ├── kmr_Latn.txt
│ │ ├── kms_Latn.txt
│ │ ├── kmu_Latn.txt
│ │ ├── kmy_Latn.txt
│ │ ├── knc_Arab.txt
│ │ ├── knc_Latn.txt
│ │ ├── kne_Latn.txt
│ │ ├── knf_Latn.txt
│ │ ├── kng_Latn.txt
│ │ ├── knj_Latn.txt
│ │ ├── knk_Latn.txt
│ │ ├── kno_Latn.txt
│ │ ├── knv_Latn.txt
│ │ ├── knx_Latn.txt
│ │ ├── kny_Latn.txt
│ │ ├── kog_Latn.txt
│ │ ├── koi_Cyrl.txt
│ │ ├── koo_Latn.txt
│ │ ├── kor_Hang.txt
│ │ ├── kos_Latn.txt
│ │ ├── kpe_Latn.txt
│ │ ├── kpf_Latn.txt
│ │ ├── kpg_Latn.txt
│ │ ├── kpj_Latn.txt
│ │ ├── kpq_Latn.txt
│ │ ├── kpr_Latn.txt
│ │ ├── kpv_Cyrl.txt
│ │ ├── kpw_Latn.txt
│ │ ├── kpx_Latn.txt
│ │ ├── kpz_Latn.txt
│ │ ├── kqa_Latn.txt
│ │ ├── kqc_Latn.txt
│ │ ├── kqe_Latn.txt
│ │ ├── kqf_Latn.txt
│ │ ├── kql_Latn.txt
│ │ ├── kqn_Latn.txt
│ │ ├── kqo_Latn.txt
│ │ ├── kqp_Latn.txt
│ │ ├── kqs_Latn.txt
│ │ ├── kqw_Latn.txt
│ │ ├── kqy_Ethi.txt
│ │ ├── krc_Cyrl.txt
│ │ ├── kri_Latn.txt
│ │ ├── krj_Latn.txt
│ │ ├── krl_Latn.txt
│ │ ├── kru_Deva.txt
│ │ ├── krx_Latn.txt
│ │ ├── ksb_Latn.txt
│ │ ├── ksc_Latn.txt
│ │ ├── ksd_Latn.txt
│ │ ├── ksf_Latn.txt
│ │ ├── ksh_Latn.txt
│ │ ├── ksj_Latn.txt
│ │ ├── ksp_Latn.txt
│ │ ├── ksr_Latn.txt
│ │ ├── kss_Latn.txt
│ │ ├── ksw_Mymr.txt
│ │ ├── ktb_Ethi.txt
│ │ ├── ktj_Latn.txt
│ │ ├── ktm_Latn.txt
│ │ ├── kto_Latn.txt
│ │ ├── ktu_Latn.txt
│ │ ├── ktz_Latn.txt
│ │ ├── kua_Latn.txt
│ │ ├── kub_Latn.txt
│ │ ├── kud_Latn.txt
│ │ ├── kue_Latn.txt
│ │ ├── kuj_Latn.txt
│ │ ├── kum_Cyrl.txt
│ │ ├── kup_Latn.txt
│ │ ├── kus_Latn.txt
│ │ ├── kvg_Latn.txt
│ │ ├── kvj_Latn.txt
│ │ ├── kvn_Latn.txt
│ │ ├── kwd_Latn.txt
│ │ ├── kwf_Latn.txt
│ │ ├── kwi_Latn.txt
│ │ ├── kwj_Latn.txt
│ │ ├── kwn_Latn.txt
│ │ ├── kwy_Latn.txt
│ │ ├── kxc_Ethi.txt
│ │ ├── kxm_Thai.txt
│ │ ├── kxw_Latn.txt
│ │ ├── kyc_Latn.txt
│ │ ├── kyf_Latn.txt
│ │ ├── kyg_Latn.txt
│ │ ├── kyq_Latn.txt
│ │ ├── kyu_Kali.txt
│ │ ├── kyu_Latn.txt
│ │ ├── kyu_Mymr.txt
│ │ ├── kyz_Latn.txt
│ │ ├── kze_Latn.txt
│ │ ├── kzf_Latn.txt
│ │ ├── kzj_Latn.txt
│ │ ├── kzn_Latn.txt
│ │ ├── lac_Latn.txt
│ │ ├── lad_Hebr.txt
│ │ ├── lad_Latn.txt
│ │ ├── lai_Latn.txt
│ │ ├── laj_Latn.txt
│ │ ├── lam_Latn.txt
│ │ ├── lao_Laoo.txt
│ │ ├── lap_Latn.txt
│ │ ├── las_Latn.txt
│ │ ├── lat_Latn.txt
│ │ ├── law_Latn.txt
│ │ ├── lbb_Latn.txt
│ │ ├── lbe_Cyrl.txt
│ │ ├── lbj_Tibt.txt
│ │ ├── lbk_Latn.txt
│ │ ├── lcm_Latn.txt
│ │ ├── lcp_Thai.txt
│ │ ├── ldi_Latn.txt
│ │ ├── ldn_Latn.txt
│ │ ├── lea_Latn.txt
│ │ ├── led_Latn.txt
│ │ ├── lee_Latn.txt
│ │ ├── lef_Latn.txt
│ │ ├── leh_Latn.txt
│ │ ├── lem_Latn.txt
│ │ ├── leu_Latn.txt
│ │ ├── lew_Latn.txt
│ │ ├── lex_Latn.txt
│ │ ├── lez_Cyrl.txt
│ │ ├── lfn_Cyrl.txt
│ │ ├── lfn_Latn.txt
│ │ ├── lgg_Latn.txt
│ │ ├── lgl_Latn.txt
│ │ ├── lgm_Latn.txt
│ │ ├── lhi_Latn.txt
│ │ ├── lhu_Latn.txt
│ │ ├── lia_Latn.txt
│ │ ├── lid_Latn.txt
│ │ ├── lif_Deva.txt
│ │ ├── lif_Limb.txt
│ │ ├── lij_Latn.txt
│ │ ├── lim_Latn.txt
│ │ ├── lin_Latn.txt
│ │ ├── lip_Latn.txt
│ │ ├── lis_Lisu.txt
│ │ ├── lit_Latn.txt
│ │ ├── liv_Latn.txt
│ │ ├── ljp_Latn.txt
│ │ ├── lki_Arab.txt
│ │ ├── llb_Latn.txt
│ │ ├── lld_Latn.txt
│ │ ├── llg_Latn.txt
│ │ ├── lln_Latn.txt
│ │ ├── lmk_Latn.txt
│ │ ├── lmo_Latn.txt
│ │ ├── lmp_Latn.txt
│ │ ├── lnd_Latn.txt
│ │ ├── lob_Latn.txt
│ │ ├── loe_Latn.txt
│ │ ├── log_Latn.txt
│ │ ├── lok_Latn.txt
│ │ ├── lol_Latn.txt
│ │ ├── lom_Latn.txt
│ │ ├── loq_Latn.txt
│ │ ├── loz_Latn.txt
│ │ ├── lrc_Arab.txt
│ │ ├── lsi_Latn.txt
│ │ ├── lsm_Latn.txt
│ │ ├── ltg_Latn.txt
│ │ ├── ltz_Latn.txt
│ │ ├── lua_Latn.txt
│ │ ├── lub_Latn.txt
│ │ ├── luc_Latn.txt
│ │ ├── lud_Latn.txt
│ │ ├── lue_Latn.txt
│ │ ├── lug_Latn.txt
│ │ ├── lun_Latn.txt
│ │ ├── luo_Latn.txt
│ │ ├── lus_Latn.txt
│ │ ├── lvs_Latn.txt
│ │ ├── lwg_Latn.txt
│ │ ├── lwo_Latn.txt
│ │ ├── lww_Latn.txt
│ │ ├── lzh_Hani.txt
│ │ ├── maa_Latn.txt
│ │ ├── mad_Latn.txt
│ │ ├── maf_Latn.txt
│ │ ├── mag_Deva.txt
│ │ ├── mah_Latn.txt
│ │ ├── mai_Deva.txt
│ │ ├── maj_Latn.txt
│ │ ├── mak_Latn.txt
│ │ ├── mal_Latn.txt
│ │ ├── mal_Mlym.txt
│ │ ├── mam_Latn.txt
│ │ ├── maq_Latn.txt
│ │ ├── mar_Deva.txt
│ │ ├── mar_Latn.txt
│ │ ├── mas_Latn.txt
│ │ ├── mau_Latn.txt
│ │ ├── mav_Latn.txt
│ │ ├── maw_Latn.txt
│ │ ├── max_Latn.txt
│ │ ├── maz_Latn.txt
│ │ ├── mbb_Latn.txt
│ │ ├── mbc_Latn.txt
│ │ ├── mbd_Latn.txt
│ │ ├── mbf_Latn.txt
│ │ ├── mbh_Latn.txt
│ │ ├── mbi_Latn.txt
│ │ ├── mbj_Latn.txt
│ │ ├── mbl_Latn.txt
│ │ ├── mbs_Latn.txt
│ │ ├── mbt_Latn.txt
│ │ ├── mca_Latn.txt
│ │ ├── mcb_Latn.txt
│ │ ├── mcd_Latn.txt
│ │ ├── mcf_Latn.txt
│ │ ├── mck_Latn.txt
│ │ ├── mcn_Latn.txt
│ │ ├── mco_Latn.txt
│ │ ├── mcp_Latn.txt
│ │ ├── mcq_Latn.txt
│ │ ├── mcu_Latn.txt
│ │ ├── mda_Latn.txt
│ │ ├── mdf_Cyrl.txt
│ │ ├── mdy_Ethi.txt
│ │ ├── med_Latn.txt
│ │ ├── mee_Latn.txt
│ │ ├── mej_Latn.txt
│ │ ├── mek_Latn.txt
│ │ ├── men_Latn.txt
│ │ ├── meq_Latn.txt
│ │ ├── mer_Latn.txt
│ │ ├── met_Latn.txt
│ │ ├── meu_Latn.txt
│ │ ├── mev_Latn.txt
│ │ ├── mfe_Latn.txt
│ │ ├── mfg_Latn.txt
│ │ ├── mfh_Latn.txt
│ │ ├── mfi_Latn.txt
│ │ ├── mfk_Latn.txt
│ │ ├── mfq_Latn.txt
│ │ ├── mfy_Latn.txt
│ │ ├── mfz_Latn.txt
│ │ ├── mgc_Latn.txt
│ │ ├── mgh_Latn.txt
│ │ ├── mgm_Latn.txt
│ │ ├── mgo_Latn.txt
│ │ ├── mgr_Latn.txt
│ │ ├── mhi_Latn.txt
│ │ ├── mhl_Latn.txt
│ │ ├── mhr_Cyrl.txt
│ │ ├── mhw_Latn.txt
│ │ ├── mhx_Latn.txt
│ │ ├── mhy_Latn.txt
│ │ ├── mib_Latn.txt
│ │ ├── mic_Latn.txt
│ │ ├── mie_Latn.txt
│ │ ├── mif_Latn.txt
│ │ ├── mig_Latn.txt
│ │ ├── mih_Latn.txt
│ │ ├── mil_Latn.txt
│ │ ├── mim_Latn.txt
│ │ ├── min_Arab.txt
│ │ ├── min_Latn.txt
│ │ ├── mio_Latn.txt
│ │ ├── mip_Latn.txt
│ │ ├── miq_Latn.txt
│ │ ├── mir_Latn.txt
│ │ ├── mit_Latn.txt
│ │ ├── miy_Latn.txt
│ │ ├── miz_Latn.txt
│ │ ├── mjc_Latn.txt
│ │ ├── mjw_Latn.txt
│ │ ├── mkd_Cyrl.txt
│ │ ├── mkl_Latn.txt
│ │ ├── mkn_Latn.txt
│ │ ├── mks_Latn.txt
│ │ ├── mkz_Latn.txt
│ │ ├── mlh_Latn.txt
│ │ ├── mlp_Latn.txt
│ │ ├── mlt_Latn.txt
│ │ ├── mlu_Latn.txt
│ │ ├── mmn_Latn.txt
│ │ ├── mmo_Latn.txt
│ │ ├── mmx_Latn.txt
│ │ ├── mna_Latn.txt
│ │ ├── mnb_Latn.txt
│ │ ├── mnf_Latn.txt
│ │ ├── mni_Beng.txt
│ │ ├── mni_Latn.txt
│ │ ├── mni_Mtei.txt
│ │ ├── mnk_Latn.txt
│ │ ├── mns_Cyrl.txt
│ │ ├── mnw_Mymr.txt
│ │ ├── mnx_Latn.txt
│ │ ├── mny_Latn.txt
│ │ ├── moa_Latn.txt
│ │ ├── moc_Latn.txt
│ │ ├── mog_Latn.txt
│ │ ├── moh_Latn.txt
│ │ ├── mop_Latn.txt
│ │ ├── mor_Latn.txt
│ │ ├── mos_Latn.txt
│ │ ├── mox_Latn.txt
│ │ ├── mpg_Latn.txt
│ │ ├── mph_Latn.txt
│ │ ├── mpm_Latn.txt
│ │ ├── mpp_Latn.txt
│ │ ├── mps_Latn.txt
│ │ ├── mpt_Latn.txt
│ │ ├── mpx_Latn.txt
│ │ ├── mqb_Latn.txt
│ │ ├── mqj_Latn.txt
│ │ ├── mqy_Latn.txt
│ │ ├── mrg_Latn.txt
│ │ ├── mri_Latn.txt
│ │ ├── mrj_Cyrl.txt
│ │ ├── mrq_Latn.txt
│ │ ├── mrv_Latn.txt
│ │ ├── mrw_Latn.txt
│ │ ├── msb_Latn.txt
│ │ ├── msc_Latn.txt
│ │ ├── mse_Latn.txt
│ │ ├── msk_Latn.txt
│ │ ├── msm_Latn.txt
│ │ ├── msy_Latn.txt
│ │ ├── mta_Latn.txt
│ │ ├── mtg_Latn.txt
│ │ ├── mti_Latn.txt
│ │ ├── mtj_Latn.txt
│ │ ├── mto_Latn.txt
│ │ ├── mtp_Latn.txt
│ │ ├── mua_Latn.txt
│ │ ├── mug_Latn.txt
│ │ ├── muh_Latn.txt
│ │ ├── mui_Latn.txt
│ │ ├── mup_Deva.txt
│ │ ├── mur_Latn.txt
│ │ ├── mus_Latn.txt
│ │ ├── mux_Latn.txt
│ │ ├── muy_Latn.txt
│ │ ├── mva_Latn.txt
│ │ ├── mvn_Latn.txt
│ │ ├── mvp_Latn.txt
│ │ ├── mwc_Latn.txt
│ │ ├── mwf_Latn.txt
│ │ ├── mwl_Latn.txt
│ │ ├── mwm_Latn.txt
│ │ ├── mwn_Latn.txt
│ │ ├── mwp_Latn.txt
│ │ ├── mwq_Latn.txt
│ │ ├── mwv_Latn.txt
│ │ ├── mww_Latn.txt
│ │ ├── mxb_Latn.txt
│ │ ├── mxp_Latn.txt
│ │ ├── mxq_Latn.txt
│ │ ├── mxt_Latn.txt
│ │ ├── mxv_Latn.txt
│ │ ├── mya_Mymr.txt
│ │ ├── myb_Latn.txt
│ │ ├── myk_Latn.txt
│ │ ├── myu_Latn.txt
│ │ ├── myv_Cyrl.txt
│ │ ├── myw_Latn.txt
│ │ ├── myx_Latn.txt
│ │ ├── myy_Latn.txt
│ │ ├── mza_Latn.txt
│ │ ├── mzh_Latn.txt
│ │ ├── mzk_Latn.txt
│ │ ├── mzl_Latn.txt
│ │ ├── mzm_Latn.txt
│ │ ├── mzn_Arab.txt
│ │ ├── mzw_Latn.txt
│ │ ├── mzz_Latn.txt
│ │ ├── nab_Latn.txt
│ │ ├── naf_Latn.txt
│ │ ├── nah_Latn.txt
│ │ ├── nak_Latn.txt
│ │ ├── nan_Latn.txt
│ │ ├── nap_Latn.txt
│ │ ├── naq_Latn.txt
│ │ ├── nas_Latn.txt
│ │ ├── nav_Latn.txt
│ │ ├── naw_Latn.txt
│ │ ├── nba_Latn.txt
│ │ ├── nbc_Latn.txt
│ │ ├── nbe_Latn.txt
│ │ ├── nbl_Latn.txt
│ │ ├── nbq_Latn.txt
│ │ ├── nbu_Latn.txt
│ │ ├── nca_Latn.txt
│ │ ├── nch_Latn.txt
│ │ ├── ncj_Latn.txt
│ │ ├── ncl_Latn.txt
│ │ ├── ncq_Laoo.txt
│ │ ├── nct_Latn.txt
│ │ ├── ncu_Latn.txt
│ │ ├── ncx_Latn.txt
│ │ ├── ndc_Latn.txt
│ │ ├── nde_Latn.txt
│ │ ├── ndh_Latn.txt
│ │ ├── ndi_Latn.txt
│ │ ├── ndj_Latn.txt
│ │ ├── ndo_Latn.txt
│ │ ├── ndp_Latn.txt
│ │ ├── nds_Latn.txt
│ │ ├── ndy_Latn.txt
│ │ ├── ndz_Latn.txt
│ │ ├── neb_Latn.txt
│ │ ├── new_Deva.txt
│ │ ├── nfa_Latn.txt
│ │ ├── nfr_Latn.txt
│ │ ├── ngb_Latn.txt
│ │ ├── ngc_Latn.txt
│ │ ├── ngl_Latn.txt
│ │ ├── ngp_Latn.txt
│ │ ├── ngu_Latn.txt
│ │ ├── nhd_Latn.txt
│ │ ├── nhe_Latn.txt
│ │ ├── nhg_Latn.txt
│ │ ├── nhi_Latn.txt
│ │ ├── nhk_Latn.txt
│ │ ├── nho_Latn.txt
│ │ ├── nhr_Latn.txt
│ │ ├── nhu_Latn.txt
│ │ ├── nhw_Latn.txt
│ │ ├── nhx_Latn.txt
│ │ ├── nhy_Latn.txt
│ │ ├── nia_Latn.txt
│ │ ├── nif_Latn.txt
│ │ ├── nii_Latn.txt
│ │ ├── nij_Latn.txt
│ │ ├── nim_Latn.txt
│ │ ├── nin_Latn.txt
│ │ ├── nio_Cyrl.txt
│ │ ├── niq_Latn.txt
│ │ ├── niu_Latn.txt
│ │ ├── niy_Latn.txt
│ │ ├── njb_Latn.txt
│ │ ├── njm_Latn.txt
│ │ ├── njn_Latn.txt
│ │ ├── njo_Latn.txt
│ │ ├── njz_Latn.txt
│ │ ├── nkf_Latn.txt
│ │ ├── nki_Latn.txt
│ │ ├── nko_Latn.txt
│ │ ├── nla_Latn.txt
│ │ ├── nlc_Latn.txt
│ │ ├── nld_Latn.txt
│ │ ├── nlg_Latn.txt
│ │ ├── nma_Latn.txt
│ │ ├── nmf_Latn.txt
│ │ ├── nmh_Latn.txt
│ │ ├── nmo_Latn.txt
│ │ ├── nmw_Latn.txt
│ │ ├── nmz_Latn.txt
│ │ ├── nnb_Latn.txt
│ │ ├── nng_Latn.txt
│ │ ├── nnh_Latn.txt
│ │ ├── nnl_Latn.txt
│ │ ├── nno_Latn.txt
│ │ ├── nnp_Latn.txt
│ │ ├── nnq_Latn.txt
│ │ ├── nnw_Latn.txt
│ │ ├── noa_Latn.txt
│ │ ├── nob_Latn.txt
│ │ ├── nod_Thai.txt
│ │ ├── nog_Cyrl.txt
│ │ ├── non_Latn.txt
│ │ ├── nop_Latn.txt
│ │ ├── not_Latn.txt
│ │ ├── nou_Latn.txt
│ │ ├── nov_Latn.txt
│ │ ├── nph_Latn.txt
│ │ ├── npi_Deva.txt
│ │ ├── npi_Latn.txt
│ │ ├── npl_Latn.txt
│ │ ├── npo_Latn.txt
│ │ ├── npy_Latn.txt
│ │ ├── nqo_Nkoo.txt
│ │ ├── nre_Latn.txt
│ │ ├── nrf_Latn.txt
│ │ ├── nri_Latn.txt
│ │ ├── nsa_Latn.txt
│ │ ├── nse_Latn.txt
│ │ ├── nsm_Latn.txt
│ │ ├── nsn_Latn.txt
│ │ ├── nso_Latn.txt
│ │ ├── nss_Latn.txt
│ │ ├── nst_Latn.txt
│ │ ├── nsu_Latn.txt
│ │ ├── ntp_Latn.txt
│ │ ├── ntr_Latn.txt
│ │ ├── ntu_Latn.txt
│ │ ├── nuj_Latn.txt
│ │ ├── nus_Latn.txt
│ │ ├── nuy_Latn.txt
│ │ ├── nuz_Latn.txt
│ │ ├── nvm_Latn.txt
│ │ ├── nwb_Latn.txt
│ │ ├── nwi_Latn.txt
│ │ ├── nwx_Deva.txt
│ │ ├── nxd_Latn.txt
│ │ ├── nya_Latn.txt
│ │ ├── nyf_Latn.txt
│ │ ├── nyk_Latn.txt
│ │ ├── nyn_Latn.txt
│ │ ├── nyo_Latn.txt
│ │ ├── nyu_Latn.txt
│ │ ├── nyy_Latn.txt
│ │ ├── nza_Latn.txt
│ │ ├── nzi_Latn.txt
│ │ ├── nzm_Latn.txt
│ │ ├── obo_Latn.txt
│ │ ├── oci_Latn.txt
│ │ ├── ogo_Latn.txt
│ │ ├── ojb_Cans.txt
│ │ ├── ojb_Latn.txt
│ │ ├── oke_Latn.txt
│ │ ├── oku_Latn.txt
│ │ ├── okv_Latn.txt
│ │ ├── old_Latn.txt
│ │ ├── olo_Latn.txt
│ │ ├── omb_Latn.txt
│ │ ├── omw_Latn.txt
│ │ ├── ong_Latn.txt
│ │ ├── ons_Latn.txt
│ │ ├── ood_Latn.txt
│ │ ├── opm_Latn.txt
│ │ ├── orv_Cyrl.txt
│ │ ├── ory_Latn.txt
│ │ ├── ory_Orya.txt
│ │ ├── oss_Cyrl.txt
│ │ ├── ota_Arab.txt
│ │ ├── otd_Latn.txt
│ │ ├── ote_Latn.txt
│ │ ├── otm_Latn.txt
│ │ ├── otn_Latn.txt
│ │ ├── oto_Latn.txt
│ │ ├── otq_Latn.txt
│ │ ├── ots_Latn.txt
│ │ ├── otw_Latn.txt
│ │ ├── oym_Latn.txt
│ │ ├── ozm_Latn.txt
│ │ ├── pab_Latn.txt
│ │ ├── pad_Latn.txt
│ │ ├── pag_Latn.txt
│ │ ├── pah_Latn.txt
│ │ ├── pam_Latn.txt
│ │ ├── pan_Guru.txt
│ │ ├── pan_Latn.txt
│ │ ├── pao_Latn.txt
│ │ ├── pap_Latn.txt
│ │ ├── pau_Latn.txt
│ │ ├── pbb_Latn.txt
│ │ ├── pbc_Latn.txt
│ │ ├── pbi_Latn.txt
│ │ ├── pbt_Arab.txt
│ │ ├── pcd_Latn.txt
│ │ ├── pck_Latn.txt
│ │ ├── pcm_Latn.txt
│ │ ├── pdc_Latn.txt
│ │ ├── pdt_Latn.txt
│ │ ├── pem_Latn.txt
│ │ ├── pfe_Latn.txt
│ │ ├── pfl_Latn.txt
│ │ ├── phm_Latn.txt
│ │ ├── pib_Latn.txt
│ │ ├── pio_Latn.txt
│ │ ├── pir_Latn.txt
│ │ ├── pis_Latn.txt
│ │ ├── pjt_Latn.txt
│ │ ├── pkb_Latn.txt
│ │ ├── plg_Latn.txt
│ │ ├── pls_Latn.txt
│ │ ├── plt_Latn.txt
│ │ ├── plu_Latn.txt
│ │ ├── plw_Latn.txt
│ │ ├── pma_Latn.txt
│ │ ├── pmf_Latn.txt
│ │ ├── pmq_Latn.txt
│ │ ├── pms_Latn.txt
│ │ ├── pmx_Latn.txt
│ │ ├── pnb_Arab.txt
│ │ ├── pne_Latn.txt
│ │ ├── pnt_Grek.txt
│ │ ├── pny_Latn.txt
│ │ ├── poe_Latn.txt
│ │ ├── poh_Latn.txt
│ │ ├── poi_Latn.txt
│ │ ├── pol_Latn.txt
│ │ ├── pon_Latn.txt
│ │ ├── por_Latn.txt
│ │ ├── pos_Latn.txt
│ │ ├── pot_Latn.txt
│ │ ├── pov_Latn.txt
│ │ ├── poy_Latn.txt
│ │ ├── ppk_Latn.txt
│ │ ├── ppo_Latn.txt
│ │ ├── pps_Latn.txt
│ │ ├── prf_Latn.txt
│ │ ├── prg_Latn.txt
│ │ ├── pri_Latn.txt
│ │ ├── prq_Latn.txt
│ │ ├── pse_Latn.txt
│ │ ├── pss_Latn.txt
│ │ ├── ptp_Latn.txt
│ │ ├── ptu_Latn.txt
│ │ ├── pua_Latn.txt
│ │ ├── pui_Latn.txt
│ │ ├── pwg_Latn.txt
│ │ ├── pwn_Latn.txt
│ │ ├── pww_Thai.txt
│ │ ├── pxm_Latn.txt
│ │ ├── qub_Latn.txt
│ │ ├── quc_Latn.txt
│ │ ├── quf_Latn.txt
│ │ ├── qug_Latn.txt
│ │ ├── quh_Latn.txt
│ │ ├── qul_Latn.txt
│ │ ├── qup_Latn.txt
│ │ ├── qus_Latn.txt
│ │ ├── quw_Latn.txt
│ │ ├── quy_Latn.txt
│ │ ├── quz_Latn.txt
│ │ ├── qva_Latn.txt
│ │ ├── qvc_Latn.txt
│ │ ├── qve_Latn.txt
│ │ ├── qvh_Latn.txt
│ │ ├── qvi_Latn.txt
│ │ ├── qvm_Latn.txt
│ │ ├── qvn_Latn.txt
│ │ ├── qvo_Latn.txt
│ │ ├── qvs_Latn.txt
│ │ ├── qvw_Latn.txt
│ │ ├── qvz_Latn.txt
│ │ ├── qwh_Latn.txt
│ │ ├── qxh_Latn.txt
│ │ ├── qxl_Latn.txt
│ │ ├── qxn_Latn.txt
│ │ ├── qxo_Latn.txt
│ │ ├── qxr_Latn.txt
│ │ ├── rad_Latn.txt
│ │ ├── rai_Latn.txt
│ │ ├── rap_Latn.txt
│ │ ├── rar_Latn.txt
│ │ ├── rav_Deva.txt
│ │ ├── raw_Latn.txt
│ │ ├── rcf_Latn.txt
│ │ ├── rej_Latn.txt
│ │ ├── rel_Latn.txt
│ │ ├── rgu_Latn.txt
│ │ ├── rhg_Latn.txt
│ │ ├── ria_Latn.txt
│ │ ├── rim_Latn.txt
│ │ ├── rjs_Deva.txt
│ │ ├── rkb_Latn.txt
│ │ ├── rmc_Latn.txt
│ │ ├── rme_Latn.txt
│ │ ├── rml_Latn.txt
│ │ ├── rmn_Cyrl.txt
│ │ ├── rmn_Grek.txt
│ │ ├── rmn_Latn.txt
│ │ ├── rmo_Latn.txt
│ │ ├── rmq_Latn.txt
│ │ ├── rmy_Cyrl.txt
│ │ ├── rmy_Latn.txt
│ │ ├── rnd_Latn.txt
│ │ ├── rng_Latn.txt
│ │ ├── rnl_Latn.txt
│ │ ├── roh_Latn.txt
│ │ ├── ron_Cyrl.txt
│ │ ├── ron_Latn.txt
│ │ ├── roo_Latn.txt
│ │ ├── rop_Latn.txt
│ │ ├── row_Latn.txt
│ │ ├── rro_Latn.txt
│ │ ├── rtm_Latn.txt
│ │ ├── rub_Latn.txt
│ │ ├── rue_Cyrl.txt
│ │ ├── ruf_Latn.txt
│ │ ├── rug_Latn.txt
│ │ ├── run_Latn.txt
│ │ ├── rup_Latn.txt
│ │ ├── rus_Cyrl.txt
│ │ ├── rwo_Latn.txt
│ │ ├── sab_Latn.txt
│ │ ├── sag_Latn.txt
│ │ ├── sah_Cyrl.txt
│ │ ├── saj_Latn.txt
│ │ ├── san_Deva.txt
│ │ ├── san_Latn.txt
│ │ ├── sas_Latn.txt
│ │ ├── sat_Latn.txt
│ │ ├── sat_Olck.txt
│ │ ├── say_Latn.txt
│ │ ├── sba_Latn.txt
│ │ ├── sbd_Latn.txt
│ │ ├── sbe_Latn.txt
│ │ ├── sbl_Latn.txt
│ │ ├── sbs_Latn.txt
│ │ ├── sby_Latn.txt
│ │ ├── sck_Deva.txt
│ │ ├── scn_Latn.txt
│ │ ├── sco_Latn.txt
│ │ ├── sda_Latn.txt
│ │ ├── sdc_Latn.txt
│ │ ├── sdh_Arab.txt
│ │ ├── sdo_Latn.txt
│ │ ├── sdq_Latn.txt
│ │ ├── seh_Latn.txt
│ │ ├── sel_Cyrl.txt
│ │ ├── ses_Latn.txt
│ │ ├── sey_Latn.txt
│ │ ├── sfw_Latn.txt
│ │ ├── sgb_Latn.txt
│ │ ├── sgc_Latn.txt
│ │ ├── sgh_Cyrl.txt
│ │ ├── sgs_Latn.txt
│ │ ├── sgw_Ethi.txt
│ │ ├── sgz_Latn.txt
│ │ ├── shi_Latn.txt
│ │ ├── shk_Latn.txt
│ │ ├── shn_Mymr.txt
│ │ ├── shp_Latn.txt
│ │ ├── shr_Latn.txt
│ │ ├── shu_Arab.txt
│ │ ├── sid_Latn.txt
│ │ ├── sig_Latn.txt
│ │ ├── sil_Latn.txt
│ │ ├── sim_Latn.txt
│ │ ├── sin_Sinh.txt
│ │ ├── sja_Latn.txt
│ │ ├── sjo_Mong.txt
│ │ ├── sju_Latn.txt
│ │ ├── skg_Latn.txt
│ │ ├── skr_Arab.txt
│ │ ├── sld_Latn.txt
│ │ ├── slk_Latn.txt
│ │ ├── sll_Latn.txt
│ │ ├── slv_Latn.txt
│ │ ├── sma_Latn.txt
│ │ ├── sme_Latn.txt
│ │ ├── smj_Latn.txt
│ │ ├── smk_Latn.txt
│ │ ├── sml_Latn.txt
│ │ ├── smn_Latn.txt
│ │ ├── smo_Latn.txt
│ │ ├── sms_Latn.txt
│ │ ├── smt_Latn.txt
│ │ ├── sna_Latn.txt
│ │ ├── snc_Latn.txt
│ │ ├── snd_Arab.txt
│ │ ├── snd_Deva.txt
│ │ ├── snd_Latn.txt
│ │ ├── snf_Latn.txt
│ │ ├── snn_Latn.txt
│ │ ├── snp_Latn.txt
│ │ ├── snw_Latn.txt
│ │ ├── sny_Latn.txt
│ │ ├── soe_Latn.txt
│ │ ├── som_Latn.txt
│ │ ├── sop_Latn.txt
│ │ ├── soq_Latn.txt
│ │ ├── sot_Latn.txt
│ │ ├── soy_Latn.txt
│ │ ├── spa_Latn.txt
│ │ ├── spl_Latn.txt
│ │ ├── spm_Latn.txt
│ │ ├── spp_Latn.txt
│ │ ├── sps_Latn.txt
│ │ ├── spy_Latn.txt
│ │ ├── srd_Latn.txt
│ │ ├── sri_Latn.txt
│ │ ├── srm_Latn.txt
│ │ ├── srn_Latn.txt
│ │ ├── srp_Cyrl.txt
│ │ ├── srp_Latn.txt
│ │ ├── srq_Latn.txt
│ │ ├── srr_Latn.txt
│ │ ├── ssd_Latn.txt
│ │ ├── ssg_Latn.txt
│ │ ├── ssw_Latn.txt
│ │ ├── ssx_Latn.txt
│ │ ├── stn_Latn.txt
│ │ ├── stp_Latn.txt
│ │ ├── stq_Latn.txt
│ │ ├── sua_Latn.txt
│ │ ├── suc_Latn.txt
│ │ ├── sue_Latn.txt
│ │ ├── suk_Latn.txt
│ │ ├── sun_Latn.txt
│ │ ├── sur_Latn.txt
│ │ ├── sus_Arab.txt
│ │ ├── sus_Latn.txt
│ │ ├── suz_Deva.txt
│ │ ├── swb_Latn.txt
│ │ ├── swc_Latn.txt
│ │ ├── swe_Latn.txt
│ │ ├── swg_Latn.txt
│ │ ├── swh_Latn.txt
│ │ ├── swk_Latn.txt
│ │ ├── swp_Latn.txt
│ │ ├── sxb_Latn.txt
│ │ ├── sxn_Latn.txt
│ │ ├── syb_Latn.txt
│ │ ├── syc_Syrc.txt
│ │ ├── syl_Beng.txt
│ │ ├── syl_Latn.txt
│ │ ├── szb_Latn.txt
│ │ ├── szl_Latn.txt
│ │ ├── szy_Latn.txt
│ │ ├── tab_Cyrl.txt
│ │ ├── tac_Latn.txt
│ │ ├── tah_Latn.txt
│ │ ├── taj_Deva.txt
│ │ ├── tam_Latn.txt
│ │ ├── tam_Taml.txt
│ │ ├── tap_Latn.txt
│ │ ├── taq_Latn.txt
│ │ ├── taq_Tfng.txt
│ │ ├── tar_Latn.txt
│ │ ├── tat_Cyrl.txt
│ │ ├── tat_Latn.txt
│ │ ├── tav_Latn.txt
│ │ ├── taw_Latn.txt
│ │ ├── tay_Latn.txt
│ │ ├── tbc_Latn.txt
│ │ ├── tbg_Latn.txt
│ │ ├── tbk_Latn.txt
│ │ ├── tbl_Latn.txt
│ │ ├── tbo_Latn.txt
│ │ ├── tbw_Latn.txt
│ │ ├── tby_Latn.txt
│ │ ├── tbz_Latn.txt
│ │ ├── tca_Latn.txt
│ │ ├── tcc_Latn.txt
│ │ ├── tcf_Latn.txt
│ │ ├── tcs_Latn.txt
│ │ ├── tcy_Knda.txt
│ │ ├── tcz_Latn.txt
│ │ ├── tdx_Latn.txt
│ │ ├── ted_Latn.txt
│ │ ├── tee_Latn.txt
│ │ ├── tel_Latn.txt
│ │ ├── tel_Telu.txt
│ │ ├── tem_Latn.txt
│ │ ├── teo_Latn.txt
│ │ ├── ter_Latn.txt
│ │ ├── tet_Latn.txt
│ │ ├── tew_Latn.txt
│ │ ├── tfr_Latn.txt
│ │ ├── tgk_Cyrl.txt
│ │ ├── tgo_Latn.txt
│ │ ├── tgp_Latn.txt
│ │ ├── tha_Thai.txt
│ │ ├── thk_Latn.txt
│ │ ├── thl_Deva.txt
│ │ ├── thv_Latn.txt
│ │ ├── tif_Latn.txt
│ │ ├── tig_Ethi.txt
│ │ ├── tih_Latn.txt
│ │ ├── tik_Latn.txt
│ │ ├── tim_Latn.txt
│ │ ├── tir_Ethi.txt
│ │ ├── tiv_Latn.txt
│ │ ├── tiy_Latn.txt
│ │ ├── tke_Latn.txt
│ │ ├── tkl_Latn.txt
│ │ ├── tkr_Cyrl.txt
│ │ ├── tku_Latn.txt
│ │ ├── tlb_Latn.txt
│ │ ├── tlf_Latn.txt
│ │ ├── tlh_Latn.txt
│ │ ├── tlj_Latn.txt
│ │ ├── tll_Latn.txt
│ │ ├── tly_Latn.txt
│ │ ├── tmc_Latn.txt
│ │ ├── tmd_Latn.txt
│ │ ├── tna_Latn.txt
│ │ ├── tnc_Latn.txt
│ │ ├── tnk_Latn.txt
│ │ ├── tnn_Latn.txt
│ │ ├── tnp_Latn.txt
│ │ ├── tnr_Latn.txt
│ │ ├── tob_Latn.txt
│ │ ├── toc_Latn.txt
│ │ ├── tod_Latn.txt
│ │ ├── tog_Latn.txt
│ │ ├── toh_Latn.txt
│ │ ├── toi_Latn.txt
│ │ ├── toj_Latn.txt
│ │ ├── tok_Latn.txt
│ │ ├── ton_Latn.txt
│ │ ├── too_Latn.txt
│ │ ├── top_Latn.txt
│ │ ├── tos_Latn.txt
│ │ ├── tpa_Latn.txt
│ │ ├── tpi_Latn.txt
│ │ ├── tpm_Latn.txt
│ │ ├── tpn_Latn.txt
│ │ ├── tpp_Latn.txt
│ │ ├── tpt_Latn.txt
│ │ ├── tpw_Latn.txt
│ │ ├── tpz_Latn.txt
│ │ ├── tqo_Latn.txt
│ │ ├── trc_Latn.txt
│ │ ├── trn_Latn.txt
│ │ ├── tro_Latn.txt
│ │ ├── trp_Latn.txt
│ │ ├── trq_Latn.txt
│ │ ├── trs_Latn.txt
│ │ ├── trv_Latn.txt
│ │ ├── tsc_Latn.txt
│ │ ├── tsg_Latn.txt
│ │ ├── tsn_Latn.txt
│ │ ├── tso_Latn.txt
│ │ ├── tsw_Latn.txt
│ │ ├── tsz_Latn.txt
│ │ ├── ttc_Latn.txt
│ │ ├── tte_Latn.txt
│ │ ├── ttj_Latn.txt
│ │ ├── ttq_Latn.txt
│ │ ├── ttq_Tfng.txt
│ │ ├── tuc_Latn.txt
│ │ ├── tue_Latn.txt
│ │ ├── tuf_Latn.txt
│ │ ├── tui_Latn.txt
│ │ ├── tuk_Arab.txt
│ │ ├── tuk_Cyrl.txt
│ │ ├── tuk_Latn.txt
│ │ ├── tul_Latn.txt
│ │ ├── tum_Latn.txt
│ │ ├── tuo_Latn.txt
│ │ ├── tur_Latn.txt
│ │ ├── tuv_Latn.txt
│ │ ├── tvk_Latn.txt
│ │ ├── tvl_Latn.txt
│ │ ├── twb_Latn.txt
│ │ ├── twi_Latn.txt
│ │ ├── twu_Latn.txt
│ │ ├── twx_Latn.txt
│ │ ├── txq_Latn.txt
│ │ ├── txu_Latn.txt
│ │ ├── tyv_Cyrl.txt
│ │ ├── tzh_Latn.txt
│ │ ├── tzj_Latn.txt
│ │ ├── tzl_Latn.txt
│ │ ├── tzm_Tfng.txt
│ │ ├── tzo_Latn.txt
│ │ ├── ubr_Latn.txt
│ │ ├── ubu_Latn.txt
│ │ ├── udm_Cyrl.txt
│ │ ├── udu_Latn.txt
│ │ ├── uig_Arab.txt
│ │ ├── uig_Cyrl.txt
│ │ ├── uig_Latn.txt
│ │ ├── ukr_Cyrl.txt
│ │ ├── umb_Latn.txt
│ │ ├── upv_Latn.txt
│ │ ├── ura_Latn.txt
│ │ ├── urb_Latn.txt
│ │ ├── urd_Arab.txt
│ │ ├── urd_Latn.txt
│ │ ├── urh_Latn.txt
│ │ ├── uri_Latn.txt
│ │ ├── urk_Thai.txt
│ │ ├── urt_Latn.txt
│ │ ├── urw_Latn.txt
│ │ ├── ury_Latn.txt
│ │ ├── usa_Latn.txt
│ │ ├── usp_Latn.txt
│ │ ├── uth_Latn.txt
│ │ ├── uvh_Latn.txt
│ │ ├── uvl_Latn.txt
│ │ ├── uzn_Cyrl.txt
│ │ ├── uzn_Latn.txt
│ │ ├── uzs_Arab.txt
│ │ ├── vag_Latn.txt
│ │ ├── vap_Latn.txt
│ │ ├── var_Latn.txt
│ │ ├── vec_Latn.txt
│ │ ├── ven_Latn.txt
│ │ ├── vep_Latn.txt
│ │ ├── vid_Latn.txt
│ │ ├── vie_Latn.txt
│ │ ├── viv_Latn.txt
│ │ ├── vls_Latn.txt
│ │ ├── vmk_Latn.txt
│ │ ├── vmw_Latn.txt
│ │ ├── vmy_Latn.txt
│ │ ├── vol_Latn.txt
│ │ ├── vot_Latn.txt
│ │ ├── vro_Latn.txt
│ │ ├── vun_Latn.txt
│ │ ├── vut_Latn.txt
│ │ ├── waj_Latn.txt
│ │ ├── wal_Ethi.txt
│ │ ├── wal_Latn.txt
│ │ ├── wap_Latn.txt
│ │ ├── war_Latn.txt
│ │ ├── wat_Latn.txt
│ │ ├── way_Latn.txt
│ │ ├── wba_Latn.txt
│ │ ├── wbm_Latn.txt
│ │ ├── wbp_Latn.txt
│ │ ├── wed_Latn.txt
│ │ ├── wer_Latn.txt
│ │ ├── wes_Latn.txt
│ │ ├── wew_Latn.txt
│ │ ├── whg_Latn.txt
│ │ ├── whk_Latn.txt
│ │ ├── wib_Latn.txt
│ │ ├── wim_Latn.txt
│ │ ├── wiu_Latn.txt
│ │ ├── wln_Latn.txt
│ │ ├── wls_Latn.txt
│ │ ├── wlv_Latn.txt
│ │ ├── wlx_Latn.txt
│ │ ├── wmt_Latn.txt
│ │ ├── wmw_Latn.txt
│ │ ├── wnc_Latn.txt
│ │ ├── wnu_Latn.txt
│ │ ├── wob_Latn.txt
│ │ ├── wol_Latn.txt
│ │ ├── wos_Latn.txt
│ │ ├── wrk_Latn.txt
│ │ ├── wrs_Latn.txt
│ │ ├── wsg_Telu.txt
│ │ ├── wsk_Latn.txt
│ │ ├── wuu_Hani.txt
│ │ ├── wuv_Latn.txt
│ │ ├── wwa_Latn.txt
│ │ ├── xal_Cyrl.txt
│ │ ├── xav_Latn.txt
│ │ ├── xbi_Latn.txt
│ │ ├── xbr_Latn.txt
│ │ ├── xed_Latn.txt
│ │ ├── xho_Latn.txt
│ │ ├── xla_Latn.txt
│ │ ├── xmf_Geor.txt
│ │ ├── xmm_Latn.txt
│ │ ├── xmv_Latn.txt
│ │ ├── xnn_Latn.txt
│ │ ├── xog_Latn.txt
│ │ ├── xon_Latn.txt
│ │ ├── xrb_Latn.txt
│ │ ├── xsb_Latn.txt
│ │ ├── xsi_Latn.txt
│ │ ├── xsm_Latn.txt
│ │ ├── xsr_Deva.txt
│ │ ├── xsu_Latn.txt
│ │ ├── xtd_Latn.txt
│ │ ├── xtm_Latn.txt
│ │ ├── xtn_Latn.txt
│ │ ├── xum_Latn.txt
│ │ ├── xuo_Latn.txt
│ │ ├── yaa_Latn.txt
│ │ ├── yad_Latn.txt
│ │ ├── yal_Latn.txt
│ │ ├── yam_Latn.txt
│ │ ├── yan_Latn.txt
│ │ ├── yao_Latn.txt
│ │ ├── yap_Latn.txt
│ │ ├── yaq_Latn.txt
│ │ ├── yas_Latn.txt
│ │ ├── yat_Latn.txt
│ │ ├── yaz_Latn.txt
│ │ ├── ybb_Latn.txt
│ │ ├── yby_Latn.txt
│ │ ├── ycn_Latn.txt
│ │ ├── ydd_Hebr.txt
│ │ ├── yim_Latn.txt
│ │ ├── yka_Latn.txt
│ │ ├── yle_Latn.txt
│ │ ├── yli_Latn.txt
│ │ ├── yml_Latn.txt
│ │ ├── yom_Latn.txt
│ │ ├── yon_Latn.txt
│ │ ├── yor_Latn.txt
│ │ ├── yrb_Latn.txt
│ │ ├── yre_Latn.txt
│ │ ├── yrk_Cyrl.txt
│ │ ├── yrl_Latn.txt
│ │ ├── yss_Latn.txt
│ │ ├── yua_Latn.txt
│ │ ├── yue_Hani.txt
│ │ ├── yuj_Latn.txt
│ │ ├── yup_Latn.txt
│ │ ├── yut_Latn.txt
│ │ ├── yuw_Latn.txt
│ │ ├── yuz_Latn.txt
│ │ ├── yva_Latn.txt
│ │ ├── zaa_Latn.txt
│ │ ├── zab_Latn.txt
│ │ ├── zac_Latn.txt
│ │ ├── zad_Latn.txt
│ │ ├── zae_Latn.txt
│ │ ├── zai_Latn.txt
│ │ ├── zam_Latn.txt
│ │ ├── zao_Latn.txt
│ │ ├── zar_Latn.txt
│ │ ├── zas_Latn.txt
│ │ ├── zat_Latn.txt
│ │ ├── zav_Latn.txt
│ │ ├── zaw_Latn.txt
│ │ ├── zca_Latn.txt
│ │ ├── zdj_Latn.txt
│ │ ├── zea_Latn.txt
│ │ ├── zgh_Tfng.txt
│ │ ├── zho_Hani.txt
│ │ ├── zia_Latn.txt
│ │ ├── ziw_Latn.txt
│ │ ├── zne_Latn.txt
│ │ ├── zoc_Latn.txt
│ │ ├── zom_Latn.txt
│ │ ├── zos_Latn.txt
│ │ ├── zpa_Latn.txt
│ │ ├── zpc_Latn.txt
│ │ ├── zpg_Latn.txt
│ │ ├── zpi_Latn.txt
│ │ ├── zpj_Latn.txt
│ │ ├── zpl_Latn.txt
│ │ ├── zpm_Latn.txt
│ │ ├── zpo_Latn.txt
│ │ ├── zpq_Latn.txt
│ │ ├── zpt_Latn.txt
│ │ ├── zpu_Latn.txt
│ │ ├── zpv_Latn.txt
│ │ ├── zpz_Latn.txt
│ │ ├── zsm_Arab.txt
│ │ ├── zsm_Latn.txt
│ │ ├── zsr_Latn.txt
│ │ ├── ztq_Latn.txt
│ │ ├── zty_Latn.txt
│ │ ├── zul_Latn.txt
│ │ ├── zyb_Latn.txt
│ │ └── zyp_Latn.txt
│ └── wordlists-0.95/
│ ├── aai_Latn.txt
│ ├── aak_Latn.txt
│ ├── aau_Latn.txt
│ ├── aaz_Latn.txt
│ ├── aba_Latn.txt
│ ├── abi_Latn.txt
│ ├── abk_Cyrl.txt
│ ├── abn_Latn.txt
│ ├── abq_Cyrl.txt
│ ├── abs_Latn.txt
│ ├── abt_Latn.txt
│ ├── abx_Latn.txt
│ ├── aby_Latn.txt
│ ├── abz_Latn.txt
│ ├── aca_Latn.txt
│ ├── acd_Latn.txt
│ ├── ace_Arab.txt
│ ├── ace_Latn.txt
│ ├── acf_Latn.txt
│ ├── ach_Latn.txt
│ ├── acm_Arab.txt
│ ├── acn_Latn.txt
│ ├── acr_Latn.txt
│ ├── acu_Latn.txt
│ ├── ada_Latn.txt
│ ├── ade_Latn.txt
│ ├── adh_Latn.txt
│ ├── adi_Latn.txt
│ ├── adj_Latn.txt
│ ├── adl_Latn.txt
│ ├── ady_Cyrl.txt
│ ├── adz_Latn.txt
│ ├── aeb_Arab.txt
│ ├── aer_Latn.txt
│ ├── aeu_Latn.txt
│ ├── aey_Latn.txt
│ ├── afr_Latn.txt
│ ├── agd_Latn.txt
│ ├── agg_Latn.txt
│ ├── agm_Latn.txt
│ ├── agn_Latn.txt
│ ├── agr_Latn.txt
│ ├── agt_Latn.txt
│ ├── agu_Latn.txt
│ ├── agw_Latn.txt
│ ├── agx_Cyrl.txt
│ ├── aha_Latn.txt
│ ├── ahk_Latn.txt
│ ├── aia_Latn.txt
│ ├── aii_Syrc.txt
│ ├── aim_Latn.txt
│ ├── ain_Latn.txt
│ ├── ajg_Latn.txt
│ ├── aji_Latn.txt
│ ├── ajz_Latn.txt
│ ├── akb_Latn.txt
│ ├── ake_Latn.txt
│ ├── akh_Latn.txt
│ ├── akp_Latn.txt
│ ├── ald_Latn.txt
│ ├── alj_Latn.txt
│ ├── aln_Latn.txt
│ ├── alp_Latn.txt
│ ├── alq_Latn.txt
│ ├── als_Latn.txt
│ ├── alt_Cyrl.txt
│ ├── aly_Latn.txt
│ ├── alz_Latn.txt
│ ├── ame_Latn.txt
│ ├── amf_Latn.txt
│ ├── amh_Ethi.txt
│ ├── ami_Latn.txt
│ ├── amk_Latn.txt
│ ├── amm_Latn.txt
│ ├── amn_Latn.txt
│ ├── amp_Latn.txt
│ ├── amr_Latn.txt
│ ├── amu_Latn.txt
│ ├── amx_Latn.txt
│ ├── ang_Latn.txt
│ ├── anm_Latn.txt
│ ├── ann_Latn.txt
│ ├── anp_Deva.txt
│ ├── anv_Latn.txt
│ ├── any_Latn.txt
│ ├── aoi_Latn.txt
│ ├── aoj_Latn.txt
│ ├── aom_Latn.txt
│ ├── aoz_Latn.txt
│ ├── apb_Latn.txt
│ ├── apc_Arab.txt
│ ├── ape_Latn.txt
│ ├── apn_Latn.txt
│ ├── apr_Latn.txt
│ ├── apt_Latn.txt
│ ├── apu_Latn.txt
│ ├── apw_Latn.txt
│ ├── apy_Latn.txt
│ ├── apz_Latn.txt
│ ├── aqz_Latn.txt
│ ├── arb_Arab.txt
│ ├── arb_Latn.txt
│ ├── are_Latn.txt
│ ├── arg_Latn.txt
│ ├── arl_Latn.txt
│ ├── arn_Latn.txt
│ ├── arp_Latn.txt
│ ├── arq_Arab.txt
│ ├── arr_Latn.txt
│ ├── ars_Arab.txt
│ ├── ary_Arab.txt
│ ├── arz_Arab.txt
│ ├── asg_Latn.txt
│ ├── asm_Beng.txt
│ ├── asm_Latn.txt
│ ├── aso_Latn.txt
│ ├── ast_Latn.txt
│ ├── ata_Latn.txt
│ ├── atb_Latn.txt
│ ├── atd_Latn.txt
│ ├── atg_Latn.txt
│ ├── ati_Latn.txt
│ ├── atj_Latn.txt
│ ├── atq_Latn.txt
│ ├── att_Latn.txt
│ ├── auc_Latn.txt
│ ├── aui_Latn.txt
│ ├── auy_Latn.txt
│ ├── ava_Cyrl.txt
│ ├── avk_Latn.txt
│ ├── avn_Latn.txt
│ ├── avt_Latn.txt
│ ├── avu_Latn.txt
│ ├── awa_Deva.txt
│ ├── awb_Latn.txt
│ ├── awi_Latn.txt
│ ├── awx_Latn.txt
│ ├── ayo_Latn.txt
│ ├── ayp_Arab.txt
│ ├── ayr_Latn.txt
│ ├── azb_Arab.txt
│ ├── azg_Latn.txt
│ ├── azj_Cyrl.txt
│ ├── azj_Latn.txt
│ ├── azz_Latn.txt
│ ├── bak_Cyrl.txt
│ ├── bal_Arab.txt
│ ├── bam_Latn.txt
│ ├── ban_Latn.txt
│ ├── bao_Latn.txt
│ ├── bar_Latn.txt
│ ├── bas_Latn.txt
│ ├── bav_Latn.txt
│ ├── bba_Latn.txt
│ ├── bbb_Latn.txt
│ ├── bbc_Latn.txt
│ ├── bbj_Latn.txt
│ ├── bbk_Latn.txt
│ ├── bbo_Latn.txt
│ ├── bbr_Latn.txt
│ ├── bcc_Arab.txt
│ ├── bch_Latn.txt
│ ├── bci_Latn.txt
│ ├── bcl_Latn.txt
│ ├── bco_Latn.txt
│ ├── bcw_Latn.txt
│ ├── bdd_Latn.txt
│ ├── bdh_Latn.txt
│ ├── bdq_Latn.txt
│ ├── bea_Latn.txt
│ ├── bef_Latn.txt
│ ├── bel_Cyrl.txt
│ ├── bem_Latn.txt
│ ├── ben_Beng.txt
│ ├── ben_Latn.txt
│ ├── beq_Latn.txt
│ ├── bew_Latn.txt
│ ├── bex_Latn.txt
│ ├── bfd_Latn.txt
│ ├── bfo_Latn.txt
│ ├── bgr_Latn.txt
│ ├── bgs_Latn.txt
│ ├── bgt_Latn.txt
│ ├── bgz_Latn.txt
│ ├── bhg_Latn.txt
│ ├── bhl_Latn.txt
│ ├── bho_Deva.txt
│ ├── bhp_Latn.txt
│ ├── bhw_Latn.txt
│ ├── bhz_Latn.txt
│ ├── bib_Latn.txt
│ ├── big_Latn.txt
│ ├── bim_Latn.txt
│ ├── bin_Latn.txt
│ ├── bis_Latn.txt
│ ├── biu_Latn.txt
│ ├── biv_Latn.txt
│ ├── bjn_Arab.txt
│ ├── bjn_Latn.txt
│ ├── bjp_Latn.txt
│ ├── bjr_Latn.txt
│ ├── bjv_Latn.txt
│ ├── bkd_Latn.txt
│ ├── bkl_Latn.txt
│ ├── bkq_Latn.txt
│ ├── bku_Latn.txt
│ ├── bkv_Latn.txt
│ ├── bla_Latn.txt
│ ├── blh_Latn.txt
│ ├── blk_Mymr.txt
│ ├── blt_Latn.txt
│ ├── blw_Latn.txt
│ ├── blz_Latn.txt
│ ├── bmh_Latn.txt
│ ├── bmk_Latn.txt
│ ├── bmq_Latn.txt
│ ├── bmr_Latn.txt
│ ├── bmu_Latn.txt
│ ├── bmv_Latn.txt
│ ├── bnj_Latn.txt
│ ├── bno_Latn.txt
│ ├── bnp_Latn.txt
│ ├── boa_Latn.txt
│ ├── bod_Tibt.txt
│ ├── boj_Latn.txt
│ ├── bom_Latn.txt
│ ├── bon_Latn.txt
│ ├── bor_Latn.txt
│ ├── bos_Latn.txt
│ ├── bov_Latn.txt
│ ├── box_Latn.txt
│ ├── bpr_Latn.txt
│ ├── bps_Latn.txt
│ ├── bpy_Beng.txt
│ ├── bqc_Latn.txt
│ ├── bqj_Latn.txt
│ ├── bqp_Latn.txt
│ ├── bre_Latn.txt
│ ├── brh_Arab.txt
│ ├── bru_Latn.txt
│ ├── brx_Deva.txt
│ ├── brx_Latn.txt
│ ├── bsc_Latn.txt
│ ├── bsn_Latn.txt
│ ├── bsp_Latn.txt
│ ├── bsq_Latn.txt
│ ├── bss_Latn.txt
│ ├── btd_Latn.txt
│ ├── bth_Latn.txt
│ ├── bts_Latn.txt
│ ├── btt_Latn.txt
│ ├── btx_Latn.txt
│ ├── bud_Latn.txt
│ ├── bug_Latn.txt
│ ├── buk_Latn.txt
│ ├── bul_Cyrl.txt
│ ├── bum_Latn.txt
│ ├── bus_Latn.txt
│ ├── bvc_Latn.txt
│ ├── bvd_Latn.txt
│ ├── bvr_Latn.txt
│ ├── bvz_Latn.txt
│ ├── bwd_Latn.txt
│ ├── bwi_Latn.txt
│ ├── bwq_Latn.txt
│ ├── bwu_Latn.txt
│ ├── bxh_Latn.txt
│ ├── bxr_Cyrl.txt
│ ├── byr_Latn.txt
│ ├── byv_Latn.txt
│ ├── byx_Latn.txt
│ ├── bzd_Latn.txt
│ ├── bzh_Latn.txt
│ ├── bzi_Thai.txt
│ ├── bzj_Latn.txt
│ ├── caa_Latn.txt
│ ├── cab_Latn.txt
│ ├── cac_Latn.txt
│ ├── caf_Latn.txt
│ ├── cag_Latn.txt
│ ├── cak_Latn.txt
│ ├── cao_Latn.txt
│ ├── cap_Latn.txt
│ ├── caq_Latn.txt
│ ├── car_Latn.txt
│ ├── cas_Latn.txt
│ ├── cat_Latn.txt
│ ├── cav_Latn.txt
│ ├── cax_Latn.txt
│ ├── cbc_Latn.txt
│ ├── cbi_Latn.txt
│ ├── cbk_Latn.txt
│ ├── cbr_Latn.txt
│ ├── cbs_Latn.txt
│ ├── cbt_Latn.txt
│ ├── cbu_Latn.txt
│ ├── cbv_Latn.txt
│ ├── cce_Latn.txt
│ ├── cco_Latn.txt
│ ├── ccp_Latn.txt
│ ├── cdf_Latn.txt
│ ├── ceb_Latn.txt
│ ├── ceg_Latn.txt
│ ├── cek_Latn.txt
│ ├── ces_Latn.txt
│ ├── cfm_Latn.txt
│ ├── cgc_Latn.txt
│ ├── cgg_Latn.txt
│ ├── cha_Latn.txt
│ ├── chd_Latn.txt
│ ├── che_Cyrl.txt
│ ├── chf_Latn.txt
│ ├── chj_Latn.txt
│ ├── chk_Latn.txt
│ ├── cho_Latn.txt
│ ├── chq_Latn.txt
│ ├── chr_Cher.txt
│ ├── chr_Latn.txt
│ ├── chu_Cyrl.txt
│ ├── chv_Cyrl.txt
│ ├── chw_Latn.txt
│ ├── chz_Latn.txt
│ ├── cjk_Latn.txt
│ ├── cjo_Latn.txt
│ ├── cjp_Latn.txt
│ ├── cjs_Cyrl.txt
│ ├── cjv_Latn.txt
│ ├── ckb_Arab.txt
│ ├── cko_Latn.txt
│ ├── ckt_Cyrl.txt
│ ├── cle_Latn.txt
│ ├── clu_Latn.txt
│ ├── cly_Latn.txt
│ ├── cme_Latn.txt
│ ├── cmn_Hani.txt
│ ├── cmo_Khmr.txt
│ ├── cmo_Latn.txt
│ ├── cmr_Latn.txt
│ ├── cnh_Latn.txt
│ ├── cni_Latn.txt
│ ├── cnk_Latn.txt
│ ├── cnl_Latn.txt
│ ├── cnt_Latn.txt
│ ├── cnw_Latn.txt
│ ├── coe_Latn.txt
│ ├── cof_Latn.txt
│ ├── cok_Latn.txt
│ ├── con_Latn.txt
│ ├── cop_Copt.txt
│ ├── cor_Latn.txt
│ ├── cos_Latn.txt
│ ├── cot_Latn.txt
│ ├── cou_Latn.txt
│ ├── cpa_Latn.txt
│ ├── cpb_Latn.txt
│ ├── cpc_Latn.txt
│ ├── cpu_Latn.txt
│ ├── cpy_Latn.txt
│ ├── crh_Cyrl.txt
│ ├── crh_Latn.txt
│ ├── cri_Latn.txt
│ ├── crj_Cans.txt
│ ├── crk_Cans.txt
│ ├── crk_Latn.txt
│ ├── crl_Cans.txt
│ ├── crm_Cans.txt
│ ├── crn_Latn.txt
│ ├── crs_Latn.txt
│ ├── crt_Latn.txt
│ ├── crx_Latn.txt
│ ├── csb_Latn.txt
│ ├── csk_Latn.txt
│ ├── cso_Latn.txt
│ ├── csw_Latn.txt
│ ├── csy_Latn.txt
│ ├── cta_Latn.txt
│ ├── ctd_Latn.txt
│ ├── cto_Latn.txt
│ ├── ctp_Latn.txt
│ ├── ctu_Latn.txt
│ ├── cub_Latn.txt
│ ├── cuc_Latn.txt
│ ├── cui_Latn.txt
│ ├── cuk_Latn.txt
│ ├── cul_Latn.txt
│ ├── cut_Latn.txt
│ ├── cux_Latn.txt
│ ├── cwd_Cans.txt
│ ├── cwe_Latn.txt
│ ├── cwt_Latn.txt
│ ├── cya_Latn.txt
│ ├── cym_Latn.txt
│ ├── czt_Latn.txt
│ ├── daa_Latn.txt
│ ├── dad_Latn.txt
│ ├── daf_Latn.txt
│ ├── dag_Latn.txt
│ ├── dah_Latn.txt
│ ├── dak_Latn.txt
│ ├── dan_Latn.txt
│ ├── dar_Cyrl.txt
│ ├── dbq_Latn.txt
│ ├── ddg_Latn.txt
│ ├── ddn_Latn.txt
│ ├── ded_Latn.txt
│ ├── des_Latn.txt
│ ├── deu_Latn.txt
│ ├── dga_Latn.txt
│ ├── dgc_Latn.txt
│ ├── dgi_Latn.txt
│ ├── dgr_Latn.txt
│ ├── dgz_Latn.txt
│ ├── dhg_Latn.txt
│ ├── dhm_Latn.txt
│ ├── dhv_Latn.txt
│ ├── did_Latn.txt
│ ├── dig_Latn.txt
│ ├── dik_Latn.txt
│ ├── dip_Latn.txt
│ ├── diq_Latn.txt
│ ├── dis_Latn.txt
│ ├── diu_Latn.txt
│ ├── div_Thaa.txt
│ ├── dje_Latn.txt
│ ├── djk_Latn.txt
│ ├── djr_Latn.txt
│ ├── dks_Latn.txt
│ ├── dln_Latn.txt
│ ├── dng_Cyrl.txt
│ ├── dnj_Latn.txt
│ ├── dnw_Latn.txt
│ ├── dob_Latn.txt
│ ├── doi_Deva.txt
│ ├── dop_Latn.txt
│ ├── dos_Latn.txt
│ ├── dow_Latn.txt
│ ├── drg_Latn.txt
│ ├── dru_Latn.txt
│ ├── dsb_Latn.txt
│ ├── dsh_Latn.txt
│ ├── dtb_Latn.txt
│ ├── dtp_Latn.txt
│ ├── dts_Latn.txt
│ ├── dty_Deva.txt
│ ├── dua_Latn.txt
│ ├── due_Latn.txt
│ ├── dug_Latn.txt
│ ├── duo_Latn.txt
│ ├── dur_Latn.txt
│ ├── dwr_Latn.txt
│ ├── dww_Latn.txt
│ ├── dyi_Latn.txt
│ ├── dyo_Latn.txt
│ ├── dyu_Latn.txt
│ ├── dzo_Tibt.txt
│ ├── ebk_Latn.txt
│ ├── efi_Latn.txt
│ ├── eka_Latn.txt
│ ├── ekk_Latn.txt
│ ├── eko_Latn.txt
│ ├── ell_Grek.txt
│ ├── eme_Latn.txt
│ ├── emi_Latn.txt
│ ├── eml_Latn.txt
│ ├── emp_Latn.txt
│ ├── enb_Latn.txt
│ ├── eng_Latn.txt
│ ├── enl_Latn.txt
│ ├── enm_Latn.txt
│ ├── enq_Latn.txt
│ ├── enx_Latn.txt
│ ├── epo_Latn.txt
│ ├── eri_Latn.txt
│ ├── ese_Latn.txt
│ ├── esi_Latn.txt
│ ├── esk_Latn.txt
│ ├── ess_Latn.txt
│ ├── esu_Latn.txt
│ ├── eto_Latn.txt
│ ├── etr_Latn.txt
│ ├── etu_Latn.txt
│ ├── eus_Latn.txt
│ ├── eve_Cyrl.txt
│ ├── ewe_Latn.txt
│ ├── ewo_Latn.txt
│ ├── ext_Latn.txt
│ ├── eza_Latn.txt
│ ├── faa_Latn.txt
│ ├── fad_Latn.txt
│ ├── fai_Latn.txt
│ ├── fal_Latn.txt
│ ├── fan_Latn.txt
│ ├── fao_Latn.txt
│ ├── far_Latn.txt
│ ├── fas_Arab.txt
│ ├── fat_Latn.txt
│ ├── ffm_Latn.txt
│ ├── fij_Latn.txt
│ ├── fil_Latn.txt
│ ├── fin_Latn.txt
│ ├── fit_Latn.txt
│ ├── fkv_Latn.txt
│ ├── fmu_Deva.txt
│ ├── fon_Latn.txt
│ ├── for_Latn.txt
│ ├── fra_Latn.txt
│ ├── frd_Latn.txt
│ ├── fro_Latn.txt
│ ├── frp_Latn.txt
│ ├── frr_Latn.txt
│ ├── fry_Latn.txt
│ ├── fub_Latn.txt
│ ├── fud_Latn.txt
│ ├── fue_Latn.txt
│ ├── fuf_Latn.txt
│ ├── fuh_Latn.txt
│ ├── fuq_Latn.txt
│ ├── fur_Latn.txt
│ ├── fuv_Arab.txt
│ ├── fuv_Latn.txt
│ ├── gaa_Latn.txt
│ ├── gag_Cyrl.txt
│ ├── gag_Latn.txt
│ ├── gah_Latn.txt
│ ├── gai_Latn.txt
│ ├── gam_Latn.txt
│ ├── gaw_Latn.txt
│ ├── gaz_Latn.txt
│ ├── gbi_Latn.txt
│ ├── gbo_Latn.txt
│ ├── gbr_Latn.txt
│ ├── gcf_Latn.txt
│ ├── gcr_Latn.txt
│ ├── gde_Latn.txt
│ ├── gdg_Latn.txt
│ ├── gdn_Latn.txt
│ ├── gdr_Latn.txt
│ ├── geb_Latn.txt
│ ├── gej_Latn.txt
│ ├── gfk_Latn.txt
│ ├── ghe_Deva.txt
│ ├── ghs_Latn.txt
│ ├── gid_Latn.txt
│ ├── gil_Latn.txt
│ ├── giz_Latn.txt
│ ├── gjn_Latn.txt
│ ├── gkn_Latn.txt
│ ├── gla_Latn.txt
│ ├── gle_Latn.txt
│ ├── glg_Latn.txt
│ ├── glk_Arab.txt
│ ├── glv_Latn.txt
│ ├── gmh_Latn.txt
│ ├── gmv_Ethi.txt
│ ├── gmv_Latn.txt
│ ├── gna_Latn.txt
│ ├── gnb_Latn.txt
│ ├── gnd_Latn.txt
│ ├── gng_Latn.txt
│ ├── gnn_Latn.txt
│ ├── gnw_Latn.txt
│ ├── goa_Latn.txt
│ ├── gof_Ethi.txt
│ ├── gof_Latn.txt
│ ├── gog_Latn.txt
│ ├── goh_Latn.txt
│ ├── gom_Deva.txt
│ ├── gom_Latn.txt
│ ├── gor_Latn.txt
│ ├── gos_Latn.txt
│ ├── got_Latn.txt
│ ├── gqr_Latn.txt
│ ├── grc_Grek.txt
│ ├── grt_Beng.txt
│ ├── gso_Latn.txt
│ ├── gsw_Latn.txt
│ ├── gub_Latn.txt
│ ├── guc_Latn.txt
│ ├── gud_Latn.txt
│ ├── gug_Latn.txt
│ ├── guh_Latn.txt
│ ├── gui_Latn.txt
│ ├── guj_Gujr.txt
│ ├── guj_Latn.txt
│ ├── guk_Ethi.txt
│ ├── gul_Latn.txt
│ ├── gum_Latn.txt
│ ├── gun_Latn.txt
│ ├── guo_Latn.txt
│ ├── guq_Latn.txt
│ ├── gur_Latn.txt
│ ├── guu_Latn.txt
│ ├── guw_Latn.txt
│ ├── gux_Latn.txt
│ ├── guz_Latn.txt
│ ├── gvc_Latn.txt
│ ├── gvf_Latn.txt
│ ├── gvl_Latn.txt
│ ├── gvn_Latn.txt
│ ├── gwi_Latn.txt
│ ├── gwr_Latn.txt
│ ├── gya_Latn.txt
│ ├── gym_Latn.txt
│ ├── gyr_Latn.txt
│ ├── hac_Arab.txt
│ ├── hae_Latn.txt
│ ├── hag_Latn.txt
│ ├── hak_Hani.txt
│ ├── hak_Latn.txt
│ ├── hat_Latn.txt
│ ├── hau_Latn.txt
│ ├── hav_Latn.txt
│ ├── haw_Latn.txt
│ ├── hay_Latn.txt
│ ├── hbo_Hebr.txt
│ ├── hbs_Latn.txt
│ ├── hch_Latn.txt
│ ├── heb_Hebr.txt
│ ├── heg_Latn.txt
│ ├── heh_Latn.txt
│ ├── her_Latn.txt
│ ├── hif_Latn.txt
│ ├── hig_Latn.txt
│ ├── hil_Latn.txt
│ ├── hin_Deva.txt
│ ├── hin_Latn.txt
│ ├── hix_Latn.txt
│ ├── hla_Latn.txt
│ ├── hlt_Latn.txt
│ ├── hmo_Latn.txt
│ ├── hmr_Latn.txt
│ ├── hne_Deva.txt
│ ├── hnj_Latn.txt
│ ├── hnn_Latn.txt
│ ├── hns_Latn.txt
│ ├── hoc_Latn.txt
│ ├── hop_Latn.txt
│ ├── hot_Latn.txt
│ ├── hra_Latn.txt
│ ├── hrv_Latn.txt
│ ├── hrx_Latn.txt
│ ├── hsb_Latn.txt
│ ├── hto_Latn.txt
│ ├── hub_Latn.txt
│ ├── hui_Latn.txt
│ ├── hun_Latn.txt
│ ├── hus_Latn.txt
│ ├── huu_Latn.txt
│ ├── huv_Latn.txt
│ ├── hvn_Latn.txt
│ ├── hwc_Latn.txt
│ ├── hye_Armn.txt
│ ├── hyw_Armn.txt
│ ├── ian_Latn.txt
│ ├── iba_Latn.txt
│ ├── ibg_Latn.txt
│ ├── ibo_Latn.txt
│ ├── icr_Latn.txt
│ ├── ido_Latn.txt
│ ├── idu_Latn.txt
│ ├── ifa_Latn.txt
│ ├── ifb_Latn.txt
│ ├── ife_Latn.txt
│ ├── ifk_Latn.txt
│ ├── ifu_Latn.txt
│ ├── ify_Latn.txt
│ ├── ige_Latn.txt
│ ├── ign_Latn.txt
│ ├── ike_Cans.txt
│ ├── ikk_Latn.txt
│ ├── ikt_Latn.txt
│ ├── ikw_Latn.txt
│ ├── ilb_Latn.txt
│ ├── ile_Latn.txt
│ ├── ilo_Latn.txt
│ ├── imo_Latn.txt
│ ├── ina_Latn.txt
│ ├── inb_Latn.txt
│ ├── ind_Latn.txt
│ ├── inh_Cyrl.txt
│ ├── ino_Latn.txt
│ ├── iou_Latn.txt
│ ├── ipi_Latn.txt
│ ├── iqw_Latn.txt
│ ├── iri_Latn.txt
│ ├── irk_Latn.txt
│ ├── iry_Latn.txt
│ ├── isd_Latn.txt
│ ├── ish_Latn.txt
│ ├── isl_Latn.txt
│ ├── iso_Latn.txt
│ ├── ita_Latn.txt
│ ├── itl_Cyrl.txt
│ ├── itv_Latn.txt
│ ├── ium_Latn.txt
│ ├── ivb_Latn.txt
│ ├── ivv_Latn.txt
│ ├── iws_Latn.txt
│ ├── ixl_Latn.txt
│ ├── izr_Latn.txt
│ ├── izz_Latn.txt
│ ├── jaa_Latn.txt
│ ├── jac_Latn.txt
│ ├── jae_Latn.txt
│ ├── jam_Latn.txt
│ ├── jav_Latn.txt
│ ├── jbo_Latn.txt
│ ├── jbu_Latn.txt
│ ├── jic_Latn.txt
│ ├── jiv_Latn.txt
│ ├── jmc_Latn.txt
│ ├── jpn_Jpan.txt
│ ├── jra_Latn.txt
│ ├── jun_Orya.txt
│ ├── jvn_Latn.txt
│ ├── kaa_Cyrl.txt
│ ├── kaa_Latn.txt
│ ├── kab_Latn.txt
│ ├── kac_Latn.txt
│ ├── kak_Latn.txt
│ ├── kal_Latn.txt
│ ├── kam_Latn.txt
│ ├── kan_Knda.txt
│ ├── kan_Latn.txt
│ ├── kao_Latn.txt
│ ├── kap_Cyrl.txt
│ ├── kaq_Latn.txt
│ ├── kas_Arab.txt
│ ├── kas_Deva.txt
│ ├── kas_Latn.txt
│ ├── kat_Geor.txt
│ ├── kaz_Cyrl.txt
│ ├── kbc_Latn.txt
│ ├── kbd_Cyrl.txt
│ ├── kbh_Latn.txt
│ ├── kbm_Latn.txt
│ ├── kbo_Latn.txt
│ ├── kbp_Latn.txt
│ ├── kbq_Latn.txt
│ ├── kbr_Latn.txt
│ ├── kby_Latn.txt
│ ├── kca_Cyrl.txt
│ ├── kcg_Latn.txt
│ ├── kck_Latn.txt
│ ├── kdc_Latn.txt
│ ├── kde_Latn.txt
│ ├── kdh_Latn.txt
│ ├── kdi_Latn.txt
│ ├── kdj_Latn.txt
│ ├── kdl_Latn.txt
│ ├── kdr_Latn.txt
│ ├── kea_Latn.txt
│ ├── kei_Latn.txt
│ ├── kek_Latn.txt
│ ├── ken_Latn.txt
│ ├── keo_Latn.txt
│ ├── ker_Latn.txt
│ ├── kew_Latn.txt
│ ├── kex_Deva.txt
│ ├── kez_Latn.txt
│ ├── kff_Telu.txt
│ ├── kgf_Latn.txt
│ ├── kgk_Latn.txt
│ ├── kgp_Latn.txt
│ ├── kgr_Latn.txt
│ ├── kha_Latn.txt
│ ├── khk_Cyrl.txt
│ ├── khm_Khmr.txt
│ ├── khq_Latn.txt
│ ├── khs_Latn.txt
│ ├── khy_Latn.txt
│ ├── khz_Latn.txt
│ ├── kia_Latn.txt
│ ├── kij_Latn.txt
│ ├── kik_Latn.txt
│ ├── kin_Latn.txt
│ ├── kir_Cyrl.txt
│ ├── kiu_Latn.txt
│ ├── kix_Latn.txt
│ ├── kjb_Latn.txt
│ ├── kje_Latn.txt
│ ├── kjh_Cyrl.txt
│ ├── kjs_Latn.txt
│ ├── kkc_Latn.txt
│ ├── kki_Latn.txt
│ ├── kkj_Latn.txt
│ ├── kkl_Latn.txt
│ ├── kle_Deva.txt
│ ├── klt_Latn.txt
│ ├── klv_Latn.txt
│ ├── kma_Latn.txt
│ ├── kmb_Latn.txt
│ ├── kmd_Latn.txt
│ ├── kmg_Latn.txt
│ ├── kmh_Latn.txt
│ ├── kmk_Latn.txt
│ ├── kmm_Latn.txt
│ ├── kmo_Latn.txt
│ ├── kmr_Cyrl.txt
│ ├── kmr_Latn.txt
│ ├── kms_Latn.txt
│ ├── kmu_Latn.txt
│ ├── kmy_Latn.txt
│ ├── knc_Arab.txt
│ ├── knc_Latn.txt
│ ├── kne_Latn.txt
│ ├── knf_Latn.txt
│ ├── kng_Latn.txt
│ ├── knj_Latn.txt
│ ├── knk_Latn.txt
│ ├── kno_Latn.txt
│ ├── knv_Latn.txt
│ ├── knx_Latn.txt
│ ├── kny_Latn.txt
│ ├── kog_Latn.txt
│ ├── koi_Cyrl.txt
│ ├── koo_Latn.txt
│ ├── kor_Hang.txt
│ ├── kos_Latn.txt
│ ├── kpe_Latn.txt
│ ├── kpf_Latn.txt
│ ├── kpg_Latn.txt
│ ├── kpj_Latn.txt
│ ├── kpq_Latn.txt
│ ├── kpr_Latn.txt
│ ├── kpv_Cyrl.txt
│ ├── kpw_Latn.txt
│ ├── kpx_Latn.txt
│ ├── kpz_Latn.txt
│ ├── kqa_Latn.txt
│ ├── kqc_Latn.txt
│ ├── kqe_Latn.txt
│ ├── kqf_Latn.txt
│ ├── kql_Latn.txt
│ ├── kqn_Latn.txt
│ ├── kqo_Latn.txt
│ ├── kqp_Latn.txt
│ ├── kqs_Latn.txt
│ ├── kqw_Latn.txt
│ ├── kqy_Ethi.txt
│ ├── krc_Cyrl.txt
│ ├── kri_Latn.txt
│ ├── krj_Latn.txt
│ ├── krl_Latn.txt
│ ├── kru_Deva.txt
│ ├── krx_Latn.txt
│ ├── ksb_Latn.txt
│ ├── ksc_Latn.txt
│ ├── ksd_Latn.txt
│ ├── ksf_Latn.txt
│ ├── ksh_Latn.txt
│ ├── ksj_Latn.txt
│ ├── ksp_Latn.txt
│ ├── ksr_Latn.txt
│ ├── kss_Latn.txt
│ ├── ksw_Mymr.txt
│ ├── ktb_Ethi.txt
│ ├── ktj_Latn.txt
│ ├── ktm_Latn.txt
│ ├── kto_Latn.txt
│ ├── ktu_Latn.txt
│ ├── ktz_Latn.txt
│ ├── kua_Latn.txt
│ ├── kub_Latn.txt
│ ├── kud_Latn.txt
│ ├── kue_Latn.txt
│ ├── kuj_Latn.txt
│ ├── kum_Cyrl.txt
│ ├── kup_Latn.txt
│ ├── kus_Latn.txt
│ ├── kvg_Latn.txt
│ ├── kvj_Latn.txt
│ ├── kvn_Latn.txt
│ ├── kwd_Latn.txt
│ ├── kwf_Latn.txt
│ ├── kwi_Latn.txt
│ ├── kwj_Latn.txt
│ ├── kwn_Latn.txt
│ ├── kwy_Latn.txt
│ ├── kxc_Ethi.txt
│ ├── kxm_Thai.txt
│ ├── kxw_Latn.txt
│ ├── kyc_Latn.txt
│ ├── kyf_Latn.txt
│ ├── kyg_Latn.txt
│ ├── kyq_Latn.txt
│ ├── kyu_Kali.txt
│ ├── kyu_Latn.txt
│ ├── kyu_Mymr.txt
│ ├── kyz_Latn.txt
│ ├── kze_Latn.txt
│ ├── kzf_Latn.txt
│ ├── kzj_Latn.txt
│ ├── kzn_Latn.txt
│ ├── lac_Latn.txt
│ ├── lad_Hebr.txt
│ ├── lad_Latn.txt
│ ├── lai_Latn.txt
│ ├── laj_Latn.txt
│ ├── lam_Latn.txt
│ ├── lao_Laoo.txt
│ ├── lap_Latn.txt
│ ├── las_Latn.txt
│ ├── lat_Latn.txt
│ ├── law_Latn.txt
│ ├── lbb_Latn.txt
│ ├── lbe_Cyrl.txt
│ ├── lbj_Tibt.txt
│ ├── lbk_Latn.txt
│ ├── lcm_Latn.txt
│ ├── lcp_Thai.txt
│ ├── ldi_Latn.txt
│ ├── ldn_Latn.txt
│ ├── lea_Latn.txt
│ ├── led_Latn.txt
│ ├── lee_Latn.txt
│ ├── lef_Latn.txt
│ ├── leh_Latn.txt
│ ├── lem_Latn.txt
│ ├── leu_Latn.txt
│ ├── lew_Latn.txt
│ ├── lex_Latn.txt
│ ├── lez_Cyrl.txt
│ ├── lfn_Cyrl.txt
│ ├── lfn_Latn.txt
│ ├── lgg_Latn.txt
│ ├── lgl_Latn.txt
│ ├── lgm_Latn.txt
│ ├── lhi_Latn.txt
│ ├── lhu_Latn.txt
│ ├── lia_Latn.txt
│ ├── lid_Latn.txt
│ ├── lif_Deva.txt
│ ├── lif_Limb.txt
│ ├── lij_Latn.txt
│ ├── lim_Latn.txt
│ ├── lin_Latn.txt
│ ├── lip_Latn.txt
│ ├── lis_Lisu.txt
│ ├── lit_Latn.txt
│ ├── liv_Latn.txt
│ ├── ljp_Latn.txt
│ ├── lki_Arab.txt
│ ├── llb_Latn.txt
│ ├── lld_Latn.txt
│ ├── llg_Latn.txt
│ ├── lln_Latn.txt
│ ├── lmk_Latn.txt
│ ├── lmo_Latn.txt
│ ├── lmp_Latn.txt
│ ├── lnd_Latn.txt
│ ├── lob_Latn.txt
│ ├── loe_Latn.txt
│ ├── log_Latn.txt
│ ├── lok_Latn.txt
│ ├── lol_Latn.txt
│ ├── lom_Latn.txt
│ ├── loq_Latn.txt
│ ├── loz_Latn.txt
│ ├── lrc_Arab.txt
│ ├── lsi_Latn.txt
│ ├── lsm_Latn.txt
│ ├── ltg_Latn.txt
│ ├── ltz_Latn.txt
│ ├── lua_Latn.txt
│ ├── lub_Latn.txt
│ ├── luc_Latn.txt
│ ├── lud_Latn.txt
│ ├── lue_Latn.txt
│ ├── lug_Latn.txt
│ ├── lun_Latn.txt
│ ├── luo_Latn.txt
│ ├── lus_Latn.txt
│ ├── lvs_Latn.txt
│ ├── lwg_Latn.txt
│ ├── lwo_Latn.txt
│ ├── lww_Latn.txt
│ ├── lzh_Hani.txt
│ ├── maa_Latn.txt
│ ├── mad_Latn.txt
│ ├── maf_Latn.txt
│ ├── mag_Deva.txt
│ ├── mah_Latn.txt
│ ├── mai_Deva.txt
│ ├── maj_Latn.txt
│ ├── mak_Latn.txt
│ ├── mal_Latn.txt
│ ├── mal_Mlym.txt
│ ├── mam_Latn.txt
│ ├── maq_Latn.txt
│ ├── mar_Deva.txt
│ ├── mar_Latn.txt
│ ├── mas_Latn.txt
│ ├── mau_Latn.txt
│ ├── mav_Latn.txt
│ ├── maw_Latn.txt
│ ├── max_Latn.txt
│ ├── maz_Latn.txt
│ ├── mbb_Latn.txt
│ ├── mbc_Latn.txt
│ ├── mbd_Latn.txt
│ ├── mbf_Latn.txt
│ ├── mbh_Latn.txt
│ ├── mbi_Latn.txt
│ ├── mbj_Latn.txt
│ ├── mbl_Latn.txt
│ ├── mbs_Latn.txt
│ ├── mbt_Latn.txt
│ ├── mca_Latn.txt
│ ├── mcb_Latn.txt
│ ├── mcd_Latn.txt
│ ├── mcf_Latn.txt
│ ├── mck_Latn.txt
│ ├── mcn_Latn.txt
│ ├── mco_Latn.txt
│ ├── mcp_Latn.txt
│ ├── mcq_Latn.txt
│ ├── mcu_Latn.txt
│ ├── mda_Latn.txt
│ ├── mdf_Cyrl.txt
│ ├── mdy_Ethi.txt
│ ├── med_Latn.txt
│ ├── mee_Latn.txt
│ ├── mej_Latn.txt
│ ├── mek_Latn.txt
│ ├── men_Latn.txt
│ ├── meq_Latn.txt
│ ├── mer_Latn.txt
│ ├── met_Latn.txt
│ ├── meu_Latn.txt
│ ├── mev_Latn.txt
│ ├── mfe_Latn.txt
│ ├── mfg_Latn.txt
│ ├── mfh_Latn.txt
│ ├── mfi_Latn.txt
│ ├── mfk_Latn.txt
│ ├── mfq_Latn.txt
│ ├── mfy_Latn.txt
│ ├── mfz_Latn.txt
│ ├── mgc_Latn.txt
│ ├── mgh_Latn.txt
│ ├── mgm_Latn.txt
│ ├── mgo_Latn.txt
│ ├── mgr_Latn.txt
│ ├── mhi_Latn.txt
│ ├── mhl_Latn.txt
│ ├── mhr_Cyrl.txt
│ ├── mhw_Latn.txt
│ ├── mhx_Latn.txt
│ ├── mhy_Latn.txt
│ ├── mib_Latn.txt
│ ├── mic_Latn.txt
│ ├── mie_Latn.txt
│ ├── mif_Latn.txt
│ ├── mig_Latn.txt
│ ├── mih_Latn.txt
│ ├── mil_Latn.txt
│ ├── mim_Latn.txt
│ ├── min_Arab.txt
│ ├── min_Latn.txt
│ ├── mio_Latn.txt
│ ├── mip_Latn.txt
│ ├── miq_Latn.txt
│ ├── mir_Latn.txt
│ ├── mit_Latn.txt
│ ├── miy_Latn.txt
│ ├── miz_Latn.txt
│ ├── mjc_Latn.txt
│ ├── mjw_Latn.txt
│ ├── mkd_Cyrl.txt
│ ├── mkl_Latn.txt
│ ├── mkn_Latn.txt
│ ├── mks_Latn.txt
│ ├── mkz_Latn.txt
│ ├── mlh_Latn.txt
│ ├── mlp_Latn.txt
│ ├── mlt_Latn.txt
│ ├── mlu_Latn.txt
│ ├── mmn_Latn.txt
│ ├── mmo_Latn.txt
│ ├── mmx_Latn.txt
│ ├── mna_Latn.txt
│ ├── mnb_Latn.txt
│ ├── mnf_Latn.txt
│ ├── mni_Beng.txt
│ ├── mni_Latn.txt
│ ├── mni_Mtei.txt
│ ├── mnk_Latn.txt
│ ├── mns_Cyrl.txt
│ ├── mnw_Mymr.txt
│ ├── mnx_Latn.txt
│ ├── mny_Latn.txt
│ ├── moa_Latn.txt
│ ├── moc_Latn.txt
│ ├── mog_Latn.txt
│ ├── moh_Latn.txt
│ ├── mop_Latn.txt
│ ├── mor_Latn.txt
│ ├── mos_Latn.txt
│ ├── mox_Latn.txt
│ ├── mpg_Latn.txt
│ ├── mph_Latn.txt
│ ├── mpm_Latn.txt
│ ├── mpp_Latn.txt
│ ├── mps_Latn.txt
│ ├── mpt_Latn.txt
│ ├── mpx_Latn.txt
│ ├── mqb_Latn.txt
│ ├── mqj_Latn.txt
│ ├── mqy_Latn.txt
│ ├── mrg_Latn.txt
│ ├── mri_Latn.txt
│ ├── mrj_Cyrl.txt
│ ├── mrq_Latn.txt
│ ├── mrv_Latn.txt
│ ├── mrw_Latn.txt
│ ├── msb_Latn.txt
│ ├── msc_Latn.txt
│ ├── mse_Latn.txt
│ ├── msk_Latn.txt
│ ├── msm_Latn.txt
│ ├── msy_Latn.txt
│ ├── mta_Latn.txt
│ ├── mtg_Latn.txt
│ ├── mti_Latn.txt
│ ├── mtj_Latn.txt
│ ├── mto_Latn.txt
│ ├── mtp_Latn.txt
│ ├── mua_Latn.txt
│ ├── mug_Latn.txt
│ ├── muh_Latn.txt
│ ├── mui_Latn.txt
│ ├── mup_Deva.txt
│ ├── mur_Latn.txt
│ ├── mus_Latn.txt
│ ├── mux_Latn.txt
│ ├── muy_Latn.txt
│ ├── mva_Latn.txt
│ ├── mvn_Latn.txt
│ ├── mvp_Latn.txt
│ ├── mwc_Latn.txt
│ ├── mwf_Latn.txt
│ ├── mwl_Latn.txt
│ ├── mwm_Latn.txt
│ ├── mwn_Latn.txt
│ ├── mwp_Latn.txt
│ ├── mwq_Latn.txt
│ ├── mwv_Latn.txt
│ ├── mww_Latn.txt
│ ├── mxb_Latn.txt
│ ├── mxp_Latn.txt
│ ├── mxq_Latn.txt
│ ├── mxt_Latn.txt
│ ├── mxv_Latn.txt
│ ├── mya_Mymr.txt
│ ├── myb_Latn.txt
│ ├── myk_Latn.txt
│ ├── myu_Latn.txt
│ ├── myv_Cyrl.txt
│ ├── myw_Latn.txt
│ ├── myx_Latn.txt
│ ├── myy_Latn.txt
│ ├── mza_Latn.txt
│ ├── mzh_Latn.txt
│ ├── mzk_Latn.txt
│ ├── mzl_Latn.txt
│ ├── mzm_Latn.txt
│ ├── mzn_Arab.txt
│ ├── mzw_Latn.txt
│ ├── mzz_Latn.txt
│ ├── nab_Latn.txt
│ ├── naf_Latn.txt
│ ├── nah_Latn.txt
│ ├── nak_Latn.txt
│ ├── nan_Latn.txt
│ ├── nap_Latn.txt
│ ├── naq_Latn.txt
│ ├── nas_Latn.txt
│ ├── nav_Latn.txt
│ ├── naw_Latn.txt
│ ├── nba_Latn.txt
│ ├── nbc_Latn.txt
│ ├── nbe_Latn.txt
│ ├── nbl_Latn.txt
│ ├── nbq_Latn.txt
│ ├── nbu_Latn.txt
│ ├── nca_Latn.txt
│ ├── nch_Latn.txt
│ ├── ncj_Latn.txt
│ ├── ncl_Latn.txt
│ ├── ncq_Laoo.txt
│ ├── nct_Latn.txt
│ ├── ncu_Latn.txt
│ ├── ncx_Latn.txt
│ ├── ndc_Latn.txt
│ ├── nde_Latn.txt
│ ├── ndh_Latn.txt
│ ├── ndi_Latn.txt
│ ├── ndj_Latn.txt
│ ├── ndo_Latn.txt
│ ├── ndp_Latn.txt
│ ├── nds_Latn.txt
│ ├── ndy_Latn.txt
│ ├── ndz_Latn.txt
│ ├── neb_Latn.txt
│ ├── new_Deva.txt
│ ├── nfa_Latn.txt
│ ├── nfr_Latn.txt
│ ├── ngb_Latn.txt
│ ├── ngc_Latn.txt
│ ├── ngl_Latn.txt
│ ├── ngp_Latn.txt
│ ├── ngu_Latn.txt
│ ├── nhd_Latn.txt
│ ├── nhe_Latn.txt
│ ├── nhg_Latn.txt
│ ├── nhi_Latn.txt
│ ├── nhk_Latn.txt
│ ├── nho_Latn.txt
│ ├── nhr_Latn.txt
│ ├── nhu_Latn.txt
│ ├── nhw_Latn.txt
│ ├── nhx_Latn.txt
│ ├── nhy_Latn.txt
│ ├── nia_Latn.txt
│ ├── nif_Latn.txt
│ ├── nii_Latn.txt
│ ├── nij_Latn.txt
│ ├── nim_Latn.txt
│ ├── nin_Latn.txt
│ ├── nio_Cyrl.txt
│ ├── niq_Latn.txt
│ ├── niu_Latn.txt
│ ├── niy_Latn.txt
│ ├── njb_Latn.txt
│ ├── njm_Latn.txt
│ ├── njn_Latn.txt
│ ├── njo_Latn.txt
│ ├── njz_Latn.txt
│ ├── nkf_Latn.txt
│ ├── nki_Latn.txt
│ ├── nko_Latn.txt
│ ├── nla_Latn.txt
│ ├── nlc_Latn.txt
│ ├── nld_Latn.txt
│ ├── nlg_Latn.txt
│ ├── nma_Latn.txt
│ ├── nmf_Latn.txt
│ ├── nmh_Latn.txt
│ ├── nmo_Latn.txt
│ ├── nmw_Latn.txt
│ ├── nmz_Latn.txt
│ ├── nnb_Latn.txt
│ ├── nng_Latn.txt
│ ├── nnh_Latn.txt
│ ├── nnl_Latn.txt
│ ├── nno_Latn.txt
│ ├── nnp_Latn.txt
│ ├── nnq_Latn.txt
│ ├── nnw_Latn.txt
│ ├── noa_Latn.txt
│ ├── nob_Latn.txt
│ ├── nod_Thai.txt
│ ├── nog_Cyrl.txt
│ ├── non_Latn.txt
│ ├── nop_Latn.txt
│ ├── not_Latn.txt
│ ├── nou_Latn.txt
│ ├── nov_Latn.txt
│ ├── nph_Latn.txt
│ ├── npi_Deva.txt
│ ├── npi_Latn.txt
│ ├── npl_Latn.txt
│ ├── npo_Latn.txt
│ ├── npy_Latn.txt
│ ├── nqo_Nkoo.txt
│ ├── nre_Latn.txt
│ ├── nrf_Latn.txt
│ ├── nri_Latn.txt
│ ├── nsa_Latn.txt
│ ├── nse_Latn.txt
│ ├── nsm_Latn.txt
│ ├── nsn_Latn.txt
│ ├── nso_Latn.txt
│ ├── nss_Latn.txt
│ ├── nst_Latn.txt
│ ├── nsu_Latn.txt
│ ├── ntp_Latn.txt
│ ├── ntr_Latn.txt
│ ├── ntu_Latn.txt
│ ├── nuj_Latn.txt
│ ├── nus_Latn.txt
│ ├── nuy_Latn.txt
│ ├── nuz_Latn.txt
│ ├── nvm_Latn.txt
│ ├── nwb_Latn.txt
│ ├── nwi_Latn.txt
│ ├── nwx_Deva.txt
│ ├── nxd_Latn.txt
│ ├── nya_Latn.txt
│ ├── nyf_Latn.txt
│ ├── nyk_Latn.txt
│ ├── nyn_Latn.txt
│ ├── nyo_Latn.txt
│ ├── nyu_Latn.txt
│ ├── nyy_Latn.txt
│ ├── nza_Latn.txt
│ ├── nzi_Latn.txt
│ ├── nzm_Latn.txt
│ ├── obo_Latn.txt
│ ├── oci_Latn.txt
│ ├── ogo_Latn.txt
│ ├── ojb_Cans.txt
│ ├── ojb_Latn.txt
│ ├── oke_Latn.txt
│ ├── oku_Latn.txt
│ ├── okv_Latn.txt
│ ├── old_Latn.txt
│ ├── olo_Latn.txt
│ ├── omb_Latn.txt
│ ├── omw_Latn.txt
│ ├── ong_Latn.txt
│ ├── ons_Latn.txt
│ ├── ood_Latn.txt
│ ├── opm_Latn.txt
│ ├── orv_Cyrl.txt
│ ├── ory_Latn.txt
│ ├── ory_Orya.txt
│ ├── oss_Cyrl.txt
│ ├── ota_Arab.txt
│ ├── otd_Latn.txt
│ ├── ote_Latn.txt
│ ├── otm_Latn.txt
│ ├── otn_Latn.txt
│ ├── oto_Latn.txt
│ ├── otq_Latn.txt
│ ├── ots_Latn.txt
│ ├── otw_Latn.txt
│ ├── oym_Latn.txt
│ ├── ozm_Latn.txt
│ ├── pab_Latn.txt
│ ├── pad_Latn.txt
│ ├── pag_Latn.txt
│ ├── pah_Latn.txt
│ ├── pam_Latn.txt
│ ├── pan_Guru.txt
│ ├── pan_Latn.txt
│ ├── pao_Latn.txt
│ ├── pap_Latn.txt
│ ├── pau_Latn.txt
│ ├── pbb_Latn.txt
│ ├── pbc_Latn.txt
│ ├── pbi_Latn.txt
│ ├── pbt_Arab.txt
│ ├── pcd_Latn.txt
│ ├── pck_Latn.txt
│ ├── pcm_Latn.txt
│ ├── pdc_Latn.txt
│ ├── pdt_Latn.txt
│ ├── pem_Latn.txt
│ ├── pfe_Latn.txt
│ ├── pfl_Latn.txt
│ ├── phm_Latn.txt
│ ├── pib_Latn.txt
│ ├── pio_Latn.txt
│ ├── pir_Latn.txt
│ ├── pis_Latn.txt
│ ├── pjt_Latn.txt
│ ├── pkb_Latn.txt
│ ├── plg_Latn.txt
│ ├── pls_Latn.txt
│ ├── plt_Latn.txt
│ ├── plu_Latn.txt
│ ├── plw_Latn.txt
│ ├── pma_Latn.txt
│ ├── pmf_Latn.txt
│ ├── pmq_Latn.txt
│ ├── pms_Latn.txt
│ ├── pmx_Latn.txt
│ ├── pnb_Arab.txt
│ ├── pne_Latn.txt
│ ├── pnt_Grek.txt
│ ├── pny_Latn.txt
│ ├── poe_Latn.txt
│ ├── poh_Latn.txt
│ ├── poi_Latn.txt
│ ├── pol_Latn.txt
│ ├── pon_Latn.txt
│ ├── por_Latn.txt
│ ├── pos_Latn.txt
│ ├── pot_Latn.txt
│ ├── pov_Latn.txt
│ ├── poy_Latn.txt
│ ├── ppk_Latn.txt
│ ├── ppo_Latn.txt
│ ├── pps_Latn.txt
│ ├── prf_Latn.txt
│ ├── prg_Latn.txt
│ ├── pri_Latn.txt
│ ├── prq_Latn.txt
│ ├── pse_Latn.txt
│ ├── pss_Latn.txt
│ ├── ptp_Latn.txt
│ ├── ptu_Latn.txt
│ ├── pua_Latn.txt
│ ├── pui_Latn.txt
│ ├── pwg_Latn.txt
│ ├── pwn_Latn.txt
│ ├── pww_Thai.txt
│ ├── pxm_Latn.txt
│ ├── qub_Latn.txt
│ ├── quc_Latn.txt
│ ├── quf_Latn.txt
│ ├── qug_Latn.txt
│ ├── quh_Latn.txt
│ ├── qul_Latn.txt
│ ├── qup_Latn.txt
│ ├── qus_Latn.txt
│ ├── quw_Latn.txt
│ ├── quy_Latn.txt
│ ├── quz_Latn.txt
│ ├── qva_Latn.txt
│ ├── qvc_Latn.txt
│ ├── qve_Latn.txt
│ ├── qvh_Latn.txt
│ ├── qvi_Latn.txt
│ ├── qvm_Latn.txt
│ ├── qvn_Latn.txt
│ ├── qvo_Latn.txt
│ ├── qvs_Latn.txt
│ ├── qvw_Latn.txt
│ ├── qvz_Latn.txt
│ ├── qwh_Latn.txt
│ ├── qxh_Latn.txt
│ ├── qxl_Latn.txt
│ ├── qxn_Latn.txt
│ ├── qxo_Latn.txt
│ ├── qxr_Latn.txt
│ ├── rad_Latn.txt
│ ├── rai_Latn.txt
│ ├── rap_Latn.txt
│ ├── rar_Latn.txt
│ ├── rav_Deva.txt
│ ├── raw_Latn.txt
│ ├── rcf_Latn.txt
│ ├── rej_Latn.txt
│ ├── rel_Latn.txt
│ ├── rgu_Latn.txt
│ ├── rhg_Latn.txt
│ ├── ria_Latn.txt
│ ├── rim_Latn.txt
│ ├── rjs_Deva.txt
│ ├── rkb_Latn.txt
│ ├── rmc_Latn.txt
│ ├── rme_Latn.txt
│ ├── rml_Latn.txt
│ ├── rmn_Cyrl.txt
│ ├── rmn_Grek.txt
│ ├── rmn_Latn.txt
│ ├── rmo_Latn.txt
│ ├── rmq_Latn.txt
│ ├── rmy_Cyrl.txt
│ ├── rmy_Latn.txt
│ ├── rnd_Latn.txt
│ ├── rng_Latn.txt
│ ├── rnl_Latn.txt
│ ├── roh_Latn.txt
│ ├── ron_Cyrl.txt
│ ├── ron_Latn.txt
│ ├── roo_Latn.txt
│ ├── rop_Latn.txt
│ ├── row_Latn.txt
│ ├── rro_Latn.txt
│ ├── rtm_Latn.txt
│ ├── rub_Latn.txt
│ ├── rue_Cyrl.txt
│ ├── ruf_Latn.txt
│ ├── rug_Latn.txt
│ ├── run_Latn.txt
│ ├── rup_Latn.txt
│ ├── rus_Cyrl.txt
│ ├── rwo_Latn.txt
│ ├── sab_Latn.txt
│ ├── sag_Latn.txt
│ ├── sah_Cyrl.txt
│ ├── saj_Latn.txt
│ ├── san_Deva.txt
│ ├── san_Latn.txt
│ ├── sas_Latn.txt
│ ├── sat_Latn.txt
│ ├── sat_Olck.txt
│ ├── say_Latn.txt
│ ├── sba_Latn.txt
│ ├── sbd_Latn.txt
│ ├── sbe_Latn.txt
│ ├── sbl_Latn.txt
│ ├── sbs_Latn.txt
│ ├── sby_Latn.txt
│ ├── sck_Deva.txt
│ ├── scn_Latn.txt
│ ├── sco_Latn.txt
│ ├── sda_Latn.txt
│ ├── sdc_Latn.txt
│ ├── sdh_Arab.txt
│ ├── sdo_Latn.txt
│ ├── sdq_Latn.txt
│ ├── seh_Latn.txt
│ ├── sel_Cyrl.txt
│ ├── ses_Latn.txt
│ ├── sey_Latn.txt
│ ├── sfw_Latn.txt
│ ├── sgb_Latn.txt
│ ├── sgc_Latn.txt
│ ├── sgh_Cyrl.txt
│ ├── sgs_Latn.txt
│ ├── sgw_Ethi.txt
│ ├── sgz_Latn.txt
│ ├── shi_Latn.txt
│ ├── shk_Latn.txt
│ ├── shn_Mymr.txt
│ ├── shp_Latn.txt
│ ├── shr_Latn.txt
│ ├── shu_Arab.txt
│ ├── sid_Latn.txt
│ ├── sig_Latn.txt
│ ├── sil_Latn.txt
│ ├── sim_Latn.txt
│ ├── sin_Sinh.txt
│ ├── sja_Latn.txt
│ ├── sjo_Mong.txt
│ ├── sju_Latn.txt
│ ├── skg_Latn.txt
│ ├── skr_Arab.txt
│ ├── sld_Latn.txt
│ ├── slk_Latn.txt
│ ├── sll_Latn.txt
│ ├── slv_Latn.txt
│ ├── sma_Latn.txt
│ ├── sme_Latn.txt
│ ├── smj_Latn.txt
│ ├── smk_Latn.txt
│ ├── sml_Latn.txt
│ ├── smn_Latn.txt
│ ├── smo_Latn.txt
│ ├── sms_Latn.txt
│ ├── smt_Latn.txt
│ ├── sna_Latn.txt
│ ├── snc_Latn.txt
│ ├── snd_Arab.txt
│ ├── snd_Deva.txt
│ ├── snd_Latn.txt
│ ├── snf_Latn.txt
│ ├── snn_Latn.txt
│ ├── snp_Latn.txt
│ ├── snw_Latn.txt
│ ├── sny_Latn.txt
│ ├── soe_Latn.txt
│ ├── som_Latn.txt
│ ├── sop_Latn.txt
│ ├── soq_Latn.txt
│ ├── sot_Latn.txt
│ ├── soy_Latn.txt
│ ├── spa_Latn.txt
│ ├── spl_Latn.txt
│ ├── spm_Latn.txt
│ ├── spp_Latn.txt
│ ├── sps_Latn.txt
│ ├── spy_Latn.txt
│ ├── srd_Latn.txt
│ ├── sri_Latn.txt
│ ├── srm_Latn.txt
│ ├── srn_Latn.txt
│ ├── srp_Cyrl.txt
│ ├── srp_Latn.txt
│ ├── srq_Latn.txt
│ ├── srr_Latn.txt
│ ├── ssd_Latn.txt
│ ├── ssg_Latn.txt
│ ├── ssw_Latn.txt
│ ├── ssx_Latn.txt
│ ├── stn_Latn.txt
│ ├── stp_Latn.txt
│ ├── stq_Latn.txt
│ ├── sua_Latn.txt
│ ├── suc_Latn.txt
│ ├── sue_Latn.txt
│ ├── suk_Latn.txt
│ ├── sun_Latn.txt
│ ├── sur_Latn.txt
│ ├── sus_Arab.txt
│ ├── sus_Latn.txt
│ ├── suz_Deva.txt
│ ├── swb_Latn.txt
│ ├── swc_Latn.txt
│ ├── swe_Latn.txt
│ ├── swg_Latn.txt
│ ├── swh_Latn.txt
│ ├── swk_Latn.txt
│ ├── swp_Latn.txt
│ ├── sxb_Latn.txt
│ ├── sxn_Latn.txt
│ ├── syb_Latn.txt
│ ├── syc_Syrc.txt
│ ├── syl_Beng.txt
│ ├── syl_Latn.txt
│ ├── szb_Latn.txt
│ ├── szl_Latn.txt
│ ├── szy_Latn.txt
│ ├── tab_Cyrl.txt
│ ├── tac_Latn.txt
│ ├── tah_Latn.txt
│ ├── taj_Deva.txt
│ ├── tam_Latn.txt
│ ├── tam_Taml.txt
│ ├── tap_Latn.txt
│ ├── taq_Latn.txt
│ ├── taq_Tfng.txt
│ ├── tar_Latn.txt
│ ├── tat_Cyrl.txt
│ ├── tat_Latn.txt
│ ├── tav_Latn.txt
│ ├── taw_Latn.txt
│ ├── tay_Latn.txt
│ ├── tbc_Latn.txt
│ ├── tbg_Latn.txt
│ ├── tbk_Latn.txt
│ ├── tbl_Latn.txt
│ ├── tbo_Latn.txt
│ ├── tbw_Latn.txt
│ ├── tby_Latn.txt
│ ├── tbz_Latn.txt
│ ├── tca_Latn.txt
│ ├── tcc_Latn.txt
│ ├── tcf_Latn.txt
│ ├── tcs_Latn.txt
│ ├── tcy_Knda.txt
│ ├── tcz_Latn.txt
│ ├── tdx_Latn.txt
│ ├── ted_Latn.txt
│ ├── tee_Latn.txt
│ ├── tel_Latn.txt
│ ├── tel_Telu.txt
│ ├── tem_Latn.txt
│ ├── teo_Latn.txt
│ ├── ter_Latn.txt
│ ├── tet_Latn.txt
│ ├── tew_Latn.txt
│ ├── tfr_Latn.txt
│ ├── tgk_Cyrl.txt
│ ├── tgo_Latn.txt
│ ├── tgp_Latn.txt
│ ├── tha_Thai.txt
│ ├── thk_Latn.txt
│ ├── thl_Deva.txt
│ ├── thv_Latn.txt
│ ├── tif_Latn.txt
│ ├── tig_Ethi.txt
│ ├── tih_Latn.txt
│ ├── tik_Latn.txt
│ ├── tim_Latn.txt
│ ├── tir_Ethi.txt
│ ├── tiv_Latn.txt
│ ├── tiy_Latn.txt
│ ├── tke_Latn.txt
│ ├── tkl_Latn.txt
│ ├── tkr_Cyrl.txt
│ ├── tku_Latn.txt
│ ├── tlb_Latn.txt
│ ├── tlf_Latn.txt
│ ├── tlh_Latn.txt
│ ├── tlj_Latn.txt
│ ├── tll_Latn.txt
│ ├── tly_Latn.txt
│ ├── tmc_Latn.txt
│ ├── tmd_Latn.txt
│ ├── tna_Latn.txt
│ ├── tnc_Latn.txt
│ ├── tnk_Latn.txt
│ ├── tnn_Latn.txt
│ ├── tnp_Latn.txt
│ ├── tnr_Latn.txt
│ ├── tob_Latn.txt
│ ├── toc_Latn.txt
│ ├── tod_Latn.txt
│ ├── tog_Latn.txt
│ ├── toh_Latn.txt
│ ├── toi_Latn.txt
│ ├── toj_Latn.txt
│ ├── tok_Latn.txt
│ ├── ton_Latn.txt
│ ├── too_Latn.txt
│ ├── top_Latn.txt
│ ├── tos_Latn.txt
│ ├── tpa_Latn.txt
│ ├── tpi_Latn.txt
│ ├── tpm_Latn.txt
│ ├── tpn_Latn.txt
│ ├── tpp_Latn.txt
│ ├── tpt_Latn.txt
│ ├── tpw_Latn.txt
│ ├── tpz_Latn.txt
│ ├── tqo_Latn.txt
│ ├── trc_Latn.txt
│ ├── trn_Latn.txt
│ ├── tro_Latn.txt
│ ├── trp_Latn.txt
│ ├── trq_Latn.txt
│ ├── trs_Latn.txt
│ ├── trv_Latn.txt
│ ├── tsc_Latn.txt
│ ├── tsg_Latn.txt
│ ├── tsn_Latn.txt
│ ├── tso_Latn.txt
│ ├── tsw_Latn.txt
│ ├── tsz_Latn.txt
│ ├── ttc_Latn.txt
│ ├── tte_Latn.txt
│ ├── ttj_Latn.txt
│ ├── ttq_Latn.txt
│ ├── ttq_Tfng.txt
│ ├── tuc_Latn.txt
│ ├── tue_Latn.txt
│ ├── tuf_Latn.txt
│ ├── tui_Latn.txt
│ ├── tuk_Arab.txt
│ ├── tuk_Cyrl.txt
│ ├── tuk_Latn.txt
│ ├── tul_Latn.txt
│ ├── tum_Latn.txt
│ ├── tuo_Latn.txt
│ ├── tur_Latn.txt
│ ├── tuv_Latn.txt
│ ├── tvk_Latn.txt
│ ├── tvl_Latn.txt
│ ├── twb_Latn.txt
│ ├── twi_Latn.txt
│ ├── twu_Latn.txt
│ ├── twx_Latn.txt
│ ├── txq_Latn.txt
│ ├── txu_Latn.txt
│ ├── tyv_Cyrl.txt
│ ├── tzh_Latn.txt
│ ├── tzj_Latn.txt
│ ├── tzl_Latn.txt
│ ├── tzm_Tfng.txt
│ ├── tzo_Latn.txt
│ ├── ubr_Latn.txt
│ ├── ubu_Latn.txt
│ ├── udm_Cyrl.txt
│ ├── udu_Latn.txt
│ ├── uig_Arab.txt
│ ├── uig_Cyrl.txt
│ ├── uig_Latn.txt
│ ├── ukr_Cyrl.txt
│ ├── umb_Latn.txt
│ ├── upv_Latn.txt
│ ├── ura_Latn.txt
│ ├── urb_Latn.txt
│ ├── urd_Arab.txt
│ ├── urd_Latn.txt
│ ├── urh_Latn.txt
│ ├── uri_Latn.txt
│ ├── urk_Thai.txt
│ ├── urt_Latn.txt
│ ├── urw_Latn.txt
│ ├── ury_Latn.txt
│ ├── usa_Latn.txt
│ ├── usp_Latn.txt
│ ├── uth_Latn.txt
│ ├── uvh_Latn.txt
│ ├── uvl_Latn.txt
│ ├── uzn_Cyrl.txt
│ ├── uzn_Latn.txt
│ ├── uzs_Arab.txt
│ ├── vag_Latn.txt
│ ├── vap_Latn.txt
│ ├── var_Latn.txt
│ ├── vec_Latn.txt
│ ├── ven_Latn.txt
│ ├── vep_Latn.txt
│ ├── vid_Latn.txt
│ ├── vie_Latn.txt
│ ├── viv_Latn.txt
│ ├── vls_Latn.txt
│ ├── vmk_Latn.txt
│ ├── vmw_Latn.txt
│ ├── vmy_Latn.txt
│ ├── vol_Latn.txt
│ ├── vot_Latn.txt
│ ├── vro_Latn.txt
│ ├── vun_Latn.txt
│ ├── vut_Latn.txt
│ ├── waj_Latn.txt
│ ├── wal_Ethi.txt
│ ├── wal_Latn.txt
│ ├── wap_Latn.txt
│ ├── war_Latn.txt
│ ├── wat_Latn.txt
│ ├── way_Latn.txt
│ ├── wba_Latn.txt
│ ├── wbm_Latn.txt
│ ├── wbp_Latn.txt
│ ├── wed_Latn.txt
│ ├── wer_Latn.txt
│ ├── wes_Latn.txt
│ ├── wew_Latn.txt
│ ├── whg_Latn.txt
│ ├── whk_Latn.txt
│ ├── wib_Latn.txt
│ ├── wim_Latn.txt
│ ├── wiu_Latn.txt
│ ├── wln_Latn.txt
│ ├── wls_Latn.txt
│ ├── wlv_Latn.txt
│ ├── wlx_Latn.txt
│ ├── wmt_Latn.txt
│ ├── wmw_Latn.txt
│ ├── wnc_Latn.txt
│ ├── wnu_Latn.txt
│ ├── wob_Latn.txt
│ ├── wol_Latn.txt
│ ├── wos_Latn.txt
│ ├── wrk_Latn.txt
│ ├── wrs_Latn.txt
│ ├── wsg_Telu.txt
│ ├── wsk_Latn.txt
│ ├── wuu_Hani.txt
│ ├── wuv_Latn.txt
│ ├── wwa_Latn.txt
│ ├── xal_Cyrl.txt
│ ├── xav_Latn.txt
│ ├── xbi_Latn.txt
│ ├── xbr_Latn.txt
│ ├── xed_Latn.txt
│ ├── xho_Latn.txt
│ ├── xla_Latn.txt
│ ├── xmf_Geor.txt
│ ├── xmm_Latn.txt
│ ├── xmv_Latn.txt
│ ├── xnn_Latn.txt
│ ├── xog_Latn.txt
│ ├── xon_Latn.txt
│ ├── xrb_Latn.txt
│ ├── xsb_Latn.txt
│ ├── xsi_Latn.txt
│ ├── xsm_Latn.txt
│ ├── xsr_Deva.txt
│ ├── xsu_Latn.txt
│ ├── xtd_Latn.txt
│ ├── xtm_Latn.txt
│ ├── xtn_Latn.txt
│ ├── xum_Latn.txt
│ ├── xuo_Latn.txt
│ ├── yaa_Latn.txt
│ ├── yad_Latn.txt
│ ├── yal_Latn.txt
│ ├── yam_Latn.txt
│ ├── yan_Latn.txt
│ ├── yao_Latn.txt
│ ├── yap_Latn.txt
│ ├── yaq_Latn.txt
│ ├── yas_Latn.txt
│ ├── yat_Latn.txt
│ ├── yaz_Latn.txt
│ ├── ybb_Latn.txt
│ ├── yby_Latn.txt
│ ├── ycn_Latn.txt
│ ├── ydd_Hebr.txt
│ ├── yim_Latn.txt
│ ├── yka_Latn.txt
│ ├── yle_Latn.txt
│ ├── yli_Latn.txt
│ ├── yml_Latn.txt
│ ├── yom_Latn.txt
│ ├── yon_Latn.txt
│ ├── yor_Latn.txt
│ ├── yrb_Latn.txt
│ ├── yre_Latn.txt
│ ├── yrk_Cyrl.txt
│ ├── yrl_Latn.txt
│ ├── yss_Latn.txt
│ ├── yua_Latn.txt
│ ├── yue_Hani.txt
│ ├── yuj_Latn.txt
│ ├── yup_Latn.txt
│ ├── yut_Latn.txt
│ ├── yuw_Latn.txt
│ ├── yuz_Latn.txt
│ ├── yva_Latn.txt
│ ├── zaa_Latn.txt
│ ├── zab_Latn.txt
│ ├── zac_Latn.txt
│ ├── zad_Latn.txt
│ ├── zae_Latn.txt
│ ├── zai_Latn.txt
│ ├── zam_Latn.txt
│ ├── zao_Latn.txt
│ ├── zar_Latn.txt
│ ├── zas_Latn.txt
│ ├── zat_Latn.txt
│ ├── zav_Latn.txt
│ ├── zaw_Latn.txt
│ ├── zca_Latn.txt
│ ├── zdj_Latn.txt
│ ├── zea_Latn.txt
│ ├── zgh_Tfng.txt
│ ├── zho_Hani.txt
│ ├── zia_Latn.txt
│ ├── ziw_Latn.txt
│ ├── zne_Latn.txt
│ ├── zoc_Latn.txt
│ ├── zom_Latn.txt
│ ├── zos_Latn.txt
│ ├── zpa_Latn.txt
│ ├── zpc_Latn.txt
│ ├── zpg_Latn.txt
│ ├── zpi_Latn.txt
│ ├── zpj_Latn.txt
│ ├── zpl_Latn.txt
│ ├── zpm_Latn.txt
│ ├── zpo_Latn.txt
│ ├── zpq_Latn.txt
│ ├── zpt_Latn.txt
│ ├── zpu_Latn.txt
│ ├── zpv_Latn.txt
│ ├── zpz_Latn.txt
│ ├── zsm_Arab.txt
│ ├── zsm_Latn.txt
│ ├── zsr_Latn.txt
│ ├── ztq_Latn.txt
│ ├── zty_Latn.txt
│ ├── zul_Latn.txt
│ ├── zyb_Latn.txt
│ └── zyp_Latn.txt
├── reference_datasets/
│ ├── monolingual/
│ │ ├── ar/
│ │ │ ├── download_101b_arabicwords.py
│ │ │ └── download_arabicweb24.py
│ │ ├── fr/
│ │ │ └── download_croissant.py
│ │ ├── hi/
│ │ │ ├── download_odaigen.py
│ │ │ └── download_sangraha.py
│ │ ├── te/
│ │ │ └── download_sangraha.py
│ │ ├── th/
│ │ │ └── download_sea_commoncrawl.py
│ │ ├── tr/
│ │ │ └── download_vngrs.py
│ │ └── zh/
│ │ ├── download_mapcc.py
│ │ ├── download_mnbvc.py
│ │ └── download_tigerbot.py
│ └── multilingual/
│ ├── copy_raw_data.py
│ ├── download_cc-100.py
│ ├── download_culturax.py
│ ├── download_hplt.py
│ ├── download_hplt_split.py
│ ├── download_mc4.py
│ └── part jsons.py
└── rehydration/
├── README.md
├── distributions/
│ ├── aai_Latn.json
│ ├── aak_Latn.json
│ ├── aau_Latn.json
│ ├── aaz_Latn.json
│ ├── aba_Latn.json
│ ├── abi_Latn.json
│ ├── abk_Cyrl.json
│ ├── abn_Latn.json
│ ├── abq_Cyrl.json
│ ├── abs_Latn.json
│ ├── abt_Latn.json
│ ├── abx_Latn.json
│ ├── aby_Latn.json
│ ├── abz_Latn.json
│ ├── aca_Latn.json
│ ├── acd_Latn.json
│ ├── ace_Latn.json
│ ├── acf_Latn.json
│ ├── ach_Latn.json
│ ├── acm_Arab.json
│ ├── acn_Latn.json
│ ├── acr_Latn.json
│ ├── acu_Latn.json
│ ├── ada_Latn.json
│ ├── ade_Latn.json
│ ├── adh_Latn.json
│ ├── adi_Latn.json
│ ├── adj_Latn.json
│ ├── adl_Latn.json
│ ├── ady_Cyrl.json
│ ├── adz_Latn.json
│ ├── aeb_Arab.json
│ ├── aer_Latn.json
│ ├── aeu_Latn.json
│ ├── aey_Latn.json
│ ├── afr_Latn.json
│ ├── agd_Latn.json
│ ├── agg_Latn.json
│ ├── agm_Latn.json
│ ├── agn_Latn.json
│ ├── agr_Latn.json
│ ├── agt_Latn.json
│ ├── agu_Latn.json
│ ├── agw_Latn.json
│ ├── agx_Cyrl.json
│ ├── aha_Latn.json
│ ├── ahk_Latn.json
│ ├── aia_Latn.json
│ ├── aii_Syrc.json
│ ├── aim_Latn.json
│ ├── ain_Latn.json
│ ├── ajg_Latn.json
│ ├── aji_Latn.json
│ ├── ajz_Latn.json
│ ├── akb_Latn.json
│ ├── ake_Latn.json
│ ├── akh_Latn.json
│ ├── akp_Latn.json
│ ├── alj_Latn.json
│ ├── aln_Latn.json
│ ├── alp_Latn.json
│ ├── alq_Latn.json
│ ├── als_Latn.json
│ ├── alt_Cyrl.json
│ ├── aly_Latn.json
│ ├── alz_Latn.json
│ ├── ame_Latn.json
│ ├── amf_Latn.json
│ ├── amh_Ethi.json
│ ├── ami_Latn.json
│ ├── amk_Latn.json
│ ├── amm_Latn.json
│ ├── amn_Latn.json
│ ├── amp_Latn.json
│ ├── amr_Latn.json
│ ├── amu_Latn.json
│ ├── amx_Latn.json
│ ├── ang_Latn.json
│ ├── anm_Latn.json
│ ├── ann_Latn.json
│ ├── anp_Deva.json
│ ├── anv_Latn.json
│ ├── any_Latn.json
│ ├── aoi_Latn.json
│ ├── aoj_Latn.json
│ ├── aom_Latn.json
│ ├── aoz_Latn.json
│ ├── apb_Latn.json
│ ├── apc_Arab.json
│ ├── ape_Latn.json
│ ├── apn_Latn.json
│ ├── apr_Latn.json
│ ├── apt_Latn.json
│ ├── apu_Latn.json
│ ├── apw_Latn.json
│ ├── apy_Latn.json
│ ├── apz_Latn.json
│ ├── arb_Arab.json
│ ├── arb_Latn.json
│ ├── are_Latn.json
│ ├── arg_Latn.json
│ ├── arl_Latn.json
│ ├── arn_Latn.json
│ ├── arp_Latn.json
│ ├── arq_Arab.json
│ ├── ars_Arab.json
│ ├── ary_Arab.json
│ ├── arz_Arab.json
│ ├── asg_Latn.json
│ ├── asm_Beng.json
│ ├── asm_Latn.json
│ ├── aso_Latn.json
│ ├── ast_Latn.json
│ ├── ata_Latn.json
│ ├── atb_Latn.json
│ ├── atd_Latn.json
│ ├── atg_Latn.json
│ ├── ati_Latn.json
│ ├── atj_Latn.json
│ ├── atq_Latn.json
│ ├── att_Latn.json
│ ├── auc_Latn.json
│ ├── aui_Latn.json
│ ├── auy_Latn.json
│ ├── ava_Cyrl.json
│ ├── avk_Latn.json
│ ├── avn_Latn.json
│ ├── avt_Latn.json
│ ├── avu_Latn.json
│ ├── awa_Deva.json
│ ├── awb_Latn.json
│ ├── awx_Latn.json
│ ├── ayo_Latn.json
│ ├── ayp_Arab.json
│ ├── ayr_Latn.json
│ ├── azb_Arab.json
│ ├── azg_Latn.json
│ ├── azj_Cyrl.json
│ ├── azj_Latn.json
│ ├── azz_Latn.json
│ ├── bak_Cyrl.json
│ ├── bam_Latn.json
│ ├── ban_Latn.json
│ ├── bao_Latn.json
│ ├── bar_Latn.json
│ ├── bas_Latn.json
│ ├── bav_Latn.json
│ ├── bba_Latn.json
│ ├── bbb_Latn.json
│ ├── bbc_Latn.json
│ ├── bbj_Latn.json
│ ├── bbk_Latn.json
│ ├── bbr_Latn.json
│ ├── bch_Latn.json
│ ├── bci_Latn.json
│ ├── bcl_Latn.json
│ ├── bco_Latn.json
│ ├── bcw_Latn.json
│ ├── bdd_Latn.json
│ ├── bdh_Latn.json
│ ├── bdq_Latn.json
│ ├── bea_Latn.json
│ ├── bef_Latn.json
│ ├── bel_Cyrl.json
│ ├── bem_Latn.json
│ ├── ben_Beng.json
│ ├── ben_Latn.json
│ ├── beq_Latn.json
│ ├── bew_Latn.json
│ ├── bex_Latn.json
│ ├── bfd_Latn.json
│ ├── bfo_Latn.json
│ ├── bgr_Latn.json
│ ├── bgs_Latn.json
│ ├── bgt_Latn.json
│ ├── bgz_Latn.json
│ ├── bhg_Latn.json
│ ├── bhl_Latn.json
│ ├── bho_Deva.json
│ ├── bhp_Latn.json
│ ├── bhw_Latn.json
│ ├── bhz_Latn.json
│ ├── bib_Latn.json
│ ├── big_Latn.json
│ ├── bim_Latn.json
│ ├── bin_Latn.json
│ ├── bis_Latn.json
│ ├── biu_Latn.json
│ ├── biv_Latn.json
│ ├── bjn_Arab.json
│ ├── bjn_Latn.json
│ ├── bjp_Latn.json
│ ├── bjr_Latn.json
│ ├── bjv_Latn.json
│ ├── bkd_Latn.json
│ ├── bkl_Latn.json
│ ├── bkq_Latn.json
│ ├── bku_Latn.json
│ ├── bkv_Latn.json
│ ├── bla_Latn.json
│ ├── blh_Latn.json
│ ├── blk_Mymr.json
│ ├── blw_Latn.json
│ ├── blz_Latn.json
│ ├── bmh_Latn.json
│ ├── bmk_Latn.json
│ ├── bmq_Latn.json
│ ├── bmr_Latn.json
│ ├── bmu_Latn.json
│ ├── bmv_Latn.json
│ ├── bno_Latn.json
│ ├── bnp_Latn.json
│ ├── boa_Latn.json
│ ├── bod_Tibt.json
│ ├── boj_Latn.json
│ ├── bom_Latn.json
│ ├── bon_Latn.json
│ ├── bos_Latn.json
│ ├── bov_Latn.json
│ ├── box_Latn.json
│ ├── bpr_Latn.json
│ ├── bps_Latn.json
│ ├── bpy_Beng.json
│ ├── bqc_Latn.json
│ ├── bqj_Latn.json
│ ├── bqp_Latn.json
│ ├── bre_Latn.json
│ ├── brh_Arab.json
│ ├── bru_Latn.json
│ ├── brx_Deva.json
│ ├── bsc_Latn.json
│ ├── bsn_Latn.json
│ ├── bsp_Latn.json
│ ├── bsq_Latn.json
│ ├── bss_Latn.json
│ ├── btd_Latn.json
│ ├── bth_Latn.json
│ ├── bts_Latn.json
│ ├── btt_Latn.json
│ ├── btx_Latn.json
│ ├── bud_Latn.json
│ ├── bug_Latn.json
│ ├── buk_Latn.json
│ ├── bul_Cyrl.json
│ ├── bum_Latn.json
│ ├── bus_Latn.json
│ ├── bvc_Latn.json
│ ├── bvd_Latn.json
│ ├── bvr_Latn.json
│ ├── bvz_Latn.json
│ ├── bwd_Latn.json
│ ├── bwi_Latn.json
│ ├── bwq_Latn.json
│ ├── bwu_Latn.json
│ ├── bxh_Latn.json
│ ├── bxr_Cyrl.json
│ ├── byr_Latn.json
│ ├── byv_Latn.json
│ ├── byx_Latn.json
│ ├── bzd_Latn.json
│ ├── bzh_Latn.json
│ ├── bzi_Thai.json
│ ├── bzj_Latn.json
│ ├── caa_Latn.json
│ ├── cab_Latn.json
│ ├── cac_Latn.json
│ ├── caf_Latn.json
│ ├── cag_Latn.json
│ ├── cak_Latn.json
│ ├── cao_Latn.json
│ ├── cap_Latn.json
│ ├── caq_Latn.json
│ ├── car_Latn.json
│ ├── cas_Latn.json
│ ├── cat_Latn.json
│ ├── cav_Latn.json
│ ├── cax_Latn.json
│ ├── cbc_Latn.json
│ ├── cbi_Latn.json
│ ├── cbk_Latn.json
│ ├── cbr_Latn.json
│ ├── cbs_Latn.json
│ ├── cbt_Latn.json
│ ├── cbu_Latn.json
│ ├── cbv_Latn.json
│ ├── cce_Latn.json
│ ├── cco_Latn.json
│ ├── ccp_Latn.json
│ ├── ceb_Latn.json
│ ├── ceg_Latn.json
│ ├── cek_Latn.json
│ ├── ces_Latn.json
│ ├── cfm_Latn.json
│ ├── cgc_Latn.json
│ ├── cgg_Latn.json
│ ├── cha_Latn.json
│ ├── chd_Latn.json
│ ├── che_Cyrl.json
│ ├── chf_Latn.json
│ ├── chj_Latn.json
│ ├── chk_Latn.json
│ ├── cho_Latn.json
│ ├── chq_Latn.json
│ ├── chr_Cher.json
│ ├── chr_Latn.json
│ ├── chu_Cyrl.json
│ ├── chv_Cyrl.json
│ ├── chw_Latn.json
│ ├── chz_Latn.json
│ ├── cjk_Latn.json
│ ├── cjo_Latn.json
│ ├── cjp_Latn.json
│ ├── cjs_Cyrl.json
│ ├── cjv_Latn.json
│ ├── ckb_Arab.json
│ ├── cko_Latn.json
│ ├── ckt_Cyrl.json
│ ├── cle_Latn.json
│ ├── clu_Latn.json
│ ├── cly_Latn.json
│ ├── cme_Latn.json
│ ├── cmn_Hani.json
│ ├── cmo_Latn.json
│ ├── cmr_Latn.json
│ ├── cnh_Latn.json
│ ├── cni_Latn.json
│ ├── cnk_Latn.json
│ ├── cnl_Latn.json
│ ├── cnt_Latn.json
│ ├── cnw_Latn.json
│ ├── coe_Latn.json
│ ├── cof_Latn.json
│ ├── cok_Latn.json
│ ├── con_Latn.json
│ ├── cop_Copt.json
│ ├── cor_Latn.json
│ ├── cos_Latn.json
│ ├── cot_Latn.json
│ ├── cou_Latn.json
│ ├── cpa_Latn.json
│ ├── cpb_Latn.json
│ ├── cpc_Latn.json
│ ├── cpu_Latn.json
│ ├── cpy_Latn.json
│ ├── crh_Cyrl.json
│ ├── crh_Latn.json
│ ├── crj_Cans.json
│ ├── crk_Cans.json
│ ├── crk_Latn.json
│ ├── crl_Cans.json
│ ├── crm_Cans.json
│ ├── crn_Latn.json
│ ├── crs_Latn.json
│ ├── crt_Latn.json
│ ├── crx_Latn.json
│ ├── csb_Latn.json
│ ├── csk_Latn.json
│ ├── cso_Latn.json
│ ├── csw_Latn.json
│ ├── csy_Latn.json
│ ├── cta_Latn.json
│ ├── ctd_Latn.json
│ ├── cto_Latn.json
│ ├── ctp_Latn.json
│ ├── ctu_Latn.json
│ ├── cub_Latn.json
│ ├── cuc_Latn.json
│ ├── cui_Latn.json
│ ├── cuk_Latn.json
│ ├── cul_Latn.json
│ ├── cut_Latn.json
│ ├── cux_Latn.json
│ ├── cwe_Latn.json
│ ├── cwt_Latn.json
│ ├── cya_Latn.json
│ ├── cym_Latn.json
│ ├── czt_Latn.json
│ ├── daa_Latn.json
│ ├── dad_Latn.json
│ ├── daf_Latn.json
│ ├── dag_Latn.json
│ ├── dah_Latn.json
│ ├── dak_Latn.json
│ ├── dan_Latn.json
│ ├── dar_Cyrl.json
│ ├── ddg_Latn.json
│ ├── ddn_Latn.json
│ ├── ded_Latn.json
│ ├── des_Latn.json
│ ├── deu_Latn.json
│ ├── dga_Latn.json
│ ├── dgc_Latn.json
│ ├── dgi_Latn.json
│ ├── dgr_Latn.json
│ ├── dgz_Latn.json
│ ├── dhg_Latn.json
│ ├── dhm_Latn.json
│ ├── dhv_Latn.json
│ ├── did_Latn.json
│ ├── dig_Latn.json
│ ├── dik_Latn.json
│ ├── diq_Latn.json
│ ├── dis_Latn.json
│ ├── diu_Latn.json
│ ├── div_Thaa.json
│ ├── dje_Latn.json
│ ├── djk_Latn.json
│ ├── djr_Latn.json
│ ├── dks_Latn.json
│ ├── dln_Latn.json
│ ├── dng_Cyrl.json
│ ├── dnj_Latn.json
│ ├── dnw_Latn.json
│ ├── dob_Latn.json
│ ├── doi_Deva.json
│ ├── dop_Latn.json
│ ├── dos_Latn.json
│ ├── dow_Latn.json
│ ├── drg_Latn.json
│ ├── dru_Latn.json
│ ├── dsb_Latn.json
│ ├── dtb_Latn.json
│ ├── dtp_Latn.json
│ ├── dts_Latn.json
│ ├── dty_Deva.json
│ ├── dua_Latn.json
│ ├── due_Latn.json
│ ├── dug_Latn.json
│ ├── duo_Latn.json
│ ├── dur_Latn.json
│ ├── dwr_Latn.json
│ ├── dww_Latn.json
│ ├── dyi_Latn.json
│ ├── dyo_Latn.json
│ ├── dyu_Latn.json
│ ├── dzo_Tibt.json
│ ├── ebk_Latn.json
│ ├── efi_Latn.json
│ ├── eka_Latn.json
│ ├── ekk_Latn.json
│ ├── eko_Latn.json
│ ├── ell_Grek.json
│ ├── emi_Latn.json
│ ├── eml_Latn.json
│ ├── emp_Latn.json
│ ├── enb_Latn.json
│ ├── enl_Latn.json
│ ├── enm_Latn.json
│ ├── enq_Latn.json
│ ├── enx_Latn.json
│ ├── epo_Latn.json
│ ├── eri_Latn.json
│ ├── ese_Latn.json
│ ├── esi_Latn.json
│ ├── esk_Latn.json
│ ├── ess_Latn.json
│ ├── esu_Latn.json
│ ├── eto_Latn.json
│ ├── etr_Latn.json
│ ├── etu_Latn.json
│ ├── eus_Latn.json
│ ├── eve_Cyrl.json
│ ├── ewe_Latn.json
│ ├── ewo_Latn.json
│ ├── ext_Latn.json
│ ├── eza_Latn.json
│ ├── faa_Latn.json
│ ├── fad_Latn.json
│ ├── fai_Latn.json
│ ├── fal_Latn.json
│ ├── fan_Latn.json
│ ├── fao_Latn.json
│ ├── far_Latn.json
│ ├── fas_Arab.json
│ ├── fat_Latn.json
│ ├── ffm_Latn.json
│ ├── fij_Latn.json
│ ├── fil_Latn.json
│ ├── fin_Latn.json
│ ├── fit_Latn.json
│ ├── fkv_Latn.json
│ ├── fmu_Deva.json
│ ├── fon_Latn.json
│ ├── for_Latn.json
│ ├── fra_Latn.json
│ ├── frd_Latn.json
│ ├── fro_Latn.json
│ ├── frp_Latn.json
│ ├── frr_Latn.json
│ ├── fry_Latn.json
│ ├── fub_Latn.json
│ ├── fud_Latn.json
│ ├── fue_Latn.json
│ ├── fuf_Latn.json
│ ├── fuh_Latn.json
│ ├── fuq_Latn.json
│ ├── fur_Latn.json
│ ├── fuv_Arab.json
│ ├── fuv_Latn.json
│ ├── gaa_Latn.json
│ ├── gag_Cyrl.json
│ ├── gag_Latn.json
│ ├── gah_Latn.json
│ ├── gai_Latn.json
│ ├── gam_Latn.json
│ ├── gaw_Latn.json
│ ├── gaz_Latn.json
│ ├── gbi_Latn.json
│ ├── gbo_Latn.json
│ ├── gbr_Latn.json
│ ├── gcf_Latn.json
│ ├── gcr_Latn.json
│ ├── gde_Latn.json
│ ├── gdg_Latn.json
│ ├── gdn_Latn.json
│ ├── gdr_Latn.json
│ ├── geb_Latn.json
│ ├── gej_Latn.json
│ ├── gfk_Latn.json
│ ├── ghs_Latn.json
│ ├── gil_Latn.json
│ ├── giz_Latn.json
│ ├── gjn_Latn.json
│ ├── gkn_Latn.json
│ ├── gla_Latn.json
│ ├── gle_Latn.json
│ ├── glg_Latn.json
│ ├── glk_Arab.json
│ ├── glv_Latn.json
│ ├── gmh_Latn.json
│ ├── gmv_Ethi.json
│ ├── gmv_Latn.json
│ ├── gna_Latn.json
│ ├── gnb_Latn.json
│ ├── gnd_Latn.json
│ ├── gng_Latn.json
│ ├── gnn_Latn.json
│ ├── gnw_Latn.json
│ ├── goa_Latn.json
│ ├── gof_Ethi.json
│ ├── gof_Latn.json
│ ├── gog_Latn.json
│ ├── goh_Latn.json
│ ├── gom_Deva.json
│ ├── gom_Latn.json
│ ├── gor_Latn.json
│ ├── gos_Latn.json
│ ├── got_Goth.json
│ ├── gqr_Latn.json
│ ├── grc_Grek.json
│ ├── grt_Beng.json
│ ├── gso_Latn.json
│ ├── gsw_Latn.json
│ ├── gub_Latn.json
│ ├── guc_Latn.json
│ ├── gud_Latn.json
│ ├── gug_Latn.json
│ ├── guh_Latn.json
│ ├── gui_Latn.json
│ ├── guj_Gujr.json
│ ├── guj_Latn.json
│ ├── guk_Ethi.json
│ ├── gul_Latn.json
│ ├── gum_Latn.json
│ ├── gun_Latn.json
│ ├── guo_Latn.json
│ ├── guq_Latn.json
│ ├── gur_Latn.json
│ ├── guu_Latn.json
│ ├── guw_Latn.json
│ ├── gux_Latn.json
│ ├── guz_Latn.json
│ ├── gvc_Latn.json
│ ├── gvf_Latn.json
│ ├── gvl_Latn.json
│ ├── gvn_Latn.json
│ ├── gwi_Latn.json
│ ├── gwr_Latn.json
│ ├── gya_Latn.json
│ ├── gym_Latn.json
│ ├── gyr_Latn.json
│ ├── hac_Arab.json
│ ├── hae_Latn.json
│ ├── hag_Latn.json
│ ├── hak_Hani.json
│ ├── hak_Latn.json
│ ├── hat_Latn.json
│ ├── hav_Latn.json
│ ├── haw_Latn.json
│ ├── hay_Latn.json
│ ├── hbo_Hebr.json
│ ├── hch_Latn.json
│ ├── heb_Hebr.json
│ ├── heg_Latn.json
│ ├── heh_Latn.json
│ ├── her_Latn.json
│ ├── hif_Latn.json
│ ├── hig_Latn.json
│ ├── hil_Latn.json
│ ├── hin_Deva.json
│ ├── hin_Latn.json
│ ├── hix_Latn.json
│ ├── hla_Latn.json
│ ├── hmo_Latn.json
│ ├── hmr_Latn.json
│ ├── hne_Deva.json
│ ├── hnj_Latn.json
│ ├── hnn_Latn.json
│ ├── hns_Latn.json
│ ├── hop_Latn.json
│ ├── hot_Latn.json
│ ├── hra_Latn.json
│ ├── hrv_Latn.json
│ ├── hrx_Latn.json
│ ├── hsb_Latn.json
│ ├── hto_Latn.json
│ ├── hub_Latn.json
│ ├── hui_Latn.json
│ ├── hun_Latn.json
│ ├── hus_Latn.json
│ ├── huu_Latn.json
│ ├── huv_Latn.json
│ ├── hvn_Latn.json
│ ├── hwc_Latn.json
│ ├── hye_Armn.json
│ ├── hyw_Armn.json
│ ├── ian_Latn.json
│ ├── iba_Latn.json
│ ├── ibg_Latn.json
│ ├── ibo_Latn.json
│ ├── icr_Latn.json
│ ├── ido_Latn.json
│ ├── idu_Latn.json
│ ├── ifa_Latn.json
│ ├── ifb_Latn.json
│ ├── ife_Latn.json
│ ├── ifk_Latn.json
│ ├── ifu_Latn.json
│ ├── ify_Latn.json
│ ├── ige_Latn.json
│ ├── ign_Latn.json
│ ├── ike_Cans.json
│ ├── ikk_Latn.json
│ ├── ikt_Latn.json
│ ├── ikw_Latn.json
│ ├── ilb_Latn.json
│ ├── ile_Latn.json
│ ├── ilo_Latn.json
│ ├── imo_Latn.json
│ ├── ina_Latn.json
│ ├── inb_Latn.json
│ ├── ind_Latn.json
│ ├── inh_Cyrl.json
│ ├── ino_Latn.json
│ ├── iou_Latn.json
│ ├── ipi_Latn.json
│ ├── iqw_Latn.json
│ ├── iri_Latn.json
│ ├── irk_Latn.json
│ ├── iry_Latn.json
│ ├── isd_Latn.json
│ ├── ish_Latn.json
│ ├── isl_Latn.json
│ ├── iso_Latn.json
│ ├── ita_Latn.json
│ ├── itv_Latn.json
│ ├── ium_Latn.json
│ ├── ivb_Latn.json
│ ├── ivv_Latn.json
│ ├── iws_Latn.json
│ ├── ixl_Latn.json
│ ├── izr_Latn.json
│ ├── izz_Latn.json
│ ├── jaa_Latn.json
│ ├── jac_Latn.json
│ ├── jae_Latn.json
│ ├── jam_Latn.json
│ ├── jav_Latn.json
│ ├── jbo_Latn.json
│ ├── jbu_Latn.json
│ ├── jic_Latn.json
│ ├── jiv_Latn.json
│ ├── jmc_Latn.json
│ ├── jpn_Jpan.json
│ ├── jra_Latn.json
│ ├── jun_Orya.json
│ ├── jvn_Latn.json
│ ├── kaa_Cyrl.json
│ ├── kaa_Latn.json
│ ├── kab_Latn.json
│ ├── kac_Latn.json
│ ├── kak_Latn.json
│ ├── kal_Latn.json
│ ├── kam_Latn.json
│ ├── kan_Knda.json
│ ├── kan_Latn.json
│ ├── kao_Latn.json
│ ├── kaq_Latn.json
│ ├── kas_Arab.json
│ ├── kas_Deva.json
│ ├── kas_Latn.json
│ ├── kat_Geor.json
│ ├── kaz_Cyrl.json
│ ├── kbc_Latn.json
│ ├── kbd_Cyrl.json
│ ├── kbh_Latn.json
│ ├── kbm_Latn.json
│ ├── kbo_Latn.json
│ ├── kbp_Latn.json
│ ├── kbq_Latn.json
│ ├── kbr_Latn.json
│ ├── kby_Latn.json
│ ├── kca_Cyrl.json
│ ├── kcg_Latn.json
│ ├── kck_Latn.json
│ ├── kdc_Latn.json
│ ├── kde_Latn.json
│ ├── kdh_Latn.json
│ ├── kdi_Latn.json
│ ├── kdj_Latn.json
│ ├── kdl_Latn.json
│ ├── kdr_Latn.json
│ ├── kea_Latn.json
│ ├── kei_Latn.json
│ ├── kek_Latn.json
│ ├── ken_Latn.json
│ ├── keo_Latn.json
│ ├── ker_Latn.json
│ ├── kew_Latn.json
│ ├── kez_Latn.json
│ ├── kff_Telu.json
│ ├── kgf_Latn.json
│ ├── kgk_Latn.json
│ ├── kgp_Latn.json
│ ├── kgr_Latn.json
│ ├── kha_Latn.json
│ ├── khk_Cyrl.json
│ ├── khm_Khmr.json
│ ├── khs_Latn.json
│ ├── khz_Latn.json
│ ├── kia_Latn.json
│ ├── kij_Latn.json
│ ├── kik_Latn.json
│ ├── kin_Latn.json
│ ├── kir_Cyrl.json
│ ├── kiu_Latn.json
│ ├── kix_Latn.json
│ ├── kjb_Latn.json
│ ├── kje_Latn.json
│ ├── kjh_Cyrl.json
│ ├── kjs_Latn.json
│ ├── kkc_Latn.json
│ ├── kki_Latn.json
│ ├── kkj_Latn.json
│ ├── kkl_Latn.json
│ ├── kle_Deva.json
│ ├── klt_Latn.json
│ ├── klv_Latn.json
│ ├── kmb_Latn.json
│ ├── kmg_Latn.json
│ ├── kmh_Latn.json
│ ├── kmk_Latn.json
│ ├── kmm_Latn.json
│ ├── kmo_Latn.json
│ ├── kmr_Cyrl.json
│ ├── kmr_Latn.json
│ ├── kms_Latn.json
│ ├── kmu_Latn.json
│ ├── kmy_Latn.json
│ ├── knc_Latn.json
│ ├── kne_Latn.json
│ ├── knf_Latn.json
│ ├── kng_Latn.json
│ ├── knj_Latn.json
│ ├── knk_Latn.json
│ ├── kno_Latn.json
│ ├── knv_Latn.json
│ ├── knx_Latn.json
│ ├── kny_Latn.json
│ ├── kog_Latn.json
│ ├── koi_Cyrl.json
│ ├── koo_Latn.json
│ ├── kor_Hang.json
│ ├── kos_Latn.json
│ ├── kpe_Latn.json
│ ├── kpf_Latn.json
│ ├── kpg_Latn.json
│ ├── kpj_Latn.json
│ ├── kpq_Latn.json
│ ├── kpr_Latn.json
│ ├── kpv_Cyrl.json
│ ├── kpw_Latn.json
│ ├── kpx_Latn.json
│ ├── kpz_Latn.json
│ ├── kqc_Latn.json
│ ├── kqe_Latn.json
│ ├── kqf_Latn.json
│ ├── kql_Latn.json
│ ├── kqn_Latn.json
│ ├── kqo_Latn.json
│ ├── kqp_Latn.json
│ ├── kqs_Latn.json
│ ├── kqw_Latn.json
│ ├── kqy_Ethi.json
│ ├── krc_Cyrl.json
│ ├── kri_Latn.json
│ ├── krj_Latn.json
│ ├── krl_Latn.json
│ ├── kru_Deva.json
│ ├── krx_Latn.json
│ ├── ksb_Latn.json
│ ├── ksc_Latn.json
│ ├── ksd_Latn.json
│ ├── ksf_Latn.json
│ ├── ksh_Latn.json
│ ├── ksj_Latn.json
│ ├── ksp_Latn.json
│ ├── ksr_Latn.json
│ ├── kss_Latn.json
│ ├── ksw_Mymr.json
│ ├── ktb_Ethi.json
│ ├── ktj_Latn.json
│ ├── ktm_Latn.json
│ ├── kto_Latn.json
│ ├── ktu_Latn.json
│ ├── ktz_Latn.json
│ ├── kua_Latn.json
│ ├── kub_Latn.json
│ ├── kud_Latn.json
│ ├── kue_Latn.json
│ ├── kuj_Latn.json
│ ├── kum_Cyrl.json
│ ├── kup_Latn.json
│ ├── kus_Latn.json
│ ├── kvg_Latn.json
│ ├── kvj_Latn.json
│ ├── kvn_Latn.json
│ ├── kwd_Latn.json
│ ├── kwf_Latn.json
│ ├── kwi_Latn.json
│ ├── kwj_Latn.json
│ ├── kwn_Latn.json
│ ├── kwy_Latn.json
│ ├── kxc_Ethi.json
│ ├── kxm_Thai.json
│ ├── kxw_Latn.json
│ ├── kyc_Latn.json
│ ├── kyf_Latn.json
│ ├── kyg_Latn.json
│ ├── kyq_Latn.json
│ ├── kyu_Kali.json
│ ├── kyu_Latn.json
│ ├── kyu_Mymr.json
│ ├── kyz_Latn.json
│ ├── kze_Latn.json
│ ├── kzf_Latn.json
│ ├── kzj_Latn.json
│ ├── lac_Latn.json
│ ├── lad_Hebr.json
│ ├── lad_Latn.json
│ ├── lai_Latn.json
│ ├── laj_Latn.json
│ ├── lam_Latn.json
│ ├── lao_Laoo.json
│ ├── lap_Latn.json
│ ├── lat_Latn.json
│ ├── lbb_Latn.json
│ ├── lbe_Cyrl.json
│ ├── lbj_Tibt.json
│ ├── lbk_Latn.json
│ ├── lcm_Latn.json
│ ├── lcp_Thai.json
│ ├── ldi_Latn.json
│ ├── ldn_Latn.json
│ ├── lee_Latn.json
│ ├── lef_Latn.json
│ ├── leh_Latn.json
│ ├── lem_Latn.json
│ ├── leu_Latn.json
│ ├── lew_Latn.json
│ ├── lex_Latn.json
│ ├── lez_Cyrl.json
│ ├── lfn_Cyrl.json
│ ├── lfn_Latn.json
│ ├── lgg_Latn.json
│ ├── lgl_Latn.json
│ ├── lgm_Latn.json
│ ├── lhi_Latn.json
│ ├── lhu_Latn.json
│ ├── lia_Latn.json
│ ├── lid_Latn.json
│ ├── lif_Deva.json
│ ├── lif_Limb.json
│ ├── lij_Latn.json
│ ├── lim_Latn.json
│ ├── lin_Latn.json
│ ├── lip_Latn.json
│ ├── lis_Lisu.json
│ ├── lit_Latn.json
│ ├── liv_Latn.json
│ ├── ljp_Latn.json
│ ├── lki_Arab.json
│ ├── llb_Latn.json
│ ├── lld_Latn.json
│ ├── llg_Latn.json
│ ├── lln_Latn.json
│ ├── lmk_Latn.json
│ ├── lmo_Latn.json
│ ├── lmp_Latn.json
│ ├── lnd_Latn.json
│ ├── lob_Latn.json
│ ├── loe_Latn.json
│ ├── log_Latn.json
│ ├── lol_Latn.json
│ ├── lom_Latn.json
│ ├── loq_Latn.json
│ ├── loz_Latn.json
│ ├── lrc_Arab.json
│ ├── lsi_Latn.json
│ ├── lsm_Latn.json
│ ├── ltg_Latn.json
│ ├── ltz_Latn.json
│ ├── lua_Latn.json
│ ├── lub_Latn.json
│ ├── luc_Latn.json
│ ├── lud_Latn.json
│ ├── lue_Latn.json
│ ├── lug_Latn.json
│ ├── lun_Latn.json
│ ├── luo_Latn.json
│ ├── lus_Latn.json
│ ├── lvs_Latn.json
│ ├── lwg_Latn.json
│ ├── lwo_Latn.json
│ ├── lww_Latn.json
│ ├── lzh_Hani.json
│ ├── maa_Latn.json
│ ├── mad_Latn.json
│ ├── maf_Latn.json
│ ├── mag_Deva.json
│ ├── mah_Latn.json
│ ├── mai_Deva.json
│ ├── maj_Latn.json
│ ├── mak_Latn.json
│ ├── mal_Latn.json
│ ├── mal_Mlym.json
│ ├── mam_Latn.json
│ ├── maq_Latn.json
│ ├── mar_Deva.json
│ ├── mar_Latn.json
│ ├── mas_Latn.json
│ ├── mau_Latn.json
│ ├── mav_Latn.json
│ ├── maw_Latn.json
│ ├── maz_Latn.json
│ ├── mbb_Latn.json
│ ├── mbc_Latn.json
│ ├── mbd_Latn.json
│ ├── mbf_Latn.json
│ ├── mbh_Latn.json
│ ├── mbi_Latn.json
│ ├── mbj_Latn.json
│ ├── mbl_Latn.json
│ ├── mbs_Latn.json
│ ├── mbt_Latn.json
│ ├── mca_Latn.json
│ ├── mcb_Latn.json
│ ├── mcd_Latn.json
│ ├── mcf_Latn.json
│ ├── mck_Latn.json
│ ├── mcn_Latn.json
│ ├── mco_Latn.json
│ ├── mcp_Latn.json
│ ├── mcq_Latn.json
│ ├── mcu_Latn.json
│ ├── mda_Latn.json
│ ├── mdf_Cyrl.json
│ ├── mdy_Ethi.json
│ ├── med_Latn.json
│ ├── mee_Latn.json
│ ├── mej_Latn.json
│ ├── mek_Latn.json
│ ├── men_Latn.json
│ ├── meq_Latn.json
│ ├── mer_Latn.json
│ ├── met_Latn.json
│ ├── meu_Latn.json
│ ├── mev_Latn.json
│ ├── mfe_Latn.json
│ ├── mfg_Latn.json
│ ├── mfh_Latn.json
│ ├── mfi_Latn.json
│ ├── mfk_Latn.json
│ ├── mfq_Latn.json
│ ├── mfy_Latn.json
│ ├── mfz_Latn.json
│ ├── mgc_Latn.json
│ ├── mgh_Latn.json
│ ├── mgo_Latn.json
│ ├── mgr_Latn.json
│ ├── mhi_Latn.json
│ ├── mhl_Latn.json
│ ├── mhr_Cyrl.json
│ ├── mhw_Latn.json
│ ├── mhx_Latn.json
│ ├── mhy_Latn.json
│ ├── mib_Latn.json
│ ├── mic_Latn.json
│ ├── mie_Latn.json
│ ├── mif_Latn.json
│ ├── mig_Latn.json
│ ├── mih_Latn.json
│ ├── mil_Latn.json
│ ├── mim_Latn.json
│ ├── min_Latn.json
│ ├── mio_Latn.json
│ ├── mip_Latn.json
│ ├── miq_Latn.json
│ ├── mir_Latn.json
│ ├── mit_Latn.json
│ ├── miy_Latn.json
│ ├── miz_Latn.json
│ ├── mjc_Latn.json
│ ├── mjw_Latn.json
│ ├── mkd_Cyrl.json
│ ├── mkl_Latn.json
│ ├── mkn_Latn.json
│ ├── mks_Latn.json
│ ├── mkz_Latn.json
│ ├── mlh_Latn.json
│ ├── mlp_Latn.json
│ ├── mlt_Latn.json
│ ├── mlu_Latn.json
│ ├── mmn_Latn.json
│ ├── mmo_Latn.json
│ ├── mmx_Latn.json
│ ├── mna_Latn.json
│ ├── mnb_Latn.json
│ ├── mnf_Latn.json
│ ├── mni_Beng.json
│ ├── mni_Latn.json
│ ├── mni_Mtei.json
│ ├── mnk_Latn.json
│ ├── mns_Cyrl.json
│ ├── mnw_Mymr.json
│ ├── mnx_Latn.json
│ ├── mny_Latn.json
│ ├── moa_Latn.json
│ ├── moc_Latn.json
│ ├── mog_Latn.json
│ ├── moh_Latn.json
│ ├── mop_Latn.json
│ ├── mor_Latn.json
│ ├── mos_Latn.json
│ ├── mox_Latn.json
│ ├── mpg_Latn.json
│ ├── mph_Latn.json
│ ├── mpm_Latn.json
│ ├── mpp_Latn.json
│ ├── mps_Latn.json
│ ├── mpt_Latn.json
│ ├── mpx_Latn.json
│ ├── mqb_Latn.json
│ ├── mqj_Latn.json
│ ├── mqy_Latn.json
│ ├── mrg_Latn.json
│ ├── mri_Latn.json
│ ├── mrj_Cyrl.json
│ ├── mrq_Latn.json
│ ├── mrv_Latn.json
│ ├── mrw_Latn.json
│ ├── msb_Latn.json
│ ├── msc_Latn.json
│ ├── mse_Latn.json
│ ├── msk_Latn.json
│ ├── msy_Latn.json
│ ├── mta_Latn.json
│ ├── mtg_Latn.json
│ ├── mti_Latn.json
│ ├── mto_Latn.json
│ ├── mtp_Latn.json
│ ├── mua_Latn.json
│ ├── mug_Latn.json
│ ├── muh_Latn.json
│ ├── mui_Latn.json
│ ├── mup_Deva.json
│ ├── mur_Latn.json
│ ├── mus_Latn.json
│ ├── mux_Latn.json
│ ├── muy_Latn.json
│ ├── mva_Latn.json
│ ├── mvn_Latn.json
│ ├── mvp_Latn.json
│ ├── mwc_Latn.json
│ ├── mwl_Latn.json
│ ├── mwm_Latn.json
│ ├── mwn_Latn.json
│ ├── mwp_Latn.json
│ ├── mwq_Latn.json
│ ├── mwv_Latn.json
│ ├── mww_Latn.json
│ ├── mxb_Latn.json
│ ├── mxp_Latn.json
│ ├── mxq_Latn.json
│ ├── mxt_Latn.json
│ ├── mxv_Latn.json
│ ├── mya_Mymr.json
│ ├── myb_Latn.json
│ ├── myk_Latn.json
│ ├── myu_Latn.json
│ ├── myv_Cyrl.json
│ ├── myw_Latn.json
│ ├── myx_Latn.json
│ ├── myy_Latn.json
│ ├── mza_Latn.json
│ ├── mzh_Latn.json
│ ├── mzk_Latn.json
│ ├── mzl_Latn.json
│ ├── mzm_Latn.json
│ ├── mzn_Arab.json
│ ├── mzw_Latn.json
│ ├── mzz_Latn.json
│ ├── nab_Latn.json
│ ├── naf_Latn.json
│ ├── nah_Latn.json
│ ├── nak_Latn.json
│ ├── nap_Latn.json
│ ├── naq_Latn.json
│ ├── nas_Latn.json
│ ├── nav_Latn.json
│ ├── naw_Latn.json
│ ├── nba_Latn.json
│ ├── nbc_Latn.json
│ ├── nbe_Latn.json
│ ├── nbl_Latn.json
│ ├── nbq_Latn.json
│ ├── nbu_Latn.json
│ ├── nca_Latn.json
│ ├── nch_Latn.json
│ ├── ncj_Latn.json
│ ├── ncl_Latn.json
│ ├── ncq_Laoo.json
│ ├── nct_Latn.json
│ ├── ncu_Latn.json
│ ├── ncx_Latn.json
│ ├── ndc_Latn.json
│ ├── nde_Latn.json
│ ├── ndh_Latn.json
│ ├── ndi_Latn.json
│ ├── ndj_Latn.json
│ ├── ndo_Latn.json
│ ├── nds_Latn.json
│ ├── ndz_Latn.json
│ ├── neb_Latn.json
│ ├── new_Deva.json
│ ├── nfa_Latn.json
│ ├── nfr_Latn.json
│ ├── ngb_Latn.json
│ ├── ngc_Latn.json
│ ├── ngl_Latn.json
│ ├── ngp_Latn.json
│ ├── ngu_Latn.json
│ ├── nhd_Latn.json
│ ├── nhe_Latn.json
│ ├── nhg_Latn.json
│ ├── nhi_Latn.json
│ ├── nhk_Latn.json
│ ├── nho_Latn.json
│ ├── nhr_Latn.json
│ ├── nhu_Latn.json
│ ├── nhw_Latn.json
│ ├── nhx_Latn.json
│ ├── nhy_Latn.json
│ ├── nia_Latn.json
│ ├── nif_Latn.json
│ ├── nii_Latn.json
│ ├── nij_Latn.json
│ ├── nim_Latn.json
│ ├── nin_Latn.json
│ ├── nio_Cyrl.json
│ ├── niu_Latn.json
│ ├── niy_Latn.json
│ ├── njb_Latn.json
│ ├── njm_Latn.json
│ ├── njn_Latn.json
│ ├── njo_Latn.json
│ ├── njz_Latn.json
│ ├── nkf_Latn.json
│ ├── nko_Latn.json
│ ├── nld_Latn.json
│ ├── nlg_Latn.json
│ ├── nma_Latn.json
│ ├── nmf_Latn.json
│ ├── nmo_Latn.json
│ ├── nmw_Latn.json
│ ├── nmz_Latn.json
│ ├── nnb_Latn.json
│ ├── nng_Latn.json
│ ├── nnh_Latn.json
│ ├── nnl_Latn.json
│ ├── nno_Latn.json
│ ├── nnp_Latn.json
│ ├── nnq_Latn.json
│ ├── nnw_Latn.json
│ ├── noa_Latn.json
│ ├── nob_Latn.json
│ ├── nod_Thai.json
│ ├── nog_Cyrl.json
│ ├── non_Latn.json
│ ├── nop_Latn.json
│ ├── not_Latn.json
│ ├── nou_Latn.json
│ ├── nov_Latn.json
│ ├── nph_Latn.json
│ ├── npi_Deva.json
│ ├── npi_Latn.json
│ ├── npl_Latn.json
│ ├── npo_Latn.json
│ ├── npy_Latn.json
│ ├── nqo_Nkoo.json
│ ├── nre_Latn.json
│ ├── nrf_Latn.json
│ ├── nri_Latn.json
│ ├── nrm_Latn.json
│ ├── nsa_Latn.json
│ ├── nse_Latn.json
│ ├── nsm_Latn.json
│ ├── nsn_Latn.json
│ ├── nso_Latn.json
│ ├── nss_Latn.json
│ ├── nst_Latn.json
│ ├── nsu_Latn.json
│ ├── ntp_Latn.json
│ ├── ntr_Latn.json
│ ├── ntu_Latn.json
│ ├── nuj_Latn.json
│ ├── nus_Latn.json
│ ├── nuy_Latn.json
│ ├── nwb_Latn.json
│ ├── nwi_Latn.json
│ ├── nwx_Deva.json
│ ├── nxd_Latn.json
│ ├── nya_Latn.json
│ ├── nyf_Latn.json
│ ├── nyk_Latn.json
│ ├── nyn_Latn.json
│ ├── nyo_Latn.json
│ ├── nyu_Latn.json
│ ├── nyy_Latn.json
│ ├── nzi_Latn.json
│ ├── nzm_Latn.json
│ ├── obo_Latn.json
│ ├── oci_Latn.json
│ ├── ogo_Latn.json
│ ├── ojb_Cans.json
│ ├── ojb_Latn.json
│ ├── oke_Latn.json
│ ├── okv_Latn.json
│ ├── old_Latn.json
│ ├── olo_Latn.json
│ ├── omb_Latn.json
│ ├── omw_Latn.json
│ ├── ong_Latn.json
│ ├── ons_Latn.json
│ ├── ood_Latn.json
│ ├── opm_Latn.json
│ ├── orv_Cyrl.json
│ ├── ory_Latn.json
│ ├── ory_Orya.json
│ ├── oss_Cyrl.json
│ ├── ota_Arab.json
│ ├── otd_Latn.json
│ ├── ote_Latn.json
│ ├── otm_Latn.json
│ ├── otn_Latn.json
│ ├── oto_Latn.json
│ ├── otq_Latn.json
│ ├── ots_Latn.json
│ ├── otw_Latn.json
│ ├── oym_Latn.json
│ ├── ozm_Latn.json
│ ├── pab_Latn.json
│ ├── pad_Latn.json
│ ├── pag_Latn.json
│ ├── pah_Latn.json
│ ├── pam_Latn.json
│ ├── pan_Guru.json
│ ├── pan_Latn.json
│ ├── pao_Latn.json
│ ├── pap_Latn.json
│ ├── pau_Latn.json
│ ├── pbb_Latn.json
│ ├── pbc_Latn.json
│ ├── pbi_Latn.json
│ ├── pbt_Arab.json
│ ├── pcd_Latn.json
│ ├── pck_Latn.json
│ ├── pcm_Latn.json
│ ├── pdc_Latn.json
│ ├── pdt_Latn.json
│ ├── pem_Latn.json
│ ├── pfe_Latn.json
│ ├── pfl_Latn.json
│ ├── phm_Latn.json
│ ├── pib_Latn.json
│ ├── pio_Latn.json
│ ├── pir_Latn.json
│ ├── pis_Latn.json
│ ├── pjt_Latn.json
│ ├── pkb_Latn.json
│ ├── plg_Latn.json
│ ├── pls_Latn.json
│ ├── plt_Latn.json
│ ├── plu_Latn.json
│ ├── plw_Latn.json
│ ├── pma_Latn.json
│ ├── pmf_Latn.json
│ ├── pmq_Latn.json
│ ├── pms_Latn.json
│ ├── pmx_Latn.json
│ ├── pnb_Arab.json
│ ├── pne_Latn.json
│ ├── pnt_Grek.json
│ ├── pny_Latn.json
│ ├── poe_Latn.json
│ ├── poh_Latn.json
│ ├── poi_Latn.json
│ ├── pol_Latn.json
│ ├── pon_Latn.json
│ ├── por_Latn.json
│ ├── pos_Latn.json
│ ├── pot_Latn.json
│ ├── pov_Latn.json
│ ├── poy_Latn.json
│ ├── ppk_Latn.json
│ ├── ppo_Latn.json
│ ├── pps_Latn.json
│ ├── prf_Latn.json
│ ├── prg_Latn.json
│ ├── pri_Latn.json
│ ├── prq_Latn.json
│ ├── pse_Latn.json
│ ├── pss_Latn.json
│ ├── ptp_Latn.json
│ ├── ptu_Latn.json
│ ├── pui_Latn.json
│ ├── pwg_Latn.json
│ ├── pwn_Latn.json
│ ├── pww_Thai.json
│ ├── pxm_Latn.json
│ ├── qub_Latn.json
│ ├── quc_Latn.json
│ ├── quf_Latn.json
│ ├── qug_Latn.json
│ ├── quh_Latn.json
│ ├── qul_Latn.json
│ ├── qup_Latn.json
│ ├── qus_Latn.json
│ ├── quw_Latn.json
│ ├── quy_Latn.json
│ ├── quz_Latn.json
│ ├── qva_Latn.json
│ ├── qvc_Latn.json
│ ├── qve_Latn.json
│ ├── qvh_Latn.json
│ ├── qvi_Latn.json
│ ├── qvm_Latn.json
│ ├── qvn_Latn.json
│ ├── qvo_Latn.json
│ ├── qvs_Latn.json
│ ├── qvw_Latn.json
│ ├── qvz_Latn.json
│ ├── qwh_Latn.json
│ ├── qxh_Latn.json
│ ├── qxl_Latn.json
│ ├── qxn_Latn.json
│ ├── qxo_Latn.json
│ ├── qxr_Latn.json
│ ├── rad_Latn.json
│ ├── rai_Latn.json
│ ├── rap_Latn.json
│ ├── rar_Latn.json
│ ├── rav_Deva.json
│ ├── raw_Latn.json
│ ├── rcf_Latn.json
│ ├── rej_Latn.json
│ ├── rel_Latn.json
│ ├── rgu_Latn.json
│ ├── rhg_Latn.json
│ ├── ria_Latn.json
│ ├── rim_Latn.json
│ ├── rjs_Deva.json
│ ├── rkb_Latn.json
│ ├── rmc_Latn.json
│ ├── rme_Latn.json
│ ├── rml_Latn.json
│ ├── rmn_Cyrl.json
│ ├── rmn_Grek.json
│ ├── rmn_Latn.json
│ ├── rmo_Latn.json
│ ├── rmq_Latn.json
│ ├── rmy_Cyrl.json
│ ├── rmy_Latn.json
│ ├── rnd_Latn.json
│ ├── rng_Latn.json
│ ├── rnl_Latn.json
│ ├── roh_Latn.json
│ ├── ron_Cyrl.json
│ ├── ron_Latn.json
│ ├── roo_Latn.json
│ ├── rop_Latn.json
│ ├── row_Latn.json
│ ├── rro_Latn.json
│ ├── rtm_Latn.json
│ ├── rub_Latn.json
│ ├── rue_Cyrl.json
│ ├── ruf_Latn.json
│ ├── rug_Latn.json
│ ├── run_Latn.json
│ ├── rup_Latn.json
│ ├── rus_Cyrl.json
│ ├── rwo_Latn.json
│ ├── sab_Latn.json
│ ├── sag_Latn.json
│ ├── sah_Cyrl.json
│ ├── san_Deva.json
│ ├── san_Latn.json
│ ├── sas_Latn.json
│ ├── sat_Latn.json
│ ├── sat_Olck.json
│ ├── sba_Latn.json
│ ├── sbd_Latn.json
│ ├── sbe_Latn.json
│ ├── sbl_Latn.json
│ ├── sbs_Latn.json
│ ├── sby_Latn.json
│ ├── sck_Deva.json
│ ├── scn_Latn.json
│ ├── sco_Latn.json
│ ├── sda_Latn.json
│ ├── sdc_Latn.json
│ ├── sdh_Arab.json
│ ├── sdo_Latn.json
│ ├── sdq_Latn.json
│ ├── seh_Latn.json
│ ├── ses_Latn.json
│ ├── sey_Latn.json
│ ├── sfw_Latn.json
│ ├── sgb_Latn.json
│ ├── sgc_Latn.json
│ ├── sgh_Cyrl.json
│ ├── sgs_Latn.json
│ ├── sgw_Ethi.json
│ ├── sgz_Latn.json
│ ├── shi_Latn.json
│ ├── shk_Latn.json
│ ├── shn_Mymr.json
│ ├── shp_Latn.json
│ ├── shu_Arab.json
│ ├── sid_Latn.json
│ ├── sig_Latn.json
│ ├── sil_Latn.json
│ ├── sim_Latn.json
│ ├── sin_Sinh.json
│ ├── sja_Latn.json
│ ├── sjo_Mong.json
│ ├── sju_Latn.json
│ ├── skg_Latn.json
│ ├── skr_Arab.json
│ ├── sld_Latn.json
│ ├── slk_Latn.json
│ ├── sll_Latn.json
│ ├── slv_Latn.json
│ ├── sma_Latn.json
│ ├── sme_Latn.json
│ ├── smj_Latn.json
│ ├── smk_Latn.json
│ ├── sml_Latn.json
│ ├── smn_Latn.json
│ ├── smo_Latn.json
│ ├── sms_Latn.json
│ ├── smt_Latn.json
│ ├── sna_Latn.json
│ ├── snc_Latn.json
│ ├── snd_Arab.json
│ ├── snd_Deva.json
│ ├── snd_Latn.json
│ ├── snf_Latn.json
│ ├── snn_Latn.json
│ ├── snp_Latn.json
│ ├── snw_Latn.json
│ ├── sny_Latn.json
│ ├── soe_Latn.json
│ ├── som_Latn.json
│ ├── sop_Latn.json
│ ├── soq_Latn.json
│ ├── sot_Latn.json
│ ├── soy_Latn.json
│ ├── spa_Latn.json
│ ├── spl_Latn.json
│ ├── spm_Latn.json
│ ├── spp_Latn.json
│ ├── sps_Latn.json
│ ├── spy_Latn.json
│ ├── srd_Latn.json
│ ├── sri_Latn.json
│ ├── srm_Latn.json
│ ├── srn_Latn.json
│ ├── srp_Cyrl.json
│ ├── srp_Latn.json
│ ├── srq_Latn.json
│ ├── srr_Latn.json
│ ├── ssd_Latn.json
│ ├── ssg_Latn.json
│ ├── ssw_L
SYMBOL INDEX (66 symbols across 18 files)
FILE: ablations/evaluation/launch_evals.py
function parse_date (line 22) | def parse_date(date_string: Optional[str]) -> Optional[datetime]:
function checkpoint_exists (line 31) | def checkpoint_exists(logging_dir: str, model_name: str, checkpoint: str...
function launch_slurm_job (line 49) | def launch_slurm_job(launch_file_contents, *args):
function get_checkpoints_to_run (line 69) | def get_checkpoints_to_run(s3_path: str, model_name: str, checkpoints: s...
FILE: ablations/evaluation/launch_random_evals.py
function launch_slurm_job (line 11) | def launch_slurm_job(launch_file_contents, *args):
FILE: ablations/training/launch_exp.py
function launch_slurm_job (line 70) | def launch_slurm_job(launch_file_contents, *args):
function print_differences (line 133) | def print_differences(target, updates):
FILE: fineweb-2-pipeline.py
function above_lang_threshold (line 109) | def above_lang_threshold(doc, threshold):
FILE: misc/precision_filtering/count_common.py
function generate_tokenizer_identifier (line 11) | def generate_tokenizer_identifier(row):
function load_and_save_tokenizer_freq (line 44) | def load_and_save_tokenizer_freq(tokenizer_id, selected_language):
FILE: misc/precision_filtering/run_precision_filtering.py
class Decontaminate (line 11) | class Decontaminate(BaseFilter):
method __init__ (line 12) | def __init__(self, lang_code, language,
method wordlist (line 50) | def wordlist(self):
method wordlist_filter (line 57) | def wordlist_filter(self, doc):
method filter (line 65) | def filter(self, document):
method url_filter (line 68) | def url_filter(self, document):
FILE: misc/precision_filtering/slurm_count_word.py
function generate_tokenizer_identifier (line 9) | def generate_tokenizer_identifier(row):
class ComputeTermFrequency (line 26) | class ComputeTermFrequency(PipelineStep):
method __init__ (line 27) | def __init__(self, tokenizer_name: str, example_language: str):
method run (line 31) | def run(self, _data, rank, world_size):
FILE: misc/precision_filtering/wordlist_gen.py
function filter_top_percentile (line 7) | def filter_top_percentile(counter, percentile=95):
function filter_by_ratio (line 24) | def filter_by_ratio(counter1, counter2, threshold=0.85):
function save (line 42) | def save(tokenizer_id, selected_language):
function generate_tokenizer_identifier (line 70) | def generate_tokenizer_identifier(row):
FILE: misc/precision_filtering/wordlist_score.py
function load_words_from_txt (line 3) | def load_words_from_txt(folder_path):
function filter_score (line 51) | def filter_score(text, lang):
FILE: misc/reference_datasets/monolingual/ar/download_arabicweb24.py
class ArrowReader (line 8) | class ArrowReader(BaseDiskReader):
method __init__ (line 12) | def __init__(
method read_file (line 48) | def read_file(self, filepath: str):
FILE: misc/reference_datasets/monolingual/fr/download_croissant.py
class ArrowReader (line 7) | class ArrowReader(BaseDiskReader):
method __init__ (line 11) | def __init__(
method read_file (line 47) | def read_file(self, filepath: str):
FILE: misc/reference_datasets/monolingual/zh/download_mapcc.py
class ConcatenatedFileStream (line 10) | class ConcatenatedFileStream:
method __init__ (line 11) | def __init__(self, filepaths):
method _open_next_file (line 17) | def _open_next_file(self):
method read (line 27) | def read(self, size=-1):
method close (line 42) | def close(self):
class JsonlPartReader (line 46) | class JsonlPartReader(JsonlReader):
method __init__ (line 47) | def __init__(
method read_files_shard (line 67) | def read_files_shard(self, shard: list[str]):
function open_concatenated_gzip_files (line 105) | def open_concatenated_gzip_files(filepaths):
class ExtractMapccStep (line 114) | class ExtractMapccStep(PipelineStep):
method run (line 119) | def run(self, data, rank: int = 0, world_size: int = 1):
class CollectMapccStep (line 126) | class CollectMapccStep(PipelineStep):
method run (line 136) | def run(self, data, rank: int = 0, world_size: int = 1):
FILE: misc/reference_datasets/multilingual/copy_raw_data.py
function adapter (line 8) | def adapter(self, data: dict, path: str, id_in_file: int | str):
class CachedListReader (line 29) | class CachedListReader(JsonlReader):
method __init__ (line 30) | def __init__(self,
method run (line 63) | def run(self, data=None, rank: int = 0, world_size: int = 1):
method read_file (line 96) | def read_file(self, filepath: str):
FILE: misc/reference_datasets/multilingual/download_cc-100.py
class CC100Reader (line 5) | class CC100Reader(PipelineStep):
method run (line 6) | def run(self, data=None, rank: int = 0, world_size: int = 1):
FILE: misc/reference_datasets/multilingual/download_culturax.py
function adapter (line 6) | def adapter(self, data: dict, path: str, id_in_file: int | str):
FILE: misc/reference_datasets/multilingual/download_hplt.py
class HPLTReader (line 6) | class HPLTReader(JsonlReader):
method run (line 8) | def run(self, data=None, rank: int = 0, world_size: int = 1):
FILE: misc/reference_datasets/multilingual/download_mc4.py
function adapter (line 7) | def adapter(self, data: dict, path: str, id_in_file: int | str):
FILE: misc/reference_datasets/multilingual/part jsons.py
class ConcatenatedFileStream (line 9) | class ConcatenatedFileStream:
method __init__ (line 10) | def __init__(self, filepaths):
method _open_next_file (line 16) | def _open_next_file(self):
method read (line 26) | def read(self, size=-1):
method close (line 41) | def close(self):
function open_concatenated_gzip_files (line 46) | def open_concatenated_gzip_files(filepaths):
class JsonlPartReader (line 56) | class JsonlPartReader(JsonlReader):
method __init__ (line 57) | def __init__(
method read_files_shard (line 77) | def read_files_shard(self, shard: list[str]):
method read_file (line 115) | def read_file(self, filepath: str):
Copy disabled (too large)
Download .json
Condensed preview — 7704 files, each showing path, character count, and a content snippet. Download the .json file for the full structured content (141,009K chars).
[
{
"path": "LICENSE",
"chars": 11357,
"preview": " Apache License\n Version 2.0, January 2004\n "
},
{
"path": "README.md",
"chars": 6952,
"preview": "\n# FineWeb 2\n\nFineWeb 2 is the second iteration of the popular 🍷 FineWeb dat"
},
{
"path": "ablations/evaluation/launch_evals.py",
"chars": 11221,
"preview": "import argparse\nfrom datetime import datetime\nimport os\nimport re\nimport subprocess\nimport tempfile\nfrom typing import O"
},
{
"path": "ablations/evaluation/launch_random_evals.py",
"chars": 4589,
"preview": "import argparse\nimport os\nimport subprocess\nimport tempfile\n\nfrom loguru import logger\n\nUSER=os.environ[\"USER\"]\n\n\ndef la"
},
{
"path": "ablations/evaluation/run_all_missing_evals.sh",
"chars": 584,
"preview": "#!/bin/bash\nLANGUAGES=(\"ru\" \"fr\" \"zh\" \"hi\" \"sw\" \"tr\" \"ar\" \"te\" \"th\")\nBUCKET=\"s3://path/to/bucket\"\nSCRIPT_PATH=\"./multili"
},
{
"path": "ablations/tokenization/launch_tokenization.py",
"chars": 2506,
"preview": "import argparse\n\nparser = argparse.ArgumentParser(\"Quickly launch thom's style of tokenization.\")\n\nparser.add_argument(\n"
},
{
"path": "ablations/training/launch_exp.py",
"chars": 11700,
"preview": "import os\nfrom pathlib import Path\nimport subprocess\nimport sys\nimport tempfile\nfrom datetime import datetime\n\nfrom nano"
},
{
"path": "configs/aai_Latn.yml",
"chars": 503,
"preview": "dup_line_frac: 0.387\ndup_n_grams:\n- - 5\n - 0.384\n- - 6\n - 0.376\n- - 7\n - 0.364\n- - 8\n - 0.348\n- - 9\n - 0.329\n- - 10"
},
{
"path": "configs/aak_Latn.yml",
"chars": 550,
"preview": "dup_line_frac: 0.358\ndup_n_grams:\n- - 5\n - 0.359\n- - 6\n - 0.35\n- - 7\n - 0.336\n- - 8\n - 0.32\n- - 9\n - 0.304\n- - 10\n "
},
{
"path": "configs/aau_Latn.yml",
"chars": 516,
"preview": "dup_line_frac: 0.398\ndup_n_grams:\n- - 5\n - 0.4\n- - 6\n - 0.393\n- - 7\n - 0.382\n- - 8\n - 0.368\n- - 9\n - 0.352\n- - 10\n "
},
{
"path": "configs/aaz_Latn.yml",
"chars": 489,
"preview": "dup_line_frac: 0.328\ndup_n_grams:\n- - 5\n - 0.303\n- - 6\n - 0.298\n- - 7\n - 0.289\n- - 8\n - 0.277\n- - 9\n - 0.262\n- - 10"
},
{
"path": "configs/aba_Latn.yml",
"chars": 652,
"preview": "dup_line_frac: 0.534\ndup_n_grams:\n- - 5\n - 0.33\n- - 6\n - 0.315\n- - 7\n - 0.298\n- - 8\n - 0.28\n- - 9\n - 0.262\n- - 10\n "
},
{
"path": "configs/abi_Latn.yml",
"chars": 592,
"preview": "dup_line_frac: 0.546\ndup_n_grams:\n- - 5\n - 0.35\n- - 6\n - 0.344\n- - 7\n - 0.328\n- - 8\n - 0.312\n- - 9\n - 0.309\n- - 10\n"
},
{
"path": "configs/abk_Cyrl.yml",
"chars": 1361,
"preview": "dup_line_frac: 0.291\ndup_n_grams:\n- - 5\n - 0.201\n- - 6\n - 0.204\n- - 7\n - 0.185\n- - 8\n - 0.18\n- - 9\n - 0.176\n- - 10\n"
},
{
"path": "configs/abn_Latn.yml",
"chars": 450,
"preview": "dup_line_frac: 0.321\ndup_n_grams:\n- - 5\n - 0.237\n- - 6\n - 0.219\n- - 7\n - 0.203\n- - 8\n - 0.191\n- - 9\n - 0.172\n- - 10"
},
{
"path": "configs/abq_Cyrl.yml",
"chars": 1210,
"preview": "dup_line_frac: 0.098\ndup_n_grams:\n- - 5\n - 0.096\n- - 6\n - 0.085\n- - 7\n - 0.073\n- - 8\n - 0.067\n- - 9\n - 0.058\n- - 10"
},
{
"path": "configs/abs_Latn.yml",
"chars": 495,
"preview": "dup_line_frac: 0.865\ndup_n_grams:\n- - 5\n - 0.56\n- - 6\n - 0.531\n- - 7\n - 0.505\n- - 8\n - 0.481\n- - 9\n - 0.449\n- - 10\n"
},
{
"path": "configs/abt_Latn.yml",
"chars": 498,
"preview": "dup_line_frac: 0.35\ndup_n_grams:\n- - 5\n - 0.353\n- - 6\n - 0.345\n- - 7\n - 0.333\n- - 8\n - 0.317\n- - 9\n - 0.301\n- - 10\n"
},
{
"path": "configs/abx_Latn.yml",
"chars": 426,
"preview": "dup_line_frac: 0.416\ndup_n_grams:\n- - 5\n - 0.423\n- - 6\n - 0.416\n- - 7\n - 0.404\n- - 8\n - 0.389\n- - 9\n - 0.372\n- - 10"
},
{
"path": "configs/aby_Latn.yml",
"chars": 445,
"preview": "dup_line_frac: 0.369\ndup_n_grams:\n- - 5\n - 0.365\n- - 6\n - 0.358\n- - 7\n - 0.346\n- - 8\n - 0.331\n- - 9\n - 0.311\n- - 10"
},
{
"path": "configs/abz_Latn.yml",
"chars": 468,
"preview": "dup_line_frac: 0.215\ndup_n_grams:\n- - 5\n - 0.169\n- - 6\n - 0.164\n- - 7\n - 0.143\n- - 8\n - 0.126\n- - 9\n - 0.114\n- - 10"
},
{
"path": "configs/aca_Latn.yml",
"chars": 455,
"preview": "dup_line_frac: 0.423\ndup_n_grams:\n- - 5\n - 0.413\n- - 6\n - 0.405\n- - 7\n - 0.391\n- - 8\n - 0.372\n- - 9\n - 0.356\n- - 10"
},
{
"path": "configs/acd_Latn.yml",
"chars": 627,
"preview": "dup_line_frac: 0.348\ndup_n_grams:\n- - 5\n - 0.33\n- - 6\n - 0.325\n- - 7\n - 0.315\n- - 8\n - 0.302\n- - 9\n - 0.288\n- - 10\n"
},
{
"path": "configs/ace_Arab.yml",
"chars": 534,
"preview": "dup_line_frac: 0.235\ndup_n_grams:\n- - 5\n - 0.19\n- - 6\n - 0.169\n- - 7\n - 0.141\n- - 8\n - 0.129\n- - 9\n - 0.117\n- - 10\n"
},
{
"path": "configs/ace_Latn.yml",
"chars": 510,
"preview": "dup_line_frac: 0.373\ndup_n_grams:\n- - 5\n - 0.27\n- - 6\n - 0.224\n- - 7\n - 0.208\n- - 8\n - 0.178\n- - 9\n - 0.162\n- - 10\n"
},
{
"path": "configs/acf_Latn.yml",
"chars": 550,
"preview": "dup_line_frac: 0.75\ndup_n_grams:\n- - 5\n - 0.507\n- - 6\n - 0.485\n- - 7\n - 0.468\n- - 8\n - 0.466\n- - 9\n - 0.453\n- - 10\n"
},
{
"path": "configs/ach_Latn.yml",
"chars": 435,
"preview": "dup_line_frac: 0.451\ndup_n_grams:\n- - 5\n - 0.331\n- - 6\n - 0.321\n- - 7\n - 0.306\n- - 8\n - 0.294\n- - 9\n - 0.275\n- - 10"
},
{
"path": "configs/acm_Arab.yml",
"chars": 613,
"preview": "dup_line_frac: 0.486\ndup_n_grams:\n- - 5\n - 0.326\n- - 6\n - 0.305\n- - 7\n - 0.282\n- - 8\n - 0.264\n- - 9\n - 0.241\n- - 10"
},
{
"path": "configs/acn_Latn.yml",
"chars": 517,
"preview": "dup_line_frac: 0.321\ndup_n_grams:\n- - 5\n - 0.249\n- - 6\n - 0.241\n- - 7\n - 0.225\n- - 8\n - 0.213\n- - 9\n - 0.201\n- - 10"
},
{
"path": "configs/acr_Latn.yml",
"chars": 424,
"preview": "dup_line_frac: 0.347\ndup_n_grams:\n- - 5\n - 0.311\n- - 6\n - 0.303\n- - 7\n - 0.292\n- - 8\n - 0.28\n- - 9\n - 0.267\n- - 10\n"
},
{
"path": "configs/acu_Latn.yml",
"chars": 463,
"preview": "dup_line_frac: 0.332\ndup_n_grams:\n- - 5\n - 0.307\n- - 6\n - 0.3\n- - 7\n - 0.286\n- - 8\n - 0.273\n- - 9\n - 0.258\n- - 10\n "
},
{
"path": "configs/ada_Latn.yml",
"chars": 501,
"preview": "dup_line_frac: 0.283\ndup_n_grams:\n- - 5\n - 0.191\n- - 6\n - 0.171\n- - 7\n - 0.155\n- - 8\n - 0.141\n- - 9\n - 0.128\n- - 10"
},
{
"path": "configs/ade_Latn.yml",
"chars": 544,
"preview": "dup_line_frac: 0.302\ndup_n_grams:\n- - 5\n - 0.272\n- - 6\n - 0.259\n- - 7\n - 0.254\n- - 8\n - 0.244\n- - 9\n - 0.227\n- - 10"
},
{
"path": "configs/adh_Latn.yml",
"chars": 438,
"preview": "dup_line_frac: 0.849\ndup_n_grams:\n- - 5\n - 0.614\n- - 6\n - 0.62\n- - 7\n - 0.588\n- - 8\n - 0.521\n- - 9\n - 0.468\n- - 10\n"
},
{
"path": "configs/adi_Latn.yml",
"chars": 432,
"preview": "dup_line_frac: 0.394\ndup_n_grams:\n- - 5\n - 0.507\n- - 6\n - 0.332\n- - 7\n - 0.316\n- - 8\n - 0.3\n- - 9\n - 0.28\n- - 10\n "
},
{
"path": "configs/adj_Latn.yml",
"chars": 555,
"preview": "dup_line_frac: 0.4\ndup_n_grams:\n- - 5\n - 0.357\n- - 6\n - 0.351\n- - 7\n - 0.341\n- - 8\n - 0.328\n- - 9\n - 0.314\n- - 10\n "
},
{
"path": "configs/adl_Latn.yml",
"chars": 513,
"preview": "dup_line_frac: 0.535\ndup_n_grams:\n- - 5\n - 0.833\n- - 6\n - 0.842\n- - 7\n - 0.835\n- - 8\n - 0.813\n- - 9\n - 0.803\n- - 10"
},
{
"path": "configs/ady_Cyrl.yml",
"chars": 1544,
"preview": "dup_line_frac: 0.624\ndup_n_grams:\n- - 5\n - 0.342\n- - 6\n - 0.338\n- - 7\n - 0.317\n- - 8\n - 0.305\n- - 9\n - 0.273\n- - 10"
},
{
"path": "configs/adz_Latn.yml",
"chars": 462,
"preview": "dup_line_frac: 0.444\ndup_n_grams:\n- - 5\n - 0.3\n- - 6\n - 0.289\n- - 7\n - 0.293\n- - 8\n - 0.28\n- - 9\n - 0.256\n- - 10\n "
},
{
"path": "configs/aeb_Arab.yml",
"chars": 643,
"preview": "dup_line_frac: 0.387\ndup_n_grams:\n- - 5\n - 0.329\n- - 6\n - 0.293\n- - 7\n - 0.255\n- - 8\n - 0.227\n- - 9\n - 0.203\n- - 10"
},
{
"path": "configs/aer_Latn.yml",
"chars": 569,
"preview": "dup_line_frac: 0.614\ndup_n_grams:\n- - 5\n - 0.436\n- - 6\n - 0.428\n- - 7\n - 0.407\n- - 8\n - 0.384\n- - 9\n - 0.366\n- - 10"
},
{
"path": "configs/aeu_Latn.yml",
"chars": 538,
"preview": "dup_line_frac: 0.375\ndup_n_grams:\n- - 5\n - 0.38\n- - 6\n - 0.37\n- - 7\n - 0.357\n- - 8\n - 0.342\n- - 9\n - 0.324\n- - 10\n "
},
{
"path": "configs/aey_Latn.yml",
"chars": 467,
"preview": "dup_line_frac: 0.639\ndup_n_grams:\n- - 5\n - 0.497\n- - 6\n - 0.46\n- - 7\n - 0.441\n- - 8\n - 0.405\n- - 9\n - 0.377\n- - 10\n"
},
{
"path": "configs/afr_Latn.yml",
"chars": 413,
"preview": "dup_line_frac: 0.412\ndup_n_grams:\n- - 5\n - 0.192\n- - 6\n - 0.162\n- - 7\n - 0.149\n- - 8\n - 0.128\n- - 9\n - 0.113\n- - 10"
},
{
"path": "configs/agd_Latn.yml",
"chars": 462,
"preview": "dup_line_frac: 0.405\ndup_n_grams:\n- - 5\n - 0.393\n- - 6\n - 0.387\n- - 7\n - 0.375\n- - 8\n - 0.361\n- - 9\n - 0.343\n- - 10"
},
{
"path": "configs/agg_Latn.yml",
"chars": 511,
"preview": "dup_line_frac: 0.375\ndup_n_grams:\n- - 5\n - 0.389\n- - 6\n - 0.381\n- - 7\n - 0.367\n- - 8\n - 0.349\n- - 9\n - 0.333\n- - 10"
},
{
"path": "configs/agm_Latn.yml",
"chars": 587,
"preview": "dup_line_frac: 0.21\ndup_n_grams:\n- - 5\n - 0.041\n- - 6\n - 0.034\n- - 7\n - 0.032\n- - 8\n - 0.029\n- - 9\n - 0.026\n- - 10\n"
},
{
"path": "configs/agn_Latn.yml",
"chars": 435,
"preview": "dup_line_frac: 0.329\ndup_n_grams:\n- - 5\n - 0.261\n- - 6\n - 0.251\n- - 7\n - 0.234\n- - 8\n - 0.222\n- - 9\n - 0.2\n- - 10\n "
},
{
"path": "configs/agr_Latn.yml",
"chars": 434,
"preview": "dup_line_frac: 0.373\ndup_n_grams:\n- - 5\n - 0.184\n- - 6\n - 0.179\n- - 7\n - 0.169\n- - 8\n - 0.156\n- - 9\n - 0.145\n- - 10"
},
{
"path": "configs/agt_Latn.yml",
"chars": 471,
"preview": "dup_line_frac: 0.4\ndup_n_grams:\n- - 5\n - 0.36\n- - 6\n - 0.357\n- - 7\n - 0.344\n- - 8\n - 0.335\n- - 9\n - 0.314\n- - 10\n "
},
{
"path": "configs/agu_Latn.yml",
"chars": 421,
"preview": "dup_line_frac: 0.127\ndup_n_grams:\n- - 5\n - 0.144\n- - 6\n - 0.13\n- - 7\n - 0.106\n- - 8\n - 0.094\n- - 9\n - 0.084\n- - 10\n"
},
{
"path": "configs/agw_Latn.yml",
"chars": 441,
"preview": "dup_line_frac: 0.676\ndup_n_grams:\n- - 5\n - 0.488\n- - 6\n - 0.481\n- - 7\n - 0.459\n- - 8\n - 0.445\n- - 9\n - 0.436\n- - 10"
},
{
"path": "configs/agx_Cyrl.yml",
"chars": 778,
"preview": "dup_line_frac: 0.456\ndup_n_grams:\n- - 5\n - 0.231\n- - 6\n - 0.242\n- - 7\n - 0.248\n- - 8\n - 0.202\n- - 9\n - 0.16\n- - 10\n"
},
{
"path": "configs/aha_Latn.yml",
"chars": 549,
"preview": "dup_line_frac: 0.331\ndup_n_grams:\n- - 5\n - 0.209\n- - 6\n - 0.196\n- - 7\n - 0.194\n- - 8\n - 0.178\n- - 9\n - 0.17\n- - 10\n"
},
{
"path": "configs/ahk_Latn.yml",
"chars": 594,
"preview": "dup_line_frac: 0.112\ndup_n_grams:\n- - 5\n - 0.159\n- - 6\n - 0.135\n- - 7\n - 0.114\n- - 8\n - 0.1\n- - 9\n - 0.088\n- - 10\n "
},
{
"path": "configs/aia_Latn.yml",
"chars": 446,
"preview": "dup_line_frac: 0.247\ndup_n_grams:\n- - 5\n - 0.239\n- - 6\n - 0.231\n- - 7\n - 0.218\n- - 8\n - 0.203\n- - 9\n - 0.194\n- - 10"
},
{
"path": "configs/aii_Syrc.yml",
"chars": 633,
"preview": "dup_line_frac: 0.321\ndup_n_grams:\n- - 5\n - 0.167\n- - 6\n - 0.159\n- - 7\n - 0.149\n- - 8\n - 0.14\n- - 9\n - 0.132\n- - 10\n"
},
{
"path": "configs/aim_Latn.yml",
"chars": 513,
"preview": "dup_line_frac: 0.913\ndup_n_grams:\n- - 5\n - 0.419\n- - 6\n - 0.412\n- - 7\n - 0.343\n- - 8\n - 0.321\n- - 9\n - 0.297\n- - 10"
},
{
"path": "configs/ain_Latn.yml",
"chars": 512,
"preview": "dup_line_frac: 0.416\ndup_n_grams:\n- - 5\n - 0.335\n- - 6\n - 0.323\n- - 7\n - 0.296\n- - 8\n - 0.273\n- - 9\n - 0.247\n- - 10"
},
{
"path": "configs/ajg_Latn.yml",
"chars": 490,
"preview": "dup_line_frac: 0.374\ndup_n_grams:\n- - 5\n - 0.237\n- - 6\n - 0.218\n- - 7\n - 0.206\n- - 8\n - 0.191\n- - 9\n - 0.183\n- - 10"
},
{
"path": "configs/aji_Latn.yml",
"chars": 625,
"preview": "dup_line_frac: 0.314\ndup_n_grams:\n- - 5\n - 0.3\n- - 6\n - 0.295\n- - 7\n - 0.286\n- - 8\n - 0.274\n- - 9\n - 0.261\n- - 10\n "
},
{
"path": "configs/ajz_Latn.yml",
"chars": 493,
"preview": "dup_line_frac: 0.532\ndup_n_grams:\n- - 5\n - 0.095\n- - 6\n - 0.092\n- - 7\n - 0.073\n- - 8\n - 0.068\n- - 9\n - 0.063\n- - 10"
},
{
"path": "configs/akb_Latn.yml",
"chars": 488,
"preview": "dup_line_frac: 0.431\ndup_n_grams:\n- - 5\n - 0.329\n- - 6\n - 0.316\n- - 7\n - 0.301\n- - 8\n - 0.273\n- - 9\n - 0.256\n- - 10"
},
{
"path": "configs/ake_Latn.yml",
"chars": 581,
"preview": "dup_line_frac: 0.392\ndup_n_grams:\n- - 5\n - 0.394\n- - 6\n - 0.389\n- - 7\n - 0.379\n- - 8\n - 0.364\n- - 9\n - 0.346\n- - 10"
},
{
"path": "configs/akh_Latn.yml",
"chars": 479,
"preview": "dup_line_frac: 0.206\ndup_n_grams:\n- - 5\n - 0.229\n- - 6\n - 0.209\n- - 7\n - 0.183\n- - 8\n - 0.162\n- - 9\n - 0.147\n- - 10"
},
{
"path": "configs/akp_Latn.yml",
"chars": 513,
"preview": "dup_line_frac: 0.236\ndup_n_grams:\n- - 5\n - 0.215\n- - 6\n - 0.212\n- - 7\n - 0.206\n- - 8\n - 0.196\n- - 9\n - 0.182\n- - 10"
},
{
"path": "configs/ald_Latn.yml",
"chars": 659,
"preview": "dup_line_frac: 0.01\ndup_n_grams:\n- - 5\n - 0.041\n- - 6\n - 0.023\n- - 7\n - 0.012\n- - 8\n - 0.006\n- - 9\n - 0.005\n- - 10\n"
},
{
"path": "configs/alj_Latn.yml",
"chars": 509,
"preview": "dup_line_frac: 0.573\ndup_n_grams:\n- - 5\n - 0.579\n- - 6\n - 0.565\n- - 7\n - 0.546\n- - 8\n - 0.525\n- - 9\n - 0.503\n- - 10"
},
{
"path": "configs/aln_Latn.yml",
"chars": 442,
"preview": "dup_line_frac: 0.587\ndup_n_grams:\n- - 5\n - 0.427\n- - 6\n - 0.425\n- - 7\n - 0.421\n- - 8\n - 0.412\n- - 9\n - 0.4\n- - 10\n "
},
{
"path": "configs/alp_Latn.yml",
"chars": 491,
"preview": "dup_line_frac: 0.462\ndup_n_grams:\n- - 5\n - 0.407\n- - 6\n - 0.399\n- - 7\n - 0.387\n- - 8\n - 0.372\n- - 9\n - 0.351\n- - 10"
},
{
"path": "configs/alq_Latn.yml",
"chars": 483,
"preview": "dup_line_frac: 0.429\ndup_n_grams:\n- - 5\n - 0.442\n- - 6\n - 0.433\n- - 7\n - 0.417\n- - 8\n - 0.399\n- - 9\n - 0.377\n- - 10"
},
{
"path": "configs/als_Latn.yml",
"chars": 461,
"preview": "dup_line_frac: 0.241\ndup_n_grams:\n- - 5\n - 0.131\n- - 6\n - 0.122\n- - 7\n - 0.113\n- - 8\n - 0.105\n- - 9\n - 0.096\n- - 10"
},
{
"path": "configs/alt_Cyrl.yml",
"chars": 1011,
"preview": "dup_line_frac: 0.7\ndup_n_grams:\n- - 5\n - 0.412\n- - 6\n - 0.402\n- - 7\n - 0.386\n- - 8\n - 0.365\n- - 9\n - 0.348\n- - 10\n "
},
{
"path": "configs/aly_Latn.yml",
"chars": 512,
"preview": "dup_line_frac: 0.244\ndup_n_grams:\n- - 5\n - 0.884\n- - 6\n - 0.943\n- - 7\n - 0.955\n- - 8\n - 0.924\n- - 9\n - 0.854\n- - 10"
},
{
"path": "configs/alz_Latn.yml",
"chars": 436,
"preview": "dup_line_frac: 0.444\ndup_n_grams:\n- - 5\n - 0.422\n- - 6\n - 0.406\n- - 7\n - 0.379\n- - 8\n - 0.358\n- - 9\n - 0.334\n- - 10"
},
{
"path": "configs/ame_Latn.yml",
"chars": 562,
"preview": "dup_line_frac: 0.293\ndup_n_grams:\n- - 5\n - 0.208\n- - 6\n - 0.202\n- - 7\n - 0.192\n- - 8\n - 0.179\n- - 9\n - 0.167\n- - 10"
},
{
"path": "configs/amf_Latn.yml",
"chars": 778,
"preview": "dup_line_frac: 0.583\ndup_n_grams:\n- - 5\n - 0.406\n- - 6\n - 0.376\n- - 7\n - 0.351\n- - 8\n - 0.311\n- - 9\n - 0.287\n- - 10"
},
{
"path": "configs/amh_Ethi.yml",
"chars": 919,
"preview": "dup_line_frac: 0.672\ndup_n_grams:\n- - 5\n - 0.273\n- - 6\n - 0.242\n- - 7\n - 0.228\n- - 8\n - 0.205\n- - 9\n - 0.183\n- - 10"
},
{
"path": "configs/ami_Latn.yml",
"chars": 415,
"preview": "dup_line_frac: 0.938\ndup_n_grams:\n- - 5\n - 0.397\n- - 6\n - 0.361\n- - 7\n - 0.338\n- - 8\n - 0.313\n- - 9\n - 0.292\n- - 10"
},
{
"path": "configs/amk_Latn.yml",
"chars": 478,
"preview": "dup_line_frac: 0.543\ndup_n_grams:\n- - 5\n - 0.461\n- - 6\n - 0.431\n- - 7\n - 0.414\n- - 8\n - 0.394\n- - 9\n - 0.357\n- - 10"
},
{
"path": "configs/amm_Latn.yml",
"chars": 439,
"preview": "dup_line_frac: 0.329\ndup_n_grams:\n- - 5\n - 0.69\n- - 6\n - 0.684\n- - 7\n - 0.667\n- - 8\n - 0.647\n- - 9\n - 0.627\n- - 10\n"
},
{
"path": "configs/amn_Latn.yml",
"chars": 450,
"preview": "dup_line_frac: 0.523\ndup_n_grams:\n- - 5\n - 0.326\n- - 6\n - 0.306\n- - 7\n - 0.285\n- - 8\n - 0.265\n- - 9\n - 0.245\n- - 10"
},
{
"path": "configs/amp_Latn.yml",
"chars": 448,
"preview": "dup_line_frac: 0.756\ndup_n_grams:\n- - 5\n - 0.424\n- - 6\n - 0.433\n- - 7\n - 0.403\n- - 8\n - 0.401\n- - 9\n - 0.346\n- - 10"
},
{
"path": "configs/amr_Latn.yml",
"chars": 437,
"preview": "dup_line_frac: 0.106\ndup_n_grams:\n- - 5\n - 0.096\n- - 6\n - 0.069\n- - 7\n - 0.047\n- - 8\n - 0.05\n- - 9\n - 0.036\n- - 10\n"
},
{
"path": "configs/amu_Latn.yml",
"chars": 519,
"preview": "dup_line_frac: 0.22\ndup_n_grams:\n- - 5\n - 0.197\n- - 6\n - 0.191\n- - 7\n - 0.18\n- - 8\n - 0.169\n- - 9\n - 0.158\n- - 10\n "
},
{
"path": "configs/amx_Latn.yml",
"chars": 536,
"preview": "dup_line_frac: 0.6\ndup_n_grams:\n- - 5\n - 0.432\n- - 6\n - 0.414\n- - 7\n - 0.401\n- - 8\n - 0.373\n- - 9\n - 0.355\n- - 10\n "
},
{
"path": "configs/ang_Latn.yml",
"chars": 454,
"preview": "dup_line_frac: 0.628\ndup_n_grams:\n- - 5\n - 0.472\n- - 6\n - 0.444\n- - 7\n - 0.405\n- - 8\n - 0.356\n- - 9\n - 0.341\n- - 10"
},
{
"path": "configs/anm_Latn.yml",
"chars": 435,
"preview": "dup_line_frac: 0.34\ndup_n_grams:\n- - 5\n - 0.249\n- - 6\n - 0.221\n- - 7\n - 0.21\n- - 8\n - 0.196\n- - 9\n - 0.181\n- - 10\n "
},
{
"path": "configs/ann_Latn.yml",
"chars": 543,
"preview": "dup_line_frac: 0.473\ndup_n_grams:\n- - 5\n - 0.296\n- - 6\n - 0.28\n- - 7\n - 0.259\n- - 8\n - 0.24\n- - 9\n - 0.223\n- - 10\n "
},
{
"path": "configs/anp_Deva.yml",
"chars": 546,
"preview": "dup_line_frac: 0.939\ndup_n_grams:\n- - 5\n - 0.385\n- - 6\n - 0.364\n- - 7\n - 0.341\n- - 8\n - 0.318\n- - 9\n - 0.295\n- - 10"
},
{
"path": "configs/anv_Latn.yml",
"chars": 574,
"preview": "dup_line_frac: 0.162\ndup_n_grams:\n- - 5\n - 0.163\n- - 6\n - 0.14\n- - 7\n - 0.12\n- - 8\n - 0.112\n- - 9\n - 0.095\n- - 10\n "
},
{
"path": "configs/any_Latn.yml",
"chars": 612,
"preview": "dup_line_frac: 0.619\ndup_n_grams:\n- - 5\n - 0.44\n- - 6\n - 0.425\n- - 7\n - 0.455\n- - 8\n - 0.405\n- - 9\n - 0.346\n- - 10\n"
},
{
"path": "configs/aoi_Latn.yml",
"chars": 566,
"preview": "dup_line_frac: 0.007\ndup_n_grams:\n- - 5\n - 0.119\n- - 6\n - 0.098\n- - 7\n - 0.079\n- - 8\n - 0.065\n- - 9\n - 0.06\n- - 10\n"
},
{
"path": "configs/aoj_Latn.yml",
"chars": 479,
"preview": "dup_line_frac: 0.332\ndup_n_grams:\n- - 5\n - 0.299\n- - 6\n - 0.291\n- - 7\n - 0.278\n- - 8\n - 0.263\n- - 9\n - 0.248\n- - 10"
},
{
"path": "configs/aom_Latn.yml",
"chars": 477,
"preview": "dup_line_frac: 0.365\ndup_n_grams:\n- - 5\n - 0.365\n- - 6\n - 0.357\n- - 7\n - 0.344\n- - 8\n - 0.329\n- - 9\n - 0.311\n- - 10"
},
{
"path": "configs/aoz_Latn.yml",
"chars": 506,
"preview": "dup_line_frac: 0.536\ndup_n_grams:\n- - 5\n - 0.346\n- - 6\n - 0.332\n- - 7\n - 0.314\n- - 8\n - 0.295\n- - 9\n - 0.278\n- - 10"
},
{
"path": "configs/apb_Latn.yml",
"chars": 508,
"preview": "dup_line_frac: 0.422\ndup_n_grams:\n- - 5\n - 0.326\n- - 6\n - 0.313\n- - 7\n - 0.292\n- - 8\n - 0.274\n- - 9\n - 0.258\n- - 10"
},
{
"path": "configs/apc_Arab.yml",
"chars": 500,
"preview": "dup_line_frac: 0.334\ndup_n_grams:\n- - 5\n - 0.248\n- - 6\n - 0.23\n- - 7\n - 0.208\n- - 8\n - 0.192\n- - 9\n - 0.174\n- - 10\n"
},
{
"path": "configs/ape_Latn.yml",
"chars": 431,
"preview": "dup_line_frac: 0.422\ndup_n_grams:\n- - 5\n - 0.378\n- - 6\n - 0.365\n- - 7\n - 0.345\n- - 8\n - 0.328\n- - 9\n - 0.312\n- - 10"
},
{
"path": "configs/apn_Latn.yml",
"chars": 604,
"preview": "dup_line_frac: 0.704\ndup_n_grams:\n- - 5\n - 0.281\n- - 6\n - 0.222\n- - 7\n - 0.21\n- - 8\n - 0.181\n- - 9\n - 0.167\n- - 10\n"
},
{
"path": "configs/apr_Latn.yml",
"chars": 511,
"preview": "dup_line_frac: 0.346\ndup_n_grams:\n- - 5\n - 0.331\n- - 6\n - 0.323\n- - 7\n - 0.313\n- - 8\n - 0.301\n- - 9\n - 0.284\n- - 10"
},
{
"path": "configs/apt_Latn.yml",
"chars": 458,
"preview": "dup_line_frac: 0.569\ndup_n_grams:\n- - 5\n - 0.534\n- - 6\n - 0.521\n- - 7\n - 0.508\n- - 8\n - 0.487\n- - 9\n - 0.456\n- - 10"
},
{
"path": "configs/apu_Latn.yml",
"chars": 526,
"preview": "dup_line_frac: 0.263\ndup_n_grams:\n- - 5\n - 0.206\n- - 6\n - 0.196\n- - 7\n - 0.189\n- - 8\n - 0.185\n- - 9\n - 0.163\n- - 10"
},
{
"path": "configs/apw_Latn.yml",
"chars": 582,
"preview": "dup_line_frac: 0.513\ndup_n_grams:\n- - 5\n - 0.398\n- - 6\n - 0.384\n- - 7\n - 0.372\n- - 8\n - 0.33\n- - 9\n - 0.307\n- - 10\n"
},
{
"path": "configs/apy_Latn.yml",
"chars": 514,
"preview": "dup_line_frac: 0.611\ndup_n_grams:\n- - 5\n - 0.489\n- - 6\n - 0.469\n- - 7\n - 0.448\n- - 8\n - 0.426\n- - 9\n - 0.385\n- - 10"
},
{
"path": "configs/apz_Latn.yml",
"chars": 555,
"preview": "dup_line_frac: 0.504\ndup_n_grams:\n- - 5\n - 0.359\n- - 6\n - 0.344\n- - 7\n - 0.327\n- - 8\n - 0.312\n- - 9\n - 0.295\n- - 10"
},
{
"path": "configs/aqz_Latn.yml",
"chars": 638,
"preview": "dup_line_frac: 0.079\ndup_n_grams:\n- - 5\n - 0.063\n- - 6\n - 0.065\n- - 7\n - 0.061\n- - 8\n - 0.052\n- - 9\n - 0.05\n- - 10\n"
},
{
"path": "configs/arb_Arab.yml",
"chars": 754,
"preview": "dup_line_frac: 0.304\ndup_n_grams:\n- - 5\n - 0.165\n- - 6\n - 0.153\n- - 7\n - 0.142\n- - 8\n - 0.131\n- - 9\n - 0.12\n- - 10\n"
},
{
"path": "configs/arb_Latn.yml",
"chars": 421,
"preview": "dup_line_frac: 0.629\ndup_n_grams:\n- - 5\n - 0.452\n- - 6\n - 0.428\n- - 7\n - 0.407\n- - 8\n - 0.364\n- - 9\n - 0.334\n- - 10"
},
{
"path": "configs/are_Latn.yml",
"chars": 499,
"preview": "dup_line_frac: 0.68\ndup_n_grams:\n- - 5\n - 0.441\n- - 6\n - 0.427\n- - 7\n - 0.39\n- - 8\n - 0.385\n- - 9\n - 0.341\n- - 10\n "
},
{
"path": "configs/arg_Latn.yml",
"chars": 424,
"preview": "dup_line_frac: 0.449\ndup_n_grams:\n- - 5\n - 0.272\n- - 6\n - 0.255\n- - 7\n - 0.233\n- - 8\n - 0.209\n- - 9\n - 0.185\n- - 10"
},
{
"path": "configs/arl_Latn.yml",
"chars": 477,
"preview": "dup_line_frac: 0.122\ndup_n_grams:\n- - 5\n - 0.061\n- - 6\n - 0.05\n- - 7\n - 0.04\n- - 8\n - 0.037\n- - 9\n - 0.033\n- - 10\n "
},
{
"path": "configs/arn_Latn.yml",
"chars": 539,
"preview": "dup_line_frac: 0.206\ndup_n_grams:\n- - 5\n - 0.171\n- - 6\n - 0.165\n- - 7\n - 0.153\n- - 8\n - 0.142\n- - 9\n - 0.13\n- - 10\n"
},
{
"path": "configs/arp_Latn.yml",
"chars": 494,
"preview": "dup_line_frac: 0.432\ndup_n_grams:\n- - 5\n - 0.316\n- - 6\n - 0.285\n- - 7\n - 0.274\n- - 8\n - 0.259\n- - 9\n - 0.245\n- - 10"
},
{
"path": "configs/arq_Arab.yml",
"chars": 849,
"preview": "dup_line_frac: 0.422\ndup_n_grams:\n- - 5\n - 0.377\n- - 6\n - 0.37\n- - 7\n - 0.355\n- - 8\n - 0.337\n- - 9\n - 0.306\n- - 10\n"
},
{
"path": "configs/arr_Latn.yml",
"chars": 771,
"preview": "dup_line_frac: 0.034\ndup_n_grams:\n- - 5\n - 0.013\n- - 6\n - 0.012\n- - 7\n - 0.013\n- - 8\n - 0.011\n- - 9\n - 0.01\n- - 10\n"
},
{
"path": "configs/ars_Arab.yml",
"chars": 532,
"preview": "dup_line_frac: 0.356\ndup_n_grams:\n- - 5\n - 0.204\n- - 6\n - 0.192\n- - 7\n - 0.18\n- - 8\n - 0.166\n- - 9\n - 0.153\n- - 10\n"
},
{
"path": "configs/ary_Arab.yml",
"chars": 567,
"preview": "dup_line_frac: 0.32\ndup_n_grams:\n- - 5\n - 0.196\n- - 6\n - 0.183\n- - 7\n - 0.169\n- - 8\n - 0.157\n- - 9\n - 0.145\n- - 10\n"
},
{
"path": "configs/arz_Arab.yml",
"chars": 647,
"preview": "dup_line_frac: 0.368\ndup_n_grams:\n- - 5\n - 0.223\n- - 6\n - 0.207\n- - 7\n - 0.19\n- - 8\n - 0.174\n- - 9\n - 0.158\n- - 10\n"
},
{
"path": "configs/asg_Latn.yml",
"chars": 489,
"preview": "dup_line_frac: 0.492\ndup_n_grams:\n- - 5\n - 0.183\n- - 6\n - 0.166\n- - 7\n - 0.154\n- - 8\n - 0.143\n- - 9\n - 0.136\n- - 10"
},
{
"path": "configs/asm_Beng.yml",
"chars": 1012,
"preview": "dup_line_frac: 0.211\ndup_n_grams:\n- - 5\n - 0.119\n- - 6\n - 0.108\n- - 7\n - 0.101\n- - 8\n - 0.09\n- - 9\n - 0.082\n- - 10\n"
},
{
"path": "configs/asm_Latn.yml",
"chars": 485,
"preview": "dup_line_frac: 0.613\ndup_n_grams:\n- - 5\n - 0.387\n- - 6\n - 0.36\n- - 7\n - 0.331\n- - 8\n - 0.308\n- - 9\n - 0.284\n- - 10\n"
},
{
"path": "configs/aso_Latn.yml",
"chars": 432,
"preview": "dup_line_frac: 0.359\ndup_n_grams:\n- - 5\n - 0.291\n- - 6\n - 0.274\n- - 7\n - 0.258\n- - 8\n - 0.233\n- - 9\n - 0.216\n- - 10"
},
{
"path": "configs/ast_Latn.yml",
"chars": 414,
"preview": "dup_line_frac: 0.679\ndup_n_grams:\n- - 5\n - 0.412\n- - 6\n - 0.379\n- - 7\n - 0.328\n- - 8\n - 0.313\n- - 9\n - 0.306\n- - 10"
},
{
"path": "configs/ata_Latn.yml",
"chars": 481,
"preview": "dup_line_frac: 0.35\ndup_n_grams:\n- - 5\n - 0.331\n- - 6\n - 0.325\n- - 7\n - 0.314\n- - 8\n - 0.299\n- - 9\n - 0.281\n- - 10\n"
},
{
"path": "configs/atb_Latn.yml",
"chars": 503,
"preview": "dup_line_frac: 0.226\ndup_n_grams:\n- - 5\n - 0.163\n- - 6\n - 0.153\n- - 7\n - 0.138\n- - 8\n - 0.129\n- - 9\n - 0.12\n- - 10\n"
},
{
"path": "configs/atd_Latn.yml",
"chars": 496,
"preview": "dup_line_frac: 0.68\ndup_n_grams:\n- - 5\n - 0.585\n- - 6\n - 0.558\n- - 7\n - 0.524\n- - 8\n - 0.487\n- - 9\n - 0.453\n- - 10\n"
},
{
"path": "configs/atg_Latn.yml",
"chars": 529,
"preview": "dup_line_frac: 0.052\ndup_n_grams:\n- - 5\n - 0.098\n- - 6\n - 0.09\n- - 7\n - 0.082\n- - 8\n - 0.074\n- - 9\n - 0.067\n- - 10\n"
},
{
"path": "configs/ati_Latn.yml",
"chars": 721,
"preview": "dup_line_frac: 0.721\ndup_n_grams:\n- - 5\n - 0.591\n- - 6\n - 0.571\n- - 7\n - 0.536\n- - 8\n - 0.519\n- - 9\n - 0.493\n- - 10"
},
{
"path": "configs/atj_Latn.yml",
"chars": 458,
"preview": "dup_line_frac: 0.58\ndup_n_grams:\n- - 5\n - 0.42\n- - 6\n - 0.255\n- - 7\n - 0.229\n- - 8\n - 0.201\n- - 9\n - 0.18\n- - 10\n "
},
{
"path": "configs/atq_Latn.yml",
"chars": 497,
"preview": "dup_line_frac: 0.738\ndup_n_grams:\n- - 5\n - 0.558\n- - 6\n - 0.548\n- - 7\n - 0.525\n- - 8\n - 0.499\n- - 9\n - 0.468\n- - 10"
},
{
"path": "configs/att_Latn.yml",
"chars": 498,
"preview": "dup_line_frac: 0.4\ndup_n_grams:\n- - 5\n - 0.381\n- - 6\n - 0.375\n- - 7\n - 0.364\n- - 8\n - 0.352\n- - 9\n - 0.333\n- - 10\n "
},
{
"path": "configs/auc_Latn.yml",
"chars": 619,
"preview": "dup_line_frac: 0.104\ndup_n_grams:\n- - 5\n - 0.074\n- - 6\n - 0.043\n- - 7\n - 0.039\n- - 8\n - 0.03\n- - 9\n - 0.021\n- - 10\n"
},
{
"path": "configs/aui_Latn.yml",
"chars": 447,
"preview": "dup_line_frac: 0.264\ndup_n_grams:\n- - 5\n - 0.199\n- - 6\n - 0.195\n- - 7\n - 0.189\n- - 8\n - 0.167\n- - 9\n - 0.148\n- - 10"
},
{
"path": "configs/auy_Latn.yml",
"chars": 833,
"preview": "dup_line_frac: 0.208\ndup_n_grams:\n- - 5\n - 0.177\n- - 6\n - 0.17\n- - 7\n - 0.159\n- - 8\n - 0.15\n- - 9\n - 0.135\n- - 10\n "
},
{
"path": "configs/ava_Cyrl.yml",
"chars": 979,
"preview": "dup_line_frac: 0.617\ndup_n_grams:\n- - 5\n - 0.309\n- - 6\n - 0.289\n- - 7\n - 0.277\n- - 8\n - 0.26\n- - 9\n - 0.238\n- - 10\n"
},
{
"path": "configs/avk_Latn.yml",
"chars": 406,
"preview": "dup_line_frac: 0.51\ndup_n_grams:\n- - 5\n - 0.349\n- - 6\n - 0.335\n- - 7\n - 0.318\n- - 8\n - 0.302\n- - 9\n - 0.284\n- - 10\n"
},
{
"path": "configs/avn_Latn.yml",
"chars": 490,
"preview": "dup_line_frac: 0.379\ndup_n_grams:\n- - 5\n - 0.276\n- - 6\n - 0.274\n- - 7\n - 0.238\n- - 8\n - 0.22\n- - 9\n - 0.197\n- - 10\n"
},
{
"path": "configs/avt_Latn.yml",
"chars": 537,
"preview": "dup_line_frac: 0.085\ndup_n_grams:\n- - 5\n - 0.099\n- - 6\n - 0.087\n- - 7\n - 0.071\n- - 8\n - 0.053\n- - 9\n - 0.051\n- - 10"
},
{
"path": "configs/avu_Latn.yml",
"chars": 710,
"preview": "dup_line_frac: 0.194\ndup_n_grams:\n- - 5\n - 0.188\n- - 6\n - 0.164\n- - 7\n - 0.136\n- - 8\n - 0.123\n- - 9\n - 0.119\n- - 10"
},
{
"path": "configs/awa_Deva.yml",
"chars": 599,
"preview": "dup_line_frac: 0.827\ndup_n_grams:\n- - 5\n - 0.594\n- - 6\n - 0.569\n- - 7\n - 0.545\n- - 8\n - 0.495\n- - 9\n - 0.465\n- - 10"
},
{
"path": "configs/awb_Latn.yml",
"chars": 467,
"preview": "dup_line_frac: 0.289\ndup_n_grams:\n- - 5\n - 0.21\n- - 6\n - 0.204\n- - 7\n - 0.196\n- - 8\n - 0.185\n- - 9\n - 0.174\n- - 10\n"
},
{
"path": "configs/awi_Latn.yml",
"chars": 456,
"preview": "dup_line_frac: 0.461\ndup_n_grams:\n- - 5\n - 0.355\n- - 6\n - 0.352\n- - 7\n - 0.348\n- - 8\n - 0.326\n- - 9\n - 0.294\n- - 10"
},
{
"path": "configs/awx_Latn.yml",
"chars": 445,
"preview": "dup_line_frac: 0.471\ndup_n_grams:\n- - 5\n - 0.321\n- - 6\n - 0.314\n- - 7\n - 0.3\n- - 8\n - 0.283\n- - 9\n - 0.265\n- - 10\n "
},
{
"path": "configs/ayo_Latn.yml",
"chars": 509,
"preview": "dup_line_frac: 0.673\ndup_n_grams:\n- - 5\n - 0.639\n- - 6\n - 0.6\n- - 7\n - 0.616\n- - 8\n - 0.598\n- - 9\n - 0.536\n- - 10\n "
},
{
"path": "configs/ayp_Arab.yml",
"chars": 614,
"preview": "dup_line_frac: 0.672\ndup_n_grams:\n- - 5\n - 0.706\n- - 6\n - 0.707\n- - 7\n - 0.676\n- - 8\n - 0.667\n- - 9\n - 0.663\n- - 10"
},
{
"path": "configs/ayr_Latn.yml",
"chars": 428,
"preview": "dup_line_frac: 0.594\ndup_n_grams:\n- - 5\n - 0.222\n- - 6\n - 0.196\n- - 7\n - 0.177\n- - 8\n - 0.16\n- - 9\n - 0.143\n- - 10\n"
},
{
"path": "configs/azb_Arab.yml",
"chars": 1064,
"preview": "dup_line_frac: 0.379\ndup_n_grams:\n- - 5\n - 0.225\n- - 6\n - 0.2\n- - 7\n - 0.179\n- - 8\n - 0.16\n- - 9\n - 0.144\n- - 10\n "
},
{
"path": "configs/azg_Latn.yml",
"chars": 451,
"preview": "dup_line_frac: 0.696\ndup_n_grams:\n- - 5\n - 0.344\n- - 6\n - 0.346\n- - 7\n - 0.3\n- - 8\n - 0.163\n- - 9\n - 0.147\n- - 10\n "
},
{
"path": "configs/azj_Cyrl.yml",
"chars": 513,
"preview": "dup_line_frac: 0.297\ndup_n_grams:\n- - 5\n - 0.15\n- - 6\n - 0.144\n- - 7\n - 0.137\n- - 8\n - 0.13\n- - 9\n - 0.12\n- - 10\n "
},
{
"path": "configs/azj_Latn.yml",
"chars": 577,
"preview": "dup_line_frac: 0.879\ndup_n_grams:\n- - 5\n - 0.3\n- - 6\n - 0.271\n- - 7\n - 0.252\n- - 8\n - 0.227\n- - 9\n - 0.202\n- - 10\n "
},
{
"path": "configs/azz_Latn.yml",
"chars": 534,
"preview": "dup_line_frac: 0.756\ndup_n_grams:\n- - 5\n - 0.476\n- - 6\n - 0.451\n- - 7\n - 0.405\n- - 8\n - 0.386\n- - 9\n - 0.372\n- - 10"
},
{
"path": "configs/bak_Cyrl.yml",
"chars": 1130,
"preview": "dup_line_frac: 0.217\ndup_n_grams:\n- - 5\n - 0.128\n- - 6\n - 0.12\n- - 7\n - 0.103\n- - 8\n - 0.092\n- - 9\n - 0.084\n- - 10\n"
},
{
"path": "configs/bam_Latn.yml",
"chars": 420,
"preview": "dup_line_frac: 0.632\ndup_n_grams:\n- - 5\n - 0.431\n- - 6\n - 0.332\n- - 7\n - 0.386\n- - 8\n - 0.325\n- - 9\n - 0.342\n- - 10"
},
{
"path": "configs/ban_Latn.yml",
"chars": 498,
"preview": "dup_line_frac: 0.69\ndup_n_grams:\n- - 5\n - 0.431\n- - 6\n - 0.422\n- - 7\n - 0.39\n- - 8\n - 0.352\n- - 9\n - 0.357\n- - 10\n "
},
{
"path": "configs/bao_Latn.yml",
"chars": 528,
"preview": "dup_line_frac: 0.306\ndup_n_grams:\n- - 5\n - 0.223\n- - 6\n - 0.204\n- - 7\n - 0.187\n- - 8\n - 0.178\n- - 9\n - 0.159\n- - 10"
},
{
"path": "configs/bar_Latn.yml",
"chars": 395,
"preview": "dup_line_frac: 0.591\ndup_n_grams:\n- - 5\n - 0.38\n- - 6\n - 0.356\n- - 7\n - 0.326\n- - 8\n - 0.301\n- - 9\n - 0.274\n- - 10\n"
},
{
"path": "configs/bas_Latn.yml",
"chars": 460,
"preview": "dup_line_frac: 0.487\ndup_n_grams:\n- - 5\n - 0.295\n- - 6\n - 0.27\n- - 7\n - 0.247\n- - 8\n - 0.228\n- - 9\n - 0.209\n- - 10\n"
},
{
"path": "configs/bav_Latn.yml",
"chars": 597,
"preview": "dup_line_frac: 0.326\ndup_n_grams:\n- - 5\n - 0.301\n- - 6\n - 0.256\n- - 7\n - 0.237\n- - 8\n - 0.223\n- - 9\n - 0.201\n- - 10"
},
{
"path": "configs/bba_Latn.yml",
"chars": 508,
"preview": "dup_line_frac: 0.098\ndup_n_grams:\n- - 5\n - 0.086\n- - 6\n - 0.082\n- - 7\n - 0.069\n- - 8\n - 0.065\n- - 9\n - 0.06\n- - 10\n"
},
{
"path": "configs/bbb_Latn.yml",
"chars": 481,
"preview": "dup_line_frac: 0.196\ndup_n_grams:\n- - 5\n - 0.108\n- - 6\n - 0.097\n- - 7\n - 0.089\n- - 8\n - 0.085\n- - 9\n - 0.073\n- - 10"
},
{
"path": "configs/bbc_Latn.yml",
"chars": 462,
"preview": "dup_line_frac: 0.429\ndup_n_grams:\n- - 5\n - 0.295\n- - 6\n - 0.286\n- - 7\n - 0.274\n- - 8\n - 0.258\n- - 9\n - 0.243\n- - 10"
},
{
"path": "configs/bbj_Latn.yml",
"chars": 560,
"preview": "dup_line_frac: 0.623\ndup_n_grams:\n- - 5\n - 0.259\n- - 6\n - 0.248\n- - 7\n - 0.234\n- - 8\n - 0.212\n- - 9\n - 0.192\n- - 10"
},
{
"path": "configs/bbk_Latn.yml",
"chars": 611,
"preview": "dup_line_frac: 0.216\ndup_n_grams:\n- - 5\n - 0.188\n- - 6\n - 0.182\n- - 7\n - 0.168\n- - 8\n - 0.158\n- - 9\n - 0.141\n- - 10"
},
{
"path": "configs/bbo_Latn.yml",
"chars": 531,
"preview": "dup_line_frac: 0.773\ndup_n_grams:\n- - 5\n - 0.572\n- - 6\n - 0.58\n- - 7\n - 0.531\n- - 8\n - 0.509\n- - 9\n - 0.476\n- - 10\n"
},
{
"path": "configs/bbr_Latn.yml",
"chars": 529,
"preview": "dup_line_frac: 0.363\ndup_n_grams:\n- - 5\n - 0.357\n- - 6\n - 0.351\n- - 7\n - 0.341\n- - 8\n - 0.325\n- - 9\n - 0.31\n- - 10\n"
},
{
"path": "configs/bch_Latn.yml",
"chars": 494,
"preview": "dup_line_frac: 0.108\ndup_n_grams:\n- - 5\n - 0.149\n- - 6\n - 0.125\n- - 7\n - 0.096\n- - 8\n - 0.086\n- - 9\n - 0.079\n- - 10"
},
{
"path": "configs/bci_Latn.yml",
"chars": 477,
"preview": "dup_line_frac: 0.393\ndup_n_grams:\n- - 5\n - 0.244\n- - 6\n - 0.234\n- - 7\n - 0.215\n- - 8\n - 0.2\n- - 9\n - 0.18\n- - 10\n "
},
{
"path": "configs/bcl_Latn.yml",
"chars": 407,
"preview": "dup_line_frac: 0.292\ndup_n_grams:\n- - 5\n - 0.198\n- - 6\n - 0.185\n- - 7\n - 0.167\n- - 8\n - 0.147\n- - 9\n - 0.132\n- - 10"
},
{
"path": "configs/bco_Latn.yml",
"chars": 584,
"preview": "dup_line_frac: 0.001\ndup_n_grams:\n- - 5\n - 0.021\n- - 6\n - 0.016\n- - 7\n - 0.012\n- - 8\n - 0.009\n- - 9\n - 0.008\n- - 10"
},
{
"path": "configs/bcw_Latn.yml",
"chars": 597,
"preview": "dup_line_frac: 0.129\ndup_n_grams:\n- - 5\n - 0.169\n- - 6\n - 0.109\n- - 7\n - 0.093\n- - 8\n - 0.086\n- - 9\n - 0.075\n- - 10"
},
{
"path": "configs/bdd_Latn.yml",
"chars": 480,
"preview": "dup_line_frac: 0.277\ndup_n_grams:\n- - 5\n - 0.173\n- - 6\n - 0.165\n- - 7\n - 0.158\n- - 8\n - 0.153\n- - 9\n - 0.125\n- - 10"
},
{
"path": "configs/bdh_Latn.yml",
"chars": 655,
"preview": "dup_line_frac: 0.41\ndup_n_grams:\n- - 5\n - 0.396\n- - 6\n - 0.39\n- - 7\n - 0.381\n- - 8\n - 0.366\n- - 9\n - 0.35\n- - 10\n "
},
{
"path": "configs/bdq_Latn.yml",
"chars": 574,
"preview": "dup_line_frac: 0.552\ndup_n_grams:\n- - 5\n - 0.418\n- - 6\n - 0.4\n- - 7\n - 0.373\n- - 8\n - 0.354\n- - 9\n - 0.335\n- - 10\n "
},
{
"path": "configs/bea_Latn.yml",
"chars": 462,
"preview": "dup_line_frac: 0.436\ndup_n_grams:\n- - 5\n - 0.265\n- - 6\n - 0.242\n- - 7\n - 0.224\n- - 8\n - 0.215\n- - 9\n - 0.192\n- - 10"
},
{
"path": "configs/bef_Latn.yml",
"chars": 454,
"preview": "dup_line_frac: 0.98\ndup_n_grams:\n- - 5\n - 0.753\n- - 6\n - 0.749\n- - 7\n - 0.735\n- - 8\n - 0.712\n- - 9\n - 0.684\n- - 10\n"
},
{
"path": "configs/bel_Cyrl.yml",
"chars": 825,
"preview": "dup_line_frac: 0.261\ndup_n_grams:\n- - 5\n - 0.124\n- - 6\n - 0.116\n- - 7\n - 0.103\n- - 8\n - 0.094\n- - 9\n - 0.084\n- - 10"
},
{
"path": "configs/bem_Latn.yml",
"chars": 445,
"preview": "dup_line_frac: 0.335\ndup_n_grams:\n- - 5\n - 0.215\n- - 6\n - 0.205\n- - 7\n - 0.189\n- - 8\n - 0.174\n- - 9\n - 0.16\n- - 10\n"
},
{
"path": "configs/ben_Beng.yml",
"chars": 536,
"preview": "dup_line_frac: 0.203\ndup_n_grams:\n- - 5\n - 0.118\n- - 6\n - 0.108\n- - 7\n - 0.099\n- - 8\n - 0.09\n- - 9\n - 0.082\n- - 10\n"
},
{
"path": "configs/ben_Latn.yml",
"chars": 433,
"preview": "dup_line_frac: 0.47\ndup_n_grams:\n- - 5\n - 0.331\n- - 6\n - 0.31\n- - 7\n - 0.286\n- - 8\n - 0.266\n- - 9\n - 0.245\n- - 10\n "
},
{
"path": "configs/beq_Latn.yml",
"chars": 440,
"preview": "dup_line_frac: 0.828\ndup_n_grams:\n- - 5\n - 0.578\n- - 6\n - 0.563\n- - 7\n - 0.554\n- - 8\n - 0.515\n- - 9\n - 0.504\n- - 10"
},
{
"path": "configs/bew_Latn.yml",
"chars": 424,
"preview": "dup_line_frac: 0.517\ndup_n_grams:\n- - 5\n - 0.311\n- - 6\n - 0.29\n- - 7\n - 0.27\n- - 8\n - 0.248\n- - 9\n - 0.229\n- - 10\n "
},
{
"path": "configs/bex_Latn.yml",
"chars": 587,
"preview": "dup_line_frac: 0.18\ndup_n_grams:\n- - 5\n - 0.226\n- - 6\n - 0.166\n- - 7\n - 0.15\n- - 8\n - 0.15\n- - 9\n - 0.133\n- - 10\n "
},
{
"path": "configs/bfd_Latn.yml",
"chars": 545,
"preview": "dup_line_frac: 0.231\ndup_n_grams:\n- - 5\n - 0.206\n- - 6\n - 0.183\n- - 7\n - 0.151\n- - 8\n - 0.143\n- - 9\n - 0.132\n- - 10"
},
{
"path": "configs/bfo_Latn.yml",
"chars": 506,
"preview": "dup_line_frac: 0.519\ndup_n_grams:\n- - 5\n - 0.349\n- - 6\n - 0.392\n- - 7\n - 0.184\n- - 8\n - 0.175\n- - 9\n - 0.166\n- - 10"
},
{
"path": "configs/bgr_Latn.yml",
"chars": 504,
"preview": "dup_line_frac: 0.234\ndup_n_grams:\n- - 5\n - 0.187\n- - 6\n - 0.184\n- - 7\n - 0.166\n- - 8\n - 0.159\n- - 9\n - 0.148\n- - 10"
},
{
"path": "configs/bgs_Latn.yml",
"chars": 500,
"preview": "dup_line_frac: 0.401\ndup_n_grams:\n- - 5\n - 0.402\n- - 6\n - 0.395\n- - 7\n - 0.383\n- - 8\n - 0.367\n- - 9\n - 0.352\n- - 10"
},
{
"path": "configs/bgt_Latn.yml",
"chars": 477,
"preview": "dup_line_frac: 0.943\ndup_n_grams:\n- - 5\n - 0.829\n- - 6\n - 0.827\n- - 7\n - 0.851\n- - 8\n - 0.751\n- - 9\n - 0.806\n- - 10"
},
{
"path": "configs/bgz_Latn.yml",
"chars": 533,
"preview": "dup_line_frac: 0.678\ndup_n_grams:\n- - 5\n - 0.562\n- - 6\n - 0.563\n- - 7\n - 0.561\n- - 8\n - 0.54\n- - 9\n - 0.534\n- - 10\n"
},
{
"path": "configs/bhg_Latn.yml",
"chars": 464,
"preview": "dup_line_frac: 0.29\ndup_n_grams:\n- - 5\n - 0.953\n- - 6\n - 0.939\n- - 7\n - 0.946\n- - 8\n - 0.908\n- - 9\n - 0.871\n- - 10\n"
},
{
"path": "configs/bhl_Latn.yml",
"chars": 514,
"preview": "dup_line_frac: 0.285\ndup_n_grams:\n- - 5\n - 0.47\n- - 6\n - 0.454\n- - 7\n - 0.434\n- - 8\n - 0.409\n- - 9\n - 0.388\n- - 10\n"
},
{
"path": "configs/bho_Deva.yml",
"chars": 511,
"preview": "dup_line_frac: 0.294\ndup_n_grams:\n- - 5\n - 0.163\n- - 6\n - 0.143\n- - 7\n - 0.131\n- - 8\n - 0.12\n- - 9\n - 0.111\n- - 10\n"
},
{
"path": "configs/bhp_Latn.yml",
"chars": 504,
"preview": "dup_line_frac: 0.65\ndup_n_grams:\n- - 5\n - 0.474\n- - 6\n - 0.453\n- - 7\n - 0.418\n- - 8\n - 0.376\n- - 9\n - 0.351\n- - 10\n"
},
{
"path": "configs/bhw_Latn.yml",
"chars": 475,
"preview": "dup_line_frac: 0.237\ndup_n_grams:\n- - 5\n - 0.191\n- - 6\n - 0.176\n- - 7\n - 0.17\n- - 8\n - 0.159\n- - 9\n - 0.148\n- - 10\n"
},
{
"path": "configs/bhz_Latn.yml",
"chars": 480,
"preview": "dup_line_frac: 0.381\ndup_n_grams:\n- - 5\n - 0.284\n- - 6\n - 0.259\n- - 7\n - 0.236\n- - 8\n - 0.211\n- - 9\n - 0.189\n- - 10"
},
{
"path": "configs/bib_Latn.yml",
"chars": 554,
"preview": "dup_line_frac: 0.245\ndup_n_grams:\n- - 5\n - 0.242\n- - 6\n - 0.192\n- - 7\n - 0.16\n- - 8\n - 0.153\n- - 9\n - 0.145\n- - 10\n"
},
{
"path": "configs/big_Latn.yml",
"chars": 437,
"preview": "dup_line_frac: 0.238\ndup_n_grams:\n- - 5\n - 0.231\n- - 6\n - 0.214\n- - 7\n - 0.187\n- - 8\n - 0.179\n- - 9\n - 0.166\n- - 10"
},
{
"path": "configs/bim_Latn.yml",
"chars": 456,
"preview": "dup_line_frac: 0.352\ndup_n_grams:\n- - 5\n - 0.297\n- - 6\n - 0.274\n- - 7\n - 0.261\n- - 8\n - 0.243\n- - 9\n - 0.232\n- - 10"
},
{
"path": "configs/bin_Latn.yml",
"chars": 540,
"preview": "dup_line_frac: 0.95\ndup_n_grams:\n- - 5\n - 0.643\n- - 6\n - 0.608\n- - 7\n - 0.587\n- - 8\n - 0.565\n- - 9\n - 0.541\n- - 10\n"
},
{
"path": "configs/bis_Latn.yml",
"chars": 469,
"preview": "dup_line_frac: 0.41\ndup_n_grams:\n- - 5\n - 0.447\n- - 6\n - 0.432\n- - 7\n - 0.415\n- - 8\n - 0.398\n- - 9\n - 0.377\n- - 10\n"
}
]
// ... and 7504 more files (download for full content)
About this extraction
This page contains the full source code of the huggingface/fineweb-2 GitHub repository, extracted and formatted as plain text for AI agents and large language models (LLMs). The extraction includes 7704 files (228.9 MB), approximately 24.1M tokens, and a symbol index with 66 extracted functions, classes, methods, constants, and types. Use this with OpenClaw, Claude, ChatGPT, Cursor, Windsurf, or any other AI tool that accepts text input. You can copy the full output to your clipboard or download it as a .txt file.
Extracted by GitExtract — free GitHub repo to text converter for AI. Built by Nikandr Surkov.