gitextract_dzo0glnd/ ├── .clang-format ├── .github/ │ └── workflows/ │ └── cmake-single-platform.yml ├── .gitignore ├── CMakeLists.txt ├── CMakePresets.json ├── README-en.md ├── README.md ├── config_on_win.bat ├── sample/ │ ├── expect_pass/ │ │ ├── [EUC-JP]readme.txt │ │ ├── [Unknown]ubuntu-22.04.2-desktop-amd64.iso.torrent │ │ ├── [gb18030]你还戴着这副眼镜.txt │ │ ├── [utf-16].txt │ │ ├── [utf-16be].txt │ │ ├── [utf-16le].txt │ │ └── [utf-8].txt │ ├── not_pass_yet/ │ │ ├── [GB18030]DialogAnimation.h │ │ ├── [GB18030]LogRecord.h │ │ ├── [GB18030]TBarTool_GB.cpp │ │ ├── [GB18030]TDraw.h │ │ ├── [GB18030]TMenu.cpp │ │ ├── [GB18030]一个字.txt │ │ ├── [GB18030]澤野弘之.lrc │ │ ├── [GB18030]编译说明.txt │ │ ├── [GB18030]连杆.cpp │ │ ├── [UTF-8]CMakeLists.txt │ │ ├── [UTF-8]TBarTool.cpp │ │ └── [UTF-8]虚拟机环境.txt │ ├── tcvn/ │ │ ├── demo1-tcvn.txt │ │ ├── demo1-utf16le.txt │ │ └── demo1-utf8.txt │ └── uchardet_test_samples/ │ ├── ar/ │ │ ├── iso-8859-6.txt │ │ ├── utf-8.txt │ │ └── windows-1256.txt │ ├── be/ │ │ ├── iso-8859-5.txt │ │ ├── utf-8.txt │ │ └── windows-1251.txt │ ├── bg/ │ │ ├── iso-8859-5.txt │ │ ├── utf-8.txt │ │ └── windows-1251.txt │ ├── ca/ │ │ ├── iso-8859-1.txt │ │ ├── utf-8.txt │ │ └── windows-1252.txt │ ├── cs/ │ │ ├── ibm852.txt │ │ ├── iso-8859-2.txt │ │ ├── mac-centraleurope.txt │ │ ├── utf-8.txt │ │ └── windows-1250.txt │ ├── da/ │ │ ├── ibm865.txt │ │ ├── iso-8859-1.txt │ │ ├── iso-8859-15.txt │ │ ├── utf-8.txt │ │ └── windows-1252.txt │ ├── de/ │ │ ├── iso-8859-1.txt │ │ ├── utf-8.txt │ │ └── windows-1252.txt │ ├── el/ │ │ ├── cp737.txt │ │ ├── iso-8859-7.txt │ │ ├── utf-8.txt │ │ └── windows-1253.txt │ ├── en/ │ │ ├── ascii.txt │ │ └── utf-8.txt │ ├── eo/ │ │ ├── iso-8859-3.txt │ │ └── utf-8.txt │ ├── es/ │ │ ├── iso-8859-1.txt │ │ ├── iso-8859-15.txt │ │ ├── utf-8.txt │ │ └── windows-1252.txt │ ├── et/ │ │ ├── iso-8859-13.txt │ │ ├── iso-8859-15.txt │ │ ├── iso-8859-4.txt │ │ ├── utf-8.txt │ │ ├── windows-1252.txt │ │ └── windows-1257.txt │ ├── fi/ │ │ ├── iso-8859-1.txt │ │ └── utf-8.txt │ ├── fr/ │ │ ├── iso-8859-1.txt │ │ ├── iso-8859-15.txt │ │ ├── utf-16.be │ │ ├── utf-32.le │ │ ├── utf-8.txt │ │ └── windows-1252.txt │ ├── ga/ │ │ ├── iso-8859-1.txt │ │ ├── utf-8.txt │ │ └── windows-1252.txt │ ├── he/ │ │ ├── ibm862.logical.txt │ │ ├── ibm862.visual.txt │ │ ├── iso-8859-8.txt │ │ ├── utf-8.txt │ │ └── windows-1255.txt │ ├── hi/ │ │ └── utf-8.txt │ ├── hr/ │ │ ├── ibm852.txt │ │ ├── iso-8859-13.txt │ │ ├── iso-8859-16.txt │ │ ├── iso-8859-2.txt │ │ ├── mac-centraleurope.txt │ │ ├── utf-8.txt │ │ └── windows-1250.txt │ ├── hu/ │ │ ├── iso-8859-2.txt │ │ ├── utf-8.txt │ │ └── windows-1250.txt │ ├── it/ │ │ ├── iso-8859-1.txt │ │ └── utf-8.txt │ ├── ja/ │ │ ├── euc-jp.txt │ │ ├── iso-2022-jp.txt │ │ ├── shift_jis.txt │ │ ├── utf-16be.txt │ │ ├── utf-16le.txt │ │ └── utf-8.txt │ ├── ka/ │ │ ├── georgian-academy.txt │ │ ├── georgian-ps.txt │ │ └── utf-8.txt │ ├── ko/ │ │ ├── iso-2022-kr.txt │ │ ├── johab.txt │ │ ├── uhc.smi │ │ ├── utf-16.le │ │ ├── utf-32.be │ │ └── utf-8.txt │ ├── lt/ │ │ ├── iso-8859-10.txt │ │ ├── iso-8859-13.txt │ │ ├── iso-8859-4.txt │ │ └── utf-8.txt │ ├── lv/ │ │ ├── iso-8859-10.txt │ │ ├── iso-8859-13.txt │ │ ├── iso-8859-4.txt │ │ └── utf-8.txt │ ├── mk/ │ │ ├── ibm855.txt │ │ ├── iso-8859-5.txt │ │ ├── utf-8.txt │ │ └── windows-1251.txt │ ├── mt/ │ │ ├── iso-8859-3.txt │ │ └── utf-8.txt │ ├── no/ │ │ ├── ibm865.txt │ │ ├── iso-8859-1.txt │ │ ├── iso-8859-15.txt │ │ ├── utf-8.txt │ │ └── windows-1252.txt │ ├── pl/ │ │ ├── ibm852.txt │ │ ├── iso-8859-13.txt │ │ ├── iso-8859-16.txt │ │ ├── iso-8859-2.txt │ │ ├── mac-centraleurope.txt │ │ ├── utf-8.txt │ │ └── windows-1250.txt │ ├── pt/ │ │ ├── iso-8859-1.txt │ │ └── utf-8.txt │ ├── ro/ │ │ ├── ibm852.txt │ │ ├── iso-8859-16.txt │ │ ├── utf-8.txt │ │ └── windows-1250.txt │ ├── ru/ │ │ ├── ibm855.txt │ │ ├── ibm866.txt │ │ ├── iso-8859-5.txt │ │ ├── koi8-r.txt │ │ ├── mac-cyrillic.txt │ │ ├── utf-8.txt │ │ └── windows-1251.txt │ ├── sk/ │ │ ├── ibm852.txt │ │ ├── iso-8859-2.txt │ │ ├── mac-centraleurope.txt │ │ ├── utf-8.txt │ │ └── windows-1250.txt │ ├── sl/ │ │ ├── ibm852.txt │ │ ├── iso-8859-16.txt │ │ ├── iso-8859-2.txt │ │ ├── mac-centraleurope.txt │ │ ├── utf-8.txt │ │ └── windows-1250.txt │ ├── sr/ │ │ ├── iso-8859-5.txt │ │ ├── utf-8.txt │ │ └── windows-1251.txt │ ├── sv/ │ │ ├── iso-8859-1.txt │ │ ├── utf-8.txt │ │ └── windows-1252.txt │ ├── th/ │ │ ├── iso-8859-11.txt │ │ ├── tis-620.txt │ │ └── utf-8.txt │ ├── tr/ │ │ ├── iso-8859-3.txt │ │ ├── iso-8859-9.txt │ │ └── utf-8.txt │ ├── uk/ │ │ ├── utf-8.txt │ │ └── windows-1251.txt │ ├── vi/ │ │ ├── utf-8.txt │ │ ├── viscii.txt │ │ └── windows-1258.txt │ └── zh/ │ ├── big5.txt │ ├── euc-tw.txt │ ├── gb18030.txt │ └── utf-8.txt ├── scripts/ │ └── extract_change_log.py ├── src/ │ ├── CMakeLists.txt │ ├── Common/ │ │ ├── CMakeLists.txt │ │ ├── CommandLineParser.cpp │ │ ├── CommandLineParser.h │ │ ├── ConsoleSettings.cpp │ │ ├── ConsoleSettings.h │ │ ├── ErrorFunction.cpp │ │ ├── ErrorFunction.h │ │ ├── FileFunction.cpp │ │ ├── FileFunction.h │ │ ├── ResourceLoader.cpp │ │ ├── ResourceLoader.h │ │ ├── SingleApplication.h │ │ ├── ThreadPool/ │ │ │ ├── SafeQueue.h │ │ │ └── ThreadPool.h │ │ ├── TimeStamp.cpp │ │ ├── TimeStamp.h │ │ ├── noncopyable.h │ │ ├── tstring.cpp │ │ └── tstring.h │ ├── Control/ │ │ ├── CMakeLists.txt │ │ ├── ControlStyle.h │ │ ├── TListView.cpp │ │ ├── TListView.h │ │ ├── TMenu.cpp │ │ └── TMenu.h │ ├── Core/ │ │ ├── CMakeLists.txt │ │ ├── CharsetCode.cpp │ │ ├── CharsetCode.h │ │ ├── Config.cpp │ │ ├── Config.h │ │ ├── Core.cpp │ │ ├── Core.h │ │ ├── Detect.cpp │ │ ├── Detect.h │ │ ├── Exceptions.cpp │ │ ├── Exceptions.h │ │ ├── LineBreaks.cpp │ │ ├── LineBreaks.h │ │ ├── Messages.cpp │ │ ├── Messages.h │ │ ├── TranslatorBase.h │ │ ├── UCNVHelper.cpp │ │ ├── UCNVHelper.h │ │ ├── Vietnamese.cpp │ │ ├── Vietnamese.h │ │ ├── cedHelper.h │ │ └── doublemap.h │ ├── SmartCharsetConverter/ │ │ ├── CLIHandler.cpp │ │ ├── CLIHandler.h │ │ ├── CMakeLists.txt │ │ ├── DialogMain.cpp │ │ ├── DialogMain.h │ │ ├── Resource/ │ │ │ └── lang_embed/ │ │ │ ├── English.json │ │ │ ├── Simplified Chinese.json │ │ │ └── Spanish.json │ │ ├── SmartCharsetConverter.cpp │ │ ├── SmartCharsetConverter.json │ │ ├── SmartCharsetConverter.rc │ │ └── resource.h │ ├── SmartCharsetConverter-imgui/ │ │ ├── CMakeLists.txt │ │ ├── FontAnalyzer.cpp │ │ ├── FontAnalyzer.h │ │ ├── FontLoader.cpp │ │ ├── FontLoader.h │ │ ├── ListView.cpp │ │ ├── ListView.h │ │ ├── MainWindow.cpp │ │ ├── MainWindow.h │ │ ├── Resource/ │ │ │ └── lang_embed/ │ │ │ ├── English.json │ │ │ ├── Simplified Chinese.json │ │ │ └── Spanish.json │ │ ├── SmartCharsetConverter.rc │ │ ├── UnicodeTable.cpp │ │ ├── UnicodeTable.h │ │ ├── main.cpp │ │ └── resource.h │ └── Translator/ │ ├── CMakeLists.txt │ ├── LanguageService.cpp │ ├── LanguageService.h │ ├── StringId.h │ ├── Translator.cpp │ ├── Translator.h │ └── internal/ │ ├── Language.cpp │ └── Language.h ├── tests/ │ ├── CMakeLists.txt │ ├── Core_Vietnamese_test.cpp │ ├── Core_test.cpp │ ├── Helper.cpp │ ├── Helper.h │ ├── LineBreaks_test.cpp │ ├── String_test.cpp │ ├── Vietnamese_test.cpp │ ├── config.h.in │ ├── icu_test.cpp │ ├── memory_leak_detection.h │ ├── memory_leak_detection_win.h │ └── uchardet_samples_test.cpp ├── third_party/ │ ├── CMakeLists.txt │ ├── WTL/ │ │ ├── Include/ │ │ │ ├── atlapp.h │ │ │ ├── atlcrack.h │ │ │ ├── atlctrls.h │ │ │ ├── atlctrlw.h │ │ │ ├── atlctrlx.h │ │ │ ├── atlddx.h │ │ │ ├── atldlgs.h │ │ │ ├── atldwm.h │ │ │ ├── atlfind.h │ │ │ ├── atlframe.h │ │ │ ├── atlgdi.h │ │ │ ├── atlmisc.h │ │ │ ├── atlprint.h │ │ │ ├── atlres.h │ │ │ ├── atlribbon.h │ │ │ ├── atlscrl.h │ │ │ ├── atlsplit.h │ │ │ ├── atltheme.h │ │ │ ├── atluser.h │ │ │ └── atlwinx.h │ │ └── MS-PL.txt │ ├── ced/ │ │ ├── .gitignore │ │ ├── CMakeLists.txt │ │ ├── LICENSE │ │ ├── README.md │ │ ├── autogen.sh │ │ ├── compact_enc_det/ │ │ │ ├── compact_enc_det.cc │ │ │ ├── compact_enc_det.h │ │ │ ├── compact_enc_det_fuzz_test.cc │ │ │ ├── compact_enc_det_generated_tables.h │ │ │ ├── compact_enc_det_generated_tables2.h │ │ │ ├── compact_enc_det_hint_code.cc │ │ │ ├── compact_enc_det_hint_code.h │ │ │ ├── compact_enc_det_unittest.cc │ │ │ └── detail_head_string.inc │ │ └── util/ │ │ ├── basictypes.h │ │ ├── case_insensitive_hash.h │ │ ├── commandlineflags.h │ │ ├── encodings/ │ │ │ ├── encodings.cc │ │ │ ├── encodings.h │ │ │ ├── encodings.pb.h │ │ │ └── encodings_unittest.cc │ │ ├── languages/ │ │ │ ├── languages.cc │ │ │ ├── languages.h │ │ │ └── languages.pb.h │ │ ├── logging.h │ │ ├── port.h │ │ ├── string_util.h │ │ └── varsetter.h │ ├── guicon/ │ │ ├── CMakeLists.txt │ │ ├── guicon.cpp │ │ └── guicon.h │ └── uchardet/ │ ├── WinCodePage_Identifiers.txt │ ├── uchardet/ │ │ ├── AUTHORS │ │ ├── CMakeLists.txt │ │ ├── COPYING │ │ ├── INSTALL │ │ ├── Origin_GitHub.url │ │ ├── README.md │ │ ├── _GitHub.url │ │ ├── _GitHub_libchardet.url │ │ ├── doc/ │ │ │ ├── CMakeLists.txt │ │ │ ├── README.maintainer │ │ │ └── uchardet.1 │ │ ├── script/ │ │ │ ├── BuildLangModel.py │ │ │ ├── BuildLangModelLogs/ │ │ │ │ ├── LangAfricaansModel.log │ │ │ │ ├── LangArabicModel.log │ │ │ │ ├── LangBelarusianModel.log │ │ │ │ ├── LangCroatianModel.log │ │ │ │ ├── LangCzechModel.log │ │ │ │ ├── LangDanishModel.log │ │ │ │ ├── LangEsperantoModel.log │ │ │ │ ├── LangEstonianModel.log │ │ │ │ ├── LangFinnishModel.log │ │ │ │ ├── LangFrenchModel.log │ │ │ │ ├── LangGermanModel.log │ │ │ │ ├── LangGreekModel.log │ │ │ │ ├── LangHungarianModel.log │ │ │ │ ├── LangIrishModel.log │ │ │ │ ├── LangItalianModel.log │ │ │ │ ├── LangLatvianModel.log │ │ │ │ ├── LangLithuanianModel.log │ │ │ │ ├── LangMalteseModel.log │ │ │ │ ├── LangNederlandsModel.log │ │ │ │ ├── LangPolishModel.log │ │ │ │ ├── LangPortugueseModel.log │ │ │ │ ├── LangRomanianModel.log │ │ │ │ ├── LangSlovakModel.log │ │ │ │ ├── LangSloveneModel.log │ │ │ │ ├── LangSpanishModel.log │ │ │ │ ├── LangSwedishModel.log │ │ │ │ ├── LangThaiModel.log │ │ │ │ ├── LangTurkishModel.log │ │ │ │ └── LangVietnameseModel.log │ │ │ ├── README │ │ │ ├── charsets/ │ │ │ │ ├── codepoints.py │ │ │ │ ├── db.py │ │ │ │ ├── ibm852.py │ │ │ │ ├── iso-8859-1.py │ │ │ │ ├── iso-8859-10.py │ │ │ │ ├── iso-8859-11.py │ │ │ │ ├── iso-8859-13.py │ │ │ │ ├── iso-8859-15.py │ │ │ │ ├── iso-8859-16.py │ │ │ │ ├── iso-8859-2.py │ │ │ │ ├── iso-8859-3.py │ │ │ │ ├── iso-8859-4.py │ │ │ │ ├── iso-8859-6.py │ │ │ │ ├── iso-8859-7.py │ │ │ │ ├── iso-8859-9.py │ │ │ │ ├── mac-centraleurope.py │ │ │ │ ├── tis-620.py │ │ │ │ ├── viscii.py │ │ │ │ ├── windows-1250.py │ │ │ │ ├── windows-1251.py │ │ │ │ ├── windows-1252.py │ │ │ │ ├── windows-1253.py │ │ │ │ ├── windows-1256.py │ │ │ │ ├── windows-1257.py │ │ │ │ └── windows-1258.py │ │ │ ├── debug.sh │ │ │ ├── gen.sh │ │ │ ├── header-template.cpp │ │ │ ├── langs/ │ │ │ │ ├── af.py │ │ │ │ ├── ar.py │ │ │ │ ├── be.py │ │ │ │ ├── cs.py │ │ │ │ ├── da.py │ │ │ │ ├── de.py │ │ │ │ ├── el.py │ │ │ │ ├── eo.py │ │ │ │ ├── es.py │ │ │ │ ├── et.py │ │ │ │ ├── fi.py │ │ │ │ ├── fr.py │ │ │ │ ├── ga.py │ │ │ │ ├── hr.py │ │ │ │ ├── hu.py │ │ │ │ ├── it.py │ │ │ │ ├── lt.py │ │ │ │ ├── lv.py │ │ │ │ ├── mt.py │ │ │ │ ├── nl.py │ │ │ │ ├── pl.py │ │ │ │ ├── pt.py │ │ │ │ ├── ro.py │ │ │ │ ├── sk.py │ │ │ │ ├── sl.py │ │ │ │ ├── sv.py │ │ │ │ ├── th.py │ │ │ │ ├── tr.py │ │ │ │ └── vi.py │ │ │ ├── release.sh │ │ │ ├── requirements.txt │ │ │ └── win32.sh │ │ ├── src/ │ │ │ ├── CMakeLists.txt │ │ │ ├── CharDistribution.cpp │ │ │ ├── CharDistribution.h │ │ │ ├── JpCntx.cpp │ │ │ ├── JpCntx.h │ │ │ ├── LangModels/ │ │ │ │ ├── LangAfricaansModel.cpp │ │ │ │ ├── LangArabicModel.cpp │ │ │ │ ├── LangBelarusianModel.cpp │ │ │ │ ├── LangBulgarianModel.cpp │ │ │ │ ├── LangCroatianModel.cpp │ │ │ │ ├── LangCzechModel.cpp │ │ │ │ ├── LangDanishModel.cpp │ │ │ │ ├── LangEsperantoModel.cpp │ │ │ │ ├── LangEstonianModel.cpp │ │ │ │ ├── LangFinnishModel.cpp │ │ │ │ ├── LangFrenchModel.cpp │ │ │ │ ├── LangGermanModel.cpp │ │ │ │ ├── LangGreekModel.cpp │ │ │ │ ├── LangHebrewModel.cpp │ │ │ │ ├── LangHungarianModel.cpp │ │ │ │ ├── LangIrishModel.cpp │ │ │ │ ├── LangItalianModel.cpp │ │ │ │ ├── LangLatvianModel.cpp │ │ │ │ ├── LangLithuanianModel.cpp │ │ │ │ ├── LangMalteseModel.cpp │ │ │ │ ├── LangNederlandsModel.cpp │ │ │ │ ├── LangPolishModel.cpp │ │ │ │ ├── LangPortugueseModel.cpp │ │ │ │ ├── LangRomanianModel.cpp │ │ │ │ ├── LangRussianModel.cpp │ │ │ │ ├── LangSlovakModel.cpp │ │ │ │ ├── LangSloveneModel.cpp │ │ │ │ ├── LangSpanishModel.cpp │ │ │ │ ├── LangSwedishModel.cpp │ │ │ │ ├── LangThaiModel.cpp │ │ │ │ ├── LangTurkishModel.cpp │ │ │ │ └── LangVietnameseModel.cpp │ │ │ ├── nsBig5Prober.cpp │ │ │ ├── nsBig5Prober.h │ │ │ ├── nsCharSetProber.cpp │ │ │ ├── nsCharSetProber.h │ │ │ ├── nsCodingStateMachine.h │ │ │ ├── nsEUCJPProber.cpp │ │ │ ├── nsEUCJPProber.h │ │ │ ├── nsEUCKRProber.cpp │ │ │ ├── nsEUCKRProber.h │ │ │ ├── nsEUCTWProber.cpp │ │ │ ├── nsEUCTWProber.h │ │ │ ├── nsEscCharsetProber.cpp │ │ │ ├── nsEscCharsetProber.h │ │ │ ├── nsEscSM.cpp │ │ │ ├── nsGB18030Prober.cpp │ │ │ ├── nsGB18030Prober.h │ │ │ ├── nsGB2312Prober.cpp │ │ │ ├── nsGB2312Prober.h │ │ │ ├── nsHebrewProber.cpp │ │ │ ├── nsHebrewProber.h │ │ │ ├── nsLatin1Prober.cpp │ │ │ ├── nsLatin1Prober.h │ │ │ ├── nsMBCSGroupProber.cpp │ │ │ ├── nsMBCSGroupProber.h │ │ │ ├── nsMBCSSM.cpp │ │ │ ├── nsPkgInt.h │ │ │ ├── nsSBCSGroupProber.cpp │ │ │ ├── nsSBCSGroupProber.h │ │ │ ├── nsSBCharSetProber.cpp │ │ │ ├── nsSBCharSetProber.h │ │ │ ├── nsSJISProber.cpp │ │ │ ├── nsSJISProber.h │ │ │ ├── nsUTF8Prober.cpp │ │ │ ├── nsUTF8Prober.h │ │ │ ├── nsUniversalDetector.cpp │ │ │ ├── nsUniversalDetector.h │ │ │ ├── nscore.h │ │ │ ├── prmem.h │ │ │ ├── symbols.cmake │ │ │ ├── tables/ │ │ │ │ ├── Big5Freq.tab │ │ │ │ ├── EUCKRFreq.tab │ │ │ │ ├── EUCTWFreq.tab │ │ │ │ ├── GB18030Freq.tab │ │ │ │ ├── GB2312Freq.tab │ │ │ │ └── JISFreq.tab │ │ │ ├── tools/ │ │ │ │ ├── CMakeLists.txt │ │ │ │ └── uchardet.cpp │ │ │ ├── uchardet.cpp │ │ │ └── uchardet.h │ │ ├── uchardet.doap │ │ └── uchardet.pc.in │ └── version.txt └── vcpkg.json