gitextract_mj0hkj7m/ ├── .github/ │ └── workflows/ │ ├── go.yml │ └── stale-issues.yml ├── .gitignore ├── CHANGELOG.md ├── README.md ├── config.go ├── deps/ │ ├── simhash/ │ │ ├── .github/ │ │ │ └── workflows/ │ │ │ └── cmake.yml │ │ ├── .gitignore │ │ ├── .gitmodules │ │ ├── .travis.yml │ │ ├── CMakeLists.txt │ │ ├── ChangeLog.md │ │ ├── README.md │ │ ├── benchmark/ │ │ │ ├── CMakeLists.txt │ │ │ ├── benchmarking.cpp │ │ │ └── lib/ │ │ │ ├── Simhasher_benchmark.h │ │ │ ├── utils.h │ │ │ └── vals.h │ │ ├── example/ │ │ │ ├── CMakeLists.txt │ │ │ └── demo.cpp │ │ ├── include/ │ │ │ └── simhash/ │ │ │ ├── Simhasher.hpp │ │ │ └── jenkins.h │ │ ├── submodules/ │ │ │ └── cppjieba/ │ │ │ ├── .github/ │ │ │ │ └── workflows/ │ │ │ │ └── cmake.yml │ │ │ ├── .gitignore │ │ │ ├── .gitmodules │ │ │ ├── CMakeLists.txt │ │ │ ├── ChangeLog.md │ │ │ ├── LICENSE │ │ │ ├── README.md │ │ │ ├── deps/ │ │ │ │ └── limonp/ │ │ │ │ ├── .github/ │ │ │ │ │ └── workflows/ │ │ │ │ │ └── cmake.yml │ │ │ │ ├── .gitignore │ │ │ │ ├── .gitmodules │ │ │ │ ├── CMakeLists.txt │ │ │ │ ├── ChangeLog.md │ │ │ │ ├── LICENSE │ │ │ │ ├── README.md │ │ │ │ ├── include/ │ │ │ │ │ └── limonp/ │ │ │ │ │ ├── ArgvContext.hpp │ │ │ │ │ ├── BlockingQueue.hpp │ │ │ │ │ ├── BoundedBlockingQueue.hpp │ │ │ │ │ ├── BoundedQueue.hpp │ │ │ │ │ ├── Closure.hpp │ │ │ │ │ ├── Colors.hpp │ │ │ │ │ ├── Condition.hpp │ │ │ │ │ ├── Config.hpp │ │ │ │ │ ├── FileLock.hpp │ │ │ │ │ ├── ForcePublic.hpp │ │ │ │ │ ├── LocalVector.hpp │ │ │ │ │ ├── Logging.hpp │ │ │ │ │ ├── Md5.hpp │ │ │ │ │ ├── MutexLock.hpp │ │ │ │ │ ├── NonCopyable.hpp │ │ │ │ │ ├── StdExtension.hpp │ │ │ │ │ ├── StringUtil.hpp │ │ │ │ │ ├── Thread.hpp │ │ │ │ │ └── ThreadPool.hpp │ │ │ │ └── test/ │ │ │ │ ├── CMakeLists.txt │ │ │ │ ├── demo.cpp │ │ │ │ ├── testdata/ │ │ │ │ │ ├── 1.conf │ │ │ │ │ ├── StdExtension.data │ │ │ │ │ ├── dict.gbk │ │ │ │ │ ├── dict.utf8 │ │ │ │ │ ├── io_testfile │ │ │ │ │ ├── jieba.dict.0.1.utf8 │ │ │ │ │ ├── jieba.dict.0.utf8 │ │ │ │ │ ├── jieba.dict.1.utf8 │ │ │ │ │ └── jieba.dict.2.utf8 │ │ │ │ ├── thread_pool_demo.cpp │ │ │ │ └── unittest/ │ │ │ │ ├── CMakeLists.txt │ │ │ │ ├── TArgvContext.cpp │ │ │ │ ├── TBlockingQueue.cpp │ │ │ │ ├── TBoundedQueue.cpp │ │ │ │ ├── TCastFloat.cpp │ │ │ │ ├── TClosure.cpp │ │ │ │ ├── TColorPrint.cpp │ │ │ │ ├── TConfig.cpp │ │ │ │ ├── TFileLock.cpp │ │ │ │ ├── TLocalVector.cpp │ │ │ │ ├── TLogging.cpp │ │ │ │ ├── TMd5.cpp │ │ │ │ ├── TMutexLock.cpp │ │ │ │ ├── TStdExtension.cpp │ │ │ │ ├── TStringUtil.cpp │ │ │ │ ├── TThread.cpp │ │ │ │ ├── TThreadPool.cpp │ │ │ │ └── gtest_main.cpp │ │ │ ├── dict/ │ │ │ │ ├── README.md │ │ │ │ ├── hmm_model.utf8 │ │ │ │ ├── idf.utf8 │ │ │ │ ├── jieba.dict.utf8 │ │ │ │ ├── pos_dict/ │ │ │ │ │ ├── char_state_tab.utf8 │ │ │ │ │ ├── prob_emit.utf8 │ │ │ │ │ ├── prob_start.utf8 │ │ │ │ │ └── prob_trans.utf8 │ │ │ │ ├── stop_words.utf8 │ │ │ │ └── user.dict.utf8 │ │ │ ├── include/ │ │ │ │ └── cppjieba/ │ │ │ │ ├── DictTrie.hpp │ │ │ │ ├── FullSegment.hpp │ │ │ │ ├── HMMModel.hpp │ │ │ │ ├── HMMSegment.hpp │ │ │ │ ├── Jieba.hpp │ │ │ │ ├── KeywordExtractor.hpp │ │ │ │ ├── MPSegment.hpp │ │ │ │ ├── MixSegment.hpp │ │ │ │ ├── PosTagger.hpp │ │ │ │ ├── PreFilter.hpp │ │ │ │ ├── QuerySegment.hpp │ │ │ │ ├── SegmentBase.hpp │ │ │ │ ├── SegmentTagged.hpp │ │ │ │ ├── TextRankExtractor.hpp │ │ │ │ ├── Trie.hpp │ │ │ │ └── Unicode.hpp │ │ │ └── test/ │ │ │ ├── CMakeLists.txt │ │ │ ├── demo.cpp │ │ │ ├── load_test.cpp │ │ │ ├── testdata/ │ │ │ │ ├── curl.res │ │ │ │ ├── extra_dict/ │ │ │ │ │ └── jieba.dict.small.utf8 │ │ │ │ ├── gbk_dict/ │ │ │ │ │ ├── hmm_model.gbk │ │ │ │ │ └── jieba.dict.gbk │ │ │ │ ├── jieba.dict.0.1.utf8 │ │ │ │ ├── jieba.dict.0.utf8 │ │ │ │ ├── jieba.dict.1.utf8 │ │ │ │ ├── jieba.dict.2.utf8 │ │ │ │ ├── load_test.urls │ │ │ │ ├── review.100 │ │ │ │ ├── review.100.res │ │ │ │ ├── server.conf │ │ │ │ ├── testlines.gbk │ │ │ │ ├── testlines.utf8 │ │ │ │ ├── userdict.2.utf8 │ │ │ │ ├── userdict.english │ │ │ │ ├── userdict.utf8 │ │ │ │ └── weicheng.utf8 │ │ │ └── unittest/ │ │ │ ├── CMakeLists.txt │ │ │ ├── gtest_main.cpp │ │ │ ├── jieba_test.cpp │ │ │ ├── keyword_extractor_test.cpp │ │ │ ├── pos_tagger_test.cpp │ │ │ ├── pre_filter_test.cpp │ │ │ ├── segments_test.cpp │ │ │ ├── textrank_test.cpp │ │ │ ├── trie_test.cpp │ │ │ └── unicode_test.cpp │ │ └── test/ │ │ ├── CMakeLists.txt │ │ ├── load_test.cpp │ │ ├── testdata/ │ │ │ ├── news_content │ │ │ ├── news_content.2 │ │ │ ├── news_content.3 │ │ │ └── news_content.4 │ │ └── unittest/ │ │ ├── CMakeLists.txt │ │ ├── TJenkins.cpp │ │ ├── TSimhash.cpp │ │ └── gtest_main.cpp │ └── update.sh ├── go.mod ├── simhash.cc ├── simhash.go ├── simhash.h └── simhash_test.go