gitextract_3d9tsb5u/ ├── .gitignore ├── LICENSE ├── README.md ├── README_EN.md ├── cache/ │ ├── make_vocab.py │ ├── make_vocab.sh │ ├── vocab.txt │ ├── vocab_all.txt │ ├── vocab_guwen.txt │ ├── vocab_seg.txt │ └── vocab_small.txt ├── config/ │ ├── model_config.json │ ├── model_config_small.json │ └── model_config_test.json ├── eval.py ├── generate.py ├── generate_texts.py ├── requirements.txt ├── scripts/ │ ├── generate.sh │ └── train.sh ├── tokenizations/ │ ├── bpe_tokenizer.py │ ├── encoder.json │ ├── thulac_dict/ │ │ └── seg │ ├── tokenization_bert.py │ ├── tokenization_bert_word_level.py │ └── vocab.bpe ├── train.json ├── train.py └── train_single.py