gitextract_r3nhpke0/ ├── README.md └── code/ ├── .gitignore ├── Config.py ├── Dockerfile ├── NEZHA/ │ ├── configuration_nezha.py │ └── modeling_nezha.py ├── bert-base-chinese/ │ └── config.json ├── bert-base-count3/ │ ├── finetuning/ │ │ ├── .ipynb_checkpoints/ │ │ │ └── PyTorch_Bert-Squad_OnnxRuntime_GPU-checkpoint.ipynb │ │ ├── Config.py │ │ ├── NEZHA/ │ │ │ ├── configuration_nezha.py │ │ │ └── modeling_nezha.py │ │ ├── model.py │ │ ├── models/ │ │ │ └── gitkeep │ │ ├── multi_gpu_QA.py │ │ └── utils.py │ └── pretrain/ │ ├── NLP_Utils.py │ ├── __init__.py │ ├── bert_model/ │ │ └── gitkeep │ ├── train_bert.py │ └── transformers1/ │ ├── __init__.py │ ├── __main__.py │ ├── activations.py │ ├── another_try.py │ ├── benchmark/ │ │ ├── __init__.py │ │ ├── benchmark.py │ │ ├── benchmark_args.py │ │ ├── benchmark_args_utils.py │ │ └── benchmark_utils.py │ ├── benchmark_utils.py │ ├── commands/ │ │ ├── __init__.py │ │ ├── convert.py │ │ ├── download.py │ │ ├── env.py │ │ ├── run.py │ │ ├── serving.py │ │ ├── train.py │ │ ├── transformers_cli.py │ │ └── user.py │ ├── configuration_albert.py │ ├── configuration_auto.py │ ├── configuration_bart.py │ ├── configuration_bert.py │ ├── configuration_camembert.py │ ├── configuration_ctrl.py │ ├── configuration_distilbert.py │ ├── configuration_electra.py │ ├── configuration_encoder_decoder.py │ ├── configuration_flaubert.py │ ├── configuration_gpt2.py │ ├── configuration_longformer.py │ ├── configuration_marian.py │ ├── configuration_mmbt.py │ ├── configuration_openai.py │ ├── configuration_reformer.py │ ├── configuration_roberta.py │ ├── configuration_t5.py │ ├── configuration_transfo_xl.py │ ├── configuration_utils.py │ ├── configuration_xlm.py │ ├── configuration_xlm_roberta.py │ ├── configuration_xlnet.py │ ├── convert_albert_original_tf_checkpoint_to_pytorch.py │ ├── convert_bart_original_pytorch_checkpoint_to_pytorch.py │ ├── convert_bert_original_tf_checkpoint_to_pytorch.py │ ├── convert_bert_pytorch_checkpoint_to_original_tf.py │ ├── convert_dialogpt_original_pytorch_checkpoint_to_pytorch.py │ ├── convert_electra_original_tf_checkpoint_to_pytorch.py │ ├── convert_gpt2_original_tf_checkpoint_to_pytorch.py │ ├── convert_graph_to_onnx.py │ ├── convert_longformer_original_pytorch_lightning_to_pytorch.py │ ├── convert_marian_to_pytorch.py │ ├── convert_openai_original_tf_checkpoint_to_pytorch.py │ ├── convert_pytorch_checkpoint_to_tf2.py │ ├── convert_reformer_trax_checkpoint_to_pytorch.py │ ├── convert_roberta_original_pytorch_checkpoint_to_pytorch.py │ ├── convert_t5_original_tf_checkpoint_to_pytorch.py │ ├── convert_transfo_xl_original_tf_checkpoint_to_pytorch.py │ ├── convert_xlm_original_pytorch_checkpoint_to_pytorch.py │ ├── convert_xlnet_original_tf_checkpoint_to_pytorch.py │ ├── data/ │ │ ├── __init__.py │ │ ├── data_collator.py │ │ ├── datasets/ │ │ │ ├── __init__.py │ │ │ ├── glue.py │ │ │ └── language_modeling.py │ │ ├── metrics/ │ │ │ ├── __init__.py │ │ │ └── squad_metrics.py │ │ └── processors/ │ │ ├── __init__.py │ │ ├── glue.py │ │ ├── squad.py │ │ ├── utils.py │ │ └── xnli.py │ ├── file.py │ ├── file_utils.py │ ├── filep.py │ ├── hf_api.py │ ├── hf_argparser.py │ ├── modelcard.py │ ├── modeling_albert.py │ ├── modeling_auto.py │ ├── modeling_bart.py │ ├── modeling_beam_search.py │ ├── modeling_bert.py │ ├── modeling_camembert.py │ ├── modeling_ctrl.py │ ├── modeling_distilbert.py │ ├── modeling_electra.py │ ├── modeling_encoder_decoder.py │ ├── modeling_flaubert.py │ ├── modeling_gpt2.py │ ├── modeling_longformer.py │ ├── modeling_marian.py │ ├── modeling_mmbt.py │ ├── modeling_openai.py │ ├── modeling_reformer.py │ ├── modeling_roberta.py │ ├── modeling_t5.py │ ├── modeling_tf_albert.py │ ├── modeling_tf_auto.py │ ├── modeling_tf_bert.py │ ├── modeling_tf_camembert.py │ ├── modeling_tf_ctrl.py │ ├── modeling_tf_distilbert.py │ ├── modeling_tf_electra.py │ ├── modeling_tf_flaubert.py │ ├── modeling_tf_gpt2.py │ ├── modeling_tf_openai.py │ ├── modeling_tf_pytorch_utils.py │ ├── modeling_tf_roberta.py │ ├── modeling_tf_t5.py │ ├── modeling_tf_transfo_xl.py │ ├── modeling_tf_transfo_xl_utilities.py │ ├── modeling_tf_utils.py │ ├── modeling_tf_xlm.py │ ├── modeling_tf_xlm_roberta.py │ ├── modeling_tf_xlnet.py │ ├── modeling_transfo_xl.py │ ├── modeling_transfo_xl_utilities.py │ ├── modeling_utils.py │ ├── modeling_xlm.py │ ├── modeling_xlm_roberta.py │ ├── modeling_xlnet.py │ ├── optimization.py │ ├── optimization_tf.py │ ├── pipelines.py │ ├── tokenization_albert.py │ ├── tokenization_auto.py │ ├── tokenization_bart.py │ ├── tokenization_bert.py │ ├── tokenization_bert_japanese.py │ ├── tokenization_camembert.py │ ├── tokenization_ctrl.py │ ├── tokenization_distilbert.py │ ├── tokenization_electra.py │ ├── tokenization_flaubert.py │ ├── tokenization_gpt2.py │ ├── tokenization_longformer.py │ ├── tokenization_marian.py │ ├── tokenization_openai.py │ ├── tokenization_reformer.py │ ├── tokenization_roberta.py │ ├── tokenization_t5.py │ ├── tokenization_transfo_xl.py │ ├── tokenization_utils.py │ ├── tokenization_xlm.py │ ├── tokenization_xlm_roberta.py │ ├── tokenization_xlnet.py │ ├── trainer.py │ ├── trainer_tf.py │ ├── trainer_utils.py │ ├── training_args.py │ ├── training_args_tf.py │ ├── try.py │ └── utils_encoder_decoder.py ├── bert-base-count3-len100/ │ └── finetuning/ │ ├── .ipynb_checkpoints/ │ │ └── PyTorch_Bert-Squad_OnnxRuntime_GPU-checkpoint.ipynb │ ├── Config.py │ ├── NEZHA/ │ │ ├── configuration_nezha.py │ │ └── modeling_nezha.py │ ├── model.py │ ├── models/ │ │ └── gitkeep │ ├── multi_gpu_QA.py │ └── utils.py ├── bert-base-count5/ │ ├── finetuning/ │ │ ├── .ipynb_checkpoints/ │ │ │ └── PyTorch_Bert-Squad_OnnxRuntime_GPU-checkpoint.ipynb │ │ ├── Config.py │ │ ├── NEZHA/ │ │ │ ├── configuration_nezha.py │ │ │ └── modeling_nezha.py │ │ ├── model.py │ │ ├── models/ │ │ │ └── gitkeep │ │ ├── multi_gpu_QA.py │ │ └── utils.py │ └── pretrain/ │ ├── NLP_Utils.py │ ├── __init__.py │ ├── bert_model/ │ │ └── gitkeep │ ├── train_bert.py │ └── transformers1/ │ ├── __init__.py │ ├── __main__.py │ ├── activations.py │ ├── another_try.py │ ├── benchmark/ │ │ ├── __init__.py │ │ ├── benchmark.py │ │ ├── benchmark_args.py │ │ ├── benchmark_args_utils.py │ │ └── benchmark_utils.py │ ├── benchmark_utils.py │ ├── commands/ │ │ ├── __init__.py │ │ ├── convert.py │ │ ├── download.py │ │ ├── env.py │ │ ├── run.py │ │ ├── serving.py │ │ ├── train.py │ │ ├── transformers_cli.py │ │ └── user.py │ ├── configuration_albert.py │ ├── configuration_auto.py │ ├── configuration_bart.py │ ├── configuration_bert.py │ ├── configuration_camembert.py │ ├── configuration_ctrl.py │ ├── configuration_distilbert.py │ ├── configuration_electra.py │ ├── configuration_encoder_decoder.py │ ├── configuration_flaubert.py │ ├── configuration_gpt2.py │ ├── configuration_longformer.py │ ├── configuration_marian.py │ ├── configuration_mmbt.py │ ├── configuration_openai.py │ ├── configuration_reformer.py │ ├── configuration_roberta.py │ ├── configuration_t5.py │ ├── configuration_transfo_xl.py │ ├── configuration_utils.py │ ├── configuration_xlm.py │ ├── configuration_xlm_roberta.py │ ├── configuration_xlnet.py │ ├── convert_albert_original_tf_checkpoint_to_pytorch.py │ ├── convert_bart_original_pytorch_checkpoint_to_pytorch.py │ ├── convert_bert_original_tf_checkpoint_to_pytorch.py │ ├── convert_bert_pytorch_checkpoint_to_original_tf.py │ ├── convert_dialogpt_original_pytorch_checkpoint_to_pytorch.py │ ├── convert_electra_original_tf_checkpoint_to_pytorch.py │ ├── convert_gpt2_original_tf_checkpoint_to_pytorch.py │ ├── convert_graph_to_onnx.py │ ├── convert_longformer_original_pytorch_lightning_to_pytorch.py │ ├── convert_marian_to_pytorch.py │ ├── convert_openai_original_tf_checkpoint_to_pytorch.py │ ├── convert_pytorch_checkpoint_to_tf2.py │ ├── convert_reformer_trax_checkpoint_to_pytorch.py │ ├── convert_roberta_original_pytorch_checkpoint_to_pytorch.py │ ├── convert_t5_original_tf_checkpoint_to_pytorch.py │ ├── convert_transfo_xl_original_tf_checkpoint_to_pytorch.py │ ├── convert_xlm_original_pytorch_checkpoint_to_pytorch.py │ ├── convert_xlnet_original_tf_checkpoint_to_pytorch.py │ ├── data/ │ │ ├── __init__.py │ │ ├── data_collator.py │ │ ├── datasets/ │ │ │ ├── __init__.py │ │ │ ├── glue.py │ │ │ └── language_modeling.py │ │ ├── metrics/ │ │ │ ├── __init__.py │ │ │ └── squad_metrics.py │ │ └── processors/ │ │ ├── __init__.py │ │ ├── glue.py │ │ ├── squad.py │ │ ├── utils.py │ │ └── xnli.py │ ├── file.py │ ├── file_utils.py │ ├── filep.py │ ├── hf_api.py │ ├── hf_argparser.py │ ├── modelcard.py │ ├── modeling_albert.py │ ├── modeling_auto.py │ ├── modeling_bart.py │ ├── modeling_beam_search.py │ ├── modeling_bert.py │ ├── modeling_camembert.py │ ├── modeling_ctrl.py │ ├── modeling_distilbert.py │ ├── modeling_electra.py │ ├── modeling_encoder_decoder.py │ ├── modeling_flaubert.py │ ├── modeling_gpt2.py │ ├── modeling_longformer.py │ ├── modeling_marian.py │ ├── modeling_mmbt.py │ ├── modeling_openai.py │ ├── modeling_reformer.py │ ├── modeling_roberta.py │ ├── modeling_t5.py │ ├── modeling_tf_albert.py │ ├── modeling_tf_auto.py │ ├── modeling_tf_bert.py │ ├── modeling_tf_camembert.py │ ├── modeling_tf_ctrl.py │ ├── modeling_tf_distilbert.py │ ├── modeling_tf_electra.py │ ├── modeling_tf_flaubert.py │ ├── modeling_tf_gpt2.py │ ├── modeling_tf_openai.py │ ├── modeling_tf_pytorch_utils.py │ ├── modeling_tf_roberta.py │ ├── modeling_tf_t5.py │ ├── modeling_tf_transfo_xl.py │ ├── modeling_tf_transfo_xl_utilities.py │ ├── modeling_tf_utils.py │ ├── modeling_tf_xlm.py │ ├── modeling_tf_xlm_roberta.py │ ├── modeling_tf_xlnet.py │ ├── modeling_transfo_xl.py │ ├── modeling_transfo_xl_utilities.py │ ├── modeling_utils.py │ ├── modeling_xlm.py │ ├── modeling_xlm_roberta.py │ ├── modeling_xlnet.py │ ├── optimization.py │ ├── optimization_tf.py │ ├── pipelines.py │ ├── tokenization_albert.py │ ├── tokenization_auto.py │ ├── tokenization_bart.py │ ├── tokenization_bert.py │ ├── tokenization_bert_japanese.py │ ├── tokenization_camembert.py │ ├── tokenization_ctrl.py │ ├── tokenization_distilbert.py │ ├── tokenization_electra.py │ ├── tokenization_flaubert.py │ ├── tokenization_gpt2.py │ ├── tokenization_longformer.py │ ├── tokenization_marian.py │ ├── tokenization_openai.py │ ├── tokenization_reformer.py │ ├── tokenization_roberta.py │ ├── tokenization_t5.py │ ├── tokenization_transfo_xl.py │ ├── tokenization_utils.py │ ├── tokenization_xlm.py │ ├── tokenization_xlm_roberta.py │ ├── tokenization_xlnet.py │ ├── trainer.py │ ├── trainer_tf.py │ ├── trainer_utils.py │ ├── training_args.py │ ├── training_args_tf.py │ ├── try.py │ └── utils_encoder_decoder.py ├── bert-base-count5-len32/ │ └── finetuning/ │ ├── .ipynb_checkpoints/ │ │ └── PyTorch_Bert-Squad_OnnxRuntime_GPU-checkpoint.ipynb │ ├── Config.py │ ├── NEZHA/ │ │ ├── configuration_nezha.py │ │ └── modeling_nezha.py │ ├── model.py │ ├── models/ │ │ └── gitkeep │ ├── multi_gpu_QA.py │ └── utils.py ├── build_vocab.py ├── docker_build.sh ├── main_fusion_thread.py ├── model.py ├── nezha-base-count3/ │ ├── finetuning/ │ │ ├── .ipynb_checkpoints/ │ │ │ └── PyTorch_Bert-Squad_OnnxRuntime_GPU-checkpoint.ipynb │ │ ├── Config.py │ │ ├── NEZHA/ │ │ │ ├── configuration_nezha.py │ │ │ └── modeling_nezha.py │ │ ├── model.py │ │ ├── models/ │ │ │ └── gitkeep │ │ ├── multi_gpu_QA.py │ │ └── utils.py │ └── pretrain/ │ ├── NEZHA/ │ │ ├── configuration_nezha.py │ │ └── modeling_nezha.py │ ├── NLP_Utils.py │ ├── __init__.py │ ├── nezha_model/ │ │ └── gitkeep │ ├── train_nezha.py │ └── transformers1/ │ ├── __init__.py │ ├── __main__.py │ ├── activations.py │ ├── another_try.py │ ├── benchmark/ │ │ ├── __init__.py │ │ ├── benchmark.py │ │ ├── benchmark_args.py │ │ ├── benchmark_args_utils.py │ │ └── benchmark_utils.py │ ├── benchmark_utils.py │ ├── commands/ │ │ ├── __init__.py │ │ ├── convert.py │ │ ├── download.py │ │ ├── env.py │ │ ├── run.py │ │ ├── serving.py │ │ ├── train.py │ │ ├── transformers_cli.py │ │ └── user.py │ ├── configuration_albert.py │ ├── configuration_auto.py │ ├── configuration_bart.py │ ├── configuration_bert.py │ ├── configuration_camembert.py │ ├── configuration_ctrl.py │ ├── configuration_distilbert.py │ ├── configuration_electra.py │ ├── configuration_encoder_decoder.py │ ├── configuration_flaubert.py │ ├── configuration_gpt2.py │ ├── configuration_longformer.py │ ├── configuration_marian.py │ ├── configuration_mmbt.py │ ├── configuration_openai.py │ ├── configuration_reformer.py │ ├── configuration_roberta.py │ ├── configuration_t5.py │ ├── configuration_transfo_xl.py │ ├── configuration_utils.py │ ├── configuration_xlm.py │ ├── configuration_xlm_roberta.py │ ├── configuration_xlnet.py │ ├── convert_albert_original_tf_checkpoint_to_pytorch.py │ ├── convert_bart_original_pytorch_checkpoint_to_pytorch.py │ ├── convert_bert_original_tf_checkpoint_to_pytorch.py │ ├── convert_bert_pytorch_checkpoint_to_original_tf.py │ ├── convert_dialogpt_original_pytorch_checkpoint_to_pytorch.py │ ├── convert_electra_original_tf_checkpoint_to_pytorch.py │ ├── convert_gpt2_original_tf_checkpoint_to_pytorch.py │ ├── convert_graph_to_onnx.py │ ├── convert_longformer_original_pytorch_lightning_to_pytorch.py │ ├── convert_marian_to_pytorch.py │ ├── convert_openai_original_tf_checkpoint_to_pytorch.py │ ├── convert_pytorch_checkpoint_to_tf2.py │ ├── convert_reformer_trax_checkpoint_to_pytorch.py │ ├── convert_roberta_original_pytorch_checkpoint_to_pytorch.py │ ├── convert_t5_original_tf_checkpoint_to_pytorch.py │ ├── convert_transfo_xl_original_tf_checkpoint_to_pytorch.py │ ├── convert_xlm_original_pytorch_checkpoint_to_pytorch.py │ ├── convert_xlnet_original_tf_checkpoint_to_pytorch.py │ ├── data/ │ │ ├── __init__.py │ │ ├── data_collator.py │ │ ├── datasets/ │ │ │ ├── __init__.py │ │ │ ├── glue.py │ │ │ └── language_modeling.py │ │ ├── metrics/ │ │ │ ├── __init__.py │ │ │ └── squad_metrics.py │ │ └── processors/ │ │ ├── __init__.py │ │ ├── glue.py │ │ ├── squad.py │ │ ├── utils.py │ │ └── xnli.py │ ├── file.py │ ├── file_utils.py │ ├── filep.py │ ├── hf_api.py │ ├── hf_argparser.py │ ├── modelcard.py │ ├── modeling_albert.py │ ├── modeling_auto.py │ ├── modeling_bart.py │ ├── modeling_beam_search.py │ ├── modeling_bert.py │ ├── modeling_camembert.py │ ├── modeling_ctrl.py │ ├── modeling_distilbert.py │ ├── modeling_electra.py │ ├── modeling_encoder_decoder.py │ ├── modeling_flaubert.py │ ├── modeling_gpt2.py │ ├── modeling_longformer.py │ ├── modeling_marian.py │ ├── modeling_mmbt.py │ ├── modeling_openai.py │ ├── modeling_reformer.py │ ├── modeling_roberta.py │ ├── modeling_t5.py │ ├── modeling_tf_albert.py │ ├── modeling_tf_auto.py │ ├── modeling_tf_bert.py │ ├── modeling_tf_camembert.py │ ├── modeling_tf_ctrl.py │ ├── modeling_tf_distilbert.py │ ├── modeling_tf_electra.py │ ├── modeling_tf_flaubert.py │ ├── modeling_tf_gpt2.py │ ├── modeling_tf_openai.py │ ├── modeling_tf_pytorch_utils.py │ ├── modeling_tf_roberta.py │ ├── modeling_tf_t5.py │ ├── modeling_tf_transfo_xl.py │ ├── modeling_tf_transfo_xl_utilities.py │ ├── modeling_tf_utils.py │ ├── modeling_tf_xlm.py │ ├── modeling_tf_xlm_roberta.py │ ├── modeling_tf_xlnet.py │ ├── modeling_transfo_xl.py │ ├── modeling_transfo_xl_utilities.py │ ├── modeling_utils.py │ ├── modeling_xlm.py │ ├── modeling_xlm_roberta.py │ ├── modeling_xlnet.py │ ├── optimization.py │ ├── optimization_tf.py │ ├── pipelines.py │ ├── tokenization_albert.py │ ├── tokenization_auto.py │ ├── tokenization_bart.py │ ├── tokenization_bert.py │ ├── tokenization_bert_japanese.py │ ├── tokenization_camembert.py │ ├── tokenization_ctrl.py │ ├── tokenization_distilbert.py │ ├── tokenization_electra.py │ ├── tokenization_flaubert.py │ ├── tokenization_gpt2.py │ ├── tokenization_longformer.py │ ├── tokenization_marian.py │ ├── tokenization_openai.py │ ├── tokenization_reformer.py │ ├── tokenization_roberta.py │ ├── tokenization_t5.py │ ├── tokenization_transfo_xl.py │ ├── tokenization_utils.py │ ├── tokenization_xlm.py │ ├── tokenization_xlm_roberta.py │ ├── tokenization_xlnet.py │ ├── trainer.py │ ├── trainer_tf.py │ ├── trainer_utils.py │ ├── training_args.py │ ├── training_args_tf.py │ ├── try.py │ └── utils_encoder_decoder.py ├── nezha-base-count5/ │ ├── finetuning/ │ │ ├── .ipynb_checkpoints/ │ │ │ └── PyTorch_Bert-Squad_OnnxRuntime_GPU-checkpoint.ipynb │ │ ├── Config.py │ │ ├── NEZHA/ │ │ │ ├── configuration_nezha.py │ │ │ └── modeling_nezha.py │ │ ├── model.py │ │ ├── models/ │ │ │ └── gitkeep │ │ ├── multi_gpu_QA.py │ │ └── utils.py │ └── pretrain/ │ ├── NEZHA/ │ │ ├── configuration_nezha.py │ │ └── modeling_nezha.py │ ├── NLP_Utils.py │ ├── __init__.py │ ├── nezha_model/ │ │ └── gitkeep │ ├── train_nezha.py │ └── transformers1/ │ ├── __init__.py │ ├── __main__.py │ ├── activations.py │ ├── another_try.py │ ├── benchmark/ │ │ ├── __init__.py │ │ ├── benchmark.py │ │ ├── benchmark_args.py │ │ ├── benchmark_args_utils.py │ │ └── benchmark_utils.py │ ├── benchmark_utils.py │ ├── commands/ │ │ ├── __init__.py │ │ ├── convert.py │ │ ├── download.py │ │ ├── env.py │ │ ├── run.py │ │ ├── serving.py │ │ ├── train.py │ │ ├── transformers_cli.py │ │ └── user.py │ ├── configuration_albert.py │ ├── configuration_auto.py │ ├── configuration_bart.py │ ├── configuration_bert.py │ ├── configuration_camembert.py │ ├── configuration_ctrl.py │ ├── configuration_distilbert.py │ ├── configuration_electra.py │ ├── configuration_encoder_decoder.py │ ├── configuration_flaubert.py │ ├── configuration_gpt2.py │ ├── configuration_longformer.py │ ├── configuration_marian.py │ ├── configuration_mmbt.py │ ├── configuration_openai.py │ ├── configuration_reformer.py │ ├── configuration_roberta.py │ ├── configuration_t5.py │ ├── configuration_transfo_xl.py │ ├── configuration_utils.py │ ├── configuration_xlm.py │ ├── configuration_xlm_roberta.py │ ├── configuration_xlnet.py │ ├── convert_albert_original_tf_checkpoint_to_pytorch.py │ ├── convert_bart_original_pytorch_checkpoint_to_pytorch.py │ ├── convert_bert_original_tf_checkpoint_to_pytorch.py │ ├── convert_bert_pytorch_checkpoint_to_original_tf.py │ ├── convert_dialogpt_original_pytorch_checkpoint_to_pytorch.py │ ├── convert_electra_original_tf_checkpoint_to_pytorch.py │ ├── convert_gpt2_original_tf_checkpoint_to_pytorch.py │ ├── convert_graph_to_onnx.py │ ├── convert_longformer_original_pytorch_lightning_to_pytorch.py │ ├── convert_marian_to_pytorch.py │ ├── convert_openai_original_tf_checkpoint_to_pytorch.py │ ├── convert_pytorch_checkpoint_to_tf2.py │ ├── convert_reformer_trax_checkpoint_to_pytorch.py │ ├── convert_roberta_original_pytorch_checkpoint_to_pytorch.py │ ├── convert_t5_original_tf_checkpoint_to_pytorch.py │ ├── convert_transfo_xl_original_tf_checkpoint_to_pytorch.py │ ├── convert_xlm_original_pytorch_checkpoint_to_pytorch.py │ ├── convert_xlnet_original_tf_checkpoint_to_pytorch.py │ ├── data/ │ │ ├── __init__.py │ │ ├── data_collator.py │ │ ├── datasets/ │ │ │ ├── __init__.py │ │ │ ├── glue.py │ │ │ └── language_modeling.py │ │ ├── metrics/ │ │ │ ├── __init__.py │ │ │ └── squad_metrics.py │ │ └── processors/ │ │ ├── __init__.py │ │ ├── glue.py │ │ ├── squad.py │ │ ├── utils.py │ │ └── xnli.py │ ├── file.py │ ├── file_utils.py │ ├── filep.py │ ├── hf_api.py │ ├── hf_argparser.py │ ├── modelcard.py │ ├── modeling_albert.py │ ├── modeling_auto.py │ ├── modeling_bart.py │ ├── modeling_beam_search.py │ ├── modeling_bert.py │ ├── modeling_camembert.py │ ├── modeling_ctrl.py │ ├── modeling_distilbert.py │ ├── modeling_electra.py │ ├── modeling_encoder_decoder.py │ ├── modeling_flaubert.py │ ├── modeling_gpt2.py │ ├── modeling_longformer.py │ ├── modeling_marian.py │ ├── modeling_mmbt.py │ ├── modeling_openai.py │ ├── modeling_reformer.py │ ├── modeling_roberta.py │ ├── modeling_t5.py │ ├── modeling_tf_albert.py │ ├── modeling_tf_auto.py │ ├── modeling_tf_bert.py │ ├── modeling_tf_camembert.py │ ├── modeling_tf_ctrl.py │ ├── modeling_tf_distilbert.py │ ├── modeling_tf_electra.py │ ├── modeling_tf_flaubert.py │ ├── modeling_tf_gpt2.py │ ├── modeling_tf_openai.py │ ├── modeling_tf_pytorch_utils.py │ ├── modeling_tf_roberta.py │ ├── modeling_tf_t5.py │ ├── modeling_tf_transfo_xl.py │ ├── modeling_tf_transfo_xl_utilities.py │ ├── modeling_tf_utils.py │ ├── modeling_tf_xlm.py │ ├── modeling_tf_xlm_roberta.py │ ├── modeling_tf_xlnet.py │ ├── modeling_transfo_xl.py │ ├── modeling_transfo_xl_utilities.py │ ├── modeling_utils.py │ ├── modeling_xlm.py │ ├── modeling_xlm_roberta.py │ ├── modeling_xlnet.py │ ├── optimization.py │ ├── optimization_tf.py │ ├── pipelines.py │ ├── tokenization_albert.py │ ├── tokenization_auto.py │ ├── tokenization_bart.py │ ├── tokenization_bert.py │ ├── tokenization_bert_japanese.py │ ├── tokenization_camembert.py │ ├── tokenization_ctrl.py │ ├── tokenization_distilbert.py │ ├── tokenization_electra.py │ ├── tokenization_flaubert.py │ ├── tokenization_gpt2.py │ ├── tokenization_longformer.py │ ├── tokenization_marian.py │ ├── tokenization_openai.py │ ├── tokenization_reformer.py │ ├── tokenization_roberta.py │ ├── tokenization_t5.py │ ├── tokenization_transfo_xl.py │ ├── tokenization_utils.py │ ├── tokenization_xlm.py │ ├── tokenization_xlm_roberta.py │ ├── tokenization_xlnet.py │ ├── trainer.py │ ├── trainer_tf.py │ ├── trainer_utils.py │ ├── training_args.py │ ├── training_args_tf.py │ ├── try.py │ └── utils_encoder_decoder.py ├── nezha-cn-base/ │ ├── config.json │ └── vocab.txt ├── requirements.txt ├── run.sh ├── serial_main_fusion_thread.py └── utils.py