gitextract_cem8xir5/ ├── .gitignore ├── LICENSE ├── README.md ├── configs/ │ ├── dataset/ │ │ ├── icd13.yaml │ │ ├── locr.yaml │ │ ├── st.yaml │ │ └── tsg.yaml │ ├── demo.yaml │ ├── pretrain.yaml │ ├── test/ │ │ └── textdesign_sd_2.yaml │ ├── test.yaml │ ├── train/ │ │ └── textdesign_sd_2.yaml │ └── train.yaml ├── dataset/ │ ├── __init__.py │ ├── dataloader.py │ └── utils/ │ └── words.txt ├── demo.py ├── metrics.py ├── pretrain.py ├── requirements.txt ├── scripts/ │ └── preprocess/ │ └── laion_ocr_pre.ipynb ├── sgm/ │ ├── __init__.py │ ├── lr_scheduler.py │ ├── models/ │ │ ├── __init__.py │ │ ├── autoencoder.py │ │ └── diffusion.py │ ├── modules/ │ │ ├── __init__.py │ │ ├── attention.py │ │ ├── autoencoding/ │ │ │ ├── __init__.py │ │ │ ├── losses/ │ │ │ │ └── __init__.py │ │ │ └── regularizers/ │ │ │ └── __init__.py │ │ ├── diffusionmodules/ │ │ │ ├── __init__.py │ │ │ ├── denoiser.py │ │ │ ├── denoiser_scaling.py │ │ │ ├── denoiser_weighting.py │ │ │ ├── discretizer.py │ │ │ ├── guiders.py │ │ │ ├── loss.py │ │ │ ├── model.py │ │ │ ├── openaimodel.py │ │ │ ├── sampling.py │ │ │ ├── sampling_utils.py │ │ │ ├── sigma_sampling.py │ │ │ ├── util.py │ │ │ └── wrappers.py │ │ ├── distributions/ │ │ │ ├── __init__.py │ │ │ └── distributions.py │ │ ├── ema.py │ │ ├── encoders/ │ │ │ ├── __init__.py │ │ │ └── modules.py │ │ └── predictors/ │ │ └── model.py │ └── util.py ├── src/ │ └── parseq/ │ ├── .gitignore │ ├── Datasets.md │ ├── LICENSE │ ├── NOTICE │ ├── README.md │ ├── bench.py │ ├── configs/ │ │ ├── bench.yaml │ │ ├── charset/ │ │ │ ├── 36_lowercase.yaml │ │ │ ├── 62_mixed-case.yaml │ │ │ └── 94_full.yaml │ │ ├── dataset/ │ │ │ ├── real.yaml │ │ │ └── synth.yaml │ │ ├── experiment/ │ │ │ ├── abinet-sv.yaml │ │ │ ├── abinet.yaml │ │ │ ├── crnn.yaml │ │ │ ├── parseq-patch16-224.yaml │ │ │ ├── parseq-tiny.yaml │ │ │ ├── parseq.yaml │ │ │ ├── trba.yaml │ │ │ ├── trbc.yaml │ │ │ ├── tune_abinet-lm.yaml │ │ │ └── vitstr.yaml │ │ ├── main.yaml │ │ ├── model/ │ │ │ ├── abinet.yaml │ │ │ ├── crnn.yaml │ │ │ ├── parseq.yaml │ │ │ ├── trba.yaml │ │ │ └── vitstr.yaml │ │ └── tune.yaml │ ├── hubconf.py │ ├── read.py │ ├── requirements.txt │ ├── setup.cfg │ ├── setup.py │ ├── strhub/ │ │ ├── __init__.py │ │ ├── data/ │ │ │ ├── __init__.py │ │ │ ├── aa_overrides.py │ │ │ ├── augment.py │ │ │ ├── dataset.py │ │ │ ├── module.py │ │ │ └── utils.py │ │ └── models/ │ │ ├── __init__.py │ │ ├── abinet/ │ │ │ ├── LICENSE │ │ │ ├── __init__.py │ │ │ ├── attention.py │ │ │ ├── backbone.py │ │ │ ├── model.py │ │ │ ├── model_abinet_iter.py │ │ │ ├── model_alignment.py │ │ │ ├── model_language.py │ │ │ ├── model_vision.py │ │ │ ├── resnet.py │ │ │ ├── system.py │ │ │ └── transformer.py │ │ ├── base.py │ │ ├── crnn/ │ │ │ ├── LICENSE │ │ │ ├── __init__.py │ │ │ ├── model.py │ │ │ └── system.py │ │ ├── modules.py │ │ ├── parseq/ │ │ │ ├── __init__.py │ │ │ ├── modules.py │ │ │ └── system.py │ │ ├── trba/ │ │ │ ├── __init__.py │ │ │ ├── feature_extraction.py │ │ │ ├── model.py │ │ │ ├── prediction.py │ │ │ ├── system.py │ │ │ └── transformation.py │ │ ├── utils.py │ │ └── vitstr/ │ │ ├── __init__.py │ │ ├── model.py │ │ └── system.py │ ├── test.py │ ├── tools/ │ │ ├── art_converter.py │ │ ├── case_sensitive_str_datasets_converter.py │ │ ├── coco_2_converter.py │ │ ├── coco_text_converter.py │ │ ├── create_lmdb_dataset.py │ │ ├── filter_lmdb.py │ │ ├── lsvt_converter.py │ │ ├── mlt19_converter.py │ │ ├── openvino_converter.py │ │ ├── test_abinet_lm_acc.py │ │ └── textocr_converter.py │ ├── train.py │ └── tune.py ├── test.py ├── train.py └── util.py