gitextract_rzpn8tp_/ ├── .gitignore ├── CODE_OF_CONDUCT.md ├── CONTRIBUTING.md ├── LICENSE ├── LICENSE-MODEL.md ├── MANIFEST.in ├── NOTICE ├── README.md ├── app.py ├── config/ │ └── train_nougat.yaml ├── docker/ │ ├── Dockerfile │ └── README.md ├── lightning_module.py ├── nougat/ │ ├── __init__.py │ ├── _version.py │ ├── dataset/ │ │ ├── __init__.py │ │ ├── create_index.py │ │ ├── gen_seek.py │ │ ├── parser/ │ │ │ ├── __init__.py │ │ │ ├── document.py │ │ │ ├── html2md.py │ │ │ ├── latexml_parser.py │ │ │ └── markdown.py │ │ ├── pdffigures.py │ │ ├── rasterize.py │ │ ├── split_htmls_to_pages.py │ │ ├── split_md_to_pages.py │ │ ├── splitter.py │ │ ├── staircase.py │ │ ├── tokenizer.json │ │ └── utils/ │ │ ├── __init__.py │ │ ├── latex_conversion.py │ │ ├── pdf_text_extract.py │ │ └── utils.py │ ├── metrics.py │ ├── model.py │ ├── postprocessing.py │ ├── transforms.py │ └── utils/ │ ├── __init__.py │ ├── checkpoint.py │ ├── dataset.py │ └── device.py ├── predict.py ├── setup.cfg ├── setup.py ├── test.py └── train.py