gitextract_k_dq053s/ ├── .docker/ │ ├── Dockerfile │ └── Dockerfile.alpine ├── .dockerignore ├── .git_archival.txt ├── .gitattributes ├── .github/ │ ├── FUNDING.yml │ ├── ISSUE_TEMPLATE/ │ │ ├── 1-bug-report-general.yml │ │ ├── 2-problem-with-specific-file.yml │ │ ├── 3-app.yml │ │ └── 4-feature-request.yml │ ├── dependabot.yml │ └── workflows/ │ ├── build.yml │ ├── release.yml │ └── triage.yml ├── .gitignore ├── .pre-commit-config.yaml ├── .readthedocs.yaml ├── LICENSE ├── LICENSES/ │ ├── AGPL-3.0-or-later.txt │ ├── Apache-2.0.txt │ ├── CC-BY-SA-1.0.txt │ ├── CC-BY-SA-2.0.txt │ ├── CC-BY-SA-2.5.txt │ ├── CC-BY-SA-3.0.txt │ ├── CC-BY-SA-4.0.txt │ ├── GFDL-1.2-or-later.txt │ ├── MIT.txt │ ├── MPL-2.0.txt │ └── Zlib.txt ├── README.md ├── README_ZH.md ├── REUSE.toml ├── bin/ │ └── bump_version.py ├── docs/ │ ├── advanced.md │ ├── api.md │ ├── apiref.md │ ├── batch.md │ ├── cloud.md │ ├── conf.py │ ├── contributing.md │ ├── cookbook.md │ ├── design_notes.md │ ├── docker.md │ ├── errors.md │ ├── index.md │ ├── installation.md │ ├── introduction.md │ ├── jbig2.md │ ├── languages.md │ ├── maintainers.md │ ├── optimizer.md │ ├── pdfsecurity.md │ ├── performance.md │ ├── plugins.md │ └── releasenotes/ │ ├── index.md │ ├── version02.md │ ├── version03.md │ ├── version04.md │ ├── version05.md │ ├── version06.md │ ├── version07.md │ ├── version08.md │ ├── version09.md │ ├── version10.md │ ├── version11.md │ ├── version12.md │ ├── version13.md │ ├── version14.md │ ├── version15.md │ ├── version16.md │ └── version17.md ├── misc/ │ ├── _webservice.py │ ├── batch.py │ ├── bisect_pdf.py │ ├── completion/ │ │ ├── ocrmypdf.bash │ │ └── ocrmypdf.fish │ ├── docker-compose.example.yml │ ├── example_plugin.py │ ├── flatpak/ │ │ └── io.ocrmypdf.ocrmypdf.metainfo.xml │ ├── ocrmypdf_compare.py │ ├── pdf_compare.py │ ├── pdf_text_diff.py │ ├── screencast/ │ │ ├── README.md │ │ └── demo.cast │ ├── synology.py │ ├── watcher.py │ └── webservice.py ├── pyproject.toml ├── scripts/ │ └── generate_glyphless_font.py ├── snapcraft.yaml ├── src/ │ └── ocrmypdf/ │ ├── RELEASE.md │ ├── __init__.py │ ├── __main__.py │ ├── _annots.py │ ├── _concurrent.py │ ├── _defaults.py │ ├── _exec/ │ │ ├── __init__.py │ │ ├── ghostscript.py │ │ ├── jbig2enc.py │ │ ├── pngquant.py │ │ ├── tesseract.py │ │ ├── unpaper.py │ │ └── verapdf.py │ ├── _graft.py │ ├── _jobcontext.py │ ├── _logging.py │ ├── _metadata.py │ ├── _options.py │ ├── _pipeline.py │ ├── _pipelines/ │ │ ├── __init__.py │ │ ├── _common.py │ │ ├── hocr_to_ocr_pdf.py │ │ ├── ocr.py │ │ └── pdf_to_hocr.py │ ├── _plugin_manager.py │ ├── _plugin_registry.py │ ├── _progressbar.py │ ├── _validation.py │ ├── _validation_coordinator.py │ ├── _version.py │ ├── api.py │ ├── builtin_plugins/ │ │ ├── __init__.py │ │ ├── concurrency.py │ │ ├── default_filters.py │ │ ├── ghostscript.py │ │ ├── null_ocr.py │ │ ├── optimize.py │ │ ├── pypdfium.py │ │ └── tesseract_ocr.py │ ├── cli.py │ ├── data/ │ │ ├── __init__.py │ │ └── sRGB.icc │ ├── exceptions.py │ ├── extra_plugins/ │ │ ├── __init__.py │ │ └── semfree.py │ ├── font/ │ │ ├── __init__.py │ │ ├── font_manager.py │ │ ├── font_provider.py │ │ ├── multi_font_manager.py │ │ └── system_font_provider.py │ ├── fpdf_renderer/ │ │ ├── __init__.py │ │ └── renderer.py │ ├── helpers.py │ ├── hocrtransform/ │ │ ├── __init__.py │ │ ├── __main__.py │ │ └── hocr_parser.py │ ├── imageops.py │ ├── languages.py │ ├── models/ │ │ ├── __init__.py │ │ └── ocr_element.py │ ├── optimize.py │ ├── pdfa.py │ ├── pdfinfo/ │ │ ├── __init__.py │ │ ├── _contentstream.py │ │ ├── _image.py │ │ ├── _types.py │ │ ├── _worker.py │ │ ├── info.py │ │ └── layout.py │ ├── pluginspec.py │ ├── py.typed │ ├── quality.py │ └── subprocess/ │ ├── __init__.py │ └── _windows.py └── tests/ ├── __init__.py ├── cache/ │ └── manifest.jsonl ├── conftest.py ├── plugins/ │ ├── gs_feature_elision.py │ ├── gs_pdfa_failure.py │ ├── gs_raster_failure.py │ ├── gs_raster_soft_error.py │ ├── gs_render_failure.py │ ├── gs_render_soft_error.py │ ├── tesseract_badutf8.py │ ├── tesseract_big_image_error.py │ ├── tesseract_cache.py │ ├── tesseract_crash.py │ ├── tesseract_debug_rotate.py │ ├── tesseract_noop.py │ └── tesseract_simulate_oom_killer.py ├── resources/ │ ├── README.rst │ ├── arabic.hocr │ ├── cjk.hocr │ ├── devanagari.hocr │ ├── hello_world_scripts.hocr │ ├── latin.hocr │ ├── linn.txt │ ├── multilingual.hocr │ └── tagged.odt ├── test_acroform.py ├── test_annots.py ├── test_api.py ├── test_check_pdf.py ├── test_completion.py ├── test_concurrency.py ├── test_fpdf_renderer.py ├── test_ghostscript.py ├── test_graft.py ├── test_helpers.py ├── test_hocr_parser.py ├── test_hocrtransform.py ├── test_image_input.py ├── test_imageops.py ├── test_json_serialization.py ├── test_logging.py ├── test_main.py ├── test_metadata.py ├── test_multi_font_manager.py ├── test_multilingual_direct.py ├── test_null_ocr_engine.py ├── test_ocr_element.py ├── test_ocr_engine_interface.py ├── test_ocr_engine_selection.py ├── test_optimize.py ├── test_page_boxes.py ├── test_page_numbers.py ├── test_pdf_renderer.py ├── test_pdfa.py ├── test_pdfinfo.py ├── test_pipeline.py ├── test_pipeline_generate_ocr.py ├── test_preprocessing.py ├── test_quality.py ├── test_rasterizer.py ├── test_rotation.py ├── test_semfree.py ├── test_soft_error.py ├── test_stdio.py ├── test_system_font_provider.py ├── test_tagged.py ├── test_tesseract.py ├── test_unpaper.py ├── test_userunit.py ├── test_validation.py ├── test_verapdf.py └── test_watcher.py