gitextract_a5not0fy/ ├── .changeset/ │ ├── README.md │ └── config.json ├── .github/ │ ├── ISSUE_TEMPLATE/ │ │ ├── bug_report.yml │ │ ├── config.yml │ │ ├── feature_request.yml │ │ └── parsing_issue.yml │ └── workflows/ │ ├── ci.yml │ ├── e2e-output.yml │ ├── homebrew_release.yml │ ├── ocr_servers.yml │ ├── release.yml │ └── sync-docs.yml ├── .gitignore ├── .prettierignore ├── .prettierrc ├── AGENTS.md ├── CHANGELOG.md ├── CLAUDE.md ├── CONTRIBUTING.md ├── LICENSE ├── OCR_API_SPEC.md ├── README.md ├── SECURITY.md ├── cli/ │ ├── README.md │ └── parse.ts ├── dataset_eval_utils/ │ ├── README.md │ ├── pyproject.toml │ └── src/ │ └── liteparse_eval/ │ ├── __init__.py │ ├── benchmark.py │ ├── evaluation.py │ ├── processing.py │ ├── providers/ │ │ ├── __init__.py │ │ ├── llm/ │ │ │ ├── __init__.py │ │ │ ├── anthropic.py │ │ │ └── base.py │ │ └── parsers/ │ │ ├── __init__.py │ │ ├── base.py │ │ ├── liteparse.py │ │ ├── markitdown.py │ │ ├── pymupdf.py │ │ └── pypdf.py │ └── report.py ├── docs/ │ └── src/ │ └── content/ │ └── docs/ │ └── liteparse/ │ ├── _meta.yml │ ├── cli-reference.md │ ├── getting_started.md │ ├── guides/ │ │ ├── _meta.yml │ │ ├── agent-skill.md │ │ ├── library-usage.md │ │ ├── multi-format.md │ │ ├── ocr.md │ │ ├── parsing-urls.md │ │ └── visual-citations.md │ └── index.md ├── docs.config.mjs ├── eslint.config.js ├── ocr/ │ ├── README.md │ ├── easyocr/ │ │ ├── Dockerfile │ │ ├── README.md │ │ ├── pyproject.toml │ │ ├── server.py │ │ └── test_server.py │ └── paddleocr/ │ ├── Dockerfile │ ├── README.md │ ├── pyproject.toml │ ├── server.py │ └── test_server.py ├── package.json ├── packages/ │ └── python/ │ ├── README.md │ ├── liteparse/ │ │ ├── __init__.py │ │ ├── parser.py │ │ ├── py.typed │ │ └── types.py │ ├── pyproject.toml │ └── tests/ │ ├── __init__.py │ ├── conftest.py │ ├── test_batch_e2e.py │ ├── test_parse_e2e.py │ └── test_screenshot_e2e.py ├── scripts/ │ ├── compare-dataset.ts │ ├── compare-outputs.sh │ ├── create-dataset.ts │ ├── generate-api-docs.sh │ ├── publish-to-homebrew-repo.sh │ ├── sync-docs-to-developer-hub.sh │ └── upload-dataset.ts ├── src/ │ ├── conversion/ │ │ ├── README.md │ │ ├── convertToPdf.test.ts │ │ └── convertToPdf.ts │ ├── core/ │ │ ├── README.md │ │ ├── config.test.ts │ │ ├── config.ts │ │ ├── parser.test.ts │ │ ├── parser.ts │ │ └── types.ts │ ├── engines/ │ │ ├── README.md │ │ ├── ocr/ │ │ │ ├── README.md │ │ │ ├── http-simple.test.ts │ │ │ ├── http-simple.ts │ │ │ ├── interface.ts │ │ │ ├── tesseract.test.ts │ │ │ └── tesseract.ts │ │ └── pdf/ │ │ ├── README.md │ │ ├── interface.ts │ │ ├── pdfium-renderer.test.ts │ │ ├── pdfium-renderer.ts │ │ ├── pdfjs.test.ts │ │ ├── pdfjs.ts │ │ └── pdfjsImporter.ts │ ├── index.ts │ ├── lib.ts │ ├── output/ │ │ ├── README.md │ │ ├── json.test.ts │ │ ├── json.ts │ │ ├── text.test.ts │ │ └── text.ts │ ├── processing/ │ │ ├── README.md │ │ ├── bbox.test.ts │ │ ├── bbox.ts │ │ ├── cleanText.test.ts │ │ ├── cleanText.ts │ │ ├── grid.ts │ │ ├── gridDebugLogger.ts │ │ ├── gridProjection.test.ts │ │ ├── gridProjection.ts │ │ ├── gridVisualizer.ts │ │ ├── markupUtils.test.ts │ │ ├── markupUtils.ts │ │ ├── ocrUtils.ts │ │ ├── octUtils.test.ts │ │ ├── searchItems.test.ts │ │ ├── searchItems.ts │ │ ├── textUtils.test.ts │ │ └── textUtils.ts │ └── vendor/ │ └── pdfjs/ │ ├── LICENSE │ ├── README.md │ ├── cmaps/ │ │ ├── 78-EUC-H.bcmap │ │ ├── 78-EUC-V.bcmap │ │ ├── 78-H.bcmap │ │ ├── 78-RKSJ-H.bcmap │ │ ├── 78-RKSJ-V.bcmap │ │ ├── 78-V.bcmap │ │ ├── 78ms-RKSJ-H.bcmap │ │ ├── 78ms-RKSJ-V.bcmap │ │ ├── 83pv-RKSJ-H.bcmap │ │ ├── 90ms-RKSJ-H.bcmap │ │ ├── 90ms-RKSJ-V.bcmap │ │ ├── 90msp-RKSJ-H.bcmap │ │ ├── 90msp-RKSJ-V.bcmap │ │ ├── 90pv-RKSJ-H.bcmap │ │ ├── 90pv-RKSJ-V.bcmap │ │ ├── Add-H.bcmap │ │ ├── Add-RKSJ-H.bcmap │ │ ├── Add-RKSJ-V.bcmap │ │ ├── Add-V.bcmap │ │ ├── Adobe-CNS1-0.bcmap │ │ ├── Adobe-CNS1-1.bcmap │ │ ├── Adobe-CNS1-2.bcmap │ │ ├── Adobe-CNS1-3.bcmap │ │ ├── Adobe-CNS1-4.bcmap │ │ ├── Adobe-CNS1-5.bcmap │ │ ├── Adobe-CNS1-6.bcmap │ │ ├── Adobe-CNS1-UCS2.bcmap │ │ ├── Adobe-GB1-0.bcmap │ │ ├── Adobe-GB1-1.bcmap │ │ ├── Adobe-GB1-2.bcmap │ │ ├── Adobe-GB1-3.bcmap │ │ ├── Adobe-GB1-4.bcmap │ │ ├── Adobe-GB1-5.bcmap │ │ ├── Adobe-GB1-UCS2.bcmap │ │ ├── Adobe-Japan1-0.bcmap │ │ ├── Adobe-Japan1-1.bcmap │ │ ├── Adobe-Japan1-2.bcmap │ │ ├── Adobe-Japan1-3.bcmap │ │ ├── Adobe-Japan1-4.bcmap │ │ ├── Adobe-Japan1-5.bcmap │ │ ├── Adobe-Japan1-6.bcmap │ │ ├── Adobe-Japan1-UCS2.bcmap │ │ ├── Adobe-Korea1-0.bcmap │ │ ├── Adobe-Korea1-1.bcmap │ │ ├── Adobe-Korea1-2.bcmap │ │ ├── Adobe-Korea1-UCS2.bcmap │ │ ├── B5-H.bcmap │ │ ├── B5-V.bcmap │ │ ├── B5pc-H.bcmap │ │ ├── B5pc-V.bcmap │ │ ├── CNS-EUC-H.bcmap │ │ ├── CNS-EUC-V.bcmap │ │ ├── CNS1-H.bcmap │ │ ├── CNS1-V.bcmap │ │ ├── CNS2-H.bcmap │ │ ├── CNS2-V.bcmap │ │ ├── ETHK-B5-H.bcmap │ │ ├── ETHK-B5-V.bcmap │ │ ├── ETen-B5-H.bcmap │ │ ├── ETen-B5-V.bcmap │ │ ├── ETenms-B5-H.bcmap │ │ ├── ETenms-B5-V.bcmap │ │ ├── EUC-H.bcmap │ │ ├── EUC-V.bcmap │ │ ├── Ext-H.bcmap │ │ ├── Ext-RKSJ-H.bcmap │ │ ├── Ext-RKSJ-V.bcmap │ │ ├── Ext-V.bcmap │ │ ├── GB-EUC-H.bcmap │ │ ├── GB-EUC-V.bcmap │ │ ├── GB-H.bcmap │ │ ├── GB-V.bcmap │ │ ├── GBK-EUC-H.bcmap │ │ ├── GBK-EUC-V.bcmap │ │ ├── GBK2K-H.bcmap │ │ ├── GBK2K-V.bcmap │ │ ├── GBKp-EUC-H.bcmap │ │ ├── GBKp-EUC-V.bcmap │ │ ├── GBT-EUC-H.bcmap │ │ ├── GBT-EUC-V.bcmap │ │ ├── GBT-H.bcmap │ │ ├── GBT-V.bcmap │ │ ├── GBTpc-EUC-H.bcmap │ │ ├── GBTpc-EUC-V.bcmap │ │ ├── GBpc-EUC-H.bcmap │ │ ├── GBpc-EUC-V.bcmap │ │ ├── H.bcmap │ │ ├── HKdla-B5-H.bcmap │ │ ├── HKdla-B5-V.bcmap │ │ ├── HKdlb-B5-H.bcmap │ │ ├── HKdlb-B5-V.bcmap │ │ ├── HKgccs-B5-H.bcmap │ │ ├── HKgccs-B5-V.bcmap │ │ ├── HKm314-B5-H.bcmap │ │ ├── HKm314-B5-V.bcmap │ │ ├── HKm471-B5-H.bcmap │ │ ├── HKm471-B5-V.bcmap │ │ ├── HKscs-B5-H.bcmap │ │ ├── HKscs-B5-V.bcmap │ │ ├── Hankaku.bcmap │ │ ├── Hiragana.bcmap │ │ ├── KSC-EUC-H.bcmap │ │ ├── KSC-EUC-V.bcmap │ │ ├── KSC-H.bcmap │ │ ├── KSC-Johab-H.bcmap │ │ ├── KSC-Johab-V.bcmap │ │ ├── KSC-V.bcmap │ │ ├── KSCms-UHC-H.bcmap │ │ ├── KSCms-UHC-HW-H.bcmap │ │ ├── KSCms-UHC-HW-V.bcmap │ │ ├── KSCms-UHC-V.bcmap │ │ ├── KSCpc-EUC-H.bcmap │ │ ├── KSCpc-EUC-V.bcmap │ │ ├── Katakana.bcmap │ │ ├── LICENSE │ │ ├── NWP-H.bcmap │ │ ├── NWP-V.bcmap │ │ ├── RKSJ-H.bcmap │ │ ├── RKSJ-V.bcmap │ │ ├── Roman.bcmap │ │ ├── UniCNS-UCS2-H.bcmap │ │ ├── UniCNS-UCS2-V.bcmap │ │ ├── UniCNS-UTF16-H.bcmap │ │ ├── UniCNS-UTF16-V.bcmap │ │ ├── UniCNS-UTF32-H.bcmap │ │ ├── UniCNS-UTF32-V.bcmap │ │ ├── UniCNS-UTF8-H.bcmap │ │ ├── UniCNS-UTF8-V.bcmap │ │ ├── UniGB-UCS2-H.bcmap │ │ ├── UniGB-UCS2-V.bcmap │ │ ├── UniGB-UTF16-H.bcmap │ │ ├── UniGB-UTF16-V.bcmap │ │ ├── UniGB-UTF32-H.bcmap │ │ ├── UniGB-UTF32-V.bcmap │ │ ├── UniGB-UTF8-H.bcmap │ │ ├── UniGB-UTF8-V.bcmap │ │ ├── UniJIS-UCS2-H.bcmap │ │ ├── UniJIS-UCS2-HW-H.bcmap │ │ ├── UniJIS-UCS2-HW-V.bcmap │ │ ├── UniJIS-UCS2-V.bcmap │ │ ├── UniJIS-UTF16-H.bcmap │ │ ├── UniJIS-UTF16-V.bcmap │ │ ├── UniJIS-UTF32-H.bcmap │ │ ├── UniJIS-UTF32-V.bcmap │ │ ├── UniJIS-UTF8-H.bcmap │ │ ├── UniJIS-UTF8-V.bcmap │ │ ├── UniJIS2004-UTF16-H.bcmap │ │ ├── UniJIS2004-UTF16-V.bcmap │ │ ├── UniJIS2004-UTF32-H.bcmap │ │ ├── UniJIS2004-UTF32-V.bcmap │ │ ├── UniJIS2004-UTF8-H.bcmap │ │ ├── UniJIS2004-UTF8-V.bcmap │ │ ├── UniJISPro-UCS2-HW-V.bcmap │ │ ├── UniJISPro-UCS2-V.bcmap │ │ ├── UniJISPro-UTF8-V.bcmap │ │ ├── UniJISX0213-UTF32-H.bcmap │ │ ├── UniJISX0213-UTF32-V.bcmap │ │ ├── UniJISX02132004-UTF32-H.bcmap │ │ ├── UniJISX02132004-UTF32-V.bcmap │ │ ├── UniKS-UCS2-H.bcmap │ │ ├── UniKS-UCS2-V.bcmap │ │ ├── UniKS-UTF16-H.bcmap │ │ ├── UniKS-UTF16-V.bcmap │ │ ├── UniKS-UTF32-H.bcmap │ │ ├── UniKS-UTF32-V.bcmap │ │ ├── UniKS-UTF8-H.bcmap │ │ ├── UniKS-UTF8-V.bcmap │ │ ├── V.bcmap │ │ └── WP-Symbol.bcmap │ ├── pdf.mjs │ ├── pdf.sandbox.mjs │ ├── pdf.worker.mjs │ └── standard_fonts/ │ ├── FoxitDingbats.pfb │ ├── FoxitFixed.pfb │ ├── FoxitFixedBold.pfb │ ├── FoxitFixedBoldItalic.pfb │ ├── FoxitFixedItalic.pfb │ ├── FoxitSerif.pfb │ ├── FoxitSerifBold.pfb │ ├── FoxitSerifBoldItalic.pfb │ ├── FoxitSerifItalic.pfb │ ├── FoxitSymbol.pfb │ ├── LICENSE_FOXIT │ └── LICENSE_LIBERATION ├── tsconfig.json ├── typedoc.json └── vitest.config.ts