gitextract_ylqgqesz/ ├── .aws/ │ └── task_definition.json ├── .flake8 ├── .gitattributes ├── .github/ │ └── workflows/ │ ├── CI.yml │ ├── build-and-deploy.yml │ ├── build-gpu.yml │ ├── release-please.yml │ └── test-build-docker.yml ├── .gitignore ├── .pre-commit-config.yaml ├── .python-version ├── .release-please-manifest.json ├── .vscode/ │ ├── extensions.json │ ├── launch.json │ └── settings.json ├── CHANGELOG.md ├── Dockerfile ├── Dockerfile.gpu ├── LICENSE ├── Makefile ├── Pipfile ├── README.md ├── benchmark/ │ ├── process_single_doc.py │ └── test_quality_sim.py ├── docker-compose.dev.yml ├── docker-compose.yml ├── docs/ │ └── archive.txt ├── evaluations/ │ └── script.py ├── libs/ │ ├── megaparse/ │ │ ├── .python-version │ │ ├── CHANGELOG.md │ │ ├── README.md │ │ ├── bench.md │ │ ├── examples/ │ │ │ ├── parse_file_fast.py │ │ │ ├── parse_file_mp.py │ │ │ └── parse_file_unstructured.py │ │ ├── program.prof │ │ ├── pyproject.toml │ │ ├── src/ │ │ │ └── megaparse/ │ │ │ ├── __init__.py │ │ │ ├── api/ │ │ │ │ ├── __init__.py │ │ │ │ ├── app.py │ │ │ │ ├── exceptions/ │ │ │ │ │ ├── __init__.py │ │ │ │ │ └── megaparse_exceptions.py │ │ │ │ └── models/ │ │ │ │ ├── __init__.py │ │ │ │ └── base.py │ │ │ ├── configs/ │ │ │ │ └── auto.py │ │ │ ├── examples/ │ │ │ │ ├── parse_file.py │ │ │ │ └── parsing_process.py │ │ │ ├── exceptions/ │ │ │ │ └── base.py │ │ │ ├── formatter/ │ │ │ │ ├── base.py │ │ │ │ ├── structured_formatter/ │ │ │ │ │ ├── __init__.py │ │ │ │ │ └── custom_structured_formatter.py │ │ │ │ └── table_formatter/ │ │ │ │ ├── __init__.py │ │ │ │ ├── llm_table_formatter.py │ │ │ │ └── vision_table_formatter.py │ │ │ ├── layout_detection/ │ │ │ │ ├── layout_detector.py │ │ │ │ ├── models/ │ │ │ │ │ └── yolov10s-doclaynet.onnx │ │ │ │ └── output.py │ │ │ ├── megaparse.py │ │ │ ├── models/ │ │ │ │ └── page.py │ │ │ ├── parser/ │ │ │ │ ├── __init__.py │ │ │ │ ├── base.py │ │ │ │ ├── builder.py │ │ │ │ ├── doctr_parser.py │ │ │ │ ├── entity.py │ │ │ │ ├── llama.py │ │ │ │ ├── megaparse_vision.py │ │ │ │ └── unstructured_parser.py │ │ │ ├── predictor/ │ │ │ │ └── layout_predictor.py │ │ │ └── utils/ │ │ │ ├── extract_metadata.py │ │ │ ├── onnx.py │ │ │ └── strategy.py │ │ └── tests/ │ │ ├── __init__.py │ │ ├── certs/ │ │ │ ├── client-cert.pem │ │ │ └── client-key.pem │ │ ├── conftest.py │ │ ├── data/ │ │ │ └── grt_example/ │ │ │ └── MegaFake_report.md │ │ ├── pdf/ │ │ │ ├── test_detect_ocr.py │ │ │ ├── test_pdf_processing.py │ │ │ └── test_pdfium_parser.py │ │ ├── supported_docs/ │ │ │ ├── Sway.epub │ │ │ ├── file-sample_500kB.odt │ │ │ ├── file_example_XLSX_50.xlsx │ │ │ ├── file_example_XLS_50.xls │ │ │ ├── sample.csv │ │ │ ├── sample.docx │ │ │ ├── sample.markdown │ │ │ ├── sample.md │ │ │ ├── sample.otf │ │ │ ├── sample.pptx │ │ │ ├── sample.txt │ │ │ ├── sample.xml │ │ │ └── sample_complexe.html │ │ ├── test_endpoints.py │ │ ├── test_import.py │ │ └── test_parsers.py │ └── megaparse_sdk/ │ ├── CHANGELOG.md │ ├── README.md │ ├── __init__.py │ ├── examples/ │ │ └── usage_example.py │ ├── megaparse_sdk/ │ │ ├── __init__.py │ │ ├── client.py │ │ ├── config.py │ │ ├── endpoints/ │ │ │ ├── __init__.py │ │ │ ├── file_upload.py │ │ │ └── url_upload.py │ │ ├── schema/ │ │ │ ├── __init__.py │ │ │ ├── document.py │ │ │ ├── extensions.py │ │ │ ├── languages.py │ │ │ ├── mp_exceptions.py │ │ │ ├── mp_inputs.py │ │ │ ├── mp_outputs.py │ │ │ ├── parser_config.py │ │ │ └── supported_models.py │ │ └── utils/ │ │ └── load_ssl.py │ ├── pyproject.toml │ └── tests/ │ ├── README.md │ ├── certs/ │ │ ├── client-cert.pem │ │ ├── client-key.pem │ │ └── rootCA.pem │ └── test_nats_client.py ├── pyproject.toml └── release-please-config.json