gitextract_s2k12qtb/ ├── .devcontainer/ │ └── devcontainer.json ├── .dockerignore ├── .gitattributes ├── .github/ │ ├── dependabot.yml │ └── workflows/ │ ├── pre-commit.yml │ └── tests.yml ├── .gitignore ├── .pre-commit-config.yaml ├── CODE_OF_CONDUCT.md ├── Dockerfile ├── LICENSE ├── README.md ├── SECURITY.md ├── SUPPORT.md └── packages/ ├── markitdown/ │ ├── README.md │ ├── ThirdPartyNotices.md │ ├── pyproject.toml │ ├── src/ │ │ └── markitdown/ │ │ ├── __about__.py │ │ ├── __init__.py │ │ ├── __main__.py │ │ ├── _base_converter.py │ │ ├── _exceptions.py │ │ ├── _markitdown.py │ │ ├── _stream_info.py │ │ ├── _uri_utils.py │ │ ├── converter_utils/ │ │ │ ├── __init__.py │ │ │ └── docx/ │ │ │ ├── __init__.py │ │ │ ├── math/ │ │ │ │ ├── __init__.py │ │ │ │ ├── latex_dict.py │ │ │ │ └── omml.py │ │ │ └── pre_process.py │ │ ├── converters/ │ │ │ ├── __init__.py │ │ │ ├── _audio_converter.py │ │ │ ├── _bing_serp_converter.py │ │ │ ├── _csv_converter.py │ │ │ ├── _doc_intel_converter.py │ │ │ ├── _docx_converter.py │ │ │ ├── _epub_converter.py │ │ │ ├── _exiftool.py │ │ │ ├── _html_converter.py │ │ │ ├── _image_converter.py │ │ │ ├── _ipynb_converter.py │ │ │ ├── _llm_caption.py │ │ │ ├── _markdownify.py │ │ │ ├── _outlook_msg_converter.py │ │ │ ├── _pdf_converter.py │ │ │ ├── _plain_text_converter.py │ │ │ ├── _pptx_converter.py │ │ │ ├── _rss_converter.py │ │ │ ├── _transcribe_audio.py │ │ │ ├── _wikipedia_converter.py │ │ │ ├── _xlsx_converter.py │ │ │ ├── _youtube_converter.py │ │ │ └── _zip_converter.py │ │ └── py.typed │ └── tests/ │ ├── __init__.py │ ├── _test_vectors.py │ ├── test_cli_misc.py │ ├── test_cli_vectors.py │ ├── test_docintel_html.py │ ├── test_files/ │ │ ├── equations.docx │ │ ├── expected_outputs/ │ │ │ ├── MEDRPT-2024-PAT-3847_medical_report_scan.md │ │ │ ├── RECEIPT-2024-TXN-98765_retail_purchase.md │ │ │ ├── REPAIR-2022-INV-001_multipage.md │ │ │ ├── SPARSE-2024-INV-1234_borderless_table.md │ │ │ ├── movie-theater-booking-2024.md │ │ │ └── test.md │ │ ├── rlink.docx │ │ ├── test.docx │ │ ├── test.epub │ │ ├── test.json │ │ ├── test.m4a │ │ ├── test.pptx │ │ ├── test.xls │ │ ├── test.xlsx │ │ ├── test_blog.html │ │ ├── test_mskanji.csv │ │ ├── test_notebook.ipynb │ │ ├── test_outlook_msg.msg │ │ ├── test_rss.xml │ │ ├── test_serp.html │ │ ├── test_wikipedia.html │ │ └── test_with_comment.docx │ ├── test_module_misc.py │ ├── test_module_vectors.py │ ├── test_pdf_masterformat.py │ ├── test_pdf_memory.py │ └── test_pdf_tables.py ├── markitdown-mcp/ │ ├── Dockerfile │ ├── README.md │ ├── pyproject.toml │ ├── src/ │ │ └── markitdown_mcp/ │ │ ├── __about__.py │ │ ├── __init__.py │ │ ├── __main__.py │ │ └── py.typed │ └── tests/ │ └── __init__.py ├── markitdown-ocr/ │ ├── LICENSE │ ├── README.md │ ├── pyproject.toml │ ├── src/ │ │ └── markitdown_ocr/ │ │ ├── __about__.py │ │ ├── __init__.py │ │ ├── _docx_converter_with_ocr.py │ │ ├── _ocr_service.py │ │ ├── _pdf_converter_with_ocr.py │ │ ├── _plugin.py │ │ ├── _pptx_converter_with_ocr.py │ │ └── _xlsx_converter_with_ocr.py │ └── tests/ │ ├── __init__.py │ ├── ocr_test_data/ │ │ ├── docx_complex_layout.docx │ │ ├── docx_image_end.docx │ │ ├── docx_image_middle.docx │ │ ├── docx_image_start.docx │ │ ├── docx_multipage.docx │ │ ├── docx_multiple_images.docx │ │ ├── pptx_complex_layout.pptx │ │ ├── pptx_image_end.pptx │ │ ├── pptx_image_middle.pptx │ │ ├── pptx_image_start.pptx │ │ ├── pptx_multiple_images.pptx │ │ ├── xlsx_complex_layout.xlsx │ │ ├── xlsx_image_end.xlsx │ │ ├── xlsx_image_middle.xlsx │ │ ├── xlsx_image_start.xlsx │ │ └── xlsx_multiple_images.xlsx │ ├── test_docx_converter.py │ ├── test_pdf_converter.py │ ├── test_pptx_converter.py │ └── test_xlsx_converter.py └── markitdown-sample-plugin/ ├── README.md ├── pyproject.toml ├── src/ │ └── markitdown_sample_plugin/ │ ├── __about__.py │ ├── __init__.py │ ├── _plugin.py │ └── py.typed └── tests/ ├── __init__.py ├── test_files/ │ └── test.rtf └── test_sample_plugin.py