gitextract_pfacmpi3/ ├── LICENSE ├── README.md ├── data_preprocessors/ │ ├── ai2d.py │ ├── chartqa.py │ ├── cord.py │ ├── deepform.py │ ├── docbank.py │ ├── docile.py │ ├── doclaynet.py │ ├── docvqa.py │ ├── docvqa_iq.py │ ├── dude.py │ ├── funsd.py │ ├── google_vision_ocr.py │ ├── hwsquad.py │ ├── iconqa.py │ ├── infographicvqa.py │ ├── klc.py │ ├── llavar.py │ ├── ocrvqa.py │ ├── pwc.py │ ├── rvlcdip.py │ ├── rvlcdip_io.py │ ├── scicap.py │ ├── scienceqa.py │ ├── screen2words.py │ ├── slidevqa.py │ ├── sroie.py │ ├── tabfact.py │ ├── tatdqa.py │ ├── textbookqa.py │ ├── utils.py │ ├── visualmrc.py │ ├── websrc.py │ ├── wildreceipt.py │ └── wtq.py ├── download.sh ├── download_scripts/ │ ├── README.md │ ├── ai2d.sh │ ├── doclaynet.sh │ ├── due.sh │ ├── funsd.sh │ ├── iconqa.sh │ ├── llavar.sh │ ├── screen2words.sh │ ├── textbookqa.sh │ ├── websrc.sh │ └── wildreceipt.sh ├── instructdoc_instructions.xlsx ├── merge_datasets.py └── process_data.sh