gitextract_4fmnuh7_/ ├── .gitignore ├── ACKNOWLEDGEMENTS ├── CODE_OF_CONDUCT.md ├── CONTRIBUTING.md ├── LICENSE ├── LICENSE_MODEL ├── README.md ├── app/ │ ├── Configuration/ │ │ └── Build.xcconfig │ ├── FastVLM/ │ │ ├── FastVLM.h │ │ ├── FastVLM.swift │ │ └── MediaProcessingExtensions.swift │ ├── FastVLM App/ │ │ ├── Assets.xcassets/ │ │ │ ├── AccentColor.colorset/ │ │ │ │ └── Contents.json │ │ │ ├── AppIcon.appiconset/ │ │ │ │ └── Contents.json │ │ │ └── Contents.json │ │ ├── ContentView.swift │ │ ├── FastVLM.entitlements │ │ ├── FastVLMApp.swift │ │ ├── FastVLMModel.swift │ │ ├── Info.plist │ │ ├── InfoView.swift │ │ └── Preview Content/ │ │ └── Preview Assets.xcassets/ │ │ └── Contents.json │ ├── FastVLM.xcodeproj/ │ │ ├── project.pbxproj │ │ └── xcshareddata/ │ │ └── xcschemes/ │ │ └── FastVLM App.xcscheme │ ├── README.md │ ├── Video/ │ │ ├── CameraController.swift │ │ ├── CameraControlsView.swift │ │ ├── CameraType.swift │ │ ├── Video.h │ │ └── VideoFrameView.swift │ └── get_pretrained_mlx_model.sh ├── get_models.sh ├── llava/ │ ├── __init__.py │ ├── constants.py │ ├── conversation.py │ ├── mm_utils.py │ ├── model/ │ │ ├── __init__.py │ │ ├── apply_delta.py │ │ ├── builder.py │ │ ├── consolidate.py │ │ ├── language_model/ │ │ │ ├── llava_llama.py │ │ │ ├── llava_mistral.py │ │ │ ├── llava_mpt.py │ │ │ └── llava_qwen.py │ │ ├── llava_arch.py │ │ ├── make_delta.py │ │ ├── multimodal_encoder/ │ │ │ ├── builder.py │ │ │ ├── clip_encoder.py │ │ │ ├── mobileclip/ │ │ │ │ ├── __init__.py │ │ │ │ ├── configs/ │ │ │ │ │ └── mobileclip_l.json │ │ │ │ └── mci.py │ │ │ └── mobileclip_encoder.py │ │ ├── multimodal_projector/ │ │ │ └── builder.py │ │ └── utils.py │ ├── serve/ │ │ ├── __init__.py │ │ ├── cli.py │ │ ├── controller.py │ │ ├── gradio_web_server.py │ │ ├── model_worker.py │ │ ├── register_worker.py │ │ ├── sglang_worker.py │ │ └── test_message.py │ ├── train/ │ │ ├── llama_flash_attn_monkey_patch.py │ │ ├── llama_xformers_attn_monkey_patch.py │ │ ├── llava_trainer.py │ │ ├── train.py │ │ ├── train_mem.py │ │ ├── train_qwen.py │ │ └── train_xformers.py │ └── utils.py ├── model_export/ │ ├── README.md │ ├── export_vision_encoder.py │ └── fastvlm_mlx-vlm.patch ├── predict.py └── pyproject.toml