gitextract_4tjgy5ni/

├── .gitignore
├── .pre-commit-config.yaml
├── LICENSE.txt
├── README.md
├── generate_video.py
├── generate_video_df.py
├── requirements.txt
├── skycaptioner_v1/
│   ├── README.md
│   ├── examples/
│   │   ├── test.csv
│   │   └── test_result.csv
│   ├── infer_fusion_caption.sh
│   ├── infer_struct_caption.sh
│   ├── requirements.txt
│   └── scripts/
│       ├── gradio_fusion_caption.py
│       ├── gradio_struct_caption.py
│       ├── utils.py
│       ├── vllm_fusion_caption.py
│       └── vllm_struct_caption.py
└── skyreels_v2_infer/
    ├── __init__.py
    ├── distributed/
    │   ├── __init__.py
    │   └── xdit_context_parallel.py
    ├── modules/
    │   ├── __init__.py
    │   ├── attention.py
    │   ├── clip.py
    │   ├── t5.py
    │   ├── tokenizers.py
    │   ├── transformer.py
    │   ├── vae.py
    │   └── xlm_roberta.py
    ├── pipelines/
    │   ├── __init__.py
    │   ├── diffusion_forcing_pipeline.py
    │   ├── image2video_pipeline.py
    │   ├── prompt_enhancer.py
    │   └── text2video_pipeline.py
    └── scheduler/
        ├── __init__.py
        └── fm_solvers_unipc.py