gitextract_ybj531gl/ ├── LICENSE ├── MSYH.TTC ├── README.md ├── configs/ │ ├── vlog_read_script_sample.yaml │ ├── vlog_write_script.yaml │ ├── with_mask_ref_sample.yaml │ └── with_mask_sample.yaml ├── datasets/ │ └── video_transforms.py ├── diffusion/ │ ├── __init__.py │ ├── diffusion_utils.py │ ├── gaussian_diffusion.py │ ├── respace.py │ └── timestep_sampler.py ├── models/ │ ├── __init__.py │ ├── attention.py │ ├── clip.py │ ├── resnet.py │ ├── unet.py │ ├── unet_blocks.py │ └── utils.py ├── requirements.txt ├── results/ │ └── vlog/ │ ├── teddy_travel/ │ │ ├── script/ │ │ │ ├── audio_prompts.txt │ │ │ ├── protagonist_place_reference.txt │ │ │ ├── protagonists_places.txt │ │ │ ├── time_scripts.txt │ │ │ ├── video_prompts.txt │ │ │ └── zh_video_prompts.txt │ │ └── story.txt │ └── teddy_travel_/ │ └── story.txt ├── sample_scripts/ │ ├── vlog_read_script_sample.py │ ├── vlog_write_script.py │ ├── with_mask_ref_sample.py │ └── with_mask_sample.py ├── utils.py └── vlogger/ ├── STEB/ │ └── model_transform.py ├── planning_utils/ │ └── gpt4_utils.py ├── videoaudio.py ├── videocaption.py └── videofusion.py