Waver 1.0 是字节跳动推出的新一代视频生成模型,基于修正流 Transformer 架构,支持文本到视频(T2V)、图像到视频(I2V)和文本到图像(T2I)生成,可在单一框架内完成,无需切换模型。支持高达 1080p 的分辨率和 2-10 秒的灵活视频长度,擅长捕捉复杂运动,生成的视频在运动幅度和时间一致性上表现出色。在 Waver-Bench 1.0 和 Hermes 运动测试集上,Waver 1.0 的表现优于现有的开源和闭源模型。支持多种艺术风格的视频生成,包括极致现实、动画、粘土、毛绒等。
Waver 1.0的项目地址
- 项目官网:http://www.waver.video/
- Github仓库:https://github.com/FoundationVision/Waver
- arXiv技术论文:https://arxiv.org/pdf/2508.15761