RTFM(Real-Time Frame Model)是李飞飞团队推出的实时生成式世界模型。模型能在单块H100 GPU上运行,实时生成3D场景,支持持久交互。RTFM通过观看大量视频数据学习光影、材质和空间关系,将复杂的物理渲染问题转化为基于数据的感知问题。RTFM为每一帧赋予空间坐标,用“上下文腾挪”技术,只关注附近帧生成新画面,实现高效且持久的世界构建。RTFM展示了未来世界模型的潜力,为实时、持久、交互式虚拟世界提供了一种全新的技术路径。
RTFM的项目地址
- 项目官网:https://www.worldlabs.ai/blog/rtfm
- 在线体验Demo:https://rtfm.worldlabs.ai/