TripoSG 是 VAST-AI-Research 团队推出的基于大规模修正流(Rectified Flow, RF)模型的高保真 3D 形状合成技术, 通过大规模修正流变换器架构、混合监督训练策略以及高质量数据集,实现了从单张输入图像到高保真 3D 网格模型的生成。TripoSG 在多个基准测试中表现出色,生成的 3D 模型具有更高的细节和更好的输入条件对齐。
TripoSG的主要功能
- 3D 内容自动化生成:TripoSG 能直接从单张输入图像生成细节惊艳的 3D 网格模型,适用于自动化生成高质量的 3D 内容。
- 高分辨率三维重建:TripoSG 的 VAE 架构能处理更高分辨率的输入,适用于高分辨率的三维重建任务。
- 高保真生成:生成的网格具有锐利的几何特征、精细的表面细节和复杂的结构。
- 语义一致性:生成的形状准确反映了输入图像的语义和外观。
- 强泛化能力:能处理多种输入风格,包括照片级真实图像、卡通和草图。
TripoSG的地址
- 项目官网:https://yg256li.github.io/TripoSG-Page/
- Github仓库:https://github.com/VAST-AI-Research/TripoSG
- HuggingFace模型库:https://huggingface.co/VAST-AI/TripoSG
- arXiv技术论文:https://arxiv.org/pdf/2502.06608