Dive3D是北京大学和小红书公司合作推出的文本到3D生成框架。框架基于分数的匹配(Score Implicit Matching,SIM)损失替代传统的KL散度目标,有效避免模式坍塌问题,显著提升3D生成内容的多样性。Dive3D在文本对齐、人类偏好和视觉保真度方面表现出色,在GPTEval3D基准测试中取得优异的定量结果,证明了在生成高质量、多样化3D资产方面的强大能力。
Dive3D的项目地址
- 项目官网:https://ai4scientificimaging.org/dive3d/
- GitHub仓库:https://github.com/ai4imaging/dive3d
- arXiv技术论文:https://arxiv.org/pdf/2506.13594