搜索结果

关键词 "PTE listening" 的搜索结果，共 2 条, 只显示前 480 条

Dive3D

Dive3D是北京大学和小红书公司合作推出的文本到3D生成框架。框架基于分数的匹配（Score Implicit Matching，SIM）损失替代传统的KL散度目标，有效避免模式坍塌问题，显著提升3D生成内容的多样性。Dive3D在文本对齐、人类偏好和视觉保真度方面表现出色，在GPTEval3D基准测试中取得优异的定量结果，证明了在生成高质量、多样化3D资产方面的强大能力。 Dive3D的项目

Lynx - 一张照片就能生成逼真个人视频

lynx 是由字节跳动研发的高保真个性化视频生成模型，仅需输入一张人像照片，即可生成身份高度一致的动态视频。该模型基于扩散 transformer（dit）架构构建，并创新性地引入了 id-adapter 和 ref-adapter 两个轻量级适配模块，分别用于精准控制人物身份和精细保留面部细节。lynx 配备专用人脸编码器提取面部特征，结合 x-nemo 技术增强表情表现力，通过 lbm 算法模

只显示前20页数据，更多请搜索