3D 建模 - 梅斯AI导航站

有言

有言是由魔珐科技推出的一个一站式AIGC视频创作和3D数字人生成平台，通过提供海量超写实3D虚拟人角色，帮助用户无需真人出镜即可制作视频。该平台基于魔珐自研的AIGC技术，支持用户输入文字快速生成3D内容，并提供自定义编辑、字幕、动效、背景音乐等后期包装功能，简化视频制作流程，让创作变得高效而有趣。有言的主要功能一站式服务：有言整合了从内容生成到后期制作的全套流程，为用户提供了从开始到

Qlib

Qlib 是一个开源的、面向 AI 的量化投资平台，旨在利用 AI 技术挖掘量化投资的潜力，赋能研究，创造价值，涵盖从探索想法到落地生产的全过程。Qlib 支持多种机器学习建模范式，包括监督学习、市场动态建模和强化学习。越来越多不同范式的 SOTA Quant 研究成果/论文正在 Qlib 中发布，以协作解决量化投资领域的关键挑战。例如，1）使用监督学习从丰富且异构的金融数据中挖掘市场复杂的非

Cartwheel

Cartwheel 是 AI 3D 动画生成平台，基于文本到动画（Text-to-Motion）技术，让用户仅需输入文本描述，快速生成高质量的 3D 角色动画。平台结合深度学习模型与传统动画技术，支持动作捕捉、自动化运动合成，与主流 3D 软件无缝集成。Cartwheel 的目标是简化 3D 动画制作流程，帮助动画师和艺术家节省时间，专注于创造性工作。 Cartwheel的主要功能文本驱

Jodi

Jodi是中国科学院计算技术研究所和中国科学院大学推出的扩散模型框架，基于联合建模图像域和多个标签域，将视觉生成与理解统一起来。Jodi基于线性扩散Transformer和角色切换机制，执行联合生成（同时生成图像和多个标签）、可控生成（基于标签组合生成图像）及图像感知（从图像预测多个标签）三种任务。Jodi用包含20万张高质量图像和7个视觉域标签的Joint-1.6M数据集进行训练。Jodi在生成

TripoSG

TripoSG 是 VAST-AI-Research 团队推出的基于大规模修正流（Rectified Flow, RF）模型的高保真 3D 形状合成技术，通过大规模修正流变换器架构、混合监督训练策略以及高质量数据集，实现了从单张输入图像到高保真 3D 网格模型的生成。TripoSG 在多个基准测试中表现出色，生成的 3D 模型具有更高的细节和更好的输入条件对齐。 TripoSG的主要功能

Playmate

Playmate是广州趣丸科技团队推出的人脸动画生成框架。框架基于3D隐式空间引导扩散模型，用双阶段训练框架，根据音频和指令精准控制人物的表情和头部姿态，生成高质量的动态肖像视频。Playmate基于运动解耦模块和情感控制模块，实现对生成视频的精细控制，显著提升视频质量和情感表达的灵活性。Playmate在音频驱动肖像动画领域取得重大进展，提供对情感和姿态的精细控制，能生成多种风格的动态肖像，具有

V-JEPA 2

Meta 又有新的动作，推出基于视频训练的世界模型 V-JEPA 2（全称 Video Joint Embedding Predictive Architecture 2）。其能够实现最先进的环境理解与预测能力，并在新环境中完成零样本规划与机器人控制。 Meta 表示，他们在追求高级机器智能（AMI）的目标过程中，关键在于开发出能像人类一样认知世界、规划陌生任务执行方案，并高效适应不断变化环境的

ChatPs

ChatPs 是创新的 Photoshop 插件，通过自然语言交互简化图像编辑流程。无需掌握复杂的 Photoshop 操作技巧或快捷键，只需用日常语言下达指令，ChatPs 可精准识别执行任务，例如选中图层、翻译文本、抠图、调整图像等。针对设计场景进行了专门训练，能满足从新手到资深设计师的多元需求，大幅减少重复性操作，提升设计效率。ChatPs 覆盖了 Photoshop 的核心功能，结合 AI

Seaweed APT2

Seaweed APT2是字节跳动推出的创新的AI视频生成模型，通过自回归对抗后训练（AAPT）技术，将双向扩散模型转化为单向自回归生成器，实现高效、高质量的视频生成。模型能在单次网络前向评估（1NFE）中生成包含多帧视频的潜空间帧，显著降低了计算复杂性，通过输入回收机制和键值缓存（KV Cache）技术，支持长时间视频生成，解决了传统模型在长视频生成中常见的动作漂移和物体变形问题。能在单块GPU

EmbodiedGen

EmbodiedGen 是用于具身智能（Embodied AI）应用的生成式 3D 世界引擎和工具包。能快速生成高质量、低成本且物理属性合理的 3D 资产和交互环境，帮助研究人员和开发者构建具身智能体的测试环境。EmbodiedGen 包含多个模块，如从图像或文本生成 3D 模型、纹理生成、关节物体生成、场景和布局生成等，支持从简单物体到复杂场景的创建。生成的 3D 资产可以直接用于机器人仿真和

Dive3D

Dive3D是北京大学和小红书公司合作推出的文本到3D生成框架。框架基于分数的匹配（Score Implicit Matching，SIM）损失替代传统的KL散度目标，有效避免模式坍塌问题，显著提升3D生成内容的多样性。Dive3D在文本对齐、人类偏好和视觉保真度方面表现出色，在GPTEval3D基准测试中取得优异的定量结果，证明了在生成高质量、多样化3D资产方面的强大能力。 Dive3D的项目

AlphaGenome

AlphaGenome是谷歌DeepMind推出的全新AI模型，能更深入地理解基因组。模型能接收长达100万个碱基对的DNA序列输入，预测数千种表征其调控活性的分子特性，评估基因变异的影响。模型基于卷积层、Transformer架构，训练数据来自大型公共数据库。模型具有长序列上下文与高分辨率、全面多模态预测、高效变异评分和新颖剪接点建模等优势，在多项基准测试中表现顶尖，基于API向非商业研究领域开

4D-LRM

4D-LRM（Large Space-Time Reconstruction Model）是Adobe研究公司、密歇根大学等机构的研究人员共同推出的新型4D重建模型。模型能基于稀疏的输入视图和任意时间点，快速、高质量地重建出任意新视图和时间组合的动态场景。模型基于Transformer的架构，预测每个像素的4D高斯原语，实现空间和时间的统一表示，具有高效性和强大的泛化能力。4D-LRM在多种相机设

FairyGen

FairyGen 是大湾区大学推出的动画故事视频生成框架，支持从单个手绘角色草图出发，生成具有连贯叙事和一致风格的动画故事视频。框架借助多模态大型语言模型（MLLM）进行故事规划，基于风格传播适配器将角色的视觉风格应用到背景中，用 3D Agent重建角色生成真实的运动序列，基于两阶段运动适配器优化视频动画的连贯性与自然度。FairyGen 在风格一致性、叙事连贯性和运动质量方面表现出色，为个性化

圆周旅迹

圆周旅迹是专注于旅行规划的智能应用，帮助用户高效、便捷地安排旅行行程。通过简洁直观的界面设计和强大的AI功能，让用户能快速输入目的地、时间等信息，自动生成合理且个性化的行程安排。支持从社交平台一键导入链接、文字或图片，快速生成同款行程；提供3D全景地图导航和路径拖拽功能，帮助用户直观规划路线；方便旅行伙伴共同编辑行程并实时更新。圆周旅迹整合了实时交通数据，支持离线地图缓存，确保用户在无网络环境下也

PFES

１．本研究提出了蛋白质折叠进化模拟器（PFES），这是一个从随机氨基酸序列开始，以原子分辨率模拟蛋白质进化的计算框架。２．作者利用PFES证明，稳定的球状蛋白质折叠可以相对容易地从随机序列进化而来，每个位点只需0.2到3个突变，与LUCA以来观察到的进化变化相当或更少。３．值得注意的是，大约一半进化出的蛋白质与已知的自然折叠（例如HTH、SH3和β三明治）相似，而其余的则是独一无二的，这凸

codonGPT

１．codonGPT引入了第一个直接在编码mRNA序列（密码子）上训练的生成语言模型，解决了基于RNA的序列建模中一个主要问题，该问题一直落后于DNA和蛋白质建模的进展。２．一项关键创新是使用推理时间同义逻辑掩蔽，确保生成的密码子序列以100%的保真度保留原始氨基酸序列，这对于治疗应用至关重要。３．强化学习（RL）首次在codonGPT的基础上用于优化特定蛋白质的密码子序列。这允许用户跨

Zoom Out AI

zoomoutai.pro 与众不同，因为它不仅仅是把图片放大。它会智能地猜测并补充缺失的部分，让图片看起来更清晰、更真实，而不是模糊或拉伸变形。它在浏览器里就能使用，不需要安装任何软件。很多工具只会把图片放大，但这个工具还能修复细节，让图片更好看。 Zoom Out AI 是一款免费工具，可将任何图像转换为缩小视频，直至看到地球。非常适合演示、创意项目和娱乐！无需下载或注册。

RoboBrain

RoboBrain 2.0 是强大的开源具身大脑模型，能统一感知、推理和规划，支持复杂任务的执行。RoboBrain 2.0 包含 7B（轻量级）和 32B（全规模）两个版本，基于异构架构，融合视觉编码器和语言模型，支持多图像、长视频和高分辨率视觉输入，及复杂任务指令和场景图。模型在空间理解、时间建模和长链推理方面表现出色，适用机器人操作、导航和多智能体协作等任务，助力具身智能从实验室走向真实场景

RoboOS

RoboOS 2.0 是智谱开源的跨本体大小脑协同框架，专为具身智能设计。框架支持多机器人协作，基于集成MCP协议和无服务器架构实现轻量化部署，降低开发门槛。框架包含基于云计算的大脑模块，负责高级认知与多智能体协同；分布式小脑模块群，专司机器人专项技能执行；及实时共享内存机制，强化环境态势感知能力。RoboOS 2.0 提供标准化接口，消除硬件适配差异，用技能商店实现机器人技能模块的智能匹配与一键

PhotoG

PhotoG是全球首个内容营销端对端智能体，实现了基于大语言模型智能规划的全模态内容生成与自适应工具调用，致力于构建等同完整传统内容营销团队的全链路智能化。目前产品获得家具、鞋服、珠宝等领域数十家国际化品牌和超过十万海外用户的认可。仅需一张产品图与自然语言，即可通过多智能体全自动生成基于市场调研和竞争格局的包含营销图片、营销视频、3D模型、营销文案、电商产品详情页、优化标题、描述和 SEO 等内

Ludo.ai

Ludo.ai 是强大的AI游戏开发平台，能帮助开发者从创意构思到实际开发的全过程。平台提供丰富的功能，包括游戏概念生成、AI 驱动的 3D 资产和图像生成、自定义精灵动画、视频生成、可玩原型制作、市场趋势分析、代码生成等。基于这些工具，开发者能快速生成创意、优化设计、验证想法，加速开发流程。 Ludo.ai的官网地址官网地址：https://ludo.ai/

TextureNoise

TextureNoise 是强大的在线3D纹理生成与编辑工具，帮助用户快速高效地创建高质量纹理。通过快速生成功能，能在几秒钟内生成令人惊叹的纹理，显著提升工作流程效率，节省时间。TextureNoise 提供画笔工具，支持用户对纹理的特定区域进行精确编辑和细节修饰，确保所有编辑和修复无缝融合，保持纹理的整体一致性。支持通用文件格式，与任何数字内容创作软件（如Blender、Maya等）完全兼容。

MarkItDown--一键把各种格式的文件转化为结构化 Markdown格式

微软开源的一个项目 MarkItDown，这么小的一个工具获得了 7w+ star。但它干的事儿特别朴素，把各种格式的文件（Word、PDF、Excel、PPT、图片、音频、HTML、JSON、甚至 zip 包）一键变成结构化 Markdown。是的，保留标题、列表、表格、链接结构的那种 Markdown。为什么我会觉得这个工具值得讲讲？因为这其实解决了一个我们常常下意识忽略的问题：在做

搜索结果

有言