关键词 "实时生成" 的搜索结果, 共 8 条, 只显示前 480 条
fireflies.ai是基于AI技术的会议记录与分析工具。fireflies.ai 能自动转录、总结、分析语音对话,支持 Google Meet、Teams、Zoom 等多种会议平台。用户能邀请 fireflies.ai 的虚拟助手加入会议,实时生成会议笔记、行动项和会议记录,基于 AI 搜索功能快速找到关键信息。fireflies.ai 提供团队协作功能,支持评论、标记和分享会议内容,同时与
通义千问Qwen2.5-Omni,仅靠一个一体式模型,就能搞定文本、音频、图像、视频全模态,并实时生成文本和自然语音。 堪称7B模型的全能冠军。
Napkin主打简洁的AI思维记录工具,通过自动结构化与可视化功能,让想法捕捉更及时,方便用户快速迭代并与团队共享创意灵感。 Napkin诞生于前Google工程师Pramod Sharma与Jerome Scholler对商业沟通效率的革命性思考。创始团队曾成功打造儿童AI教育品牌Osmo,在长达十年的产品开发过程中,他们深刻体会到文字主导的沟通方式对创意的束缚——冗长的文档与PPT不仅降低信
WebThinker是中国人民大学、北京智源人工智能研究院和华为泊松实验室等机构提出的深度研究智能体。WebThinker赋能大型推理模型(LRMs)在推理过程中自主进行网络搜索、网页导航和报告撰写。WebThinker基于深度网页探索器和自主思考、搜索、写作策略,让LRMs能动态获取信息,实时生成高质量研究报告。WebThinker基于强化学习的训练策略进一步优化工具使用效率。WebThinke
AI+SQL 语法专家模型驱动,Oracle→OceanBase 迁移效率提升 10 倍! 企业级 SQL 方言智能转换平台 SQLShift 今日正式上线。作为国内首个支持 Oracle→OceanBase 存储过程自动转换的 SaaS 服务,SQLShift 深度融合 AI 与 SQL 语法专家模型,精准解决数据库国产化迁移中的隐式转换、逻辑失真等核心痛点,助力企业实现零误差交付。 直击国
fellou开源智能体工作流框架,Eko 2.0 在不同复杂程度上始终表现优异: 简单任务:成功率为 95%(其他产品的成功率为 80-90%) 平均成功率:78%(其他产品成功率为 56-61%) 中等复杂度:成功率为 76%(其他产品的成功率为 49-58%) 困难任务:成功率为 70%(其他产品的成功率为 32-43%) 这些数字背后隐藏着不可靠的自动化工具和企业真正可以依
LLIA(Low-Latency Interactive Avatars)是美团公司推出的基于扩散模型的实时音频驱动肖像视频生成框架。框架基于音频输入驱动虚拟形象的生成,支持实现低延迟、高保真度的实时交互。LLIA用可变长度视频生成技术,减少初始视频生成的延迟,结合一致性模型训练策略和模型量化技术,显著提升推理速度。LLIA支持用类别标签控制虚拟形象的状态(如说话、倾听、空闲)及面部表情的精细控制
RTFM(Real-Time Frame Model)是李飞飞团队推出的实时生成式世界模型。模型能在单块H100 GPU上运行,实时生成3D场景,支持持久交互。RTFM通过观看大量视频数据学习光影、材质和空间关系,将复杂的物理渲染问题转化为基于数据的感知问题。RTFM为每一帧赋予空间坐标,用“上下文腾挪”技术,只关注附近帧生成新画面,实现高效且持久的世界构建。RTFM展示了未来世界模型的潜力,为实
只显示前20页数据,更多请搜索