关键词 "大模型" 的搜索结果, 共 11 条, 只显示前 480 条
微软研究院的一个研究团队探索了使用主动式强化学习(agentic reinforcement learning)来实现这一目标,也就是说,模型会与专用工具环境中的工具进行交互,并根据收到的反馈调整其推理方式。而他们的探索成果便是 rStar2-Agent,这是一种强大的主动式强化学习方法。使用该方法,这个微软团队训练了一个 14B 的推理模型 rStar2-Agent-14B—— 该模型达到前沿级
ROMA是一个元代理框架,它使用递归分层结构来解决复杂问题。通过将任务分解为可并行执行的组件,ROMA 使代理能够应对复杂的推理挑战,同时保持透明性,从而简化上下文工程和迭代。该框架提供并行问题解决功能,代理可以同时处理复杂任务的不同部分;其开发过程透明,结构清晰,易于调试;此外,我们搜索代理的强大基准测试结果也证明了其卓越的性能。我们已经展示了该框架的有效性,但这仅仅是个开始。作为一个开源且可扩
阿里巴巴正式发布其医疗大模型QuarkMed,它在一项模拟中国执业医师资格考试的测试中,取得了70%的惊人准确率,性能超越一众顶尖模型。其成功的秘诀并非单一技术突破,而是一套严谨的组合拳:世界级的数据工程 (1T tokens的权威分级数据) 与独创的“四段式”训练心法,系统性地将通用AI锻造成领域专家。更重要的是,该项目为行业揭示了两条关于AI可靠性的黄金法则:• 法则一:在高风险领域,RAG(
字节跳动开源的图像生成大模型,目前是第4版Seedream 4, 这是字节跳动最新发布的豆包图像创作模型。该模型集成了文生图、图像编辑、多图融合、组图生成等多种能力,最高支持4K分辨率图像生成主要亮点多模态玩法拓展:灵活支持文本、图像的组合输入,允许文生图、图生图、图像编辑、多图编辑、组图生成等创作模式,玩法创意多样。风格化美感提升:支持高度自由的艺术风格迁移,从巴洛克到赛博朋克风,风格百变,更可
小美是美团正式发布的首款AI生活Agent。定位为“小而美的AI生活小秘书”,通过自然语言交互为用户提供便捷的生活服务。小美能快速响应用户指令,完成外卖点单、餐厅推荐、订座导航等操作。例如,用户只需说“给我点一份和府捞面的鸡丝凉面”,小美能迅速完成点单并支付。小美基于美团自研的龙猫大模型,能提供从决策辅助到直接代办的深度服务。支持定时任务,用户可以设置每天早上10点点一杯星巴克的冰美式送到公司,小
阿里巴巴推出FunAudio-ASR语音识别大模型,专为解决企业落地难题。模型通过创新的Context增强模块,有效优化了“幻觉”“串语种”等关键问题。在高噪声等复杂场景下,其识别准确率显著提升,幻觉率从78.5%降至10.7%。目前,FunAudio-ASR 已在钉钉的“AI听记”、视频会议、DingTalk A1硬件等多个场景中应用,验证了其在真实企业环境中的稳定性和高精度识别能力,特别是在垂
腾讯优图实验室进一步开源 Youtu-GraphRAG——这是一款全新的图检索增强生成框架,主打大语言模型+GraphRAG模式,把知识组织成「图谱」,再交给大语言模型去检索和推理,帮助大模型在处理复杂问答类任务时减少「胡言乱语」,回答更精准、更可追溯。它尤其适用于企业知识库问答、科研文档解析、个人知识库、私域知识管理等知识密集型场景。要减少胡编乱造,关键在于更精准的检索与推理。Youtu-Gra
Spark Chemistry-X1-13B 是科大讯飞开源的化学专业大型语言模型。模型基于讯飞星火X1-0420大模型,经过多种化学任务数据集的微调,具备卓越的复杂化学问题解决能力,同时保持强大的通用性。模型基于新的注意力掩码机制,结合长思维链和快思考,有效防止不同推理模式之间的干扰。模型在高等知识问答、化学名称转换和分子性质预测等任务上表现出色,能助力化学科研工作的高效推进,激发跨领域创新,推
MiroMind:由陈天桥先生创立的预测型 AI 平台MiroMind 是由陈天桥推出的一个专注于 AI 领域的平台,致力于开发全球领先的预测型大模型。该平台的核心理念是让 AI “记住过去、洞察未来”,通过其独特的记忆驱动机制,帮助 AI 进行更精准的预测与决策。MiroMind 的主要产品包括:MiroThinker:一个开源的深度研究模型,在 GAIA 等基准测试中表现出色,超越了许多同类开
Qianfan-VL 是百度智能云千帆专为企业级多模态应用场景打造的视觉理解大模型。它提供 3B、8B 和 70B 三种尺寸,不仅具备出色的通用能力,还针对 OCR、教育等垂直领域进行了专项强化。该模型基于开源模型,并在百度自研的昆仑芯 P800 上完成了全流程计算任务,展现出卓越的性能和效率。核心功能多尺寸模型:提供从轻量级到大规模的三种版本,满足不同企业和开发者的需求,适用于各种场景,从端上实
nanochat是AI领域专家Andrej Karpathy发布的开源项目,以极低成本和高效流程训练小型语言模型,实现类似ChatGPT的对话功能。仅需约100美元(使用8张H100 GPU训练4小时),即可训练出能进行基础对话、创作故事/诗歌、回答简单问题的小型模型。若增加预算至1000美元(训练约41.6小时),模型性能可显著提升,能解决简单数学/代码问题并参与多项选择题测试。项目包含从数据准
只显示前20页数据,更多请搜索
Showing 97 to 107 of 107 results