关键词 "r1" 的搜索结果, 共 6 条, 只显示前 480 条
MiniMax-M1是MiniMax团队最新推出的开源推理模型,基于混合专家架构(MoE)与闪电注意力机制(lightning attention)相结合,总参数量达 4560 亿,每个token激活 459 亿参数。模型超过国内的闭源模型,接近海外的最领先模型,具有业内最高的性价比。MiniMax-M1原生支持 100 万token的上下文长度,提供40 和80K两种推理预算版本,适合处理长输入
Miniwork是高效的AI工具平台,聚焦提升工作、学习、内容创作、运营营销等多个方向,专为提升工作与学习效率的用户打造。Miniwork涵盖SEO分析及优化、写作辅助、图像生成、PDF处理、营销策划及运营管理等多元化AI工具,通过前沿技术集成包括GPT-4o、Claude 3.7 sonnet、Gemini 1.5 Flash、Llama 3.1、DeepSeek-R1、GLM-4-plus等在
SelectYet是实用的AI文献分析工具,基于先进的AI技术和“记忆摘要”技术,为研究人员提供高效便捷的文献处理服务。用户只需输入研究主题、上传PDF文献,设置自定义分析选项,可快速启动分析。工具能对海量文献进行结构化分析,快速提取关键信息,形成文献综述,加速信息筛选和整理的过程。SelectYet接入了deepseek-R1/V3模型,未来将融合更多模型的优势,提升分析的准确性和效率。 Se
Baichuan-M2在HealthBench上得到60.1的高分,以32B的较小尺寸不仅反超OpenAI 最新开源模型gpt-oss120b(得分57.6),更是力压Qwen3-235B、Deepseek R1、Kimi K2等当前世界所有开源大模型。 针对医疗领域用户隐私考虑下的模型私有化部署需求,我们对Baichuan-M2进行了极致轻量化,量化后的模型精度接近无损,可以在RTX409
微软研究院的一个研究团队探索了使用主动式强化学习(agentic reinforcement learning)来实现这一目标,也就是说,模型会与专用工具环境中的工具进行交互,并根据收到的反馈调整其推理方式。而他们的探索成果便是 rStar2-Agent,这是一种强大的主动式强化学习方法。使用该方法,这个微软团队训练了一个 14B 的推理模型 rStar2-Agent-14B—— 该模型达到前沿级
MedResearcher-R1是蚂蚁集团开源的一款Agentic AI,旨在解决医疗领域的“稀疏知识”难题。它摒弃“数据投喂”模式,转而主动“设计”高质量训练:• 智能数据:通过KISA框架,从3000万+文献中筛选罕见实体,生成高难度多步推理任务。• 精准学习:配备优先考虑“权威性”的专用工具,并采用“蒙版引导”及复合奖励函数,训练AI掌握可泛化的“思考方法”。• 卓越表现:仅用约2100条“
只显示前20页数据,更多请搜索
Showing 25 to 30 of 30 results