关键词 "微软" 的搜索结果, 共 5 条, 只显示前 480 条
百川智能核心团队由来自搜狗、百度、华为、微软、字节、腾讯等知名科技公司的AI顶尖人才组成。百川智能成立不到100天,便发布了Baichuan-7B、Baichuan-13B两款开源可免费商用的中文大模型。2025年1月24日,百川智能发布全场景深度思考模型Baichuan-M1-preview,该模型同时具备语言、视觉和搜索三大领域推理能力,现已在百小应中正式上线。
BitNet 是微软研究院开发的第一个开源、原生 1 位大型语言模型 (LLM),参数规模达 20 亿。 该模型在 4 万亿个标记的语料库上进行训练,表明原生 1 位 LLM 可以实现与类似大小的领先开放权重、全精度模型相当的性能,同时在计算效率(内存、能量、延迟)方面具有显著优势。 github地址:https://github.com/microsoft/BitNet
MAI-DS-R1 是 DeepSeek-R1 推理模型,经过微软 AI 团队的后期训练,提高了其对受阻主题的响应能力和风险状况,同时保持了其推理能力和竞争性能。基于 DeepSeek-R1,这是一种基于 Transformer 的自回归语言模型,利用多头自注意力和混合专家 (MoE) 进行可扩展和高效的推理。 MAI-DS-R1 是一个 DeepSeek-R1 推理模型,经过微软 AI 团队的后期训练,旨在填补先前版本模型中的信息空白,并提升其风险状况,同时保持 R1 推理能力。该模型使用来自Tulu 3 SFT 数据集的 11 万个安全和不合规示例进行训练,此外还使用了内部开发的约 35 万个多语言示例数据集,该数据集涵盖了各种存在偏差的主题。 MAI-DS-R1 成功解锁了原始 R1 模型中大多数先前被阻止的查询,同时在相关安全基准测试中超越了近期发布的 R1-1776 模型(由 Perplexity 进行后训练)。这些结果的实现同时保留了原始 DeepSeek-R1 的通用推理能力。
AutoGen是微软发布的一个工具,旨在帮助开发者创建基于大语言模型的复杂应用程序。 AutoGen是一个开源编程框架,旨在帮助开发者构建基于多智能体的应用程序,特别是那些涉及复杂工作流和对话模式的场景。AutoGen由微软推出,支持多种编程语言和跨语言开发,包括Python和.NET。其主要特点包括: 多智能体支持:AutoGen允许开发者创建多个智能体,这些智能体可以相互对话、协作完成任务。每个智能体可以扮演不同的角色,如用户智能体和助手智能体,分别负责提出需求和执行任务 对话模式:AutoGen支持多种对话模式,包括单智能体和多智能体对话。它提供了丰富的API和工具,使得开发者可以自定义智能体的行为和交互方式 工作流编排:AutoGen简化了复杂工作流的编排、自动化和优化。它能够处理大语言模型(LLM)的弱点,最大化LLM的性能 跨领域应用:AutoGen适用于多个领域,包括代码生成、自动翻译、自动摘要等。它支持多种LLM集成,使得开发者可以轻松构建复杂的应用程序
微软开放的桌面智能体,The Desktop AgentOS.
只显示前20页数据,更多请搜索