关键词 "测试" 的搜索结果, 共 15 条, 只显示前 480 条
MedResearcher-R1是蚂蚁集团开源的一款Agentic AI,旨在解决医疗领域的“稀疏知识”难题。它摒弃“数据投喂”模式,转而主动“设计”高质量训练:• 智能数据:通过KISA框架,从3000万+文献中筛选罕见实体,生成高难度多步推理任务。• 精准学习:配备优先考虑“权威性”的专用工具,并采用“蒙版引导”及复合奖励函数,训练AI掌握可泛化的“思考方法”。• 卓越表现:仅用约2100条“
阿里巴巴正式发布其医疗大模型QuarkMed,它在一项模拟中国执业医师资格考试的测试中,取得了70%的惊人准确率,性能超越一众顶尖模型。其成功的秘诀并非单一技术突破,而是一套严谨的组合拳:世界级的数据工程 (1T tokens的权威分级数据) 与独创的“四段式”训练心法,系统性地将通用AI锻造成领域专家。更重要的是,该项目为行业揭示了两条关于AI可靠性的黄金法则:• 法则一:在高风险领域,RAG(
GPT-5-Codex 是 OpenAI 推出的专为编程优化的模型,基于 GPT-5 进一步强化。模型聚焦于真实世界的软件工程任务,如从零搭建项目、代码重构、调试、测试和代码审查等。模型能根据任务复杂度动态调整思考时间,简单任务秒回,复杂任务深度思考,支持独立完成长达 7 小时的复杂任务。模型代码审查能力出色,能精准发现关键缺陷,减少无效评论。GPT-5-Codex 支持多模态输入,能在云端查看图
腾讯优图实验室进一步开源 Youtu-GraphRAG——这是一款全新的图检索增强生成框架,主打大语言模型+GraphRAG模式,把知识组织成「图谱」,再交给大语言模型去检索和推理,帮助大模型在处理复杂问答类任务时减少「胡言乱语」,回答更精准、更可追溯。它尤其适用于企业知识库问答、科研文档解析、个人知识库、私域知识管理等知识密集型场景。要减少胡编乱造,关键在于更精准的检索与推理。Youtu-Gra
小米集团AI实验室新一代 Kaldi 团队发布了基于 Flow Matching 架构的ZipVoice系列语音合成(TTS)模型——ZipVoice(零样本单说话人语音合成模型)与ZipVoice-Dialog(零样本对话语音合成模型)。作为 zipformer 在语音生成任务上的应用和探索,ZipVoice解决了现有零样本语音合成模型的参数量大、合成速度慢的痛点,在轻量化建模和推理加速上取得了
RustGPT 是用 Rust 编写的 Transformer 架构语言模型。RustGPT从零开始构建,不依赖任何外部机器学习框架,仅用 ndarray 进行矩阵运算。项目包括事实文本补全的预训练、用于会话 AI 的指令微调及交互式聊天模式测试。RustGPT模块化架构确保关注点的清晰分离,便于理解和扩展。RustGPT 适合对 Rust 和机器学习感兴趣的开发者,是一个优秀的学习项目。Rust
LLaSO:大型语言和语音模型中可重复研究的基础框架完全开放的语料库+基准+参考模型,用于组合语音语言理解。LLaSO-Base 在涵盖语言、语义和副语言类别的 20 项任务中获得LLaSO-Eval 的最佳标准化总体得分。???? LLaSO 是什么?LLaSO 是第一个完全开放的端到端大规模语音语言建模堆栈,在一个框架中统一数据、评估和建模。LLaSO-Align (12.0M):基于 ASR 的对
MentalAge.org is a fun and engaging online platform that helps you discover your psychological age through an interactive 12-question test.
SimpleFold 是苹果公司推出的轻量级蛋白质折叠预测 AI 模型。模型基于流匹配(Flow Matching)技术,跳过多序列比对(MSA)等复杂模块,直接从随机噪声生成蛋白质的三维结构,大幅降低计算成本。在 CAMEO22 和 CASP14 等权威基准测试中,SimpleFold 表现出色,无需昂贵的多序列比对和三角注意机制,能达到与顶尖模型(如 AlphaFold2、RoseTTAFol
AI Quests 是谷歌研究团队与斯坦福学习加速器联合推出的游戏化教育工具,通过沉浸式冒险活动,让11至14岁的学生学习人工智能(AI)及在现实世界中的应用。学生将扮演谷歌研究人员的角色,解决与气候、健康和科学相关的问题。首个任务是洪水预测,未来将有糖尿病视网膜病变检测和大脑映射等任务。每个任务配有课程计划、教师指南和真实研究人员的视频信息,帮助学生理解AI的实际应用。AI Quests主要功能
Neovate Code 是蚂蚁集团开源的智能编程助手,专注于提升开发效率。工具能深度理解代码库,遵循既有编码习惯,精准完成代码生成、Bug修复和重构等任务。通过对话式界面,支持开发者用自然地描述需求,Neovate Code 提供安全、可控的实现方案。工具支持多种流行模型(如 OpenAI、Anthropic 等),可通过插件系统灵活扩展功能。目前以 CLI 工具形式提供,未来将适配更多客户端形
CWM(Code World Model)是 Meta 开源的一个拥有 320 亿参数的代码语言模型。它率先将“世界模型”的概念引入代码生成领域,让模型能够通过模拟代码执行过程,更深层次地理解和生成代码,而不仅仅是基于模式匹配。CWM 在多项基准测试中表现出色,例如在 Math-500 数据集上取得了 96.6% 的准确率。该模型的权重已公开,旨在推动代码生成和理解领域的研究,并帮助开发者更高效地
MiroMind:由陈天桥先生创立的预测型 AI 平台MiroMind 是由陈天桥推出的一个专注于 AI 领域的平台,致力于开发全球领先的预测型大模型。该平台的核心理念是让 AI “记住过去、洞察未来”,通过其独特的记忆驱动机制,帮助 AI 进行更精准的预测与决策。MiroMind 的主要产品包括:MiroThinker:一个开源的深度研究模型,在 GAIA 等基准测试中表现出色,超越了许多同类开
Lessie AI 号称是全球首个**“人物搜索”AI 智能体**(People Search AI Agent),致力于帮助您高效连接任何人、链接世界。这款专注于网红营销的 AI 工具目前处于免费测试阶段,每月提供 1500 次免费网红搜索额度。Lessie AI 能在短短 30 秒内,为您在 TikTok、YouTube 和 Instagram 等主流社交媒体平台上,找到 500+ 位与您的品
Vibecode 是一款专为 AI 编程开发者设计的移动应用构建平台,它能让您通过简单的自然语言描述,快速构建和部署功能完善的 React Native 移动应用。该平台提供了一个集成的开发环境,您无需 API 密钥即可使用多种 AI 工具,并能在本地即时预览和测试应用,通过 App Clip 快速分享以获取反馈。Vibecode 旨在让应用开发变得简单快捷,尤其适合初学者和非技术用户快速实现创意
只显示前20页数据,更多请搜索
Showing 169 to 183 of 183 results