搜索结果

关键词 "QA testing" 的搜索结果，共 3 条, 只显示前 480 条

WebSailor

WebSailor 是阿里通义实验室开源的网络智能体，专注于复杂信息检索与推理任务。通过创新的数据合成方法（如 SailorFog-QA）和训练技术（如拒绝采样微调和 DUPO 算法），在高难度任务中表现出色，在 BrowseComp 等评测中超越多个知名模型，登顶开源网络智能体榜单。WebSailor 的推理重构技术能高效处理复杂任务，生成简洁且精准的推理链。在复杂场景中表现出色，在简单任务中展

Youtu-agent – 腾讯优图推出的开源智能体框架

Youtu-agent 是腾讯优图实验室推出的开源智能体框架，用在构建、运行和评估自主智能体。框架基于开源模型DeepSeek-V3实现领先性能，支持多种模型 API 和工具集成，具备强大的智能体能力，如数据分析、文件处理和深度研究。框架用灵活的架构设计，支持 YAML 配置和自动智能体生成，简化开发流程。Youtu-agent 在 WebWalkerQA 和 GAIA 基准测试中表现出色，适用智

ST-Raptor--开源表格问答工具

上海交通大学等开源了一款半结构化表格问答工具：ST-Raptor，无需微调，准确率超GPT-4o 做文档智能、财务审核、报表自动化、医疗质控、法律合规的可以看看它通过视觉理解、结构化解析以及语言推理，来解决复杂、不规则表格的问答问题也就是说可以用它对Excel报表、网站上的表格以及Markdown、csv文件进行问答，比如学术表、财务报表 ST-Raptor先用VLM识别表格整体和单元格内容，

只显示前20页数据，更多请搜索