关键词 "大模型" 的搜索结果, 共 3 条, 只显示前 480 条
TokenPony 是为个人开发者和小型团队设计的高效 AI 平台,如同一位智能指挥家,将多种主流大模型(如 DeepSeek、Kimi、Qwen、GLM 等)集成在一个统一接口下,极大地简化了模型切换的繁琐流程。用户无需跨平台操作,可一键接入并自由调用不同模型,享受超长 1024K 上下文支持,轻松处理长文档和复杂任务。TokenPony 提供零配置、免部署的一键调用 API,无需自建 GPU
微软研究院的一个研究团队探索了使用主动式强化学习(agentic reinforcement learning)来实现这一目标,也就是说,模型会与专用工具环境中的工具进行交互,并根据收到的反馈调整其推理方式。而他们的探索成果便是 rStar2-Agent,这是一种强大的主动式强化学习方法。使用该方法,这个微软团队训练了一个 14B 的推理模型 rStar2-Agent-14B—— 该模型达到前沿级
ROMA是一个元代理框架,它使用递归分层结构来解决复杂问题。通过将任务分解为可并行执行的组件,ROMA 使代理能够应对复杂的推理挑战,同时保持透明性,从而简化上下文工程和迭代。该框架提供并行问题解决功能,代理可以同时处理复杂任务的不同部分;其开发过程透明,结构清晰,易于调试;此外,我们搜索代理的强大基准测试结果也证明了其卓越的性能。我们已经展示了该框架的有效性,但这仅仅是个开始。作为一个开源且可扩
只显示前20页数据,更多请搜索
Showing 97 to 99 of 99 results