关键词 "强化学习" 的搜索结果, 共 4 条, 只显示前 480 条
1.codonGPT引入了第一个直接在编码mRNA序列(密码子)上训练的生成语言模型,解决了基于RNA的序列建模中一个主要问题,该问题一直落后于DNA和蛋白质建模的进展。 2.一项关键创新是使用推理时间同义逻辑掩蔽,确保生成的密码子序列以100%的保真度保留原始氨基酸序列,这对于治疗应用至关重要。 3.强化学习(RL)首次在codonGPT的基础上用于优化特定蛋白质的密码子序列。这允许用户跨
Pokee AI 是下一代通用 AI Agent 开发平台。平台基于强化学习(RL)技术构建高效、个性化且交互性强的 AI Agent,替代传统大语言模型进行任务规划和工具调用。Pokee AI 的 Agent 在多步骤任务执行、推理和工具使用方面表现出色,能快速响应用户指令、提供精准服务,适用于电商、开发与创作、企业自动化等多个领域,基于个性化服务与用户建立长期绑定关系,推动 AI 在更多场景中
Klear-Reasoner 是快手推出的基于 Qwen3-8B-Base 的推理模型,专注于提升数学和代码推理能力。模型通过长思维链监督微调(long CoT SFT)和强化学习(RL)训练,核心创新是 GPPO算法,通过保留被裁剪的梯度信息,解决传统方法中探索能力受限和负样本收敛慢的问题,在 AIME 和 LiveCodeBench 等基准测试中达到 8B 模型的顶尖水平。Klear-Reas
Aivilization 是香港科技大学推出的全球首个大型人工智能多智能体社会模拟沙盒平台。结合了公民科学游戏、公共教育和大规模多智能体社会模拟,通过可视化的数字沙盒,让用户创造、引导并观察成千上万个 AI 智能体,模拟未来人与 AI 共存的社会演化。平台的核心目标是普及 AI 知识、收集人类反馈数据以支持 AI 技术研究,探索 AI 在未来社会中的角色。支持数千个 AI 智能体同时在线,模拟复杂
只显示前20页数据,更多请搜索
Showing 25 to 28 of 28 results