AI Engineer MCP 2025

Ai Math Solver

<p>"AI Math Solver makes solving math problems simple and fast. Get accurate, step-by-step solutions for algebra, geometry, calculus, and word problems—free and easy for students, teachers, and math lovers."</p>

AI-Researcher

<p>AI-Researcher 是香港大学数据科学实验室推出的开源自动化科学研究工具，基于大型语言模型（LLM）代理实现从研究想法到论文发表的全流程自动化。AI-Researcher 支持用户在两种模式下操作：一是提供详细的研究想法描述，系统据此生成实现策略；二是提供参考文献，系统自主生成创新想法实施。平台集成文献综述、想法生成、算法设计与验证、结果分析和论文撰写等核心功能，支持多领域研究，基于开源的基准测试套件评估研究质量。</p> <h2 style="font-size: 20px;">AI-Researcher的主要功能</h2> <ul> <li>文献综述：系统自动收集和分析特定领域的现有研究文献，基于检索学术数据库（如 arXiv、IEEE Xplore 等）和代码平台（如 GitHub、Hugging Face）获取高质量的研究资源。</li> <li>算法验证与优化：自动进行实验设计、执行和结果分析，评估算法的性能，根据反馈进行优化，确保算法的有效性和可靠性。</li> <li>论文撰写：自动生成完整的学术论文，包括研究背景、方法、实验结果和讨论等内容。</li> <li>多领域支持与基准测试：支持计算机视觉、自然语言处理、数据挖掘等多个领域的研究，提供标准化的基准测试框架，用在评估研究质量和创新性。</li> </ul> <h2 style="font-size: 20px;">AI-Researcher的技术原理</h2> <ul> <li>多模态数据集成与处理：系统基于自动化工具从学术数据库和代码平台收集文献、代码和数据集，用自然语言处理（NLP）技术对文本内容进行解析和分析，提取关键信息。</li> <li>基于LLM的智能代理：基于大型语言模型（LLM）作为核心驱动，用预训练模型（如 OpenAI 的 GPT 或 DeepSeek 的模型）生成高质量的文本内容，包括研究想法、算法设计和论文撰写。</li> <li>自动化实验与验证：系统基于容器化技术（如 Docker）和自动化脚本，实现算法的快速部署和实验执行。系统自动设计实验流程、收集结果，基于机器学习技术对结果进行分析和优化。</li> <li>多级任务处理与模块化设计：支持两种任务级别：用户提供详细想法（Level 1）和仅提供参考文献（Level 2）。系统根据任务级别调用不同的模块，实现从想法生成到论文撰写的全流程自动化。</li> </ul> <h2 style="font-size: 20px;">AI-Researcher的项目地址</h2> <ul> <li>GitHub仓库：<a class="external" href="https://github.com/HKUDS/AI-Researcher" target="_blank" rel="noopener nofollow">https://github.com/HKUDS/AI-Researcher</a></li> </ul>

Aurora

<p>Aurora是微软研究院推出的13亿参数的大气基础模型，基于从海量大气数据中提取有价值信息，用在预测全球天气模式、空气污染和海洋波浪等大气过程。模型用预训练和微调的架构，处理不同分辨率和压力水平的数据。Aurora在多个预测任务中表现出色，包括高分辨率天气预测、空气污染预测和热带气旋轨迹预测，计算速度比传统数值天气模型快约5000倍。模型提高了预测精度，降低计算成本，为应对气候变化和极端天气事件提供有力工具。</p> <p> </p> <h2 style="font-size: 20px;">Aurora的主要功能</h2> <ul> <li>高分辨率天气预测：Aurora能生成高分辨率（如0.1°）的全球天气预测，覆盖未来10天的气象变量，包括温度、风速、气压等。</li> <li>空气污染预测：Aurora能预测全球空气污染水平，包括二氧化氮（NO₂）、二氧化硫（SO₂）、臭氧（O₃）和颗粒物（PM1、PM2.5、PM10）等污染物的浓度。</li> <li>海洋波浪预测：Aurora能预测海洋波浪的高度、周期和方向，帮助航运、沿海防御和海洋能源开发等领域。</li> <li>热带气旋轨迹预测：Aurora能准确预测热带气旋的移动轨迹，为防灾减灾提供重要支持。</li> <li>极端天气事件预测：Aurora在预测极端天气事件（如风暴、洪水、干旱）方面表现出色，能提前发出预警，减少灾害损失。</li> </ul> <h2 style="font-size: 20px;">Aurora的技术原理</h2> <ul> <li>基础模型架构：Aurora用预训练和微调的两阶段训练方法。预训练阶段，模型在大量多样化的大气数据上学习通用的天气和气候表示；微调阶段，模型针对特定任务（如天气预测或空气污染预测）进行优化。</li> <li>3D Swin Transformer：Aurora的核心是灵活的3D Swin Transformer，支持处理不同空间分辨率和压力水平的大气变量。</li> <li>Perceiver编码器和解码器：基于Perceiver的编码器和解码器，处理异构输入，在不同分辨率和保真度下生成预测。</li> <li>数据多样性：在预训练阶段用多种数据源，包括分析数据、再分析数据、气候模拟和业务预报数据。多样化的数据输入让模型能学习到更广泛的大气动力学模式。</li> <li>计算效率：基于高效的模型架构和训练方法，显著提高计算效率，在短时间内生成高精度的预测，计算速度比传统数值天气模型快约5000倍。</li> </ul> <h2 style="font-size: 20px;">Aurora的项目地址</h2> <ul> <li>项目官网：<a class="external" href="https://microsoft.github.io/aurora/intro.html?utm_source=medsci" target="_blank" rel="noopener">https://microsoft.github.io/aurora</a></li> <li>GitHub仓库：<a class="external" href="https://github.com/microsoft/aurora" target="_blank" rel="noopener nofollow">https://github.com/microsoft/aurora</a></li> <li>arXiv技术论文：<a class="external" href="https://arxiv.org/pdf/2405.13063" target="_blank" rel="noopener nofollow">https://arxiv.org/pdf/2405.13063</a></li> </ul>

DreamGen

<p>DreamGen是英伟达推出的创新的机器人学习技术，基于AI视频世界模型生成合成数据，让机器人能在梦境中学习新技能。DreamGen仅需少量现实视频数据，能生成大规模逼真的训练数据，实现机器人在新环境中的行为泛化和环境泛化。DreamGen的四步流程包括微调视频世界模型、生成虚拟数据、提取虚拟动作以及训练下游策略。DreamGen让机器人在没有真实世界数据支持的情况下，凭文本指令完成复杂任务，显著提升学习效率和泛化能力。</p> <h2 style="font-size: 20px;">DreamGen的主要功能</h2> <ul> <li>行为泛化：让机器人学习、执行新的行为，无需为每种新行为收集大量的真实世界数据。</li> <li>环境泛化：让机器人在未见过的环境中执行任务。基于在单一环境中收集的数据，机器人能在多种新环境中成功执行任务。</li> <li>数据增强：生成大规模的合成训练数据，提升机器人在复杂任务中的成功率。</li> <li>多机器人系统支持：支持多种机器人系统（如Franka、SO-100等）和不同的策略架构（如Diffusion Policy、GR00T N1等），具有广泛的适用性。</li> </ul> <h2 style="font-size: 20px;">DreamGen的技术原理</h2> <ul> <li>微调视频世界模型：用目标机器人的遥操作轨迹数据，微调视频世界模型（如Sora、Veo等），捕捉机器人的运动学和动力学特征。基于低秩适应（LoRA）技术，减少模型对原始数据的遗忘，适应新的机器人特征。</li> <li>虚拟数据生成：给定初始帧和语言指令，视频世界模型生成描述预期行为的大量机器人视频序列。视频不仅包含已知行为，包括新环境中的新行为。基于过滤掉不符合指令的“噩梦”视频，确保生成的数据质量。</li> <li>虚拟动作提取：用潜在动作模型（LAPA）或逆动力学模型（IDM）解析生成的视频序列，提取伪动作序列，形成神经轨迹。伪动作序列用在训练下游的视觉运动策略。</li> <li>策略训练：用生成的视频动作序列对（即神经轨迹）训练下游的视觉运动策略。基于神经轨迹，机器人在没有真实世界数据的情况下学习新任务，实现零样本泛化。</li> </ul> <h2 style="font-size: 20px;">DreamGen的项目地址</h2> <ul> <li>项目官网：<a class="external" href="https://research.nvidia.com/labs/gear/dreamgen/?utm_source=ai-bot.cn" target="_blank" rel="noopener nofollow">https://research.nvidia.com/labs/gear/dreamgen/</a></li> <li>arXiv技术论文：<a class="external" href="https://arxiv.org/pdf/2505.12705" target="_blank" rel="noopener nofollow">https://arxiv.org/pdf/2505.12705</a></li> </ul>

Cosmos-Reason1

<p>英纬达发布了其最新的 Cosmos-Reason1系列模型，旨在提升人工智能在物理常识和具身推理方面的能力。随着人工智能在语言处理、数学及代码生成等领域取得显著进展，如何将这些能力扩展到物理环境中成为了一大挑战。</p> <p><img style="display: block; margin-left: auto; margin-right: auto;" src="https://img.medsci.cn/aisite/tinymce/2025/05/21/1747866697_gdVkD30Uu5.png"></p> <p>物理 AI（Physical AI）不同于传统的人工智能，它依赖于视频等感官输入，并结合现实物理法则来生成反应。物理 AI 的应用领域包括机器人和自动驾驶车辆等，需要具备常识推理能力和对空间、时间及物理规律的深入理解。</p> <p>然而，现有的 AI 模型在与物理世界的连接上依然存在弱点，无法直观理解重力或空间关系，这使得其在具身任务中的表现不佳。直接在物理世界中进行训练的成本高昂且风险巨大，这在一定程度上阻碍了物理 AI 的发展。</p> <p>为了解决这些问题，英纬达的 Cosmos-Reason1模型提出了创新的解决方案。该系列模型包括 Cosmos-Reason1-7B 和 Cosmos-Reason1-56B 两个版本，采用了物理 AI 监督微调和强化学习两大训练阶段。</p> <p>研究团队引入了双本体系统，一个分层本体将物理常识分为空间、时间和基础物理三大类，另一个本体则映射人类、机械臂和人形机器人等具身代理的推理能力。</p> <p>模型架构采用了仅解码器的大型语言模型，结合视觉编码器以处理视频数据，从而实现文本和视觉数据的同步推理。为此，团队构建了针对物理常识的三个基准测试，涵盖604个问题和426个视频，以及针对具身推理的六个基准，包含610个问题和600个视频。</p> <p>经过训练，Cosmos-Reason1模型在物理常识和具身推理基准测试中表现出色，特别是在强化学习训练后，在预测下一步行动、验证任务完成及评估物理可行性等方面取得了显著进展。</p> <p>随着 Cosmos-Reason1系列模型的推出，英伟达为物理推理任务提供了新的解决方案，未来在机器人和自动驾驶领域的应用潜力可期。</p> <p>入口: https://github.com/nvidia-cosmos/cosmos-reason1</p>

LegoGPT

<p>卡内基梅隆大学的研究团队开发出一款名为 LegoGPT 的 AI 模型，能够根据文字指令生成可实际搭建的乐高设计。</p> <p>比如输入文本「基本款沙发」，一眨眼的功夫，乐高沙发就拼好了。</p> <p>团队训练了一种自回归大型语言模型，通过预测下一个 token 的方式，判断下一块该放置什么积木。团队还为模型增加了有效性校验和带有物理感知的回滚机制，确保生成的设计不会出现积木重叠或悬空等问题，也就是说最终结果始终可行且结构稳固。不仅如此，LegoGPT 输出的设计，既能由人手搭建，也支持机器人操作。</p> <p>用于训练 LegoGPT 的数据集被命名为 StableText2Lego，构建流程也相当复杂：系统会先将文本提示转化为 ShapeNetCore 网格模型，再将其嵌入一个 20×20×20 的体素网格中，从而生成初步的乐高积木布局。</p> <p>LegoGPT 以端到端的方式根据用户提供的文本提示生成乐高结构。值得一提的是，生成的乐高结构物理上稳定且可搭建。</p> <p><img style="display: block; margin-left: auto; margin-right: auto;" src="https://img.medsci.cn/aisite/tinymce/2025/05/20/1747721734_jkAbalo4T3.png"></p> <p>LegoGPT 出自卡内基梅隆大学助理教授朱俊彦团队，朱俊彦表示：LegoGPT 是迈向「物理对象生成制造」这一终极目标的一小步。当前版本仍存在局限：仅支持 20x20x20 的构建尺寸、21 种物体类别和基础积木类型，但他们也在努力扩展其能力！</p> <p>链接</p> <ul> <li> <p>arXiv 地址：<a href="https://www.oschina.net/action/GoToLink?url=https%3A%2F%2Farxiv.org%2Fpdf%2F2505.05469" target="_blank" rel="noopener">https://arxiv.org/pdf/2505.05469</a></p> </li> <li> <p>GitHub 地址：<a href="https://www.oschina.net/action/GoToLink?url=https%3A%2F%2Fgithub.com%2FAvaLovelace1%2FLegoGPT" target="_blank" rel="noopener">https://github.com/AvaLovelace1/LegoGPT</a></p> </li> <li> <p>Demo 地址：<a href="https://www.oschina.net/action/GoToLink?url=https%3A%2F%2Fhuggingface.co%2Fspaces%2Fcmu-gil%2FLegoGPT-Demo" target="_blank" rel="noopener">https://huggingface.co/spaces/cmu-gil/LegoGPT-Demo</a></p> </li> </ul>

FutureHouse

<p>FutureHouse是指一个非营利组织，它刚刚发布了四个超人类的AI科学家智能体，包括Crow（乌鸦）、Falcon（猎鹰）、Owl（猫头鹰）和Phoenix（凤凰）。这些智能体专门用于科学研究，已经通过了严格的基准测试，在搜索精度和准确性上超越了目前顶级的搜索模型，如o3-mini、GPT-4.5、Claude-3.7。此外，它们在直接文献搜索任务中，检索和综合能力比博士水平的研究人员更高。这些AI科学家智能体能够访问大量完整的科学文本，从而能够回答关于实验方案和研究局限性的详细问题。</p>

mujoco

<p>Mujoco（Multi-Joint dynamics with Contact）是一款用于机器人学、生物力学等领域的高性能物理仿真引擎，其核心功能包括动力学模拟、接触力建模及多关节系统仿真。该工具提供直观的操作界面、丰富的物理参数配置以及灵活的约束条件设置，适用于复杂机械系统或生物运动的模拟分析。以下从操作功能、仿真交互机制、核心术语与参数三个维度展开说明。</p> <p>MuJoCo是“多关节接触动力学”（Multi-Joint dynamics with Contact）的缩写。它是一款通用物理引擎，旨在促进机器人技术、生物力学、图形动画、机器学习以及其他需要快速准确地模拟铰接式结构与环境相互作用的领域的研究和开发。</p> <p><a href="https://www.deepmind.com/" rel="nofollow">该存储库由Google DeepMind</a>维护。</p> <p>MuJoCo 拥有 C API，面向研究人员和开发者。运行时模拟模块经过调优，可最大程度提升性能，并可在内置 XML 编译器预先分配的低级数据结构上运行。该库包含一个原生 GUI 的交互式可视化功能，并以 OpenGL 渲染。MuJoCo 还公开了大量用于计算物理相关量的实用函数。</p> <p>我们还为<a href="https://unity.com/" rel="nofollow">Unity</a>游戏引擎提供<a href="https://mujoco.readthedocs.io/en/stable/python.html#python-bindings" rel="nofollow">Python 绑定</a>和插件。</p> <div class="markdown-heading" dir="auto"> <h2 class="heading-element" dir="auto" tabindex="-1">文档</h2> <a id="user-content-documentation" class="anchor" href="https://github.com/google-deepmind/mujoco#documentation" aria-label="永久链接：文档"></a></div> <p><a href="https://mujoco.readthedocs.io/" rel="nofollow">MuJoCo 的文档可以在mujoco.readthedocs.io</a>找到。即将发布的下一版本功能可以在“最新”分支的<a href="https://mujoco.readthedocs.io/en/latest/changelog.html" rel="nofollow">变更日志中找到。</a></p> <div class="markdown-heading" dir="auto"> <h2 class="heading-element" dir="auto" tabindex="-1">入门</h2> <a id="user-content-getting-started" class="anchor" href="https://github.com/google-deepmind/mujoco#getting-started" aria-label="永久链接：入门"></a></div> <p>有两种简单的方法可以开始使用 MuJoCo：</p> <ol dir="auto"> <li> <p><code>simulate</code>在您的机器上运行。 <a href="https://www.youtube.com/watch?v=P83tKA1iz2Y" rel="nofollow">此视频</a><code>simulate</code>展示了MuJoCo 原生交互式查看器的屏幕截图。请按照文档<a href="https://mujoco.readthedocs.io/en/latest/programming#getting-started" rel="nofollow">“入门”</a><code>simulate</code>部分中描述的步骤在您的机器上运行。</p> </li> <li> <p>探索我们的在线 IPython 笔记本。如果您是 Python 用户，不妨先从我们在 Google Colab 上运行的教程笔记本开始：</p> </li> </ol> <ul dir="auto"> <li>入门教程讲授 MuJoCo 基础知识： <a href="https://colab.research.google.com/github/google-deepmind/mujoco/blob/main/python/tutorial.ipynb" rel="nofollow"><img style="display: block; margin-left: auto; margin-right: auto;" src="https://camo.githubusercontent.com/96889048f8a9014fdeba2a891f97150c6aac6e723f5190236b10215a97ed41f3/68747470733a2f2f636f6c61622e72657365617263682e676f6f676c652e636f6d2f6173736574732f636f6c61622d62616467652e737667"></a></li> <li>模型编辑教程展示了如何以程序方式创建和编辑模型： <a href="https://colab.research.google.com/github/google-deepmind/mujoco/blob/main/python/mjspec.ipynb" rel="nofollow"><img style="display: block; margin-left: auto; margin-right: auto;" src="https://camo.githubusercontent.com/96889048f8a9014fdeba2a891f97150c6aac6e723f5190236b10215a97ed41f3/68747470733a2f2f636f6c61622e72657365617263682e676f6f676c652e636f6d2f6173736574732f636f6c61622d62616467652e737667"></a></li> <li>推出的教程展示了如何使用多线程<code>rollout</code>模块： <a href="https://colab.research.google.com/github/google-deepmind/mujoco/blob/main/python/rollout.ipynb" rel="nofollow"><img style="display: block; margin-left: auto; margin-right: auto;" src="https://camo.githubusercontent.com/96889048f8a9014fdeba2a891f97150c6aac6e723f5190236b10215a97ed41f3/68747470733a2f2f636f6c61622e72657365617263682e676f6f676c652e636f6d2f6173736574732f636f6c61622d62616467652e737667"></a></li> <li>LQR教程合成了一个线性二次控制器，用于使人形机器人单腿保持平衡： <a href="https://colab.research.google.com/github/google-deepmind/mujoco/blob/main/python/LQR.ipynb" rel="nofollow"><img style="display: block; margin-left: auto; margin-right: auto;" src="https://camo.githubusercontent.com/96889048f8a9014fdeba2a891f97150c6aac6e723f5190236b10215a97ed41f3/68747470733a2f2f636f6c61622e72657365617263682e676f6f676c652e636f6d2f6173736574732f636f6c61622d62616467652e737667"></a></li> <li>最小二乘教程解释了如何使用基于 Python的非线性最小二乘求解器： <a href="https://colab.research.google.com/github/google-deepmind/mujoco/blob/main/python/least_squares.ipynb" rel="nofollow"><img style="display: block; margin-left: auto; margin-right: auto;" src="https://camo.githubusercontent.com/96889048f8a9014fdeba2a891f97150c6aac6e723f5190236b10215a97ed41f3/68747470733a2f2f636f6c61622e72657365617263682e676f6f676c652e636f6d2f6173736574732f636f6c61622d62616467652e737667"></a></li> <li>MJX教程提供了<a href="https://mujoco.readthedocs.io/en/stable/mjx.html" rel="nofollow">MuJoCo XLA</a>的使用示例，它是用 JAX 编写的 MuJoCo 的一个分支： <a href="https://colab.research.google.com/github/google-deepmind/mujoco/blob/main/mjx/tutorial.ipynb" rel="nofollow"><img style="display: block; margin-left: auto; margin-right: auto;" src="https://camo.githubusercontent.com/96889048f8a9014fdeba2a891f97150c6aac6e723f5190236b10215a97ed41f3/68747470733a2f2f636f6c61622e72657365617263682e676f6f676c652e636f6d2f6173736574732f636f6c61622d62616467652e737667"></a></li> <li>可微分物理教程使用从 MuJoCo 物理步骤自动得出的解析梯度来训练运动策略： <a href="https://colab.research.google.com/github/google-deepmind/mujoco/blob/main/mjx/training_apg.ipynb" rel="nofollow"><img style="display: block; margin-left: auto; margin-right: auto;" src="https://camo.githubusercontent.com/96889048f8a9014fdeba2a891f97150c6aac6e723f5190236b10215a97ed41f3/68747470733a2f2f636f6c61622e72657365617263682e676f6f676c652e636f6d2f6173736574732f636f6c61622d62616467652e737667"></a></li> </ul> <div class="markdown-heading" dir="auto"> <h2 class="heading-element" dir="auto" tabindex="-1">安装</h2> <a id="user-content-installation" class="anchor" href="https://github.com/google-deepmind/mujoco#installation" aria-label="永久链接：安装"></a></div> <div class="markdown-heading" dir="auto"> <h3 class="heading-element" dir="auto" tabindex="-1">预构建的二进制文件</h3> <a id="user-content-prebuilt-binaries" class="anchor" href="https://github.com/google-deepmind/mujoco#prebuilt-binaries" aria-label="永久链接：预构建二进制文件"></a></div> <p>版本化发行版以预编译二进制文件的形式提供，可从 GitHub <a href="https://github.com/google-deepmind/mujoco/releases">发行页面</a>获取，这些发行版针对 Linux（x86-64 和 AArch64）、Windows（仅限 x86-64）和 macOS（通用）构建。这是推荐的使用该软件的方式。</p> <div class="markdown-heading" dir="auto"> <h3 class="heading-element" dir="auto" tabindex="-1">从源代码构建</h3> <a id="user-content-building-from-source" class="anchor" href="https://github.com/google-deepmind/mujoco#building-from-source" aria-label="永久链接：从源代码构建"></a></div> <p>希望从源代码构建 MuJoCo 的用户，请参阅文档中<a href="https://mujoco.readthedocs.io/en/latest/programming#building-mujoco-from-source" rel="nofollow">“从源代码构建”</a>部分。但请注意，分支末端的提交<code>main</code>可能不稳定。</p> <div class="markdown-heading" dir="auto"> <h3 class="heading-element" dir="auto" tabindex="-1">Python（&gt;= 3.9）</h3> <a id="user-content-python--39" class="anchor" style="box-sizing: border-box; background-color: transparent; color: #0969da; text-decoration: underline; float: left; padding-right: 4px; margin: auto; line-height: 1; position: absolute; top: 12.5px; left: -28px; display: flex; width: 28px; height: 28px; border-radius: 6px; opacity: 0; justify-content: center; align-items: center; transform: translateY(-50%); text-underline-offset: 0.2rem;" href="https://github.com/google-deepmind/mujoco#python--39" aria-label="永久链接：Python（&gt;= 3.9）"></a></div> <p>本机 Python 绑定预先打包了 MuJoCo 的副本，可以通过以下方式从<a href="https://pypi.org/project/mujoco/" rel="nofollow">PyPI</a>安装：</p> <div class="highlight highlight-source-shell notranslate position-relative overflow-auto" dir="auto"> <pre>pip install mujoco</pre> <div class="zeroclipboard-container"> </div> </div>

AlphaFold Protein Structure Database

<p>2021年7月，谷歌旗下DeepMind团队和欧洲生物信息研究所（EMBL-EBI）合作，发布由人工智能系统AlphaFold预测的蛋白结构数据库（AlphaFold Protein Structure Database）。这一数据库包含了AlphaFold人工智能系统预测的约35万个蛋白结构，覆盖包括人类以及20种生物学研究中常用模式生物（大肠杆菌、果蝇、斑马鱼、小鼠…）。在人类蛋白质组方面，AI对98.5%的人类蛋白的结构做出了预测。此前，科学家们在数十年的努力之后，解析的蛋白结构只覆盖了人类蛋白序列中17%的氨基酸。这一数据库的发布也有望为生命科学带来革命性的变化。欧洲生物信息研究所主任Ewan Birney博士将它称之为人类基因组图谱发布以来最重要的数据库之一。</p>

AlphaFold

<p>AlphaFold 是 DeepMind 开源的人工智能系统，借助 AlphaFold 可以更加准确的预测蛋白质的形状。主要应用于医疗保健和生命科学领域，有可能加速药物的研究与发现。</p> <div class="dpu8C _2kCxD"> <p>AlphaFold到底厉害在哪里？它的核心武器叫做“深度学习”，简单来说，就是让AI自己去学习成千上万个已知的蛋白质结构，从中找出隐藏的规律。更重要的是，AlphaFold引入了一种叫做“进化信息”的数据，分析不同物种的蛋白质在进化过程中是如何保持稳定的。因为自然界已经给出了答案——能活下来的生物，蛋白质折叠结构一定是合理的。</p> </div> <div class="dpu8C _2kCxD"> <p>AlphaFold 1代刚问世时，已经在科学界引起轰动，预测准确率超过了以往所有算法。但DeepMind并不满足。他们接着推出了AlphaFold 2，性能直接飙升到另一个维度。2020年的国际蛋白质结构预测竞赛（CASP）上，AlphaFold 2的成绩让评委目瞪口呆：准确率高到接近实验解析的水平，甚至有些蛋白质的预测结果和实验数据一模一样。</p> </div> <div class="dpu8C _2kCxD"> <p>这是什么概念？过去，科学家要花几年、几十万美金，才能搞定一个蛋白质结构。现在，AlphaFold只需要几分钟，成本几乎为零。而且，它不需要实验室，不需要昂贵的设备，只需要一台服务器，和一段代码。</p> </div> <div class="dpu8C _2kCxD"> <p>这不是简单的技术进步，这是游戏规则的改变。</p> </div> <div class="dpu8C _2kCxD"> <p>03</p> </div> <div class="dpu8C _2kCxD"> <p>更令人震惊的是，DeepMind没有选择把AlphaFold的技术锁在实验室里，而是直接把整个模型和预测数据免费开放给全球科学界。短短几个月内，AlphaFold预测出了2亿多个蛋白质的三维结构，覆盖了几乎所有已知的生物物种。</p> </div> <div class="dpu8C _2kCxD"> <p>这意味着什么？意味着世界上任何一个科学家，无论是在哈佛的顶级实验室，还是在非洲偏远的野外研究站，都可以瞬间获得过去需要几十年才能积累的数据。这是一场彻底的科学平民化革命。</p> </div> <div class="dpu8C _2kCxD"> <p>AlphaFold的影响是立竿见影的。它推动了抗疟疾疫苗的突破，甚至帮助科学家找到了解决抗生素耐药性的新方法。在环境领域，科学家用它设计出能分解塑料的酶，尝试解决全球塑料污染问题。在医学领域，研究人员正在用它解析阿尔茨海默症、癌症等复杂疾病的蛋白质机制，寻找全新的治疗方案。</p> </div> <div class="dpu8C _2kCxD"> <p>更疯狂的是，科学家们不仅用AI来预测蛋白质，还开始用AI来“设计”蛋白质。是的，AlphaFold的进化版可以直接创造出自然界从未出现过的全新蛋白质，用于制造抗毒素、疫苗，甚至可以设计出能够捕捉二氧化碳、缓解全球变暖的分子。</p> </div> <div class="dpu8C _2kCxD"> <p>这不再是传统意义上的生物学研究，而是一场全新的生物技术革命。</p> </div> <div class="dpu8C _2kCxD"> <p>04</p> </div> <div class="dpu8C _2kCxD"> <p>AlphaFold的成功，不禁让人思考一个更深层次的问题：科学的未来，会不会越来越依赖AI？过去，人类的科学发现依靠的是天才的直觉、艰苦的实验和偶然的灵感。而现在，AI可以在短时间内处理人类几辈子都算不清的数据，找到隐藏在混沌中的规律。</p> </div> <div class="dpu8C _2kCxD"> <p>这是一件令人兴奋的事情，但也让人有些不安。当AI可以设计药物、预测疾病、创造生命分子，人类科学家的角色会变成什么？我们会不会沦为“AI实验室的操作员”，只是按下按钮，等待结果的“工具人”？</p> </div> <div class="dpu8C _2kCxD"> <p>或许，这正是科技发展的必然趋势。人类从发明算盘到计算机，再到人工智能，每一次工具的进化，都是对人类智慧的扩展。AI不会取代科学家，但它会迫使科学家重新定义自己的角色：不再是孤独的探索者，而是与AI并肩作战的合作伙伴。</p> </div> <div class="dpu8C _2kCxD"> <p>历史上，哥白尼用望远镜改变了人类对宇宙的认知，牛顿用公式揭示了万有引力的秘密。而今天，AlphaFold用算法打开了生命的黑匣子。科学从未停止前进的脚步，唯一不变的，是人类不断追问世界本质的勇气。</p> </div> <div class="dpu8C _2kCxD"> <p>所以，当你听到AlphaFold这个名字时，不要只把它当作某个高科技产品。它是一道新的曙光，照亮了人类理解生命、改造世界的道路。而这场由AI引领的科学革命，才刚刚开始。</p> </div>

MathModelAgent

<div class="dpu8C _2kCxD"> <p>一款开源MathModelAgent的AI助手，专为数学建模设计的智能工具，能够自动完成从问题分析、模型构建、代码编写到论文撰写的全流程，展现了AI在学术与技术领域的深远潜力。</p> </div> <div class="_3hMwG _2kCxD"> <div class="_1NCGf"><img style="display: block; margin-left: auto; margin-right: auto;" src="https://img.medsci.cn/aisite/tinymce/2025/05/19/1747627885_hMn9vPMlDH.png"></div> </div> <div class="dpu8C _2kCxD"> <p>MathModelAgent:数学建模的革命性助手</p> </div> <div class="dpu8C _2kCxD"> <p>MathModelAgent是一个多智能体协作系统，集成了多个专业模块，包括负责数学建模的“建模手”、代码编写与调试的“代码手”以及论文撰写的“论文手”。据开源社区介绍，该系统通过协同工作，能够高效处理复杂的数学建模任务。无论是解析问题、建立数学模型、生成可执行代码，还是输出格式规范的学术论文，MathModelAgent都能一站式完成，为研究人员和开发者提供了前所未有的便利。该工具支持多种主流AI模型，并内置本地代码解释器，能够直接运行和调试生成的代码。这一功能显著降低了开发者的工作负担，尤其在需要快速验证模型或代码的场景中表现尤为突出。X平台上的开发者反馈称，MathModelAgent的出现“重新定义了数学建模的效率和可能性”。</p> </div> <div class="dpu8C _2kCxD"> <p>核心特性:智能协作与全流程覆盖</p> </div> <div class="dpu8C _2kCxD"> <p>MathModelAgent的设计理念是将数学建模的复杂流程分解为模块化任务，由多个智能体分工协作完成。其主要特性包括:</p> </div> <div class="dpu8C _2kCxD"> <ul> <li> <p>问题分析与建模:建模手能够快速解析输入的数学问题，生成符合逻辑的数学模型，适用于从高中到大学水平的多种数学任务。</p> </li> <li> <p>代码生成与调试:代码手内置反思模块，可生成高质量代码并通过本地解释器进行实时调试，确保代码的正确性和可执行性。</p> </li> <li> <p>论文自动撰写:论文手根据建模和计算结果，自动生成格式规范的学术论文，涵盖摘要、方法、结果等完整结构，极大减轻了学术写作的压力。</p> </li> <li> <p>开源与灵活性:MathModelAgent已在GitHub上开源，允许开发者根据需求定制模块或集成其他AI模型，进一步扩展其应用场景。</p> </li> </ul> </div> <div class="dpu8C _2kCxD"> <p>这些特性使MathModelAgent成为学术研究、工程应用和教育领域的理想工具，尤其适合需要快速迭代和验证的场景。</p> </div> <div class="dpu8C _2kCxD"> <p>MathModelAgent的开源属性进一步增强了其影响力。通过GitHub平台，全球开发者可以自由访问、修改和优化这一工具，推动了数学建模领域的开源生态发展。AIbase观察到，MathModelAgent的发布正值AI在学术领域的应用热潮，这使其有望成为数学研究和教育中的重要助力。</p> </div> <div class="dpu8C _2kCxD"> <p>技术亮点:效率与精准的完美结合</p> </div> <div class="dpu8C _2kCxD"> <p>MathModelAgent的成功得益于其在效率与精准性上的平衡。系统通过多智能体协作，将传统建模流程中的人工干预降至最低，同时保持高质量输出。其内置的反思模块能够在代码生成后自动检查错误并优化，确保结果的可靠性。此外，MathModelAgent支持多种数学问题类型，从代数、几何到微积分、统计学，覆盖广泛的应用场景。</p> </div> <div class="dpu8C _2kCxD"> <p>与此同时，该工具的本地代码解释器功能使其无需依赖云端服务即可完成复杂计算，特别适合计算资源受限的环境。这一设计不仅提升了效率，还增强了数据隐私保护，受到学术界和工业界的广泛好评。</p> </div>

MSQA

<p>MSQA（Multi-modal Situated Question Answering）是大规模多模态情境推理数据集，提升具身AI代理在3D场景中的理解与推理能力。数据集包含251K个问答对，覆盖9个问题类别，基于3D场景图和视觉-语言模型在真实世界3D场景中收集。MSQA用文本、图像和点云的交错多模态输入，减少单模态输入的歧义。引入MSNN（Multi-modal Next-step Navigation）基准测试，评估模型在情境间导航的能力，有助于开发更强大的情境推理模型，推动3D场景理解技术的发展。</p> <p><img src="https://img.medsci.cn/aisite/img//NppYnDhHg0s1Zy6hxsHksJuUbsRlE8klJ7i5ofTy.png"></p> <h2 style="font-size: 20px;">MSQA的主要功能</h2> <ul> <li>多模态情境推理：MSQA提供包含251K个问答对的数据集，问答对覆盖9个不同的问题类别，涉及3D场景中的复杂情境和对象模态。</li> <li>数据模态的多样性：支持文本、图像和点云等多种数据模态，提供更全面的情境描述，减少单模态输入的局限性和歧义。</li> <li>评估模型性能：设计MSQA和MSNN两个基准测试任务，评估和比较不同模型在3D场景中的情境推理和导航能力。</li> <li>促进AI研究：基于提供大规模的多模态数据集，MSQA推动了具身AI和3D场景理解领域的研究进展。</li> <li>预训练和模型开发：MSQA数据集作为预训练材料，帮助开发和优化更强大的情境推理模型。</li> </ul> <h2 style="font-size: 20px;">MSQA的技术原理</h2> <ul> <li>数据收集与生成：用3D场景图和视觉-语言模型（VLMs）在真实世界的3D场景中自动且可扩展地收集数据。</li> <li>多模态输入设置：引入交错多模态输入，结合文本、图像和点云数据，提供更准确的情境和问题描述。</li> <li>情境意识建模：整合不同模态的输入数据，提高模型对情境的感知和理解能力。</li> <li>评估基准测试设计：设计MSQA和MSNN两个基准测试，分别针对情境问答和下一步导航任务，全面评估模型的多模态理解和情境推理能力。</li> <li>模型评估与分析：在MSQA和MSNN上进行实验，分析现有模型的局限性，探索处理多模态输入和情境建模的重要性。</li> </ul> <h2 style="font-size: 20px;">MSQA的项目地址</h2> <ul> <li>项目官网：<a class="external" href="https://msr3d.github.io/?utm_source=medsci" target="_blank" rel="noopener">msr3d.github.io</a></li> <li>arXiv技术论文：<a class="external" href="https://arxiv.org/pdf/2409.02389" target="_blank" rel="noopener nofollow">https://arxiv.org/pdf/2409.02389</a></li> </ul>

Being-M0

<p>Being-M0 基于业界首个百万级动作数据集 MotionLib，用创新的 MotionBook 编码技术，将动作序列转化为二维图像进行高效表示和生成。Being-M0 验证了大数据+大模型在动作生成领域的技术可行性，显著提升动作生成的多样性和语义对齐精度，实现从人体动作到多款人形机器人的高效迁移，为通用动作智能奠定基础。</p> <h2 style="font-size: 20px;">Being-M0的主要功能</h2> <ul> <li>文本驱动动作生成：根据输入的自然语言描述生成相应的人类动作序列。</li> <li>动作迁移：模型将生成的人类动作迁移到多种人形机器人平台上，如Unitree H1、H1-2、G1等，让机器人执行类似的人类动作。</li> <li>多模态数据支持：Being-M0支持多种模态的数据，包括RGB视频、深度信息等，能处理多人交互场景，为复杂场景下的动作生成提供支持。</li> </ul> <h2 style="font-size: 20px;">Being-M0的技术原理</h2> <ul> <li>大规模数据集 MotionLib：基于业界首个百万级动作生成数据集 MotionLib，数据集包含超过120万条动作序列，是现有最大公开数据集的15倍。数据集基于自动化处理流程从公开数据集和在线平台收集，进行细粒度的标注。</li> <li>MotionBook 编码技术：基于 MotionBook 编码技术，将动作序列建模为单通道二维动作图像，分别在时间轴和关节轴构建独立编码空间，完整保留运动的多维结构特征。基于降维投影消除传统codebook查找环节，让动作词表容量提升两个数量级。</li> <li>优化+学习的两阶段解决方案：在动作迁移方面，用优化、学习的两阶段解决方案。优化阶段基于多目标优化方法生成满足机器人运动学约束的动作序列；学习阶段用轻量级MLP网络学习从人体动作到人形机器人动作的映射关系，实现高效的动作迁移。</li> </ul> <h2 style="font-size: 20px;">Being-M0的项目地址</h2> <ul> <li>项目官网：<a class="external" href="https://beingbeyond.github.io/Being-M0/?utm_source=medsci" target="_blank" rel="noopener">https://beingbeyond.github.io/Being-M0/</a></li> <li>arXiv技术论文：<a class="external" href="https://arxiv.org/pdf/2410.03311" target="_blank" rel="noopener nofollow">https://arxiv.org/pdf/2410.03311</a></li> </ul>

AlphaEvolve

<p>AlphaEvolve是谷歌DeepMind推出的通用科学Agent，基于结合大型语言模型（LLMs）的创造力和自动评估器来设计和优化高级算法。用Gemini Flash和Gemini Pro两种模型，基于进化框架不断改进最有潜力的算法。AlphaEvolve在数据中心调度、硬件设计、AI训练和复杂数学问题解决等领域取得显著成果，优化矩阵乘法算法，提升数据中心效率，在多个开放数学问题上取得突破。AlphaEvolve展示了从特定领域到广泛现实挑战的算法开发能力。</p> <p><img style="display: block; margin-left: auto; margin-right: auto;" src="https://lh3.googleusercontent.com/0arf1iMoZrNmKp9wHT5nU5Qp1D834jAUD2mlSA2k8dG3lzW81deaxqBXVuYOLlUiu-R1Luz4Kr2j8wosjdRlJeGZK_pRwiedtQR5qtIneDETuljkpMg=w616"></p> <h2 style="font-size: 20px;">AlphaEvolve的主要功能</h2> <ul> <li>发现和优化算法：在数学和计算领域，发现新的算法、优化现有算法。</li> <li>提升计算效率：提高数据中心的调度效率、硬件设计的性能及AI训练的速度。</li> <li>解决复杂数学问题：提出解决复杂数学问题的新方法，例如在矩阵乘法和几何问题上的突破。</li> <li>跨领域应用：支持应用在多个领域，包括材料科学、药物发现和可持续性等。</li> </ul> <h2 style="font-size: 20px;">AlphaEvolve的技术原理</h2> <ul> <li>进化计算框架：基于进化算法来逐步改进代码。用户定义一个初始程序，包括需要进化的代码块和评估函数。LLM 生成代码的修改（diffs），修改被用在当前程序，生成新的候选程序。每个新生成的程序基于用户提供的评估函数进行评分，评估函数返回一个或多个标量指标。根据评估结果，选择表现较好的程序进入下一代，保留一些多样性探索更广泛的搜索空间。</li> <li>LLM 的角色：LLM 在 AlphaEvolve 中扮演核心角色，负责生成代码的修改和提出新的解决方案。LLM 的能力包括：LLM 根据当前程序和历史信息生成代码的修改建议。修改是小的调整，或是完全重写的代码块。LLM 根据评估结果调整生成策略，在后续迭代中提出更优的解决方案。LLM 处理丰富的上下文信息，包括问题描述、相关文献、代码片段等，有助于生成更符合问题需求的代码。</li> <li>评估机制：AlphaEvolve 的评估机制是自动化的，用户需要提供评估函数，函数对生成的解决方案进行量化评估。评估函数的输出通常是一个或多个标量指标。</li> <li>进化数据库：进化数据库用于在存储和管理进化过程中生成的程序及评估结果。保存所有生成的程序及其评估结果，为后续迭代提供参考。基于算法确保进化过程中保持足够的多样性，避免陷入局部最优解。快速检索和选择表现较好的程序，提高进化效率。</li> <li>分布式计算：多个计算任务并行运行，每个任务在需要时等待其他任务的结果。基于合理分配计算资源，最大化评估的样本数量，提高进化速度。支持在大规模计算集群上运行，适应不同规模的问题。</li> </ul> <h2 style="font-size: 20px;">AlphaEvolve的项目地址</h2> <ul> <li>项目官网：<a class="external" href="https://deepmind.google/discover/blog/alphaevolve-a-gemini-powered-coding-agent-for-designing-advanced-algorithms/?utm_source=medsci" target="_blank" rel="noopener">https://deepmind.google/discover/blog/alphaevolve</a></li> <li>arXiv技术论文：<a class="external" href="https://storage.googleapis.com/deepmind-media/DeepMind.com/Blog/alphaevolve-a-gemini-powered-coding-agent-for-designing-advanced-algorithms/AlphaEvolve.pdf" target="_blank" rel="noopener nofollow">https://storage.googleapis.com/deepmind-media/DeepMind.com/Blog/alphaevolve</a></li> </ul>

kkFileView

文档在线预览项目解决方案，采用流行的 Spring Boot 框架构建，易于设置和部署。这个多功能开源项目为多种文档格式提供基础支持，包括：支持Office文档，如doc，，，，，，，，，，，，，，，，，，等。docx,xls,xlsx,xlsm,ppt,pptx,csv,tsv,dotm,xlt,xltm,dotx,lam,dotx,xla,pages 支持wps、、、、等国产WPS Office文档dps。支持OpenOffice 、LibreOffice等办公文档，包括odt、、、、、、、、和ods。ots,odp,otpsix,ottf,odtf,ods 支持 Visio 流程图文件，如vsd、vsdx。支持 Windows 系统映像文件，如wmf、emf。支持 Photoshop 软件模型文件如psd、eps。支持诸如pdf、、ofd和等文档格式rtf。支持软件模型文件，如xmind。支持bpmn工作流文件。支持eml邮件文件支持epub书籍文档支持3D模型文件，如obj、、、、、、、、、、、、、、、、、、、等。3dsstlplygltfglboff3dmfbxdaewrl3mfifcbrepstepigesfcstdbim dwg支持、dxf、dwf iges、 igs、dwt、dng、ifc、、、等CAD 模型文件dwfx。stlcf2plt 支持所有纯文本文件，如txt，xml（渲染），（md渲染），，，，，，，等。javaphppyjscss 支持zip、、、、、等压缩包。rarjartargzip7z jpg支持、jpeg、png、gif、、、等图像预览（翻转、缩放、镜像）bmp。icojfifwebp tif支持和等图像信息模型文件tiff。支持图像格式文件，如tga。支持矢量图像格式文件，如svg。支持mp3，，，。wavmp4flv 支持多种音频和视频格式文件，如avi、、、、和。movwmvmkv3gprm 支持dcm。支持drawio。特征使用流行的框架 spring boot 进行构建易于构建和部署基本支持主流办公文档的在线预览，如Doc、docx、Excel、PDF、TXT、zip、rar、图片等 REST API 抽象文件预览界面，以便轻松扩展更多文件扩展名并自行开发此项目官方网站和文档网址：https://kkview.cn

分类导航

相关推荐