关键词 "蒸馏" 的搜索结果, 共 4 条, 只显示前 480 条
此开源项目旨在完全从0开始,仅用3块钱成本 + 2小时!即可训练出仅为25.8M的超小语言模型MiniMind。 MiniMind系列极其轻量,最小版本体积是 GPT-3 的 1/7000,力求做到最普通的个人GPU也可快速训练。 项目同时开源了大模型的极简结构-包含拓展共享混合专家(MoE)、数据集清洗、预训练(Pretrain)、监督微调(SFT)、LoRA微调, 直接偏好强化学习(DPO
全新的生成模型MeanFlow,最大亮点在于它彻底跳脱了传统训练范式——无须预训练、蒸馏或课程学习,仅通过一次函数评估(1-NFE)即可完成生成。 MeanFlow在ImageNet 256×256上创下3.43 FID分数,实现从零开始训练下的SOTA性能。 图1(上):在ImageNet 256×256上从零开始的一步生成结果 在ImageNet 256×25
Aivilization 是香港科技大学推出的全球首个大型人工智能多智能体社会模拟沙盒平台。结合了公民科学游戏、公共教育和大规模多智能体社会模拟,通过可视化的数字沙盒,让用户创造、引导并观察成千上万个 AI 智能体,模拟未来人与 AI 共存的社会演化。平台的核心目标是普及 AI 知识、收集人类反馈数据以支持 AI 技术研究,探索 AI 在未来社会中的角色。支持数千个 AI 智能体同时在线,模拟复杂
字节跳动开源的图像生成大模型,目前是第4版Seedream 4, 这是字节跳动最新发布的豆包图像创作模型。该模型集成了文生图、图像编辑、多图融合、组图生成等多种能力,最高支持4K分辨率图像生成主要亮点多模态玩法拓展:灵活支持文本、图像的组合输入,允许文生图、图生图、图像编辑、多图编辑、组图生成等创作模式,玩法创意多样。风格化美感提升:支持高度自由的艺术风格迁移,从巴洛克到赛博朋克风,风格百变,更可
只显示前20页数据,更多请搜索