梅斯AI导航站
首页 梅斯小智 MCP 排行榜 资讯 临床指南 期刊 梅斯公开课 收录

搜索结果

关键词 "蒸馏" 的搜索结果, 共 2 条, 只显示前 480 条

minimind

minimind

此开源项目旨在完全从0开始,仅用3块钱成本 + 2小时!即可训练出仅为25.8M的超小语言模型MiniMind。 MiniMind系列极其轻量,最小版本体积是 GPT-3 的 1/7000,力求做到最普通的个人GPU也可快速训练。 项目同时开源了大模型的极简结构-包含拓展共享混合专家(MoE)、数据集清洗、预训练(Pretrain)、监督微调(SFT)、LoRA微调, 直接偏好强化学习(DPO

MeanFlow

MeanFlow

全新的生成模型MeanFlow,最大亮点在于它彻底跳脱了传统训练范式——无须预训练、蒸馏或课程学习,仅通过一次函数评估(1-NFE)即可完成生成。 MeanFlow在ImageNet 256×256上创下3.43 FID分数,实现从零开始训练下的SOTA性能。 图1(上):在ImageNet 256×256上从零开始的一步生成结果 在ImageNet 256×25

只显示前20页数据,更多请搜索

©Copyrigh2012-至今 梅斯(MedSci)

本站旨在介绍医药健康研究进展和信息,不作为诊疗方案推荐。如需获得诊断或治疗方面指导,请前往正规医院就诊。

用户应遵守著作权法,尊重著作权人合法权益,不违法上传、存储并分享他人作品。投诉、举报、维权邮箱:editor@medsci.cn,或在此留言

备案号 沪ICP备14018916号-1 沪公网安备 31010402000380 信息举报中心 违法和不良信息举报中心 上海网警网络110