关键词 "数据集" 的搜索结果, 共 24 条, 只显示前 480 条
RWKV开源发布了 RWKV7-G1 1.5B 推理模型(Reasoning Model)。模型基于 World v3.5 数据集训练,包含更多小说、网页、数学、代码和 reasoning 数据,总数据为 5.16T tokens。其具备其它同尺寸模型不具备的推理能力和任务能力,同时还支持现实世界 100+ 种语言。 在实际测试中,RWKV7-G1 1.5B 模型的推理逻辑性较强,能够完成有难度的
苹果 FastVLM 的模型让你的 iPhone 瞬间拥有了“火眼金睛”,不仅能看懂图片里的各种复杂信息,还能像个段子手一样跟你“贫嘴”!而且最厉害的是,它速度快到飞起,苹果官方宣称,首次给你“贫嘴”的速度比之前的一些模型快了足足85倍!这简直是要逆天啊! 视觉语言模型的 “成长烦恼” 现在的视觉语
Muyan-TTS,一款低成本、具备良好二次开发支持的模型并完全开源,以方便学术界和小型应用团队的音频技术爱好者。 当前开源的Muyan-TTS版本由于训练数据规模有限,致使其仅对英语语种呈现出良好的支持效果。不过,得益于与之同步开源的详尽训练方法,从事相关行业的开发者能够依据自身实际业务场景,灵活地对Muyan-TTS进行功能升级与定制化改造。 01. H
昆仑万维正式开源(17B+)Matrix-Game大模型,即Matrix-Zero世界模型中的可交互视频生成大模型。Matrix-Game是Matrix系列在交互式世界生成方向的正式落地,也是工业界首个开源的10B+空间智能大模型,它是一个面向游戏世界建模的交互式世界基础模型,专为开放式环境中的高质量生成与精确控制而设计。 空间智能作为AI时代的重要前沿技术,正在重塑我们与虚拟世界的
Nexus-Gen:图像理解、生成和编辑的统一模型,开源届的GPT-4o平替 待办事项 发布训练和推理代码。 发布模型检查点。 发布技术报告。 发布训练数据集。 什么是Nexus-Gen Nexus-Gen 是一个统一模型,它将 LLM 的语言推理能力与扩散模型的图像合成能力协同起来。为了对齐 LLM 和扩散模型的嵌入
Step1X-3D是什么 Step1X-3D 是StepFun联合LightIllusions推出的高保真、可控的 3D 资产生成框架。基于严格的数据整理流程,从超过 500 万个 3D 资产中筛选出 200 万个高质量数据,创建标准化的几何和纹理属性数据集。Step1X-3D 支持多模态条件输入,如文本和语义标签,基于低秩自适应(LoRA)微调实现灵活的几何控制。Step1X-3D 推动了 3
TinyVLA是一种面向机器人操控的视觉-语言-动作(VLA)模型,由华东师范大学和上海大学团队推出。针对现有VLA模型的不足,如推理速度慢和需要大量数据预训练,提出解决方案。TinyVLA基于轻量级的多模态模型和扩散策略解码器,显著提高推理速度,减少对大规模数据集的依赖。模型在模拟和真实机器人平台上经过广泛测试,证明在速度、数据效率以及多任务学习和泛化能力方面优于现有的先进模型OpenVLA。T
百宝箱Tbox(原芝士饼)是蚂蚁集团(支付宝)推出的一站式 AI 原生应用开发平台,无需任何代码基础,只需通过自然语言,简单几步即可完成应用的创建与发布。百宝箱Tbox集成了多种主流大模型,如通义千问、月之暗面等。百宝箱Tbox不仅可以帮你轻松创建各类智能体(Agent),支持一键发布到支付宝小程序,还能发布到其他平台 百宝箱Tbox的主要功能 0代码开发:用户无需编写代码即可快速搭建AI
WorldMem 是南洋理工大学、北京大学和上海 AI Lab 推出的创新 AI 世界生成模型。模型基于引入记忆机制,解决传统世界生成模型在长时序下缺乏一致性的关键问题。在WorldMem中,智能体在多样化场景中自由探索,生成的世界在视角和位置变化后能保持几何一致性。WorldMem 支持时间一致性建模,模拟动态变化(如物体对环境的影响)。模型在 Minecraft 数据集上进行大规模训练,在真实
Being-M0 基于业界首个百万级动作数据集 MotionLib,用创新的 MotionBook 编码技术,将动作序列转化为二维图像进行高效表示和生成。Being-M0 验证了大数据+大模型在动作生成领域的技术可行性,显著提升动作生成的多样性和语义对齐精度,实现从人体动作到多款人形机器人的高效迁移,为通用动作智能奠定基础。 Being-M0的主要功能 文本驱动动作生成:根据输入的自然语言
MSQA(Multi-modal Situated Question Answering)是大规模多模态情境推理数据集,提升具身AI代理在3D场景中的理解与推理能力。数据集包含251K个问答对,覆盖9个问题类别,基于3D场景图和视觉-语言模型在真实世界3D场景中收集。MSQA用文本、图像和点云的交错多模态输入,减少单模态输入的歧义。引入MSNN(Multi-modal Next-step Navi
ViLAMP(VIdeo-LAnguage Model with Mixed Precision)是蚂蚁集团和中国人民大学联合推出的视觉语言模型,专门用在高效处理长视频内容。基于混合精度策略,对视频中的关键帧保持高精度分析,显著降低计算成本提高处理效率。ViLAMP在多个视频理解基准测试中表现出色,在长视频理解任务中,展现出显著优势。ViLAMP能在单张A100 GPU上处理长达1万帧(约3小时)
DICE-Talk是复旦大学联合腾讯优图实验室推出的新颖情感化动态肖像生成框架,支持生成具有生动情感表达且保持身份一致性的动态肖像视频。DICE-Talk引入情感关联增强模块,基于情感库捕获不同情感之间的关系,提升情感生成的准确性和多样性。框架设计情感判别目标,基于情感分类确保生成过程中的情感一致性。在MEAD和HDTF数据集上的实验表明,DICE-Talk在情感准确性、对口型和视觉质量方面均优于
Sketch2Anim 是爱丁堡大学联合Snap Research、东北大学推出的自动化框架,能将2D草图故事板直接转换为高质量的3D动画。基于条件运动合成技术,用3D关键姿势、关节轨迹和动作词精确控制动画的生成。框架包含两个核心模块,多条件运动生成器和2D、3D神经映射器。Sketch2Anim能生成自然流畅的3D动画,支持交互式编辑,极大地提高动画制作的效率和灵活性。 Sketch2Anim
SuperEdit是字节跳动智能创作团队和佛罗里达中央大学计算机视觉研究中心联合推出的指令引导图像编辑方法,基于优化监督信号提高图像编辑的精度和效果。SuperEdit基于纠正编辑指令,与原始图像和编辑图像对更准确地对齐,引入对比监督信号,进一步优化模型训练。SuperEdit不需要额外的视觉语言模型(VLM)或预训练任务,仅依赖高质量的监督信号,在多个基准测试中实现显著的性能提升。 Super
WebThinker是中国人民大学、北京智源人工智能研究院和华为泊松实验室等机构提出的深度研究智能体。WebThinker赋能大型推理模型(LRMs)在推理过程中自主进行网络搜索、网页导航和报告撰写。WebThinker基于深度网页探索器和自主思考、搜索、写作策略,让LRMs能动态获取信息,实时生成高质量研究报告。WebThinker基于强化学习的训练策略进一步优化工具使用效率。WebThinke
一、核心技术:自学习和自修复的治疗引擎 PathOS Platform™是Pathos AI 的专有平台,构建于现代数据基础设施之上,能够自动化地进行靶点识别和优先级排序。 核心技术为自学习和自修复的Discovery Engine(发现引擎): 1、自动靶点识别:利用多种正交方法(orthogonal methods)自动识别和优先排序药物靶点。 2、自适应模型:能够根据新数据进行自我学
技术:小分子抑制剂 疾病领域:纤维化 最新消息:E轮融资1.1亿美元 Insilico Medicine 致力于将人工智能应用于药物研发的每个环节,力求显著缩短研发时间,降低成本,从而为患者带来救命的药物。为了实现这一目标,公司利用新一代人工智能系统,将生物学、化学和临床试验分析紧密结合。其集成的药物研发套件 Pharma.AI 包含 PandaOmics(用于发现和优先排序新靶点)
疾病领域:神经科学和代谢疾病 近期融资:C轮融资4亿美元 最新消息:与礼来公司合作,推进包括MASLD在内的代谢疾病的新型治疗方法 通过生成与患者数据一致的高通量功能基因组数据集,并通过新颖的机器学习方法解读这些数据,insitro 构建了能够加速靶点选择和有效疗法设计的预测模型。这项人工智能辅助药物研发为 insitro 的研发管线奠定了基础,该管线涵盖神经科学和代谢疾病领域的候选
领先资产技术:小分子超氧化物清除剂 重大并购活动:与人工智能药物研发公司Exscientia合并 最新消息:宣布了用于治疗慢性心肌梗塞的先导药物REC-994令人鼓舞的2期临床试验数据 人工智能药物研发公司 Recursion 的核心使命是 Recursion 操作系统 (OS),这是一个跨多种技术构建的平台,可不断扩展世界上最大的专有生物、化学和以患者为中心的数据集之一。 同时
专长:精准医疗的联邦学习。Owkin 利用联邦学习技术,在保护数据隐私的同时,实现协作式 AI 研究。他们在肿瘤学和心脏病学领域的应用已构建出可指导个性化治疗决策的预测模型。Owkin 与领先医院和研究机构的合作进一步扩大了其影响力。 Owkin于2016年成立于法国巴黎,是一家AI驱动的精准医疗公司,由临床医师Thomas Clozel博士与生物学人工智能先驱Gilles Wainrib博士共
Terray Therapeutics 拥有一批高质量的实验数据,想要进一步训练自己的小分子化学基础模型,用生成式 AI 来解决复杂的药物发现问题,但稀缺的计算资源是他们面临的一大障碍。英伟达承诺,将为 Terray 提供 NVIDIA DGX™ Cloud 平台,利用 NVIDIA AI 软件堆栈和 NVIDIA 的全栈计算专业知识,协助 Terray 优化和扩展其基础模型的开发。
角井(北京)生物技术有限公司是一家专注于应用人工智能和组学大数据等创新技术加速新药发现和验证的新兴企业。公司自成立以来,将人工智能算法团队、资深大分子药物研发团队及高通量湿实验平台有机结合在一起,全力打造了AI赋能的新一代大分子药物设计平台,用于开发全新的药物及治疗方案。公司聚焦在前端的药物发现到POC验证区间,和合作伙伴共同变革大分子创新药物研发的既有范式。 角井生物拥有独到的超大数据集驱动的
卡内基梅隆大学的研究团队开发出一款名为 LegoGPT 的 AI 模型,能够根据文字指令生成可实际搭建的乐高设计。 比如输入文本「基本款沙发」,一眨眼的功夫,乐高沙发就拼好了。 团队训练了一种自回归大型语言模型,通过预测下一个 token 的方式,判断下一块该放置什么积木。团队还为模型增加了有效性校验和带有物理感知的回滚机制,确保生成的设计不会出现积木重叠或悬空等问题,也就是说最终结果始终可行
只显示前20页数据,更多请搜索
Showing 25 to 48 of 60 results