关键词 "20 styles" 的搜索结果, 共 24 条, 只显示前 480 条
MoonCast 是零样本播客生成系统,从纯文本源合成自然的播客风格语音。通过长上下文语言模型和大规模语音数据训练,能生成几分钟长的播客音频,支持中文和英文。生成语音的自然性和连贯性,在长音频生成中能保持高质量。MoonCast 使用特定的LLM提示来生成播客脚本,通过语音合成模块将其转换为最终的播客音频。用户可以通过简单的命令和预训练权重快速生成播客。 MoonCast的项目地址 项目官
National Gallery Mixtape 是伦敦国家美术馆联合 Google Arts & Culture 推出的 AI 音乐实验工具。汇集了伦敦国家美术馆精选的200幅世界名画,涵盖从文艺复兴时期到现代的各种风格和主题。用户可从这些画作中最多选择6幅,拖放到指定区域,AI会分析画作的色彩、主题、情感和历史背景等元素,生成与之匹配的音乐片段。能通过调整音乐片段的音量、顺序和叠加方式
OpenAudio S1是Fish Audio推出的文本转语音(TTS)模型,基于超过200万小时的音频数据训练,支持13种语言。采用双自回归(Dual-AR)架构和强化学习与人类反馈(RLHF)技术,生成的声音高度自然、流畅,几乎与人类配音无异。模型支持超过50种情感和语调标记,用户可通过自然语言指令灵活调整语音表达。OpenAudio S1支持零样本和少样本语音克隆,仅需10到30秒的音频样本
VTable: 不只是高性能的多维数据分析表格,更是行列间创作的方格艺术家!免费,开源,基于Canvas 的 百万数据秒级渲染前端表格组件库 VTable是字节跳动开源可视化解决方案 VisActor 的组件之一。 在现代应用程序中,表格组件是不可或缺的一部分,它们能够快速展示大量数据,并提供良好的可视化效果和交互体验。VTable是一款基于可视化渲染引擎VRender的高性能表格组件库,为用
Playmate是广州趣丸科技团队推出的人脸动画生成框架。框架基于3D隐式空间引导扩散模型,用双阶段训练框架,根据音频和指令精准控制人物的表情和头部姿态,生成高质量的动态肖像视频。Playmate基于运动解耦模块和情感控制模块,实现对生成视频的精细控制,显著提升视频质量和情感表达的灵活性。Playmate在音频驱动肖像动画领域取得重大进展,提供对情感和姿态的精细控制,能生成多种风格的动态肖像,具有
NovaCV 是基于人工智能技术的在线AI简历生成器,帮助用户快速制作专业、美观的求职简历。集成了领先的 AI 功能,如智能简历助手、一键生成工作描述、AI 润色引擎、智能纠错、中英文翻译等,确保简历内容精准且专业。NovaCV 提供了丰富的专业模板,覆盖主流行业,排版设计符合招聘者喜好,能帮助求职者在众多简历中脱颖而出。NovaCV 提供 API 服务,支持简历智能检查、文本解析和模板生成等功能
普林斯顿与复旦推出HistBench和HistAgent,首个人文AI评测基准 普林斯顿大学AI实验室与复旦大学历史学系联手推出了全球首个聚焦历史研究能力的AI评测基准——HistBench,并同步开发了深度嵌入历史研究场景的AI助手——HistAgent。这一成果不仅填补了人文学科AI测试的空白,更为复杂史料处理与多模态理解建立了系统工具框架。 历史是关于时间中的人的
MiniMax-M1是MiniMax团队最新推出的开源推理模型,基于混合专家架构(MoE)与闪电注意力机制(lightning attention)相结合,总参数量达 4560 亿,每个token激活 459 亿参数。模型超过国内的闭源模型,接近海外的最领先模型,具有业内最高的性价比。MiniMax-M1原生支持 100 万token的上下文长度,提供40 和80K两种推理预算版本,适合处理长输入
CreateVision AI 是AI图像生成平台,平台融合 Flux.1 Dev 和 GPT-Image-1 两大顶级模型,为用户提供开源与闭源技术路线的极致体验。平台支持用户将创意想法瞬间转化为高质量图像,轻松生成逼真照片、卡通、插画和抽象艺术。支持样式、颜色、光照、构图的 4D 精准控制,满足专业创作需求。CreateVision AI 生成的图像能用在商业用途,无数量限制。 官方网站:h
FLUX.1 Kontext 是由 Black Forest Labs 推出的图像生成与编辑模型,支持上下文感知的图像处理。模型基于文本和图像提示进行生成与编辑,支持对象修改、风格转换、背景替换、角色一致性保持和文本编辑等多种任务。FLUX.1 Kontext Pro版本支持快速迭代图像编辑,能在多次编辑中保持图像质量和角色特征稳定。。Kontext Max版本在提示词遵循、排版生成和编辑一致性方
MedRAG是南洋理工大学研究团队提出的医学诊断模型,通过结合知识图谱推理增强大语言模型(LLM)的诊断能力。模型构建了四层细粒度诊断知识图谱,可精准分类不同病症表现,通过主动补问机制填补患者信息空白。MedRAG在真实临床数据集上诊断准确率提升了11.32%,具备良好的泛化能力,可应用于不同LLM基模型。MedRAG支持多模态输入,能实时解析症状并生成精准诊断建议。 MedRAG的主要功能
Sourcely是AI驱动的学术搜索工具,能帮助学生和研究人员快速找到、总结和添加可信的学术资源。Sourcely提供超过2亿篇论文的访问权限,基于高级搜索过滤器简化研究过程。Sourcely的特色包括免费PDF下载、个性化搜索过滤器,及即时引用导出功能。Sourcely用学生视角创建真正理解学术社区需求的工具,保持与最新研究和趋势的同步,确保工具不断改进和发展。 Sourcely的主要功能
MAI-DxO(Microsoft AI Diagnostic Orchestrator)是微软推出的先进人工智能系统,能提升医疗诊断的准确性和效率。基于模拟一组具有不同诊断方法的虚拟医生协作解决复杂的医疗案例。MAI-DxO能提出后续问题、订购检查,在获取新信息后更新推理,逐步缩小诊断范围。MAI-DxO能进行成本检查,确保在成本约束内做出诊断。在对《新英格兰医学杂志》发布的复杂病例进行测试时,
Chai-2,这是分子设计领域的一项重大突破。Chai-2 在设计完全从头抗体时实现了前所未有的两位数成功率,与以往方法相比,命中率提高了几个数量级。只需测试 20 个设计,该模型就能在各种靶点中轻松找到可行的匹配方案。该模型的高成功率和广泛的泛化能力为快速精准的原子级分子工程新时代铺平了道路。 我们挑战 Chai-2 设计多达 20 种抗体或纳米抗体,以针对 52 个不同的蛋白靶点,所有这些靶
1. 本研究介绍了 PrefixProt,这是一个新颖的框架,它通过利用预训练蛋白质语言模型 (ProtLM) 上的前缀调整来实现可控蛋白质设计。它使用学习到的虚拟标记作为模块化控制标签,引导蛋白质生成朝着所需的结构和功能特性发展。 2. PrefixProt 最引人注目的特性在于它能够通过组合不同的虚拟标记来生成具有多种用户自定义属性(例如结构和功能)的蛋白质,而无需重新训练基础模型。这种组合
1.PRO-LDM 引入了一种模块化潜在扩散模型,用于全长蛋白质序列设计,该模型兼具无条件生成和功能优化,将准确性与计算效率完美结合。 2. 一项重大创新在于在潜在空间中应用扩散,显著降低采样成本,同时保持生成序列的保真度和多样性。 3. PRO-LDM 通过将条件潜在扩散与监督适应度预测相结合,实现了具有目标特性(例如荧光、溶解度、热/化学稳定性)的蛋白质序列的可控设计。 4. 通过无分类
MegaFold是一个跨平台系统,用于加速蛋白质结构预测模型(例如 AlphaFold3、AlphaFold2)。 为什么选择 MegaFold? 跨平台支持:通过优化的基于 Triton 的内核,支持在异构设备上执行,包括 NVIDIA GPU 和 AMD GPU。 易于使用:只需更改几行代码即可获得巨大的性能提升 速度提升:每次迭代训练时间加快高达 1.73 倍 减少内存:将
1.本研究提出了蛋白质折叠进化模拟器(PFES),这是一个从随机氨基酸序列开始,以原子分辨率模拟蛋白质进化的计算框架。 2.作者利用PFES证明,稳定的球状蛋白质折叠可以相对容易地从随机序列进化而来,每个位点只需0.2到3个突变,与LUCA以来观察到的进化变化相当或更少。 3.值得注意的是,大约一半进化出的蛋白质与已知的自然折叠(例如HTH、SH3和β三明治)相似,而其余的则是独一无二的,这凸
RoboBrain 2.0 是强大的开源具身大脑模型,能统一感知、推理和规划,支持复杂任务的执行。RoboBrain 2.0 包含 7B(轻量级)和 32B(全规模)两个版本,基于异构架构,融合视觉编码器和语言模型,支持多图像、长视频和高分辨率视觉输入,及复杂任务指令和场景图。模型在空间理解、时间建模和长链推理方面表现出色,适用机器人操作、导航和多智能体协作等任务,助力具身智能从实验室走向真实场景
EXAONE 4.0是韩国LG AI Research推出的自研混合推理大模型。模型融合通用自然语言处理和高级推理能力,支持韩语、英语和西班牙语。模型分为32B的专业版和1.2B的端侧版,前者基于多项国家级认证考试,适用高专业领域,后者体积小、性能优,支持本地运行,适合隐私和安全要求高的场景。EXAONE 4.0在国际高难度基准测试中表现优异,如MMLU-Pro 81.8分、AIME 2025 8
Copy2AI 是 AI创作助手,帮助提升用户的工作与创作效率。Copy2AI 包含三大核心产品,智能剪贴板,支持内容分析、翻译和润色;智能创作助手,提供灵感激发和文案生成;智能聊天助手,支持自然语言对话和文件分析。Copy2AI 支持本地AI部署,确保隐私安全,兼容Windows、macOS和Linux系统。Copy2AI基于强大的AI功能,适用日常办公、内容创作和生活场景,能成为用户得力助手。
LearnCoach 是专为 K12 学生设计的AI学习辅导平台,通过 AI 老师为学生提供个性化学习体验,根据学生的学习情况定制课程,以辅导课和视频播放列表两种模式,帮助学生从基础知识到考试实战全方位提升。平台拥有丰富的视频教程、考试题目等资源,能突出学习重点,让学生高效学习。学生可随时随地通过语音输入等方式与 AI 老师互动,获得即时帮助。LearnCoach 每天提供 20 分钟免费使用时长
iFlow CLI 是阿里旗下心流团队推出的能运行在终端的 AI 智能体,专为开发者和高效工作者设计。iFlow CLI支持自然语言交互,能快速分析代码、生成文档、调试程序、管理文件、查询信息等。iFlow CLI 内置强大的 AI 模型(如 Qwen3-Coder、Kimi K2 等),支持用户在终端中高效完成复杂任务,提升工作效率。iFlow CLI 安装便捷,支持多种操作系统,完全免费,是编
LandPPT 是AI演示文稿生成平台,能将文档内容快速转换为专业的 PPT 演示文稿。LandPPT支持 OpenAI、Claude、Gemini 等多种 AI 模型,兼容 PDF、Word、Markdown 等文件格式,支持智能解析内容,生成结构清晰的大纲和精美的 PPT 页面。平台提供丰富的模板系统和自定义功能,用户基于现代化的 Web 界面进行可视化编辑、实时预览和多格式导出。LandPP
只显示前20页数据,更多请搜索
Showing 337 to 360 of 366 results