关键词 "100% rights retention" 的搜索结果, 共 24 条, 只显示前 480 条
ACE-Step,这是一个用于音乐生成的全新开源基础模型,它克服了现有方法的关键局限性,并通过整体架构设计实现了最佳性能。当前的方法在生成速度、音乐连贯性和可控性之间面临着固有的权衡。例如,基于 LLM 的模型(例如 Yue、SongGen)在歌词对齐方面表现出色,但推理速度慢且存在结构性伪影。另一方面,扩散模型(例如 DiffRhythm)虽然能够实现更快的合成速度,但通常缺乏长距离的结构连贯性
通义是一个通情、达义的国产AI模型,可以帮你解答问题、文档阅读、联网搜索并写作总结,最多支持1000万字的文档速读。
阿里巴巴昨日在 Github 等平台开源了 ZeroSearch 大模型搜索引擎。这是一种无需与真实搜索引擎交互即可激励大模型搜索能力的强化学习框架。 ZeroSearch 主要利用了大模型在大规模预训练过程中积累的丰富知识,将其转化为一个检索模块,能够根据搜索查询生成相关内容。同时,还可以动态控制生成内容的质量,这是传统搜索引擎所不具备的特殊功能。 研究人员在 NQ、TriviaQA、Pop
RWKV开源发布了 RWKV7-G1 1.5B 推理模型(Reasoning Model)。模型基于 World v3.5 数据集训练,包含更多小说、网页、数学、代码和 reasoning 数据,总数据为 5.16T tokens。其具备其它同尺寸模型不具备的推理能力和任务能力,同时还支持现实世界 100+ 种语言。 在实际测试中,RWKV7-G1 1.5B 模型的推理逻辑性较强,能够完成有难度的
Muyan-TTS,一款低成本、具备良好二次开发支持的模型并完全开源,以方便学术界和小型应用团队的音频技术爱好者。 当前开源的Muyan-TTS版本由于训练数据规模有限,致使其仅对英语语种呈现出良好的支持效果。不过,得益于与之同步开源的详尽训练方法,从事相关行业的开发者能够依据自身实际业务场景,灵活地对Muyan-TTS进行功能升级与定制化改造。 01. H
Asendia AI是什么 Asendia AI 是基于人工智能的求职辅导工具,帮助求职者提升求职技能,高效准备面试。提供个性化职业规划,根据个人情况推荐求职策略。智能职位匹配功能,能快速为求职者找到合适的职位。求职者可以选择100多个专家审核的面试模拟练习,涵盖各种职业和面试类型。在模拟面试后,Asendia AI 会提供详细的面试反馈报告,帮助求职者识别改进不足之处。AI职业咨询,求职者可以
BetterYeah AI是一个企业级AI智能体平台,通过简化AI Agent的开发流程,使企业能快速构建和部署AI应用。平台的核心产品能力包括零代码搭建Agent、一站式模型集成、知识库管理、数据库连接、可视化工作流(Flow)、丰富的官方插件(Plugin)、多模态ChatBot支持以及简单的开发运维工具。 BetterYeah AI的主要功能 零代码搭建Agent:允许用户无需编写代
多面鹅(OfferGoose)是AI面试模拟平台,面向求职者,通过模拟真实面试场景,帮助用户提升面试技巧和通过率。包括AI模拟面试、实时面试提醒、智能面试押题、深度面试复盘等。用户可根据求职目标选择不同职位和公司类型进行模拟面试,系统会生成相关问题。模拟面试结束后,多面鹅会提供详细反馈和分析,帮助用户发现不足并改进。支持多语言面试,包括德文、日文、法语、简体中文、英语、西班牙文、韩文等,能根据用户
Addsubtitle 是基于 AI 的在线视频编辑工具,通过智能技术为用户提供便捷的字幕添加、翻译及视频编辑服务。用户可以轻松将视频翻译成100多种语言,一键添加多种语言的字幕,提升视频的全球覆盖率。直观的在线编辑器支持实时编辑字幕文本,能自定义字幕样式,包括字体、颜色、尺寸和布局等,满足不同品牌和风格的需求。 Addsubtitle的主要功能 AI 视频翻译:支持将视频翻译成100
ViLAMP(VIdeo-LAnguage Model with Mixed Precision)是蚂蚁集团和中国人民大学联合推出的视觉语言模型,专门用在高效处理长视频内容。基于混合精度策略,对视频中的关键帧保持高精度分析,显著降低计算成本提高处理效率。ViLAMP在多个视频理解基准测试中表现出色,在长视频理解任务中,展现出显著优势。ViLAMP能在单张A100 GPU上处理长达1万帧(约3小时)
OpenMemory MCP 是mem0推出的基于开放模型上下文协议(MCP)构建的开源工具,能解决 AI 工具记忆痛点,实现不同工具间共享上下文信息。OpenMemory MCP支持 100% 本地运行,数据存储在用户本地设备上,确保隐私和安全。OpenMemory MCP 具备跨平台支持、标准化内存操作、集中式仪表板等优势,广泛用在软件开发、项目管理、错误跟踪等场景,帮助用户提升工作效率,让
BILIVE 是基于 AI 技术的开源工具,专为 B 站直播录制与处理设计。工具支持自动录制直播、渲染弹幕和字幕,支持语音识别、自动切片精彩片段,生成有趣的标题和风格化的视频封面。BILIVE 能自动将处理后的视频投稿至 B 站,综合多种模态模型,兼容超低配置机器,无需 GPU 即可运行,适合个人用户和小型服务器使用。 1. Introduction Have you notice
专长:分子建模与药物设计。Schrödinger 将基于物理的计算化学与机器学习相结合,以推动药物研发。其先进的分子建模软件不仅供公司内部使用,也供武田制药和百时美施贵宝等合作伙伴使用。Schrödinger 拥有不断增长的内部项目管线,包括肿瘤学和神经病学领域的在研项目,并因突破计算药物设计的界限而备受赞誉。 在比尔及梅琳达·盖茨基金会1000万美元的资助下,Schrödinger于8月开始扩
专长:精准医疗的联邦学习。Owkin 利用联邦学习技术,在保护数据隐私的同时,实现协作式 AI 研究。他们在肿瘤学和心脏病学领域的应用已构建出可指导个性化治疗决策的预测模型。Owkin 与领先医院和研究机构的合作进一步扩大了其影响力。 Owkin于2016年成立于法国巴黎,是一家AI驱动的精准医疗公司,由临床医师Thomas Clozel博士与生物学人工智能先驱Gilles Wainrib博士共
Lantern Pharma成立于2013年,2020年在纳斯达克上市,是一家以肿瘤学为重点的,新兴的临床阶段制药公司,利用人工智能、基因组学和机器学习来改变药物发现和开发的成本、速度和时间。 员工仅20余人,市值仅4600多万美元,是业界对Lantern的初步印象。 但其商业模式更别具一格: 接盘大公司放弃的药物继续研发, 即通过其AI平台找到被弃药物的临床人群药效,缩小目标人群进行研发,从
Drug Farm(药物牧场),是一家通过 piggyBac 转座子发现药物靶标的 first-in-class 药物研发公司,在中美两地逐步建立团队,现已确定若干新的免疫靶点,并开发出进入临床阶段的首创新药。近日,该公司获得《麻省理工科技评论》中国・第二届生命科学创业大赛 “最佳团队奖”,生辉借此机会采访了其联合创始人兼首席运营官 许枞博士。 Drug Farm 致力于构建独特的平
类似 Manus 但基于 Deepseek R1 Agents 的本地模型。 Manus AI 的本地替代品,它是一个具有语音功能的大语言模型秘书,可以 Coding、访问你的电脑文件、浏览网页,并自动修正错误与反省,最重要的是不会向云端传送任何资料。采用 DeepSeek R1 等推理模型构建,完全在本地硬体上运行,进而保证资料的隐私。 Features: 100% 本机运行:
flowith 团队推出了其最新的 AI 智能体产品Agent Neo。是世界首个可以支持无限步骤・无限上下文・无限工具的 AI Agent。 据称,Agent Neo 具备处理无限工作流步骤的能力,支持长时间云端执行,并拥有嵌套代理层级结构。用户还可以通过其知识市场将专业知识变现。 官方演示展示了通过单一提示生成完整游戏设计文档的案例,并强调其能够处理超过 1000 个逻辑步骤,7
DreamGen是英伟达推出的创新的机器人学习技术,基于AI视频世界模型生成合成数据,让机器人能在梦境中学习新技能。DreamGen仅需少量现实视频数据,能生成大规模逼真的训练数据,实现机器人在新环境中的行为泛化和环境泛化。DreamGen的四步流程包括微调视频世界模型、生成虚拟数据、提取虚拟动作以及训练下游策略。DreamGen让机器人在没有真实世界数据支持的情况下,凭文本指令完成复杂任务,显著
凹凸工坊是专业的在线 AI 手写稿件生成工具,支持将Word文档一键转换为真实的手写稿图片。工具提供多种手写字体、纸张背景及涂改率和凌乱度的调整功能,模拟真实的手写场景,生成的图片无水印且支持高清打印(600dpi)。工具的超级DIY功能和放宽的文件大小限制,进一步提升使用体验,适用于需要手写稿的多种场景,如作业、书信等。 凹凸工坊的主要功能 文档转换:将Word文档一键转换为手写稿图
Pocket Flow 是极简的 LLM(大型语言模型)框架,仅用 100 行代码实现。具有轻量级、无依赖、无厂商锁定的特点。Pocket Flow支持多Agents、工作流、检索增强生成(RAG)等强大功能,帮助开发者快速构建基于 LLM 的应用程序。基于Agentic Coding范式,AI Agents协助开发,大幅提升开发效率。Pocket Flow 适合希望用极简方式开发 LLM 应用的
Jaaz 是开源的AI设计Agent,本地免费 Lovart 平替项目。具备强大的 AI 设计能力,能智能生成设计提示,批量生成图像、海报、故事板等。Jaaz 支持 Ollama、Stable Diffusion、Flux Dev 等本地图像和语言模型,实现免费的图像生成。用户可以通过 GPT-4o、Flux Kontext 等技术,在对话中编辑图像,进行对象移除、风格转换等操作。Jaaz 提供无
OpenAudio S1是Fish Audio推出的文本转语音(TTS)模型,基于超过200万小时的音频数据训练,支持13种语言。采用双自回归(Dual-AR)架构和强化学习与人类反馈(RLHF)技术,生成的声音高度自然、流畅,几乎与人类配音无异。模型支持超过50种情感和语调标记,用户可通过自然语言指令灵活调整语音表达。OpenAudio S1支持零样本和少样本语音克隆,仅需10到30秒的音频样本
Qwen3 Reranker是阿里巴巴通义千问团队发布的文本重排序模型,属于Qwen3模型家族。采用单塔交叉编码器架构,输入文本对后输出相关性得分。模型通过多阶段训练范式,基于高质量标注数据和大量合成训练对进行训练,支持超过100种语言,涵盖主流自然语言及多种编程语言。性能表现上,Qwen3 Reranker-8B在MTEB排行榜上取得了72.94的高分,Qwen3 Reranker-0.6B也已
只显示前20页数据,更多请搜索
Showing 145 to 168 of 168 results