关键词 "高质量" 的搜索结果, 共 20 条, 只显示前 480 条
4D-LRM(Large Space-Time Reconstruction Model)是Adobe研究公司、密歇根大学等机构的研究人员共同推出的新型4D重建模型。模型能基于稀疏的输入视图和任意时间点,快速、高质量地重建出任意新视图和时间组合的动态场景。模型基于Transformer的架构,预测每个像素的4D高斯原语,实现空间和时间的统一表示,具有高效性和强大的泛化能力。4D-LRM在多种相机设
Qwen VLo 是通义千问团队推出的多模态统一理解与生成模型。在多模态大模型的基础上进行了全面升级,能“看懂”世界,能基于理解进行高质量的再创造,实现了从感知到生成的跨越。能精准理解图像内容,在此基础上进行一致性和高质量的生成。用户可以通过自然语言指令要求模型对图像进行风格转换、场景重构或细节修饰,模型能灵活响应并生成符合预期的结果。Qwen VLo 支持多语言指令,打破语言壁垒,为全球用户提供
OmniGen2 是北京智源人工智能研究院推出的开源多模态生成模型。能根据文本提示生成高质量图像,支持指令引导的图像编辑,比如修改背景或人物特征等。OmniGen2 采用双组件架构,结合视觉语言模型(VLM)和扩散模型,实现对多种生成任务的统一处理。优势在于开源免费、高性能以及强大的上下文生成能力,适用于商业、创意设计和研究开发等场景。 OmniGen2的项目地址 项目官网:https:/
WebSailor 是阿里通义实验室开源的网络智能体,专注于复杂信息检索与推理任务。通过创新的数据合成方法(如 SailorFog-QA)和训练技术(如拒绝采样微调和 DUPO 算法),在高难度任务中表现出色,在 BrowseComp 等评测中超越多个知名模型,登顶开源网络智能体榜单。WebSailor 的推理重构技术能高效处理复杂任务,生成简洁且精准的推理链。在复杂场景中表现出色,在简单任务中展
飞搜侠是专注于飞书文档搜索的高效工具,帮助用户快速找到所需的高质量飞书文档资源。具备智能搜索功能,能精准匹配用户输入的关键词,快速定位相关文档,提供一键访问链接,方便用户实时预览文档内容。飞搜侠支持移动端应用,用户可以随时随地进行搜索,适合移动办公和学习场景。热门搜索内容涵盖Prompt合集、AI工具、自媒体创业、职场技能、运营技巧和个人成长等多个领域,能满足不同用户的需求。 飞搜侠的主要功能
Seed Diffusion是字节跳动Seed团队推出的实验性扩散语言模型,专注于代码生成任务。模型通过两阶段扩散训练、约束顺序学习和强化高效并行解码等关键技术,实现显著的推理加速。模型的推理速度达到2146 tokens/s,比同等规模的自回归模型快5.4倍,在多个代码基准测试中表现与自回归模型相当,在代码编辑任务上超越自回归模型。Seed Diffusion展示了离散扩散模型作为下一代生成模型
AI-Researcher 是香港大学数据科学实验室推出的开源自动化科学研究工具,基于大型语言模型(LLM)代理实现从研究想法到论文发表的全流程自动化。AI-Researcher 支持用户在两种模式下操作:一是提供详细的研究想法描述,系统据此生成实现策略;二是提供参考文献,系统自主生成创新想法实施。平台集成文献综述、想法生成、算法设计与验证、结果分析和论文撰写等核心功能,支持多领域研究,基于开源的
Glass 是Pickle 团队推出的开源隐形 AI 桌面助手。Glass能在后台实时捕捉屏幕内容和音频,将其转化为结构化知识。Glass核心功能包括实时会议记录、自动摘要生成、上下文理解及实时问答。Glass 的设计真正隐形,不会出现在屏幕录制、截图或 Dock 中,完全不干扰用户操作。Glass支持 macOS 和 Windows 系统,用户能免费使用,且无需注册。Glass开源特性成为 AI
Machined AI 是 AI 内容创作平台,专为高效生成高质量内容而设计,平台能在短时间内完成内容创作任务,包括撰写文章、构建内容集群、自动化关键词研究、内部链接和发布等。平台核心优势在于快速生成事实准确、引用权威的内容,支持与 WordPress、Webflow 等平台的无缝集成,提供个性化功能,如自带 API 密钥,帮助用户降低成本。Machined AI 是内容创作者和团队提升效率、建立
Pykaso AI 是强大的AI创作平台,能帮助用户生成和编辑高质量的图像与视频内容。平台提供多种功能,包括图像到图像生成、皮肤纹理增强、AI 图像编辑及 4K 视频生成等。平台支持用户基于简单的操作,如上传图片或输入文本提示,快速生成逼真的 AI 角色和创意内容。Pykaso AI 支持训练个性化模型,满足不同用户的创作需求,助力用户在社交媒体等领域实现高效创作和内容传播。 官网地址:ht
Nano Banana 是 AI 图像编辑模型,目前仅在 LMArena 网站上随机出现。模型具有极高的人物一致性,能精准还原人物的面部特征和表情,在背景替换和风格转换方面表现出色。用户只需上传图片并输入提示词,即可生成高质量的图像。模型生成效果被认为是 AI 图像编辑领域的新王者。如何使用Nano Banana访问LMArena:访问LMArena的官网 https://lmarena.ai/
Aluo AI 是专为电商卖家和内容创作者设计的 AI 图像处理平台。通过先进的 AI 技术,帮助用户在短短 30 秒内将普通产品图片转变为专业级的营销视觉内容。平台的核心功能包括高精度的背景去除、智能产品图片生成以及强大的 AI 图片编辑工具。用户无需任何设计经验或复杂软件,只需上传图片,AI 能自动识别去除背景,生成高质量的产品展示图,提供丰富的场景模板供选择。 Aluo AI的主要功能
TextureNoise 是强大的在线3D纹理生成与编辑工具,帮助用户快速高效地创建高质量纹理。通过快速生成功能,能在几秒钟内生成令人惊叹的纹理,显著提升工作流程效率,节省时间。TextureNoise 提供画笔工具,支持用户对纹理的特定区域进行精确编辑和细节修饰,确保所有编辑和修复无缝融合,保持纹理的整体一致性。支持通用文件格式,与任何数字内容创作软件(如Blender、Maya等)完全兼容。
Eleven Music 是 ElevenLabs 推出的 AI 音乐生成工具,能根据简单的文本提示快速生成高质量、定制化的音乐作品,支持多种风格、语言和场景。用户能通过自然语言描述调整歌曲的风格、节奏、歌词等,支持逐段编辑,实现无缝过渡和精确的情绪转换。生成的音乐适用电影、广告、游戏等多种商业用途,支持多语言歌词创作,提供工作室级别的音频输出,是音乐创作者、企业和广告商的理想选择。
ToonComposer 是香港中文大学、腾讯 PCG ARC 实验室和北京大学研究人员共同推出的生成式 AI 工具,几秒能将草图转化成专业级动画。ToonComposer基于生成式后关键帧技术,将传统动画制作中的中间帧生成和上色环节整合为自动化过程,仅需一个草图和一个上色参考帧,能生成高质量的动画视频。工具支持稀疏草图注入和区域控制,让艺术家能准控制动画效果,大幅减少人工工作量,提高创作效率,为
Aivilization 是香港科技大学推出的全球首个大型人工智能多智能体社会模拟沙盒平台。结合了公民科学游戏、公共教育和大规模多智能体社会模拟,通过可视化的数字沙盒,让用户创造、引导并观察成千上万个 AI 智能体,模拟未来人与 AI 共存的社会演化。平台的核心目标是普及 AI 知识、收集人类反馈数据以支持 AI 技术研究,探索 AI 在未来社会中的角色。支持数千个 AI 智能体同时在线,模拟复杂
Elser AI 是专注于动漫创作的生成式人工智能平台。核心功能是通过 AI 技术帮助用户快速生成高质量的漫画内容,包括角色、场景、分镜和剧本等。平台的 Comic AI 2.0 版本增加了多种风格和高级模型,用户可以根据自己的需求选择不同的漫画风格,如日漫、美漫和国漫等。Elser AI 提供了推荐内容和最新发布的作品,供用户浏览和参考。Elser AI的官网地址官网地址:https://com
这是一个新型的医生平台,通过AI快速发现高质量研究文献,并针对文献的研究亮点进行评述。平台有这些亮点:1 总结全球最新,高质量文献,过滤掉大量低质量的文献和信息2 对当前的诸多热点进行全面的总结分析,并洞察该领域的未来趋势。3 面向全球,多语言展示。网站:https://news.medxy.ai
OmniHuman-1.5 字节推出的先进的AI模型,能从单张图片和语音轨道生成富有表现力的数字人动画。模型基于双重系统认知理论,融合多模态大语言模型和扩散变换器,模拟人类的深思熟虑和直觉反应。模型能生成动态的多角色动画,支持通过文本提示进行细化,实现更精准的动画效果。OmniHuman-1.5 的动画具有复杂的角色互动和丰富的情感表现,为动画制作和数字内容创作带来全新的可能性,大大提升创作效率和
LoomlyAI 是专注于视觉内容解决方案的 AI 平台,提供 AI 模特和智能换装功能。基于 AI 模型取代传统模特拍摄,快速生成高质量的商业图片和视频,解决模特拍摄成本高、版权复杂和流程繁琐的问题。平台产品亮点包括无 AI 感的多样化模特库、10 秒快速生成的智能换装功能及一键生成视频的功能。LoomlyAI 适用电商、社交媒体和内容创作,帮助用户高效制作视觉内容,提升商业价值。LoomlyA
只显示前20页数据,更多请搜索
Showing 97 to 116 of 116 results