关键词 "效率" 的搜索结果, 共 24 条, 只显示前 480 条
BAGEL是字节跳动开源的多模态基础模型,拥有140亿参数,其中70亿为活跃参数。采用混合变换器专家架构(MoT),通过两个独立编码器分别捕捉图像的像素级和语义级特征。BAGEL遵循“下一个标记组预测”范式进行训练,使用海量多模态标记数据进行预训练,包括语言、图像、视频和网络数据。在性能方面,BAGEL在多模态理解基准测试中超越了Qwen2.5-VL和InternVL-2.5等顶级开源视觉语言模型
mPLUG-Owl3是阿里巴巴推出的通用多模态AI模型,专为理解和处理多图及长视频设计。在保持准确性的同时,显著提升了推理效率,能在4秒内分析完2小时电影。模型采用创新的Hyper Attention模块,优化视觉与语言信息的融合,支持多图场景和长视频理解。mPLUG-Owl3在多个基准测试中达到行业领先水平,其论文、代码和资源已开源,供研究和应用。 mPLUG-Owl3的主要功能 多
Prezi是创新的AI演示文稿工具,基于开放式画布和动态演示方式,帮助用户创建引人入胜的演示文稿和视频。与传统线性幻灯片不同,Prezi支持自由组织内容,提供丰富的模板和资源库,包括图片、GIF和图标等。Prezi AI技术辅助用户快速生成演示内容,提升创意效率。Prezi广泛应用于商业和教育领域,深受全球用户喜爱。 Prezi的主要功能 开放式画布:提供无边界的画布,让用户自由地组织
Dashtoon是基于人工智能技术的漫画创作应用,简化漫画的创作流程,让创作者能快速生成角色、插画、背景和对话框。通过AI工具,Dashtoon能自动去除背景、增强图像质量,提供故事板到漫画的转换,提升创作效率。Dashtoon提供了平台,让创作者可以发布和变现他们的作品,满足全球读者的需求。新手或是专业漫画家,能轻松创作出高质量的漫画作品。 Dashtoon的主要功能 一致性角色:用户可
NVILA是NVIDIA推出的系列视觉语言模型,能平衡效率和准确性。模型用“先扩展后压缩”策略,有效处理高分辨率图像和长视频。NVILA在训练和微调阶段进行系统优化,减少资源消耗,在多项图像和视频基准测试中达到或超越当前领先模型的准确性,包括Qwen2VL、InternVL和Pixtral在内的多种顶尖开源模型,及GPT-4o和Gemini等专有模型。NVILA引入时间定位、机器人导航和医学成像等
DMind是DMind研究机构发布的专为Web3领域优化的大型语言模型。针对区块链、去中心化金融和智能合约等场景深度优化,使用Web3数据微调采用RLHF技术对齐。DMind在Web3专项基准测试中表现优异,性能远超一线通用模型,推理成本仅为主流大模型的十分之一。包含DMind-1和DMind-1-mini两个版本,前者适合复杂指令和多轮对话,后者轻量级,响应快、延迟低,适合代理部署和链上工具。
Joy Industrial是京东工业推出的行业首个供应链为核心的工业大模型。模型针对工业场景,依托京东工业在工业数智供应链领域的经验积累和数据沉淀,基于“工业大模型+供应链场景应用”双引擎,构建全栈产品矩阵。Joy Industrial首批推出需求代理、运营代理、商品专家、集成专家、关务代理等AI产品,能解决工业供应链中的数据孤岛、协同冲突等痛点,助力产业降本增效、合规保供,推动产业链结构性变革
II-Agent:一个用于构建和部署智能体的全新开源框架。II-Agent 是一款开源智能助手,旨在简化和增强跨领域的工作流程。它代表了我们与技术互动方式的重大进步——从被动工具转变为能够独立执行复杂任务的智能系统。作为简易的COZE,Dify平替。 ii-agent开源框架,擅长构建跨多个领域工作流的Agent,能独立执行复杂任务已是Agent标配 其技能覆盖研究与核查、内容生成、数据分析可视
fellou开源智能体工作流框架,Eko 2.0 在不同复杂程度上始终表现优异: 简单任务:成功率为 95%(其他产品的成功率为 80-90%) 平均成功率:78%(其他产品成功率为 56-61%) 中等复杂度:成功率为 76%(其他产品的成功率为 49-58%) 困难任务:成功率为 70%(其他产品的成功率为 32-43%) 这些数字背后隐藏着不可靠的自动化工具和企业真正可以依
Aurora是微软研究院推出的13亿参数的大气基础模型,基于从海量大气数据中提取有价值信息,用在预测全球天气模式、空气污染和海洋波浪等大气过程。模型用预训练和微调的架构,处理不同分辨率和压力水平的数据。Aurora在多个预测任务中表现出色,包括高分辨率天气预测、空气污染预测和热带气旋轨迹预测,计算速度比传统数值天气模型快约5000倍。模型提高了预测精度,降低计算成本,为应对气候变化和极端天气事件提
Pocket Flow 是极简的 LLM(大型语言模型)框架,仅用 100 行代码实现。具有轻量级、无依赖、无厂商锁定的特点。Pocket Flow支持多Agents、工作流、检索增强生成(RAG)等强大功能,帮助开发者快速构建基于 LLM 的应用程序。基于Agentic Coding范式,AI Agents协助开发,大幅提升开发效率。Pocket Flow 适合希望用极简方式开发 LLM 应用的
CodeWave 是网易数帆推出的低代码开发平台,通过智能化手段提升软件开发效率。具备数据模型设计、页面搭建、逻辑与流程设计等核心功能,支持从简单应用到复杂系统的快速构建。平台提供大量标准化组件及扩展能力,满足不同行业和场景的开发需求。可视化设计器让开发过程更直观,降低技术门槛。CodeWave 支持应用源码导出和独立部署,确保代码级安全,满足企业对数据隐私和安全的严格要求。 CodeWave的
Macaly 是创新的无代码应用开发工具,通过自然语言处理技术,让用户能将想法转化为可运行的应用程序。可以通过简单的文字描述或语音指令,直接参与到应用的创建和修改过程中。Macaly 能实时反馈视觉效果,让用户即时看到更改结果,极大地提高了开发效率和协作体验。Macaly 与 GitHub 深度集成,支持无缝的代码管理和协作,包括拉取、推送和问题管理。 Macaly的主要功能 自然语言
蚂上有创意是支付宝推出的AI设计工具,主要面向商家提供AI电商设计服务。蚂上有创意整合支付宝多年积累的高质量素材和模板,将其产品化,让商家能够轻松创建营销素材。蚂上有创意的功能特点包括免费商用素材、AI图像处理工具、口语化对话生图、创意洞察等,降低了AI使用门槛,提升设计效率和商业效果。 蚂上有创意的主要功能 免费商用素材:提供支付宝多年积累的高质量素材和模板,支持在线编辑和内容替换。
Gemini Diffusion是谷歌推出的实验性文本扩散模型。与传统自回归模型逐词生成文本不同,基于逐步细化噪声生成输出,能快速迭代纠正错误,让Gemini Diffusion在文本生成任务中表现出色,具备快速响应、生成更连贯文本和迭代细化等能力。Gemini Diffusion性能在外部基准测试中与更大规模模型相当,速度更快。Gemini Diffusion作为实验性演示提供,用户加入等待名单
KreadoAI是一个AIGC数字营销视频创作平台,专注于利用人工智能技术简化和优化视频内容的创作流程。用户只需输入文本或关键词,Kreado AI能创作出真实或虚拟人物的视频内容。平台提供超过 700 种数字人形象和 1600 多种语音选项,支持 140 多种语言,广泛应用于营销、教育、培训、医疗等领域。 KreadoAI 的最新版本增加了真人语音克隆、真人形象克隆、PPT 文件生成数字人口播视
Hedra是由原斯坦福大学的研究团队成立的数字创作实验室推出的AI对口型视频生成工具,专注于将人工智能技术应用于人物角色视频的生成。用户可以上传任意人物的照片和语音,Hedra会根据这些输入生成动态视频,其中人物的唇形、表情和姿态都能与语音内容完美同步。Hedra支持文本和图片生成视频,目前在免费公测中,提供无限时长的视频生成能力,单个视频最长可达30秒(开放预览版),并且每60秒的输入可以生成9
墨狐AI是北京云泥科技推出的AI小说写作助手,专为网文小说作者设计。通过自动生成大纲、快速续写、剧情树分析和小说转剧本等功能,帮助作者解决创作难题,提高写作效率。用户只需简单输入灵感或现有文本,墨狐AI便能提供创意丰富的写作辅助,适合需要提升创作速度和质量的网文作者和爱好者。 墨狐AI的主要功能 生成大纲:用户输入简单的故事灵感,墨狐AI能自动生成包含世界观、角
蛙蛙写作是杭州引力智航科技推出的AI小说和内容写作助手,帮助作者提高写作效率和创作质量。蛙蛙写作利用先进的AI技术,为用户提供了一系列写作辅助功能,让创作过程更加便捷和高效。蛙蛙写作的目标是让内容创作变得更加简单,无论是专业作家、自媒体运营者还是普通爱好者,都能通过蛙蛙写作快速产出高质量的作品。 蛙蛙写作的主要功能 蛙蛙写作工具版 AI生成内容:用户只需提供故事的基本元素(如书名
橙篇是由百度推出的一款AI写作工具,基于百度文库的庞大内容库和尖端AI技术,为用户提供了强大的长文件处理和内容创作能力。用户可以利用橙篇AI轻松理解、总结超大量、多格式、长篇幅的文件,并通过即时问答功能获得所需信息。此外,橙篇还支持长文生成、深度编辑和多模态创作,极大地丰富了用户的创作手段。橙篇的研发基于百度文库12亿内容的积累,结合了20万精调数据和1.4亿用户的行为数据,以及百度文库、百度学术
心流是阿里巴巴推出的基于星辰大模型的AI搜索助手,通过智能技术提升用户的知识获取效率。集成了近3000万篇学术论文资源,覆盖Nature、IEEE、ArXiv等权威期刊,支持学术问答、AI精读、段落总结、智能翻译和名词解释等功能,能帮助研究人员和学生快速理解和分析论文内容。心流提供DeepSeek渠道,联网搜索协助思考过程,具备通用问答、慢推理、私人知识库等功能,适用于市场调研、文档分析、内容创作
夸克是阿里推出的AI搜索应用,集成了浏览器搜索、网盘、实用工具等功能。夸克支持手机版、Pad版、Windows电脑PC版,资产一键同步。提供6T超大空间、AI总结、AI生成等智能服务。用户可通过手机扫码快速登录,享受无缝的多端协同体验。夸克极速、安全、高效、高颜值,是你的学习、工作、生活的高效拍档。 夸克的功能特色 智能搜索:夸克基于AI智能引擎提供快速、准确的搜索结果,查资料更快,工作,
如影数字人超级直播间,行业首创多模态智能运营,依托“商汤日日新SenseNova”多模态大模型,具备智能选品、素材提炼等能力,能够大幅提高直播间运营效率。无需视频采集即可复刻现有直播间,当日复刻当日播。 支持多平台直播,智能互动逼真形象引流吸粉
Kilo Code 是开源的VS Code AI Agent扩展程序,提升开发人员的编码效率。具备强大的代码生成能力,能根据自然语言描述快速生成代码片段,有效减少手动编写代码的时间。Kilo Code 能自动化执行多种重复性编码任务,例如代码格式化、重构以及生成样板代码等,进一步提高开发效率。内置最新的AI模型,如Claude和 Gemini 2.5 Pro,无需用户手动配置API密钥,提供MCP
只显示前20页数据,更多请搜索
Showing 97 to 120 of 137 results