关键词 "优化" 的搜索结果, 共 24 条, 只显示前 480 条
响指HaiSnap是AI零代码应用开发平台,通过可视化操作和拖拽式界面,用户无需编写代码可快速搭建应用,简化了开发流程。响指HaiSnap支持调用多种预训练的AI模型,涵盖文本生成、图像识别等多种功能,满足不同场景的需求。响指HaiSnap提供一键部署功能,用户可以轻松将应用发布到云端,无需复杂的服务器配置。响指HaiSnap配备了任务管理、小工具以及小游戏等多种功能模块,方便用户高效完成任务,增
妙思是腾讯广告推出的基于腾讯混元大模型的一站式AI广告创意平台。为广告主提供文生图、图生图、商品背景合成、妙思衍生、特定风格LORA等多种创意工具,简化广告制作与投放流程。基于AIGC技术,妙思平台能快速生成高质量的创意内容,如人像、风景等,支持广告素材的高效生产和投放,让广告投放更加迅速和便捷。 妙思的主要功能 灵感提供:基于查看大盘创意内容热榜,获取不同行业、投放版位、比例的灵感内
TinyVLA是一种面向机器人操控的视觉-语言-动作(VLA)模型,由华东师范大学和上海大学团队推出。针对现有VLA模型的不足,如推理速度慢和需要大量数据预训练,提出解决方案。TinyVLA基于轻量级的多模态模型和扩散策略解码器,显著提高推理速度,减少对大规模数据集的依赖。模型在模拟和真实机器人平台上经过广泛测试,证明在速度、数据效率以及多任务学习和泛化能力方面优于现有的先进模型OpenVLA。T
Yourware 是提供快速部署工具的在线平台,支持 HTML、CSS、JavaScript 和 React 等前端技术。基于一键部署功能,让用户轻松将网页代码快速上线,无需复杂的云服务或 GitHub Pages 等操作。Yourware 提供一键美化、作品集展示和权限控制等功能,帮助用户优化网页视觉效果、集中展示创作成果、保护隐私。平台汇聚了全球创作者的优秀作品,为用户提供学习和交流的社区环境
VACE(Video Creation and Editing)是阿里巴巴通义实验室推出的一站式视频生成与编辑框架。基于整合多种视频任务(如参考视频生成、视频到视频编辑、遮罩编辑等)到一个统一模型中,实现高效的内容创作和编辑功能。VACE的核心在于Video Condition Unit(VCU),将文本、图像、视频和遮罩等多种模态输入整合为统一的条件单元,支持多种任务的灵活组合。开源的 Wan2
秒哒是百度推出的零代码AI开发平台/首个无代码工具,用户无需编写代码,通过自然语言描述需求,可快速生成应用。秒哒具备无代码编程、多智能体协作和多工具调用三大特性。无代码编程让非技术人员也能轻松上手,多智能体协作可智能调度不同智能体完成复杂任务,多工具调用能接入多种实用工具。 🚀平台特点 零代码开发:用户无需掌握复杂的编程语言和代码编写技能,只需通过自然语言描述需求,平台就自动将需求转化
BetterYeah AI是一个企业级AI智能体平台,通过简化AI Agent的开发流程,使企业能快速构建和部署AI应用。平台的核心产品能力包括零代码搭建Agent、一站式模型集成、知识库管理、数据库连接、可视化工作流(Flow)、丰富的官方插件(Plugin)、多模态ChatBot支持以及简单的开发运维工具。 BetterYeah AI的主要功能 零代码搭建Agent:允许用户无需编写代
百宝箱Tbox(原芝士饼)是蚂蚁集团(支付宝)推出的一站式 AI 原生应用开发平台,无需任何代码基础,只需通过自然语言,简单几步即可完成应用的创建与发布。百宝箱Tbox集成了多种主流大模型,如通义千问、月之暗面等。百宝箱Tbox不仅可以帮你轻松创建各类智能体(Agent),支持一键发布到支付宝小程序,还能发布到其他平台 百宝箱Tbox的主要功能 0代码开发:用户无需编写代码即可快速搭建AI
FaceShot是同济大学、上海 AI Lab和南京理工大学推出的新型无需训练的肖像动画生成框架。用外观引导的地标匹配模块和基于坐标的地标重定位模块,为各种角色生成精确且鲁棒的地标序列,基于潜在扩散模型的语义对应关系,跨越广泛的角色类型生成面部动作序列。将地标序列输入预训练的地标驱动动画模型生成动画视频。FaceShot突破对现实肖像地标的限制,适用于任何风格化的角色和驱动视频,或作为插件与任何地
Screenify是先进的AI面试工具,帮助企业高效筛选候选人,优化招聘流程。通过自动化面试流程,让企业能快速创建面试、定义评估标准自动发送给候选人,节省了安排面试和收集反馈的时间。AI面试官根据职位要求、候选人经验和回答进行个性化调整,确保评估的一致性和公平性,消除了人为偏见,提供客观的评分和反馈。Screenify支持候选人通过Google Meet或Zoom随时随地进行面试,整个流程无缝融入
AlphaEvolve是谷歌DeepMind推出的通用科学Agent,基于结合大型语言模型(LLMs)的创造力和自动评估器来设计和优化高级算法。用Gemini Flash和Gemini Pro两种模型,基于进化框架不断改进最有潜力的算法。AlphaEvolve在数据中心调度、硬件设计、AI训练和复杂数学问题解决等领域取得显著成果,优化矩阵乘法算法,提升数据中心效率,在多个开放数学问题上取得突破。A
Being-M0 基于业界首个百万级动作数据集 MotionLib,用创新的 MotionBook 编码技术,将动作序列转化为二维图像进行高效表示和生成。Being-M0 验证了大数据+大模型在动作生成领域的技术可行性,显著提升动作生成的多样性和语义对齐精度,实现从人体动作到多款人形机器人的高效迁移,为通用动作智能奠定基础。 Being-M0的主要功能 文本驱动动作生成:根据输入的自然语言
MSQA(Multi-modal Situated Question Answering)是大规模多模态情境推理数据集,提升具身AI代理在3D场景中的理解与推理能力。数据集包含251K个问答对,覆盖9个问题类别,基于3D场景图和视觉-语言模型在真实世界3D场景中收集。MSQA用文本、图像和点云的交错多模态输入,减少单模态输入的歧义。引入MSNN(Multi-modal Next-step Navi
Co-Sight是中兴通讯开源的超级智能体项目,为协同视觉分析平台及智能自动化底座。采用多智能体架构,构建“数字团队”协同体系,通过DAG任务引擎驱动,实现任务的高效调度与执行。Co-Sight具备自我进化能力,能通过执行记录与模型推理自动生成智能总结报告,形成持续改进闭环。注重安全与可靠性,所有操作在沙箱环境中运行,支持日志追溯、权限管控与合规审计。 Co-Sight的主要功能 智能总结
CareerSwift是人工智能驱动的求职助手,帮助求职者高效完成求职过程。通过AI分析简历内容提供改进建议,使简历更符合行业标准和职位要求;提供面试辅导资源,助力求职者提升面试技巧,支持智能匹配推荐适合的职位,简化申请流程;帮助用户管理求职进度,及时了解申请状态。为用户提供个性化的求职建议,确保简历通过雇主的申请人跟踪系统(ATS),提高求职成功率。 CareerSwift的主要功能
讯飞晓医APP是由科大讯飞医疗推出的一款智能医疗健康助手应用,利用讯飞星火医疗大模型技术,结合丰富的医学数据和深度学习算法,为用户提供症状自查、药物查询、中医辨证、报告解读、医院推荐、科室推荐和饮食建议等多功能服务。该应用旨在通过人工智能技术,提升用户的健康管理效率,优化就医体验,实现个性化、精准的健康咨询和指导,轻松管理自己和家人的健康。 讯飞晓医APP的主要功能 症状自查:用户输入
Sketch2Anim 是爱丁堡大学联合Snap Research、东北大学推出的自动化框架,能将2D草图故事板直接转换为高质量的3D动画。基于条件运动合成技术,用3D关键姿势、关节轨迹和动作词精确控制动画的生成。框架包含两个核心模块,多条件运动生成器和2D、3D神经映射器。Sketch2Anim能生成自然流畅的3D动画,支持交互式编辑,极大地提高动画制作的效率和灵活性。 Sketch2Anim
Seedance 1.0 lite是火山引擎推出的豆包视频生成模型的小参数量版本,支持文生视频和图生视频两种生成方式,支持生成5秒或10秒、480p或720p分辨率的视频。具备影视级视频生成质量,能精细控制人物外貌、衣着、表情动作等细节,支持360度环绕、航拍、变焦等多种运镜技术,生成的视频画质细腻、美感十足。模型广泛用在电商广告、娱乐特效、影视创作、动态壁纸等领域,能有效降低制作成本和周期。
ZenCtrl 是 Fotographer AI 推出的 AI 图像生成工具,支持从单张图像生成高质量、多视角和多样化场景的图像,无需额外训练数据。基于先进算法和图像处理技术,支持实时元素再生,适用于产品摄影、虚拟试穿、人物肖像控制、插画等场景。ZenCtrl 为创意和商业领域中高效、灵活的视觉内容生成解决方案。 ZenCtrl的主要功能 多视角和多样化场景生成:从单张主题图像生成高质量、
Scenethesis 是 NVIDIA 推出的创新框架,用在从文本生成交互式 3D 场景。框架结合大型语言模型(LLM)和视觉感知技术,基于多阶段流程实现高效生成,用 LLM 进行粗略布局规划,基于视觉模块细化布局生成图像指导,用优化模块调整物体姿态确保物理合理性,基于判断模块验证场景的空间连贯性。Scenethesis 能生成多样化的室内外场景,具有高度的真实感和物理合理性,广泛应用在虚拟内容
SuperEdit是字节跳动智能创作团队和佛罗里达中央大学计算机视觉研究中心联合推出的指令引导图像编辑方法,基于优化监督信号提高图像编辑的精度和效果。SuperEdit基于纠正编辑指令,与原始图像和编辑图像对更准确地对齐,引入对比监督信号,进一步优化模型训练。SuperEdit不需要额外的视觉语言模型(VLM)或预训练任务,仅依赖高质量的监督信号,在多个基准测试中实现显著的性能提升。 Super
KuaiMod 是快手推出的基于多模态大模型的短视频质量判别框架,能高效识别和过滤有害及低质量内容。框架借鉴普通法(Common Law)体系,基于案例驱动的方式动态更新审核策略,快速适应短视频平台上内容的快速变化。KuaiMod 结合视觉语言模型(VLM)和链式推理(Chain-of-Thought,中 CoT)技术,基于用户反馈进行强化学习,实现精准的内容判别。KuaiMod 离线测试准确率高
WebThinker是中国人民大学、北京智源人工智能研究院和华为泊松实验室等机构提出的深度研究智能体。WebThinker赋能大型推理模型(LRMs)在推理过程中自主进行网络搜索、网页导航和报告撰写。WebThinker基于深度网页探索器和自主思考、搜索、写作策略,让LRMs能动态获取信息,实时生成高质量研究报告。WebThinker基于强化学习的训练策略进一步优化工具使用效率。WebThinke
VoiceCanvas 是开源的多语言语音合成平台。基于 AI 技术提供高质量的文字转语音服务,支持超过 50 种语言,集成 OpenAI TTS、AWS Polly 和 MiniMax 等多种语音服务。VoiceCanvas 提供个人声音克隆功能,用户上传几秒音频样本能创建个性化声音。VoiceCanvas适合内容创作者、教育工作者和企业用户,显著提升语音内容制作效率。 VoiceCanvas
只显示前20页数据,更多请搜索
Showing 49 to 72 of 141 results