关键词 "多语言" 的搜索结果, 共 24 条, 只显示前 480 条
Pemo是AI驱动的文档管理工具。工具支持PDF、Epub、Word等多种格式文档的导入与管理,具备一键翻译、智能总结、思维导图生成等功能,帮助用户快速理解复杂文献,提升阅读效率。Pemo提供沉浸式阅读体验,用户自定义阅读模式、进行标注和笔记,方便记录灵感。Pemo支持文档格式转换,满足不同需求,是学生、科研人员和职场人士提升学习与工作效率的好帮手。 Pemo的主要功能 导入与分类:支
VoiceCanvas 是开源的多语言语音合成平台。基于 AI 技术提供高质量的文字转语音服务,支持超过 50 种语言,集成 OpenAI TTS、AWS Polly 和 MiniMax 等多种语音服务。VoiceCanvas 提供个人声音克隆功能,用户上传几秒音频样本能创建个性化声音。VoiceCanvas适合内容创作者、教育工作者和企业用户,显著提升语音内容制作效率。 VoiceCanvas
XAnswer是一款支持生成思维导图的免费AI搜索工具,聚合全网优质信息源,结合LLM能力和RAG技术, 为用户提供实时、准确的搜索结果。AI驱动的精准搜索,提供直接答案;支持指定信息源搜索(新闻、LinkdIn、Youtube等);快速响应搜索查询,生成结果提供思维导图,支持中英两种语言。XAnswer特别适合需要高效信息检索和知识管理的用户,无论是学术研究还是日常查询。 XAnswer的
Question.AI的简介 Question.AI 是作业帮推出的AI学习助手应用,专为学生、专业人士和好奇者设计。通过简单易用的界面提供即时准确的答案,支持 140 多种语言翻译,打破语言障碍。智能写作功能可优化文本,提升写作质量。提供数学计算器功能,帮助用户解决复杂数学问题。 Question.AI的主要功能 拍照解题:用户可以通过拍摄题目照片,系统会快速识别并提供答案。 文
SeeMuseums 是创新的 AI 导览应用,为博物馆游客提供个性化、智能化的参观体验。应用具备多语言支持、智能推荐、AI 音频导览等功能,根据用户兴趣推荐艺术品和展览。用户向 AI 导游提问,获取详细解读,基于个人笔记和照片上传记录所见所感。SeeMuseums 能满足不同用户需求,提升参观乐趣,让博物馆之旅更加丰富和难忘。 SeeMuseums的主要功能 多语言支持:提供多种语言
Dolphin 是字节跳动开源的轻量级、高效的文档解析大模型。基于先解析结构后解析内容的两阶段方法,第一阶段生成文档布局元素序列,第二阶段用元素作为锚点并行解析内容。Dolphin在多种文档解析任务上表现出色,性能超越GPT-4.1、Mistral-OCR等模型。Dolphin 具有322M参数,体积小、速度快,支持多种文档元素解析,包括文本、表格、公式等。Dolphin的代码和预训练模型已公开,
Google Beam是谷歌推出的AI驱动的3D视频通信平台。基于先进的AI技术和3D成像,将2D视频流转换为逼真的3D效果,让远程通话更自然、更直观。用户能像面对面一样进行眼神交流和读懂细微表情,增强沟通效果。Google Beam支持实时语音翻译,打破语言障碍,让全球用户无缝交流。平台基于Google Cloud的强大支持,具备企业级可靠性,支持无缝集成到现有工作流程中。 Google Be
Pippit是字节旗下 CapCut 推出的AI营销内容创作平台,专为电商、社交媒体运营和品牌推广设计。帮助用户轻松生成高质量的视频和图片内容,无需专业设计技能。用户只需输入网页链接或脚本,可快速生成多种营销视频,支持多语言,可批量创作图片。 Pippit提供丰富的商业授权素材库,包括视频模板、图片、设计元素和音频,确保生成内容的合规性。支持一键发布到 TikTok、Instagram 等平台,
JoyPix 是专注于数字人和语音合成的AI创作工具。用户可以通过上传照片创建个性化的虚拟形象,支持与虚拟形象进行语音对话。JoyPix 提供自定义虚拟形象,可以根据自己的需求进一步定制虚拟形象的外观。JoyPix支持声音克隆,用户只需上传10秒音频片段,可克隆自己的声音,生成自然流畅的语音输出。JoyPix 的文本转语音功能可以将文本转换为逼真的语音,满足多种语音合成需求。JoyPix提供了虚拟
KreadoAI是一个AIGC数字营销视频创作平台,专注于利用人工智能技术简化和优化视频内容的创作流程。用户只需输入文本或关键词,Kreado AI能创作出真实或虚拟人物的视频内容。平台提供超过 700 种数字人形象和 1600 多种语音选项,支持 140 多种语言,广泛应用于营销、教育、培训、医疗等领域。 KreadoAI 的最新版本增加了真人语音克隆、真人形象克隆、PPT 文件生成数字人口播视
通义万相AI视频是阿里推出的一款完全免费的AI视频生成工具,支持文生视频和图生视频两种方式,可以根据用户提供的文字提示词或图片,自动创作出具有影视级画面质感的高清视频(最长6秒)。通义万相AI视频支持多种艺术风格,包括但不限于古风、科幻、动画等,并且特别优化了对中式元素的理解和表现。通义万相AI视频能处理多语言输入,支持“灵感扩写”功能,一键帮用户完善提示词,还自带“音频生成”功能,视频生成自带音
PPT.AI 是AI演示文稿制作工具,能快速将用户输入的主题或上传的文档内容转换为专业的 PPT 演示文稿。具备智能内容生成、自动设计与排版、丰富模板选择、多语言支持等功能,支持15种主要语言,提供50多个专业模板。用户只需输入主题或上传文件,选择模板,可快速生成演示文稿,支持进一步自定义编辑。PPT.AI 考虑数据安全,提供银行级加密和安全云存储。 PPT.AI的主要功能 智能生成演示文
PodAgent 是香港中文大学、微软和小红书联合推出的播客生成框架。基于模拟真实的脱口秀场景,用多智能体协作系统(包括主持人、嘉宾和编剧)自动生成丰富且结构化的对话内容。PodAgent构建了多样化的声音库,用在精准匹配角色与声音,确保音频的自然度和沉浸感。PodAgent 引入基于大语言模型(LLM)的语音合成技术,生成富有表现力和情感的语音,让播客更具吸引力。PodAgent 推出了全面的评
幻舟AI是一站式AI短片创作平台,支持批量生成广告片、宣传片、动画片等。基于Midjourney、Runway等全球领先的AI模型,实现剧本创作、角色设计、分镜生成及视频制作的全流程服务。平台支持多种模型切换,满足不同风格和场景需求。幻舟AI高效整合创作资源,简化操作流程,提升创作效率,是影视创作者的有力工具。 幻舟AI的主要功能 剧本创作:自动生成故事剧本和分镜图,支持自定义编辑。 角
钉钉宜搭是阿里巴巴推出的低代码应用开发平台,帮助企业快速、高效地搭建数字化业务应用。通过可视化拖拽和配置的方式,让不懂代码的业务人员也能开发出符合自身需求的应用系统,降低了开发门槛和成本。用户可以用丰富的组件库,快速构建出各类业务表单,通过自定义流程规则实现高效的业务审批和流转。宜搭具备强大的数据统计和分析能力,能帮助企业更好地进行决策支持。 钉钉宜搭的主要功能 应用可视化搭建:提供大
OpenAudio S1是Fish Audio推出的文本转语音(TTS)模型,基于超过200万小时的音频数据训练,支持13种语言。采用双自回归(Dual-AR)架构和强化学习与人类反馈(RLHF)技术,生成的声音高度自然、流畅,几乎与人类配音无异。模型支持超过50种情感和语调标记,用户可通过自然语言指令灵活调整语音表达。OpenAudio S1支持零样本和少样本语音克隆,仅需10到30秒的音频样本
Lillian是Scrumball推出的AI网红营销助手,专为解决网红营销中的效率和数据分析痛点而设计。Lillian基于集成最新的Claude 4技术,将网红数据分析时间从30分钟缩短至3秒,实现真正的实时洞察。Lillian提供自定义多维分析,包括受众画像、内容表现对比和竞品策略剖析,帮助品牌精准定位目标受众。Lillian支持智能内容创作、多平台统一管理和全流程自动化,助力品牌高效管理网红合
普林斯顿与复旦推出HistBench和HistAgent,首个人文AI评测基准 普林斯顿大学AI实验室与复旦大学历史学系联手推出了全球首个聚焦历史研究能力的AI评测基准——HistBench,并同步开发了深度嵌入历史研究场景的AI助手——HistAgent。这一成果不仅填补了人文学科AI测试的空白,更为复杂史料处理与多模态理解建立了系统工具框架。 历史是关于时间中的人的
QuickCreator是为中国出海企业推出的AI SEO写作工具。基于AI技术,能快速生成高质量、符合搜索引擎优化标准的内容,涵盖博客、落地页等多种形式。工具操作简单,提供如关键词框架搭建、自动插入外部引用等实用功能,支持一键导出至WordPress。QuickCreator帮助用户用更低的成本和更短的时间完成SEO工作,显著提升网站自然流量和搜索引擎排名,是出海企业提升内容创作效率和营销效果的
智声云配(DubbingX) 是 AI 智能配音工具,提供语音合成(TTS)、音色迁移、歌声转换等多种功能。工具支持中文、英文、日文、粤语等多语言,拥有近2500种情绪语态,支持高度定制,满足游戏、影视、动漫、有声书等多场景需求。工具音色版权合规,支持商用,能显著降低配音成本。智声云配结合专业高校和全球配音演员资源,致力于为用户提供高质量、多样化的音频解决方案。 智声云配官网:https://d
Qwen VLo 是通义千问团队推出的多模态统一理解与生成模型。在多模态大模型的基础上进行了全面升级,能“看懂”世界,能基于理解进行高质量的再创造,实现了从感知到生成的跨越。能精准理解图像内容,在此基础上进行一致性和高质量的生成。用户可以通过自然语言指令要求模型对图像进行风格转换、场景重构或细节修饰,模型能灵活响应并生成符合预期的结果。Qwen VLo 支持多语言指令,打破语言壁垒,为全球用户提供
蚂蚁PPT是基于人工智能技术的在线AI PPT生成平台,帮助用户快速、高效地创建演示文稿。用户只需输入主题或关键词,系统能自动生成包含大纲、内容和设计的完整PPT初稿。提供多种专业模板,用户可以根据需求调整模板风格、颜色和字体,实现个性化设计。蚂蚁PPT支持多语言输入与生成,适合不同语言背景的用户。适用于教育、商务、个人等多种场景。 蚂蚁PPT的官网地址 官网地址:https://www.
EXAONE 4.0是韩国LG AI Research推出的自研混合推理大模型。模型融合通用自然语言处理和高级推理能力,支持韩语、英语和西班牙语。模型分为32B的专业版和1.2B的端侧版,前者基于多项国家级认证考试,适用高专业领域,后者体积小、性能优,支持本地运行,适合隐私和安全要求高的场景。EXAONE 4.0在国际高难度基准测试中表现优异,如MMLU-Pro 81.8分、AIME 2025 8
Voxtral 是 Mistral AI 推出的先进音频模型,基于卓越的语音转录和深度理解能力,推动语音作为自然的人机交互方式。Voxtral提供 24B 和 3B 两种版本,分别适用生产规模和本地部署。Voxtral 支持多语言、长文本上下文、内置问答和总结功能,能直接触发后端功能调用。Voxtral 性能在多个基准测试中超越现有开源模型和专有 API,同时成本更低,广泛应用在各种场景,助力语音
只显示前20页数据,更多请搜索
Showing 25 to 48 of 49 results