关键词 "bulk OCR" 的搜索结果, 共 7 条, 只显示前 480 条
KuaiMod 是快手推出的基于多模态大模型的短视频质量判别框架,能高效识别和过滤有害及低质量内容。框架借鉴普通法(Common Law)体系,基于案例驱动的方式动态更新审核策略,快速适应短视频平台上内容的快速变化。KuaiMod 结合视觉语言模型(VLM)和链式推理(Chain-of-Thought,中 CoT)技术,基于用户反馈进行强化学习,实现精准的内容判别。KuaiMod 离线测试准确率高
Question.AI的简介 Question.AI 是作业帮推出的AI学习助手应用,专为学生、专业人士和好奇者设计。通过简单易用的界面提供即时准确的答案,支持 140 多种语言翻译,打破语言障碍。智能写作功能可优化文本,提升写作质量。提供数学计算器功能,帮助用户解决复杂数学问题。 Question.AI的主要功能 拍照解题:用户可以通过拍摄题目照片,系统会快速识别并提供答案。 文
Dolphin 是字节跳动开源的轻量级、高效的文档解析大模型。基于先解析结构后解析内容的两阶段方法,第一阶段生成文档布局元素序列,第二阶段用元素作为锚点并行解析内容。Dolphin在多种文档解析任务上表现出色,性能超越GPT-4.1、Mistral-OCR等模型。Dolphin 具有322M参数,体积小、速度快,支持多种文档元素解析,包括文本、表格、公式等。Dolphin的代码和预训练模型已公开,
Ming-Lite-Omni是蚂蚁集团开源的统一多模态大模型。模型基于MoE架构,融合文本、图像、音频和视频等多种模态的感知能力,具备强大的理解和生成能力。模型在多个模态基准测试中表现出色,在图像识别、视频理解、语音问答等任务上均取得优异成绩。模型支持全模态输入输出,能实现自然流畅的多模态交互,为用户提供一体化的智能体验。Ming-Lite-Omni具备高度的可扩展性,可广泛用在OCR识别、知识问
High-quality, cost-effective, faster, and bulk professional clipping path and photo editing services. Our services are open 24/7. 获得专业的剪切路径、背景移除、阴影、颜色变换、修图、蒙版、隐形模特和矢量转换服务。使用专业的照片编辑功能提升您的视觉效果,
灵语文档(MindLink)是AI驱动的云文档编辑平台,为企业提供一站式文档编辑和共享服务。平台具备多组态支持,包括思维导图、原型白板、可视化图表等功能,支持文档版本历史管理、智能创作、全平台访问、权限控制和AI智能助手等强大功能。基于AI + 多模态能力,灵语文档能显著提高团队协作效率,打破部门壁垒,增强信息共享,确保文档安全。灵语文档根据企业需求灵活定制,帮助企业高效管理知识资产,赋能数字化转
普林斯顿与复旦推出HistBench和HistAgent,首个人文AI评测基准 普林斯顿大学AI实验室与复旦大学历史学系联手推出了全球首个聚焦历史研究能力的AI评测基准——HistBench,并同步开发了深度嵌入历史研究场景的AI助手——HistAgent。这一成果不仅填补了人文学科AI测试的空白,更为复杂史料处理与多模态理解建立了系统工具框架。 历史是关于时间中的人的
只显示前20页数据,更多请搜索
Showing 193 to 199 of 199 results