关键词 "OCR magic" 的搜索结果, 共 24 条, 只显示前 480 条
An MCP (Model Context Protocol) server for accessing and searching Magic UI components
It's like v0 but in your Cursor/WindSurf/Cline. 21st dev Magic MCP server for working with your frontend like Magic
A Model Context Protocol server for converting almost anything to Markdown
OpenAPI (based) text from image extraction MCP Server
A RAG-ready MCP server for semantic PDF search with OCR, FAISS, and transformers—plug into any MCP client and retrieve intelligent answers within your MCP client.
MCP server that provides computer control capabilities, like mouse, keyboard, OCR, etc. using PyAutoGUI, RapidOCR, ONNXRuntime. Similar to 'computer-use' by Anthropic. With Zero External Dependencies.
📸 Google OCR MCP server 📸
A Model Context Protocol (MCP) server
A MCP server based on RapidOCR, providing an easy-to-use OCR interface.
Model Context Protocol (MCP) Server for Mistral OCR API
Model Context Protocol (MCP) Server for Handwriting OCR
Convert handwritten and printed text to Markdown and structured data with unparalleled accuracy.
MCP server exposing AutoHotkey functionality, enabling model interfaces to automation tasks on Windows.
A magical design tool for Figma powered by AI. Wave Your Magic Wand. Design with the power of AI to do everything from copywriting to generating unique icons ...
OCRmyPDF 为扫描的 PDF 文件添加光学字符识别 (OCR) 文本层,以便于搜索。 PDF 是存储和交换扫描文档的最佳格式。遗憾的是,PDF 格式的修改可能比较困难。OCRmyPDF 可以轻松地将图像处理和 OCR(可识别、可搜索的文本)应用于现有 PDF。 OCRmyPDF 是一款 Python 应用程序和库,它为 PDF 中的图像添加文本“图层”,使扫描的图像 PDF 可搜索。
Stirling-PDF是一款基于 Docker 的本地托管、功能强大的 Web PDF 处理工具。它支持您对 PDF 文件执行各种操作,包括拆分、合并、转换、重组、添加图像、旋转、压缩等等。这款本地托管的 Web 应用程序功能强大,功能全面,可满足您所有的 PDF 需求。 所有文件和 PDF 要么仅存在于客户端,要么仅在任务执行期间驻留在服务器内存中,要么仅在任务执行期间临时驻留在某个文件
docext Overview ‌docext‌是一个基于视觉语言模型(VLM)的本地无结构数据提取工具,特别适用于处理各种文档,如发票、护照等。它无需传统的OCR技术,通过深度学习的视觉语言模型,能够准确识别并提取文档图像中的字段数据和表格信息‌12。 技术特点和应用场景 ‌无需OCR‌:docext利用视觉语言模
KuaiMod 是快手推出的基于多模态大模型的短视频质量判别框架,能高效识别和过滤有害及低质量内容。框架借鉴普通法(Common Law)体系,基于案例驱动的方式动态更新审核策略,快速适应短视频平台上内容的快速变化。KuaiMod 结合视觉语言模型(VLM)和链式推理(Chain-of-Thought,中 CoT)技术,基于用户反馈进行强化学习,实现精准的内容判别。KuaiMod 离线测试准确率高
Question.AI的简介 Question.AI 是作业帮推出的AI学习助手应用,专为学生、专业人士和好奇者设计。通过简单易用的界面提供即时准确的答案,支持 140 多种语言翻译,打破语言障碍。智能写作功能可优化文本,提升写作质量。提供数学计算器功能,帮助用户解决复杂数学问题。 Question.AI的主要功能 拍照解题:用户可以通过拍摄题目照片,系统会快速识别并提供答案。 文
超级麦吉是一个强大的通用型 AI Agent,专门面向复杂任务场景设计。通过多 Agent 设计体系以及丰富的工具能力支持,超级麦吉支持自主任务理解、自主任务规划、自主行动、自主纠错等智能的能力。它能够理解自然语言指令,执行各类业务流程,并交付最终的目标结果。作为麦吉产品矩阵的旗舰产品,超级麦吉通过开源的方式提供了强大的二次开发能力,让企业能够快速构建和部署符合特定业务需求的智能助手,大幅提升决策
Dolphin 是字节跳动开源的轻量级、高效的文档解析大模型。基于先解析结构后解析内容的两阶段方法,第一阶段生成文档布局元素序列,第二阶段用元素作为锚点并行解析内容。Dolphin在多种文档解析任务上表现出色,性能超越GPT-4.1、Mistral-OCR等模型。Dolphin 具有322M参数,体积小、速度快,支持多种文档元素解析,包括文本、表格、公式等。Dolphin的代码和预训练模型已公开,
Ming-Lite-Omni是蚂蚁集团开源的统一多模态大模型。模型基于MoE架构,融合文本、图像、音频和视频等多种模态的感知能力,具备强大的理解和生成能力。模型在多个模态基准测试中表现出色,在图像识别、视频理解、语音问答等任务上均取得优异成绩。模型支持全模态输入输出,能实现自然流畅的多模态交互,为用户提供一体化的智能体验。Ming-Lite-Omni具备高度的可扩展性,可广泛用在OCR识别、知识问
Unlock your brand's full potential with Bijutoha - your one-stop shop for graphic design, web design, SEO magic, and captivating photo editing. Bijutoha 是一家创意机构,秉承 Biju 和 Toha 的共同愿景。我们专注于通过强大的平面设计、网页
灵语文档(MindLink)是AI驱动的云文档编辑平台,为企业提供一站式文档编辑和共享服务。平台具备多组态支持,包括思维导图、原型白板、可视化图表等功能,支持文档版本历史管理、智能创作、全平台访问、权限控制和AI智能助手等强大功能。基于AI + 多模态能力,灵语文档能显著提高团队协作效率,打破部门壁垒,增强信息共享,确保文档安全。灵语文档根据企业需求灵活定制,帮助企业高效管理知识资产,赋能数字化转
只显示前20页数据,更多请搜索
Showing 265 to 288 of 288 results