关键词 "Passport OCR" 的搜索结果, 共 24 条, 只显示前 480 条
Nanonets is an AI platform that automates processes and extracts actionable insights from unstructured data.
LabLab is a platform that encourages innovation with AI technology through hackathons and events.
Free math homework help with accurate answers.
AI-powered image translator for text extraction and translation.
AI-powered software for editing and managing PDF files.
InternVL Family: A Pioneering Open-Source Alternative to GPT-4o. 接近GPT-4o表现的开源多模态对话模型 InternVL 家族:利用开源套件缩小与商业多模态模型的差距——GPT-4o 的先驱开源替代方案 InternVL3,一个性能强大的开源多模态大模型。其中InternVL3-78B同时在感知能力和推理能力上同时达到了开源第
Mirror of
Build MCP servers for any website with automatic browser auth syncing
A Model Context Protocol server for converting almost anything to Markdown
OpenAPI (based) text from image extraction MCP Server
A RAG-ready MCP server for semantic PDF search with OCR, FAISS, and transformers—plug into any MCP client and retrieve intelligent answers within your MCP client.
MCP server that provides computer control capabilities, like mouse, keyboard, OCR, etc. using PyAutoGUI, RapidOCR, ONNXRuntime. Similar to 'computer-use' by Anthropic. With Zero External Dependencies.
📸 Google OCR MCP server 📸
A Model Context Protocol (MCP) server
A MCP server based on RapidOCR, providing an easy-to-use OCR interface.
Model Context Protocol (MCP) Server for Mistral OCR API
Model Context Protocol (MCP) Server for Handwriting OCR
Convert handwritten and printed text to Markdown and structured data with unparalleled accuracy.
MCP server exposing AutoHotkey functionality, enabling model interfaces to automation tasks on Windows.
OCRmyPDF 为扫描的 PDF 文件添加光学字符识别 (OCR) 文本层,以便于搜索。 PDF 是存储和交换扫描文档的最佳格式。遗憾的是,PDF 格式的修改可能比较困难。OCRmyPDF 可以轻松地将图像处理和 OCR(可识别、可搜索的文本)应用于现有 PDF。 OCRmyPDF 是一款 Python 应用程序和库,它为 PDF 中的图像添加文本“图层”,使扫描的图像 PDF 可搜索。
Stirling-PDF是一款基于 Docker 的本地托管、功能强大的 Web PDF 处理工具。它支持您对 PDF 文件执行各种操作,包括拆分、合并、转换、重组、添加图像、旋转、压缩等等。这款本地托管的 Web 应用程序功能强大,功能全面,可满足您所有的 PDF 需求。 所有文件和 PDF 要么仅存在于客户端,要么仅在任务执行期间驻留在服务器内存中,要么仅在任务执行期间临时驻留在某个文件
docext Overview ‌docext‌是一个基于视觉语言模型(VLM)的本地无结构数据提取工具,特别适用于处理各种文档,如发票、护照等。它无需传统的OCR技术,通过深度学习的视觉语言模型,能够准确识别并提取文档图像中的字段数据和表格信息‌12。 技术特点和应用场景 ‌无需OCR‌:docext利用视觉语言模
KuaiMod 是快手推出的基于多模态大模型的短视频质量判别框架,能高效识别和过滤有害及低质量内容。框架借鉴普通法(Common Law)体系,基于案例驱动的方式动态更新审核策略,快速适应短视频平台上内容的快速变化。KuaiMod 结合视觉语言模型(VLM)和链式推理(Chain-of-Thought,中 CoT)技术,基于用户反馈进行强化学习,实现精准的内容判别。KuaiMod 离线测试准确率高
Question.AI的简介 Question.AI 是作业帮推出的AI学习助手应用,专为学生、专业人士和好奇者设计。通过简单易用的界面提供即时准确的答案,支持 140 多种语言翻译,打破语言障碍。智能写作功能可优化文本,提升写作质量。提供数学计算器功能,帮助用户解决复杂数学问题。 Question.AI的主要功能 拍照解题:用户可以通过拍摄题目照片,系统会快速识别并提供答案。 文
只显示前20页数据,更多请搜索
Showing 121 to 144 of 147 results