OCRmyPDF 为扫描的 PDF 文件添加光学字符识别 (OCR) 文本层,以便于搜索。 PDF 是存储和交换扫描文档的最佳格式。遗憾的是,PDF 格式的修改可能比较困难。OCRmyPDF 可以轻松地将图像处理和 OCR(可识别、可搜索的文本)应用于现有 PDF。 OCRmyPDF 是一款 Python 应用程序和库,它为 PDF 中的图像添加文本“图层”,使扫描的图像 PDF 可搜索。它使用 OCR 来猜测图像中包含的文本。OCRmyPDF 还支持插件,可以自定义其处理步骤,并且对包含扫描图像和无需文本识别的“原生数字”内容的 PDF 具有高度的兼容性。

相关推荐

Sourcely

Sourcely

<p>Sourcely是AI驱动的学术搜索工具,能帮助学生和研究人员快速找到、总结和添加可信的学术资源。Sourcely提供超过2亿篇论文的访问权限,基于高级搜索过滤器简化研究过程。Sourcely的特色包括免费PDF下载、个性化搜索过滤器,及即时引用导出功能。Sourcely用学生视角创建真正理解学术社区需求的工具,保持与最新研究和趋势的同步,确保工具不断改进和发展。</p> <h2 style="font-size: 20px;">Sourcely的主要功能</h2> <ul> <li>快速找到学术资源:用户粘贴文章或论文,Sourcely自动寻找、总结和添加相关的学术来源。</li> <li>免费PDF下载:用户能免费下载列出来源的PDF文件。</li> <li>高级搜索过滤器:用户用高级过滤器,例如出版年份、作者身份、相关性等,定制来源发现。</li> <li>引用导出:即时导出引用,方便用户将找到的来源直接添加到研究论文中。</li> <li>文献自动摘要:自动生成文献摘要,快速了解文献的核心内容,节省大量阅读时间。</li> </ul> <h2 style="font-size: 20px;">Sourcely的官网地址</h2> <ul> <li>官网地址:<a class="external" href="https://www.sourcely.net/?utm_source=medsci" target="_blank" rel="noopener">sourcely.net</a></li> </ul> <h2 style="font-size: 20px;">Sourcely的产品定价</h2> <ul> <li>试用会员:一次性支付7美元,获得2000个字符的Pro模式使用权。</li> <li>月度会员:每月17美元。</li> <li>年度会员:每月14美元。</li> <li>会员权益:支持粘贴整个论文或文章;找到的来源数量没有限制;每个来源提供事实摘要;能将来源保存在库中以便日后使用;优先客户支持;无广告体验。</li> </ul>

stirling PDF

stirling PDF

Stirling-PDF是一款基于 Docker 的本地托管、功能强大的 Web PDF 处理工具。它支持您对 PDF 文件执行各种操作,包括拆分、合并、转换、重组、添加图像、旋转、压缩等等。这款本地托管的 Web 应用程序功能强大,功能全面,可满足您所有的 PDF 需求。 所有文件和 PDF 要么仅存在于客户端,要么仅在任务执行期间驻留在服务器内存中,要么仅在任务执行期间临时驻留在某个文件中。此时,用户下载的任何文件都已从服务器中删除。 广泛的 PDF 功能:访问 50 多种工具,包括签名、转换、合并等。

PDFMathTranslate

PDFMathTranslate

PDF scientific paper translation with preserved formats - 基于 AI 完整保留排版的 PDF 文档全文双语翻译,支持 Google/DeepL/Ollama/OpenAI 等服务,提供 CLI/GUI/MCP/Docker/Zotero