Agentic Document Extraction

Agentic Document Extraction

访问网站

概述

LandingAI Agentic 文档提取API 从视觉复杂的文档(如表格、图片和图表)中提取结构化数据,并返回具有精确元素位置的分层 JSON。

这个 Python 库包装了该 API 以提供:

  • 长文档支持——一次调用即可处理 100 多页 PDF
  • 自动重试/分页——处理并发、超时和速率限制
  • 辅助实用程序——边界框代码片段、可视化调试器等

特征

  • 📦包含电池的安装: pip install agentic-doc – 无需其他任何操作 → 请参阅 安装
  • 🗂️所有文件类型:解析任意长度的 PDF、单个图像或 URL → 请参阅 支持的文件
  • 📚长文档就绪:自动拆分和并行处理 1000 多页 PDF,然后拼接结果 → 参见 解析大型 PDF 文件
  • 🧩结构化输出:返回分层 JSON 以及可渲染的 Markdown → 参见 结果架构
  • 👁️真实视觉效果:可选的边界框片段和整页可视化 → 请参阅 将 Groundings 另存为图像
  • 🏃批处理和并行:提供列表;库管理线程和速率限制(BATCH_SIZEMAX_WORKERS)→参见 批量解析多个文件
  • 🔄弹性:针对 408/429/502/503/504 和速率限制命中的指数退避重试 → 请参阅 使用重试自动处理 API 错误和速率限制
  • 🛠️嵌入式助手: parse_documents,,parse_and_save_documentsparse_and_save_document参见 主要功能
  • ⚙️通过 env / .env 配置:调整并行度、日志记录样式、重试上限 — 无需更改代码 → 请参阅 配置选项
  • 🌐原始 API 就绪:高级用户仍然可以直接访问 REST 端点 → 请参阅 API 文档

快速入门

安装

pip install agentic-doc