LandingAI Agentic 文档提取API 从视觉复杂的文档(如表格、图片和图表)中提取结构化数据,并返回具有精确元素位置的分层 JSON。
这个 Python 库包装了该 API 以提供:
- 长文档支持——一次调用即可处理 100 多页 PDF
- 自动重试/分页——处理并发、超时和速率限制
- 辅助实用程序——边界框代码片段、可视化调试器等
- 📦包含电池的安装:
pip install agentic-doc
– 无需其他任何操作 → 请参阅 安装 - 🗂️所有文件类型:解析任意长度的 PDF、单个图像或 URL → 请参阅 支持的文件
- 📚长文档就绪:自动拆分和并行处理 1000 多页 PDF,然后拼接结果 → 参见 解析大型 PDF 文件
- 🧩结构化输出:返回分层 JSON 以及可渲染的 Markdown → 参见 结果架构
- 👁️真实视觉效果:可选的边界框片段和整页可视化 → 请参阅 将 Groundings 另存为图像
- 🏃批处理和并行:提供列表;库管理线程和速率限制(
BATCH_SIZE
,MAX_WORKERS
)→参见 批量解析多个文件 - 🔄弹性:针对 408/429/502/503/504 和速率限制命中的指数退避重试 → 请参阅 使用重试自动处理 API 错误和速率限制
- 🛠️嵌入式助手:
parse_documents
,,parse_and_save_documents
→parse_and_save_document
参见 主要功能 - ⚙️通过 env / .env 配置:调整并行度、日志记录样式、重试上限 — 无需更改代码 → 请参阅 配置选项
- 🌐原始 API 就绪:高级用户仍然可以直接访问 REST 端点 → 请参阅 API 文档
pip install agentic-doc