上海交通大学等开源了一款半结构化表格问答工具:ST-Raptor,无需微调,准确率超GPT-4o 做文档智能、财务审核、报表自动化、医疗质控、法律合规的可以看看 它通过视觉理解、结构化解析以及语言推理,来解决复杂、不规则表格的问答问题 也就是说可以用它对Excel报表、网站上的表格以及Markdown、csv文件进行问答,比如学术表、财务报表 ST-Raptor先用VLM识别表格整体和单元格内容,再通过 HO-Tree算法将表格结构抽象为层次树,用于逻辑分块与定位,最后由LLM在树节点上推理问答
ST-Raptor是一款用于解答表格问题的工具,表格具有多种半结构化布局。它仅接受 Excel 格式的表格和自然语言问题作为输入,即可给出精准的答案。
与许多现有方法不同,ST-Raptor 无需额外微调。它结合了视觉语言模型 (VLM) 和树构建算法 (HO-Tree),并可灵活地与不同的 LLM 集成。ST-Raptor 采用两阶段验证机制,以确保结果的可靠性。
❓ ST-Raptor 可以处理哪些表?
半结构化表格,如个人信息表、学术表、财务表……来自 Excel、网站(HTML)、Markdown、csv 文件……
???? SSTQA 基准
SSTQA 中的102 个表格和764 个问题是从超过2031 个真实世界中精心挑选出来的,考虑了具有
ST-Raptor是一款用于解答表格问题的工具,表格具有多种半结构化布局。它仅接受 Excel 格式的表格和自然语言问题作为输入,即可给出精准的答案。
与许多现有方法不同,ST-Raptor 无需额外微调。它结合了视觉语言模型 (VLM) 和树构建算法 (HO-Tree),并可灵活地与不同的 LLM 集成。ST-Raptor 采用两阶段验证机制,以确保结果的可靠性。
❓ ST-Raptor 可以处理哪些表?
半结构化表格,如个人信息表、学术表、财务表……来自 Excel、网站(HTML)、Markdown、csv 文件……
下载包含 2k+ 个表的未过滤数据集:原始数据集。
下载 SSTQA 基准:SSTQA 基准。