No-code web scraping tool for collecting website data.

相关推荐

NLWeb

NLWeb

<p>微软发布了名为 “NLWeb” 的开源项目,旨在简化创建网站的自然语言对话界面,使任何网站都能轻松转变为 AI 驱动的应用程序。</p> <p>NLWeb 定位为 “智能体 Web 时代的 HTML”,支持自定义模型与数据交互,旨在帮助开发者轻松将网站转化为支持自然语言交互的 AI 应用,可提供 “类似 ChatGPT 的聊天界面”。</p> <p><img style="display: block; margin-left: auto; margin-right: auto;" src="https://img.medsci.cn/aisite/tinymce/2025/05/20/1747720101_8TIy5jHQiu.png"></p> <p>NLWeb 开源地址:https://github.com/microsoft/NLWeb</p> <p>据介绍,NLWeb 的核心在于利用网站已有的半结构化数据(如 Schema.org、RSS 等),结合大语言模型(LLM)的能力,创建既适合人类用户也适合 AI 应用使用的自然语言接口。</p> <p>此外,NLWeb 还引入了 “模型上下文协议”(Model Context Protocol,MCP),允许站长自行配置相应协议,以便于允许自家网站可以被其他 MCP 生态系统的参与者通过各种方式查询到。</p> <p><img style="display: block; margin-left: auto; margin-right: auto;" src="https://img.medsci.cn/aisite/tinymce/2025/05/20/1747720101_PRz1rBNpsf.gif"></p> <p>微软技术研究员 Ramanathan V. Guha 表示,NLWeb 的愿景是让自然语言交互成为新一代 Web 的标准,就像 HTML 在早期互联网中的作用一样。该项目的设计具有高度技术中立性,支持所有主流操作系统、AI 模型和向量数据库,开发者可以根据自身需求选择最合适的组件。</p> <p>目前,微软已与一小部分网站合作测试 NLWeb,涉及 Common Sense Media、Eventbrite、O’Reilly Media、Shopify 和 Tripadvisor 等网站等。</p>

PhantomBuster

PhantomBuster

PhantomBuster is a web-based platform for data extraction and analysis from online sources.

Apify

Apify

Comprehensive platform for web scraping and automation tools.