简介:
Agenty 推出的一款简单、功能强大的无代码网络抓取软件,可使用在线点击式网站爬虫从网站中提取数据
Agenty 的无代码网络数据抓取软件使用点击式 CSS 选择器从网站中提取数据,实时提取数据 pview 并将数据快速导出到 JSON/CSV/TSV。
使用 Chrome 扩展程序构建免费的网络抓取脚本,并在代理云上托管以进行批量 URL 抓取和更高级的网络抓取功能:如计划、匿名网站抓取、网站抓取、抓取 100 个或数百万个网页、同时提取多个网站、上传数据到服务器、FTP、S3 等
使用扩展,您可以构建 3 种类型的代理 -
1.网页抓取代理
2. 变化检测代理
3.网络爬虫代理
如何使用
- 转到您要提取的网站,然后启动扩展程序。
- 在"新建"下选择代理类型,或者您可以使用我的代理下的示例代理模板。
- 单击您要提取的网页元素(它将变为绿色)。然后,网络抓取应用程序将为该元素生成最佳 CSS 选择器,并将突出显示(黄色)与该选择器匹配的所有内容。
- 现在您可以单击突出显示的元素将其从选择器(红色)中删除,或单击未突出显示的元素将其添加到提取器中。通过这个选择和拒绝的过程,Web Scraping App 将帮助您为需要提取的项目提供完美的 CSS 选择器。
- 提取任意数量的带有文本、HTML 或 ATTR(属性)的字段,并即时输出提取数据的视图。
如何编辑您的网络抓取/变化检测代理
- 转到创建代理的网站 URL
2.启动代理扩展 - 单击您的代理旁边的打开按钮以在代理中打开它。
- 现在,您可以添加/更改任何内容并将其保存回您的帐户。
特征
- 从网页中提取任意数量的字段。
2.使用内置的CSS选择器一键生成图案。 - 编写您自己的自定义 CSS 选择器。
- 选择要提取的项目。例如 TEXT、HTML 或 ATTR(属性)
- 选择 CSS 选择器后立即查看结果 pview。
- 左右切换位置。
- 以最流行的文件格式 JSON、CSV 或 TSV 导出输出
最好的网页抓取工具
首先是用于网站抓取的 jQuery 样式 CSS 选择器扩展。立即安装以使用最先进的屏幕抓取技术来解析 HTML 并免费从网站抓取/提取信息。例如价格抓取、电子邮件抓取、数据抓取、隐藏的 html 标签抓取。
Web 抓取也称为屏幕抓取、Web 数据提取和 Web 收获等。
无论您是使用 Agenty 抓取网站,还是使用 C#、Python、Node JS、Perl、Ruby、Java 或 JavaScript 编程语言的 API。您可以使用 chrome 扩展生成 jQuery 样式的 CSS 选择器以进行网络抓取。
查看更多详情:https://agenty.com
插件下载: