Octoparse是八爪鱼采集器的海外版本,任何人都可以轻松抓取网页,无需编码就可以快速收集web数据,通过单击将网页转换为结构化电子表格!
软件特色:
先进的网页抓取功能
你所需要的一切,以自动化你的网络刮擦。
使用方便
用简单的点和点击刮取所有数据。
无需编码。
处理所有网站
搜刮网站,无限滚动。
登录、下拉、AJAX...
下载结果
以CSV、Excel、API的形式下载搜刮的数据。
或保存到数据库中。
云端服务
在八爪鱼云平台上24小时不间断地搜刮和访问数据。
刮痧
安排任务在任何特定时间刮。
每小时、每天、每周...
IP轮换
自动旋转IP,防止IP
从被封锁。
更新日志:
1、主要更新
-更好的体验:全新的软件设计,更稳定、更流畅的数据采集体验。卡滞、慢的问题会得到改善。
-改进的网站兼容性:核心渲染浏览器已经从Firefox升级到Chrome,具有更好的兼容性。
-更快的提取速度:显著提高了本地运行的速度。
-更加简洁的UI交互:界面更加简洁,工作流逻辑更加清晰。
2、笔记
-您可以在设备上同时安装8.1版和7版。
-支持Windows 7及更高版本(仅支持x64位系统)。如果您使用的是Windows XP或x32位系统,请下载7.3.0版。
-云服务器仍在版本7之下。版本8.1中配置的某些任务可能无法在云中正常运行。
3、删除的功能
-向导模式(即将合并为“高级模式”)
4、即将推出的功能
-数据导出为JSON格式
-XPath工具
常见问题答疑:
如何输入关键字列表并抓取搜索结果?
使用Octoparse,您可以轻松地在搜索框中添加 要搜索的关键字列表,然后从搜索结果中捕获数据 。无需一一手动输入关键字进行搜索。
常规工作流包括两个主要部分:
1)搜索关键字列表 。
2)提取搜索结果。