Linux版后羿收集器是一款超级好用的网页数据收集工具。通过该软件,用户可以快速采集目标网页的相关数据信息,软件还可以可视化定制采集流程。所以有需要的用户可以下载体验。
软件功能
1.可视化和定制采集过程。
全程问答引导,可视化操作,用户自定义采集流程。
自动记录和模拟网页操作顺序
高级设置满足更多采集要求。
2.单击以提取网页数据。
点击鼠标选择要抓取的网页内容,操作简单。
可以选择提取文本、链接、属性、html标签等。
3.运行批量数据采集。
软件根据采集流程和提取规则自动批量采集。
快速实时显示采集速度和过程,可以切换软件在后台运行,不干扰前台工作。
4.导出并发布收集的数据。
收集的数据会自动制成表格,并且可以自由配置字段。
支持数据导出到Excel等本地文件和一键发布到CMS网站/数据库/微信微信官方账号等媒体。
如何输入正确的网址
用户创建任务时,必须先输入正确的网址。采集器上的输入框不同于一般的浏览器搜索框,他们需要输入网址,而不是直接输入文字。
用户输入网址时,不要直接输入首页的网址,而是搜索结果页的网址。
举个例子,如果用户想在后羿收藏者上收藏文档教程的内容,如果他直接输入后羿收藏者首页的网址,那么我们就无法收藏文档教程的内容。
我们需要复制的是显示收藏对象的页面的URL,以便收藏具体的内容,如下图所示。
更新内容
1.提高
任务分组支持设置注释
添加电子邮件提醒功能
支持MySQL8版本
2.修理
修复某些情况下的滚动问题。
修复某些情况下的文件下载问题。