极速手机网

集搜客GooSeeker采集规则图文教学

集搜客GooSeeker是一款功能非常强大的网页数采集工具,能够帮助用户轻松采集网页中的超链接,表格,图片信息,文字内容等等,致力于将互联网中的所有内容转化为数据库和表格,界面简洁,功能列表信息排布,大大方便了用户的使用,用户可以对网页内容的结构进行转换,并且对收集到的内容进行标注用户可以自定义采集规则,帮助大家能够从更广的角度和深度去采取网页数据。
使用帮助
第一步:打开网页
1.1, 加载网页,看到要采集的内容
打开数据管家用户需要输入网址,并点击键盘中的回车按钮,等待王者加载完成之后,用户请查看当前的网页内容是否完整,用户如果需要采集网页下方的各种内容,就需要哪种网页侧边的滚动条,让网页能够得到充分的加载,然后才可以创建新的采集任务。
1.2 ,创建采集任务
用户如果需要创建新的采集任务,只需要在页面的左上角点击添加按钮,也就是加号,然后在弹出的菜单栏中输入当前采集的任务名称,任务名称是唯一的,如果有相同的财经,明天就需要进行更改,直到能够为系统接受为止。
集搜客GooSeeker采集规则图文教学
集搜客GooSeeker采集规则图文教学图1
第二步:标注需要采集的信息
2.1,在网页上做标注
用户如果需要采集当前网页第一个商品的标题信息,就使用鼠标点击标题,然后双击在弹出的菜单栏窗口中输入内容编辑一个字段名称,对应到Excel中的字段,输入商品标题,创建输出Excel表格,填写表格名称。
集搜客GooSeeker采集规则图文教学
集搜客GooSeeker采集规则图文教学图2
2.2,标注更多内容
接下来用户需要重复上一个操作步骤来填写店铺名称评论数量以及标注的价格信息。
第三步:保存规则,采数据
3.1,测试采集是否符合预期
点击“测试”按钮,检查信息完整性。很有可能采集到的内容是空的,或者是包含了很多不需要的内容,或者错位了,采集到了相邻的内容。那么就需要重新调整映射关系,如果直观标注不精确,可以去下面的DOM窗口做内容映射。
集搜客GooSeeker采集规则图文教学
集搜客GooSeeker采集规则图文教学图3
3.2,点击“保存”
只有保存了规则,爬虫才能执行规则,采集数据。未来还可以修改规则。
集搜客GooSeeker采集规则图文教学
集搜客GooSeeker采集规则图文教学图4

相关下载

下载集搜客GooSeeker

集搜客GooSeeker

大小:30.21 MB

相关文章

相关软件

大家都在找