极速手机网

火车采集器分页采集设置教程

对于设置列表分页,下图的起始网址--批量网址设置是最常见也是最常用的。

图:列表上下页分页

现在我们用另外一种获取分页的办法,即通过列表上下页无限分页采集获取功能来自动获取分页。

使用这个功能,起始页就只需要把首页地址添加进去就可以了,如下图:

图:列表上下页分页

然后进入[高级模式]-分页设置,设置区域开始字符串、区域结束字符串、地址样式、分页地址等字段。

图:列表上下页分页

我们以http://news.qq.com/newsgn/zhxw/shizhengxinwen.htm为例,我们看下第一页分页源代码的情况如下:

图:列表上下页分页

我们看下第二页分页源代码的情况如下:

图:列表上下页分页

分析得出:当前页都是在<div class="pageNav">后的<strong></strong>这个代码后面紧接着一个<a href="">就是下一页地址。 也就是说我们是要通过当前页获取下一页,这样一级一级的向下获取,直至把所有分页获取到。 所以,区域开始字符串为:<div class="pageNav">(*)</strong>区域结束字符串为:</a>(*)</div>

图:列表上下页分页

地址样式根据截取区域的格式来写:<a href="[参数]">

效果如下:

图:列表上下页分页

另外上图 “4” 即采集4页的意思,默认“0”为不限,采集所有分页。

相关下载

下载火车采集器

火车采集器

大小:23.23 MB

相关文章

相关软件

大家都在找