广告位 |
蓝天采集器您现在的位置是:主页 > 蓝天采集器
蓝天采集器内容允许匹配多个元素循环入库教程
2020-04-27蓝天采集器 938人已围观
简介我们平时在采集一些论坛或者贴吧,问答平台等都会有多段内容,在写采集规则的时候我们就要换一种操作方法,利用我们的循环入库。我们就以http://bbs.skycaiji.com/forum.php?mod=viewthre···
我们平时在采集一些论坛或者贴吧,问答平台等都会有多段内容,在写采集规则的时候我们就要换一种操作方法,利用我们的循环入库。
我们就以http://bbs.skycaiji.com/forum.php?mod=viewthread&tid=849为例;
来获取获取它的主题内容和回复内容。
查看源代码,分析得到:
主题内容开始字符串为id="postmessage_2055"> 因为不同的帖子,ID不同,
所以我们把2055这个数字设置为(*)通配符.
即开头字符串为id="postmessage_(*)">
结尾字符串为</td></tr></table>
然后勾选下图中的循环匹配,即可实现主题和回复的内容采集。
出现效果图入下:(当然越可以选择拼接为文本)
到这里我们的蓝天采集器循环入库就完成了。拼接文本是入库到一个字段里面,根据自己的需要来设置。
上一篇:蓝天采集器如何设置略缩图教程
广告位 |
发表评论