广告位 |
蓝天采集器您现在的位置是:主页 > 蓝天采集器
蓝天采集器如何采集disucz站的回帖评论信息
2020-06-25蓝天采集器 615人已围观
简介disucz网站使用人数也是非常的多,作为一款论坛系统发帖回帖都很便捷。disucz网站的内容采集都比较简答,但是如果想把回帖评论信息也一并采集了这个时候问题来了,该如何来操作呢,今天蜀戎网给大家分析学习一下。https···
disucz网站使用人数也是非常的多,作为一款论坛系统发帖回帖都很便捷。disucz网站的内容采集都比较简答,但是如果想把回帖评论信息也一并采集了这个时候问题来了,该如何来操作呢,今天蜀戎网给大家分析学习一下。
https:// www . hostloc.com /thread-707617-1-1.html
我们以此站为例,采集回帖评论;
查看源代码:
我们查找循环的标签发现:
id="postmessage 标签多次出现循环,分析得知这就是我们需要采集的标签。
id="postmessage_8668384">后面的数字,每一条回复内容都会不同,所以我们用通配符来代替。规则直接写
id="postmessage_(*)">[内容1]</td></tr></table>
最后点击测试最终展示效果
因为回帖评论信息是多个,所以我们要勾选上循环匹配,当然了我们还可以吧我们采集回来的数据进行拼接为文本格式插入到我们的内容中去,然后利用的字段组合即可。以上就是disucz站的回帖评论信息采集规则教程,回帖评论信息所有的网站规则都是通用的,原理也是一样,所有学会这里几乎都OK的!还有不明白的底部下方留言解答。
广告位 |
发表评论
相关文章
随机图文
-
163K网站系统登录滑动验证-阿里人机验证配置教程
S版系统的登录验证采用了阿里人机验证api,开启后能极大增强系统安全性···... -
pbootcms在打开首页的时候No input file specified.解决办法
当上面吧网站清空根目录以后呢,上传新的数据,接着访问我们的网站。在一些···... -
Xpath不固定元素列表规则写法
我们在写蓝天采集器规则的时候有时候回遇到网页中有不固定元素列表,我们该···... -
PbootCMS附件上传失败报错UNKNOW: Code: 8192; Desc: stripos():
PbootCMS附件上传时报错:上传失败:UNKNOW: Code: ···...