在采集规则里面我们详细讲解了如何来写标签提取内容,比如固定标签内容我们如何来写呢直接看下面图示例。

固定数值设定

只需要选择固定字符就可以了。当然还有一个就是获取当前页网址---正则提取---当前页网址:^(?<content>[sS]*?)$

获取当前页网址

好了,接下来我们就配置入库了。内容发布规则--选择导入wpm模块,选择网站编码utf-8---配置好入库网址---保存。

入库网址配置

配置好这里了,我们就可以直接从开头起始页测试采集列表网址,获取到阅读页网址,然后点击测试,入库就可以看到效果了。

入门成功

发布成功显示了这个状态码就恭喜你,规则没有任何的问题,我们直接可以在网站后台看到了。是不是很简单呢,1分钟学会。好了以上就是完整的一套采集入库的详细操作教程。演示规则已经放在模板群了,需要的可以进群下载。


相关文章