采集器设置:规则名称就是你要采集内容对应的名称,比如你要采集新闻这里就可以写新闻,你自己去规划,都填写完成记得保存。
起始页网址:这里呢我们可以设置栏目页也可以设置列表页。
内容页网址获取-选择正则(这种比较方便简单)操作完成记得保存,测试一下。
点击保存就好了,每一步都可以测试一下。
这里的规则其实还有可以使用xpath;
xpath的采集规则呢相对正则来说是更加的快捷,//*@class="news_info"/a1/@href;
*是匹配所有的意思;
@是标签;
class="news_info这个是我们网页唯一的代码标识;
/代表是一层路径,//代表的是两层路径;
a1这里这个1是指的只显示1条,因为很多时候页面上一个名称有好几个链接我们就需要在这里设置只显示一条就好了。
获取内容:
最简单方式就是直接打开这个页面用快捷键;
蓝天采集器标题设置
蓝天采集器标题设置;内容里面我们可以选择数据处理过滤一些标签、空格等:
略缩图设置;由于我们的发布插件里面没有设置,需要我们手动去设置一下:文件路径在:蓝天采集器安装目录plugin eleasecmsPbootDemoSkycaiji.php
这里是对应了我们的数据库信息;我们也可以多添加一些,只需要和我们的数据库对应起来就好了。
以上这个插件修改只是增加略缩图,要是不需要的话不用作任何的修改;点击保存就可以了。
接下来就是点击发布设置:先在第三方云平台下载pbootcms文章插件(没皮的小芒果开发);
发布方式选择本地CMS就可以了,数据库这些发布方式适合单独存放用不建议新手选择使用。
本地数据绑定这里的路径一定要注意:D:phpstudyPHPTutorialWWW@pboot 结尾带上pboot,还有就是路径不要绑定在采集器里面。然后选择我们的CMS插件就可以了,这里就直接选择我们刚才设定内容数据 点击保存,接下来直接保存就好了。
设置完成点击回到我们的任务列表,点击采集就可以了。
以上如还有不明白的地方都可以直接进群咨询交流:548327025。
如看了以上的还不明白可以直接看下我们的视频教程: