蓝天采集器是一款功能性非常强大的采集器,直接部署在云端的比较便捷。我们在平常的采集中会发现一些网站的数据都进行了封装加密,前台看到的内容,我们在审查元素查看代码的时候确发现没有内容。这种情况就是源网站增加了防采集,这个时候呢我们就需要开启我们的蓝天采集器渲染模式。
Windows系统安装chrome:
第一步:Windows系统都比较简单,直接在php里面开启proc_open就可以了,如果您使用的是宝塔的控制面板可以看下这里是如何开启的。
第二步:我们在谷歌官网下载谷歌最新版浏览,下载好直接安装就可以了。安装完成以后我们的默认路径是:
C:Program Files (x86)GoogleChromeApplicationchrome.exe(如下图所示)
路径都是默认的;所以只需要填写进去,然后点击保存就可以了,有一点需要注意就是当我们开启渲染模式以后,有可能会导致原来的采集规则失败,所以我们需要重新添加下采集规则。还有一点就是我们的渲染功能开启了以后如何判断生效还是没有生效看顶部的绿色横条就知道了,如果不成功会是黄色如下图,成功了是绿色,会直接提示的。
以上介绍的最简单一种操作方法,如果您的系统是linux系统安装方式就不一样了,因为不像windows系统那样直观操作,我们是通过快捷命令来执行的。