相信许多的站长朋友们有时候会需要采集百度搜索出来的信息,直接采集是获取不到任何的链接信息的。下面就跟着蜀戎网络一起来学习一下,本教程只作为蓝天采集器分析测试。
首页在www.baidu.com搜索我们想要采集的信息,比如:蓝天采集器教程;
我们采集域名和标题;用谷歌浏览器推荐,直接查看源代码
可以很清楚的看到我们所需要的信息就在这里;好了接下来直接在我们的蓝天采集器后台写规则。
添加任务-----采集设置(这里需要把Cookie 缓存数据填写上)入下图所示
起始页网址(就是我们搜索出来结果页链接)
获取内容(添加字段)
style="text-decoration:none;">[内容1]</a><div class="c-tools" id="(*)" data-tools='{"title":"[内容2]",
点击保存----查看下测试结果
到这里就教程就全部结束。
当然我们也可以在内容处理里面过滤/后面的内容只需要显示网址等,可以自行去操作,业务都比较简单。