相信许多的站长朋友们有时候会需要采集百度搜索出来的信息,直接采集是获取不到任何的链接信息的。下面就跟着蜀戎网络一起来学习一下,本教程只作为蓝天采集器分析测试。

首页在www.baidu.com搜索我们想要采集的信息,比如:蓝天采集器教程;

蓝天采集器教程搜索

我们采集域名和标题;用谷歌浏览器推荐,直接查看源代码

域名和标题

可以很清楚的看到我们所需要的信息就在这里;好了接下来直接在我们的蓝天采集器后台写规则。

添加任务-----采集设置(这里需要把Cookie 缓存数据填写上)入下图所示

Cookie 缓存数据

起始页网址(就是我们搜索出来结果页链接)

起始页链接

获取内容(添加字段)

style="text-decoration:none;">[内容1]</a><div class="c-tools" id="(*)" data-tools='{"title":"[内容2]",

获取内容字段

点击保存----查看下测试结果

测试结果

到这里就教程就全部结束

当然我们也可以在内容处理里面过滤/后面的内容只需要显示网址等,可以自行去操作,业务都比较简单。

相关文章