我们在采集数据的时候经常会遇到,页面上没有我们想要的内容都隐藏起来了。也可以说是ajx传输在页面上的,这个时候我们采集的规则就要变动一下。

http://shili.skycaiji.com/info/json/house

{"list":[{"title":"-开头------结尾-"}]}

json数组

起始页:

起始页链接

起始页的链接直接输入我们需要采集的页面就可以了,如果有分页的话直接使用多页进行匹配。

内容页这里规则就有点区别了,我们需要用到json的字符串。

list.*.url

内容链接规则

点击测试一下

链接展示

链接全部获取到了,是不是很简单呢;相对于正则或者xpath来说更加的便捷,直接用字符串就全部匹配了,接下来我们开始写获取内容字段。

标题字段演示

标题:data.title
地址:data.address
均价:data.price
户型:data.huxing
标签:data.tags

规则其实和刚才我们上一步内容链接是一样的直接用字符串获取;写好以后点击保存;点击测试效果如下。

获取内容结果页

好了,以上教程由蜀戎网独家制作完成,禁止转载复制!如还有不明白的欢迎下方留言。

相关文章