我们在采集数据的时候经常会遇到,页面上没有我们想要的内容都隐藏起来了。也可以说是ajx传输在页面上的,这个时候我们采集的规则就要变动一下。
http://shili.skycaiji.com/info/json/house
{"list":[{"title":"-开头------结尾-"}]}
起始页:
起始页的链接直接输入我们需要采集的页面就可以了,如果有分页的话直接使用多页进行匹配。
内容页这里规则就有点区别了,我们需要用到json的字符串。
list.*.url
点击测试一下
链接全部获取到了,是不是很简单呢;相对于正则或者xpath来说更加的便捷,直接用字符串就全部匹配了,接下来我们开始写获取内容字段。
标题:data.title 地址:data.address 均价:data.price 户型:data.huxing 标签:data.tags
规则其实和刚才我们上一步内容链接是一样的直接用字符串获取;写好以后点击保存;点击测试效果如下。
好了,以上教程由蜀戎网独家制作完成,禁止转载复制!如还有不明白的欢迎下方留言。