新手完全按照手册来的,自己尝试用后台的中国农业网新闻做测试,把原来的规则匹配改为chrome提取的xpath却一直抓不到数据,反倒是用chrome或xpathhelper插件匹配都是可以的,是规则写的不对么?
比如抓标题"https://www.zgny.com/news/nongyeyaowen/201805/60978.html",写xpath规则为"/html/body/div[@class='qhbg']/div[@class='m'][2]/div[@class='hnw_xwzx_left']/div[@class='chy_contents_c1']/h1" 在chrome中调试就有数据,在系统测试就抓不到标题 测试了下可以抓取到xpath
你的运行环境发下
操作系统 Linux 3.10.0-514.26.2.el7.x86_64
运行环境 Apache
数据库 mysql 5.5.57-log
PHP版本 5.6.34
上传限制 50M
我试了下属性选无可以采集到 之前用的chrome测通的innerText就抓不到,必须选无么 innerText是你自定义的属性吧?属性选“无”或者“text”效果一样
比如抓标题"https://www.zgny.com/news/nongyeyaowen/201805/60978.html",写xpath规则为"/html/body/div[@class='qhbg']/div[@class='m'][2]/div[@class='hnw_xwzx_left']/div[@class='chy_contents_c1']/h1" 在chrome中调试就有数据,在系统测试就抓不到标题 测试了下可以抓取到xpath
你的运行环境发下
admin 发表于 2018-5-12 21:54
测试了下可以抓取到xpath
操作系统 Linux 3.10.0-514.26.2.el7.x86_64
运行环境 Apache
数据库 mysql 5.5.57-log
PHP版本 5.6.34
上传限制 50M
我试了下属性选无可以采集到 之前用的chrome测通的innerText就抓不到,必须选无么 innerText是你自定义的属性吧?属性选“无”或者“text”效果一样