突然发现网易新闻采集页面编码是UTF-8而内容页面却是gb2312这个怎么解决啊。前面开启自动检测编码,页面无法检测出来,内容貌似也是一样,设置成UTF-8后 页面出连接了,而内容却乱码了 这个怎么解决啊。我吧采集规则传到云平台了,希望大家有解决方法后再传上去!谢谢你们
内容页用Xpath可以抓取到!!!
问一下站长下一个版本多久更新,真心迫不及待!
测试了下,网站编码选择自动检测可以抓取到数据啊
自动编码我的抓不起来0.0看图,最后一个是utf-8我也不清楚那里问题。要不我把程序传到云平台你看看 下个版本自动检测编码已强化,基本能检测出所有编码
内容页用Xpath可以抓取到!!!
问一下站长下一个版本多久更新,真心迫不及待!
测试了下,网站编码选择自动检测可以抓取到数据啊
admin 发表于 2018-4-23 19:34
测试了下,网站编码选择自动检测可以抓取到数据啊
自动编码我的抓不起来0.0看图,最后一个是utf-8我也不清楚那里问题。要不我把程序传到云平台你看看 下个版本自动检测编码已强化,基本能检测出所有编码