广告位

热点资讯您现在的位置是:主页 > 热点资讯

蓝天采集器又有新的问题!版主来哈。关于采集的

2018-04-23热点资讯 201人已围观

简介突然发现网易新闻采集页面编码是UTF-8而内容页面却是gb2312这个怎么解决啊。前面开启自动检测编码,页面无法检测出来,内容貌似也是一样,设置成UTF-8后 页面出连接了,而内容却乱码了 这个怎么解决啊。我吧采集规则传···

突然发现网易新闻采集页面编码是UTF-8而内容页面却是gb2312这个怎么解决啊。前面开启自动检测编码,页面无法检测出来,内容貌似也是一样,设置成UTF-8后 页面出连接了,而内容却乱码了 这个怎么解决啊。我吧采集规则传到云平台了,希望大家有解决方法后再传上去!谢谢你们
内容页用Xpath可以抓取到!!!
问一下站长下一个版本多久更新,真心迫不及待!
测试了下,网站编码选择自动检测可以抓取到数据啊
admin 发表于 2018-4-23 19:34
测试了下,网站编码选择自动检测可以抓取到数据啊

自动编码我的抓不起来0.0看图,最后一个是utf-8我也不清楚那里问题。要不我把程序传到云平台你看看 下个版本自动检测编码已强化,基本能检测出所有编码

Tags: 自动检测  页面  内容 

广告位
发表评论
评论列表
      广告位
      广告位

    相关知识点

    站点信息

    • 文章统计506篇文章
    • 标签管理相关知识点
    • 微信公众号:扫描二维码,关注我们