本帖最后由 伍六柒 于 2019-3-13 18:52 编辑
使用的版本是2.0,使用了wordpress插件发布,但发布后分类无法对应,有时是未分类,但经常是最后一个分类,并不是自己选择的分类。还有标签是没有设置的,但是发布后会多出来标签,随机 的。不知道什么情况??? 本帖最后由 伍六柒 于 2019-3-14 09:58 编辑
找到问题了,WP的程序默认是全部文章导入POST,但关联分类是另一个表,但那个表是采集的保留2条数据位置的方法,也就是如果只有一条分类信息则必须将分类ID+1,不然就会造成未分类(分类失败),所以解决方法有两个,一是WP发布插件中使用分类+1.二是手动填写分类ID自己+1 。
还有,发现分类是取出所有iterm,而不是实际的分类列表,也会造成很多问题,取出真正分类的代码如下:
话说,老大很久没出现了,不知道提的问题建议会不会有用,但还是继续提一条:
很多时候采集失败的原因是超时,现在蓝天采集也会记录下失败的地址,但只是记录,我的建议是是否加入一个筛选,选出那些失败的,然后可以只针对采集失败的再次采集。
嗯,你可以改插件代码实现你的需求
2.1版本 已采集数据中有个“一键清除失败的网址”功能,可以试试
收到 谢谢老大
使用的版本是2.0,使用了wordpress插件发布,但发布后分类无法对应,有时是未分类,但经常是最后一个分类,并不是自己选择的分类。还有标签是没有设置的,但是发布后会多出来标签,随机 的。不知道什么情况??? 本帖最后由 伍六柒 于 2019-3-14 09:58 编辑
找到问题了,WP的程序默认是全部文章导入POST,但关联分类是另一个表,但那个表是采集的保留2条数据位置的方法,也就是如果只有一条分类信息则必须将分类ID+1,不然就会造成未分类(分类失败),所以解决方法有两个,一是WP发布插件中使用分类+1.二是手动填写分类ID自己+1 。
还有,发现分类是取出所有iterm,而不是实际的分类列表,也会造成很多问题,取出真正分类的代码如下:
- $catsDb= $this->db()->table( '__TERMS__' )
- ->alias( 't' )
- ->join( '__TERM_TAXONOMY__ e', 'e.term_id = t.term_id' )
- ->where( [ 'e.taxonomy' => 'category' ] )
- ->select();
话说,老大很久没出现了,不知道提的问题建议会不会有用,但还是继续提一条:
很多时候采集失败的原因是超时,现在蓝天采集也会记录下失败的地址,但只是记录,我的建议是是否加入一个筛选,选出那些失败的,然后可以只针对采集失败的再次采集。
嗯,你可以改插件代码实现你的需求
2.1版本 已采集数据中有个“一键清除失败的网址”功能,可以试试
admin 发表于 2019-3-14 18:04
嗯,你可以改插件代码实现你的需求
2.1版本 已采集数据中有个“一键清除失败的网址”功能,可以试试 ...
收到 谢谢老大