我们在采集内容的时候,比如有些网站img图片内容非常多或者是对方站点添加了密密麻麻的水印,这个时候我们就需要过滤掉,该如何来设置屏蔽掉呢,请看下面的教程。
登录蓝天采集器后台:任务----任务列表----选择对应任务
点击---获取内容字段----选择需要过滤的字段名---选择数据处理
选择:html标签过滤 (如下图设置)
选择需要过滤的img的参数内容,点击保存,这样我们采集回来的内容就会自动吧img的内容过滤掉,比如我们还可以手动添加,png.jpeg等。以上就是全部的操作教程,入还有不明白的地方欢迎下方留言。