广告位

热点资讯您现在的位置是:主页 > 热点资讯

蓝天采集器站长采集规则不能直接写正则表达式吗

2018-05-17热点资讯 229人已围观

简介 我这样去匹配 标题 在正则调试工具中是能匹配出来的 采集器环境中就不行了 只能<h1>[内容]</h1>这样匹配吗 规则中必须要有[内容]或者捕获组,不然拼接成最终内容就是空值 admin ···

蓝天采集器站长采集规则不能直接写正则表达式吗 我这样去匹配 标题 在正则调试工具中是能匹配出来的 采集器环境中就不行了 只能<h1>[内容]</h1>这样匹配吗
规则中必须要有[内容]或者捕获组,不然拼接成最终内容就是空值
admin 发表于 2018-5-17 21:27
规则中必须要有[内容]或者捕获组,不然拼接成最终内容就是空值

能直接支持正则就好了
admin 发表于 2018-5-17 21:27
规则中必须要有[内容]或者捕获组,不然拼接成最终内容就是空值

请问运用 [内容]和捕获组这两个有什么区别么
juemeialg 发表于 2018-5-17 22:45
能直接支持正则就好了

支持正则的,只是说返回的匹配数据需要用个[内容]标签来装,可以过滤不要的html代码达到精准匹配,你肯定不想把<h1>也输出到标题里吧? 而捕获组也是正表达式的语法,百度下就知道了
wangchenyuF2 发表于 2018-5-18 01:21
请问运用 [内容]和捕获组这两个有什么区别么

[内容]是泛匹配,捕获组可以写正则精准匹配

Tags: 内容  正则  发表于 

广告位
发表评论
评论列表
      广告位
      广告位

    相关知识点

    站点信息

    • 文章统计506篇文章
    • 标签管理相关知识点
    • 微信公众号:扫描二维码,关注我们