蓝天采集器站长采集规则不能直接写正则表达式吗 我这样去匹配 标题 在正则调试工具中是能匹配出来的 采集器环境中就不行了 只能<h1>[内容]</h1>这样匹配吗
规则中必须要有[内容]或者捕获组,不然拼接成最终内容就是空值
admin 发表于 2018-5-17 21:27
规则中必须要有[内容]或者捕获组,不然拼接成最终内容就是空值

能直接支持正则就好了
admin 发表于 2018-5-17 21:27
规则中必须要有[内容]或者捕获组,不然拼接成最终内容就是空值

请问运用 [内容]和捕获组这两个有什么区别么
juemeialg 发表于 2018-5-17 22:45
能直接支持正则就好了

支持正则的,只是说返回的匹配数据需要用个[内容]标签来装,可以过滤不要的html代码达到精准匹配,你肯定不想把<h1>也输出到标题里吧? 而捕获组也是正表达式的语法,百度下就知道了
wangchenyuF2 发表于 2018-5-18 01:21
请问运用 [内容]和捕获组这两个有什么区别么

[内容]是泛匹配,捕获组可以写正则精准匹配
相关文章