为了账号安全,请及时绑定邮箱和手机立即绑定

正则表达式负前瞻

正则表达式负前瞻

尚方宝剑之说 2019-11-30 10:25:04
在我的主目录中,我有一个包含Drupal平台的文件夹drupal-6.14。在此目录中,我使用以下命令:find drupal-6.14 -type f -iname '*' | grep -P 'drupal-6.14/(?!sites(?!/all|/default)).*' | xargs tar -czf drupal-6.14.tar.gz该命令的作用是gzip压缩drupal-6.14文件夹,不包括drupal-6.14 / sites /的 所有子文件夹,但site / all和sites / default除外。我的问题是关于正则表达式的:grep -P 'drupal-6.14/(?!sites(?!/all|/default)).*'该表达式可以排除我要排除的所有文件夹,但是我不太明白为什么。使用正则表达式匹配所有字符串,但不包含子模式x的字符串除外。或者换句话说,否定子模式。我(认为)我知道解决这些问题的一般策略是使用否定先行,但我从未完全满意地理解过分积极和消极的行事方式。这些年来,我已经阅读了许多网站。PHP和Python regex手册以及其他页面,例如http://www.regular-expressions.info/lookaround.html等,但是我对它们从未真正有过深刻的了解。有人可以解释这是如何工作的,也许可以提供一些类似的例子来做类似的事情?-更新一:关于Andomar的回应:双重否定前瞻能否更简洁地表达为单个肯定前瞻性陈述:即是:'drupal-6.14/(?!sites(?!/all|/default)).*'相当于:'drupal-6.14/(?=sites(?:/all|/default)).*'???-更新二:根据@andomar和@alan moore-您不能将双负前瞻换为正前瞻。
查看完整描述

3 回答

?
回首忆惘然

TA贡献1847条经验 获得超11个赞

否定的前瞻表示,在此位置,以下正则表达式无法匹配。


让我们举一个简化的例子:


a(?!b(?!c))


a      Match: (?!b) succeeds

ac     Match: (?!b) succeeds

ab     No match: (?!b(?!c)) fails

abe    No match: (?!b(?!c)) fails

abc    Match: (?!b(?!c)) succeeds

最后一个例子是双重否定:它允许b后面跟一个c。嵌套的负前瞻变为正前瞻:c应该存在。


在每个示例中,仅a匹配。前瞻仅是一个条件,不会添加到匹配的文本中。


查看完整回答
反对 回复 2019-11-30
?
海绵宝宝撒

TA贡献1809条经验 获得超8个赞

环顾四周可以嵌套。


所以这个正则表达式匹配“Drupal的6.14 /”是不是后面是“地王” 不跟着“/ all”或“/默认”。


令人困惑?使用不同的词,我们可以说它与“ drupal-6.14 /”匹配,然后不跟“ sites”,除非再跟“ / all”或“ / default”


查看完整回答
反对 回复 2019-11-30
?
慕虎7371278

TA贡献1802条经验 获得超4个赞

如果您这样修改正则表达式:


drupal-6.14/(?=sites(?!/all|/default)).*

             ^^

...然后,它将匹配所有包含的内容drupal-6.14/,sites然后是或以外的其他 所有内容。例如:/all/default


drupal-6.14/sites/foo

drupal-6.14/sites/bar

drupal-6.14/sitesfoo42

drupal-6.14/sitesall

更改?=为?!匹配您的原始正则表达式将简单地抵消那些匹配:


drupal-6.14/(?!sites(?!/all|/default)).*

             ^^

所以,这只是意味着drupal-6.14/现在不能被跟随sites,随后以外的任何 /all或/default。因此,现在,这些输入将满足正则表达式:


drupal-6.14/sites/all

drupal-6.14/sites/default

drupal-6.14/sites/all42

但是,从其他一些答案(可能还有您的问题)中可能看不出来的是,您的正则表达式也将允许其他输入,drupal-6.14/后面紧跟其他内容sites。例如:


drupal-6.14/foo

drupal-6.14/xsites

结论:因此,您的正则表达式基本上说要包括其名称以或以外的其他子目录开头的所有子目录。drupal-6.14 sitesalldefault


查看完整回答
反对 回复 2019-11-30
  • 3 回答
  • 0 关注
  • 496 浏览

添加回答

举报

0/150
提交
取消
意见反馈 帮助中心 APP下载
官方微信