正则表达式高级用法

  • Post author:
  • Post category:其他



目录


贪婪与非贪婪匹配


匹配不包含


匹配换行


匹配制表符


匹配中文


匹配中文标点符号


贪婪与非贪婪匹配

贪婪:<dependency>(\R?\t?.)*</dependency>

非贪婪:<dependency>(\R?\t?.)*

?

</dependency>,在*+等数量词后加?

匹配不包含


((?!(target|maven)).)* 表示不包含target和maven

例如:^E:\\01_myWork\\202109_premiumit\\citi-sf\\

((?!(target|maven)).)*

\\pom.xml$

匹配换行

\R


R大写

匹配制表符

\t

t为小写

匹配中文

[\u4e00-\u9fa5]+

对应notepad++查找正则表达式为:


[一-龥]+

\u 代表为Unicode编码。即在Unicode编码中4e00-9fa5为中文字符编码区

匹配中文标点符号

[\u2014\u2018\u2019\u3015\u3016\u3017\u201c\u201d\u2026\u3001\u3002\u3008\u3009\u300a\u300b\u300c\u300d\u300e\u300f\u3010\u3011\u3012\u3013\u3014\u3015\u3016\u3017\uff01\uff08\uff09\uff0c\uff1a\uff1b\uff1f\ufe43\ufe44\ufe4f\uff5e\uffe5]+

对应notepad++查找正则表达式为:


[—‘’〕〖〗“”…、。〈〉《》「」『』【】〒〓〔〕〖〗!(),:;?﹃﹄﹏~¥]+



编码



字符






编码



字符






编码



字符






编码



字符



\u2014






\u3001






\u3010






\uff01





\u2018






\u3002






\u3011






\uff08





\u2019






\u3008






\u3012






\uff09





\u3015






\u3009






\u3013






\uff0c





\u3016






\u300a






\u3014






\uff1a





\u3017






\u300b






\u3015






\uff1b





\u201c






\u300c






\u3016






\uff1f





\u201d






\u300d






\u3017






\ufe43





\u2026






\u300e











\ufe44










\u300f











\ufe4f




















\uff5e




















\uffe5





版权声明:本文为wangjz2008原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。