正则表达式及python中re库的使用

  • Post author:
  • Post category:python


正则表达式是一个特殊的字符序列
它能够帮助用户便捷的检查一个字符串是否符合某种规则模式
元字符
-具有特殊意义的专用字符
-用来描述字符串的边界的元字符
-开始'^'  结尾'$'

常用的元字符
.        匹配任意字符(除\n)
\w小写    匹配  字母、数字下划线
\W大写    匹配非字母、数字下划线
\s小写    匹配任意  空白字符
\S大写    匹配任意非空白字符
\b       匹配位于开头或结尾的空字符串
\d       匹配任意十进制数

限定符
-限定符用于限定匹配的次数
?        匹配前面的字符0次或1次         colou?r     可以匹配color或colour
+        匹配前面的字符1次或多次        colou+r     可以匹配colour或colouu...r
*        匹配前面的字符0次或多次        colou*r     可以匹配color或colouu...r
{n}       匹配前面的字符n次             colou{2}r   可以匹配colouur
{n,}      匹配前面的字符最少n次          colou{2}r   可以匹配colouur或colouu...r
{n,m}     匹配前面的字符最少n次,最多m次  colou{2,4}r  可以匹配colouur或colouuur或colouuuur

其它字符
区间字符 []        匹配[]中指定的字符      [0-9]   匹配0、1、2、3、4、5、6、7、8、9           [.?!]  匹配标点符号点,问号,感叹号
排除字符 ^         匹配不在[]中指定的字符   [^0-9]   匹配除0、1、2、3、4、5、6、7、8、9的字符
选择字符 |         用于匹配|左右的任意字符   \d{18}|\d{15}  匹配15位或18位身份证
转义字符           同python中的转义字符     \.  将  .  作为普通字符使用

[\u4e00-\u9fa5]   匹配任意一个汉字

分组  ( )          
改变限定符的使用        six|fourth  匹配six或fourth   (six|four)th   匹配sixth或fourth



版权声明:本文为yane45a原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。