Python 正则表达式:split

  • Post author:
  • Post category:python


作用:用正则表达式的字符分割字符串,正则的字符会被抛弃。

本文以 提取URL的地址与参数 为例,介绍re模块的split的用法: 返回值 -> 列表

复杂匹配 = re.compile(正则表达式): 将正则表达式实例化

+

re.split(要匹配的字符串): 从字符串开头 开始匹配,寻找完整个字符串后,将结果以 列表 返回

简单匹配 =  re.split(正则表达式, 要匹配的原字符串): 从字符串开头 开始匹配,寻找完整个字符串后,将结果以 列表 返回

懒癌,配上模块函数解释好消化

re.split(pattern, string, maxsplit=0, flags=0),如果匹配成功,则返回一个列表,否则返回原string列表;
第一个参数:正则表达式
第二个参数:要匹配查找的原始字符串;
第三个参数:可选参数,表示最大的拆分次数,默认为0,表示全部分割;
第四个参数:可选参数,标志位,用于控制正则表达式的匹配方式,如:是否区分大小写,多行匹配等等;
需要特别注意的是,这个方法并不是完全匹配。它仅仅决定在字符串开始的位置是否匹配。所以当pattern结束时若还有剩余字符,仍然视为成功。想要完全匹配,可以在表达式末尾加上边界匹配符'$'
例如: re.split(‘z’, ‘p.python.p’)返回值为['p.python.p'];  #失败返回原string列表
       re.split(‘p’, ‘p.python.p’)返回值为['', '.', 'ython.', '']   #成功返回新列表

方法一:

对象名1 = re.split(正则表达式,  要匹配的原字符串)

#!/usr/bin/python
# -*- coding: utf-8 -*-

import os,re;

pattern = r'[?|&]'
string = "https://www.baidu.com/baidu?&ie=utf-8&word=51cto"
result = re.split(pattern, string)
print('Match:',result)

运行结果:

Match: ['https://www.baidu.com/baidu', '', 'ie=utf-8', 'word=51cto']





转载于:https://blog.51cto.com/13502993/2317601


关闭菜单