python爬虫的正则表达式(re模块)

  • Post author:
  • Post category:python




正则表达式



1. findall(返回的是列表)

findall:  匹配字符串中所有的符合正则的内容
lst = re.findall(r"\d+", "我的电话号是:10086 我女朋友的电话是:10010")
print(lst)



2. finditer(返回的是迭代器)

finditer: 匹配字符串中所有的内容[返回的是迭代器], 从迭代器中拿到内容需要.group()
it = re.finditer(r"\d+", "我的电话号是:10086, 我女朋友的电话是:10010")
for i in it:
   print(i.group())



3. search

search, 找到一个结果就返回, 返回的结果是match对象. 拿数据需要.group()
s = re.search(r"\d+", "我的电话号是:10086, 我女朋友的电话是:10010")
print(s.group())



4. 预加载正则表达式

obj = re.compile(r"\d+")
ret = obj.finditer("我的电话号是:10086, 我女朋友的电话是:10010")
for it in ret:
   print(it.group())
   
ret = obj.findall("呵呵哒, 我就不信你不换我1000000000")
print(ret)



版权声明:本文为weixin_51415327原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。