解析数据的三大工具：re、bs4和xpath

1、re模块

预加载正则表达式：

import re
import csv
obj=re.complie(r'#')
reader=obj.finditer(resp.text)
for it in reader:
  ul=it.group('#')
f=open('#.csv',mode='w',encoding='utf-8')
csvwriter=csv.writer(f)

2、bs4

把页面源代码交给BeautifulSoup处理，生成源数据

从bs中查找数据

from bs4 import BeautifulSoup
page=BeautifulSoup(rexp.text,'html.parser')
table=page.find('标签','属性=值')

拿到所有数据行

trs=table.find_all('tr')[1:]

3、xpath

from lxml import etree
tree=etree.xml(xml)
result=tree.xpath('')
print(result)

原文链接：https://blog.csdn.net/jiuxianfei/article/details/116425795

你可能也喜欢