1、re模块
预加载正则表达式:
import re
import csv
obj=re.complie(r'#')
reader=obj.finditer(resp.text)
for it in reader:
ul=it.group('#')
f=open('#.csv',mode='w',encoding='utf-8')
csvwriter=csv.writer(f)
2、bs4
把页面源代码交给BeautifulSoup处理,生成源数据
从bs中查找数据
from bs4 import BeautifulSoup
page=BeautifulSoup(rexp.text,'html.parser')
table=page.find('标签','属性=值')
拿到所有数据行
trs=table.find_all('tr')[1:]
3、xpath
from lxml import etree
tree=etree.xml(xml)
result=tree.xpath('')
print(result)
版权声明:本文为jiuxianfei原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。