解析数据的三大工具:re、bs4和xpath

  • Post author:
  • Post category:其他


1、re模块

预加载正则表达式:

import re
import csv
obj=re.complie(r'#')
reader=obj.finditer(resp.text)
for it in reader:
  ul=it.group('#')
f=open('#.csv',mode='w',encoding='utf-8')
csvwriter=csv.writer(f)

2、bs4

把页面源代码交给BeautifulSoup处理,生成源数据

从bs中查找数据

from bs4 import BeautifulSoup
page=BeautifulSoup(rexp.text,'html.parser')
table=page.find('标签','属性=值')

拿到所有数据行

trs=table.find_all('tr')[1:]

3、xpath

from lxml import etree
tree=etree.xml(xml)
result=tree.xpath('')
print(result)



版权声明:本文为jiuxianfei原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。