根据业务需要,需要抓取页面详情,很多时候,详情页来自于不同的类型分类,因此页面元素是不一样的
使用following-sibling
included_content = selector.xpath('/html/body/div[6]/div[3]/following-sibling::*') #正文
tempcontent=""
#循环拼接
for i in included_content:
# print(i.extract())
tempcontent+=i.extract()
版权声明:本文为haoyuexihuai原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。