Python爬虫入门9:BeautifulSoup快速查找HTML内容

  • Post author:
  • Post category:python




☞ ░

前往老猿Python博客 https://blog.csdn.net/LaoYuanPython




一、引言

在上节介绍了BeautifulSoup对象的主要属性,通过这些属性可以访问标签、内容,但这种方法要么就只能访问符合条件的第一个对象,要么需要遍历访问对象,某些情况下不能通过指定特征快速定位标签和内容。本节将介绍使用BeautifulSoup提供的相关方法快速定位标签和内容的方法。本节继续复用上节中的HTML文件和对象定义代码。

本节案例中介绍处理的c:\temp\s1.html文件内容如下:

<!DOCTYPE html>
<html lang="zh-CN">
<head>
<style type="text/css">	.textline{color:blue;}</style>
<link href="https://blog.csdn.net/LaoYuanPython/article/details/95360624" rel="canonical"/>
<title>BeautifulSoups使用方法 - 老猿Python - CSDN博客 </title></head>
<body> 	
  <h1>老猿Python</h1>
	<div><p class="te



版权声明:本文为LaoYuanPython原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。