本文主要是介绍python网络爬虫2——BeautifulSoup库信息提取,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
一、安装
cmd :pip install beautifulsoup4
from bs4 import BeautifulSoup #BeautifulSoup是一个类
soup = BeautifulSoup('<p>data</p>', 'html.parser')
#'<p>data</p>'是需要解析的html格式的信息,'html.parser'是解析器soup2 = BeautifulSoup(open('D://demo.html','html.parser')
二、BeautifulSoup库的基本元素
1.对BeautifulSoup库的理解
- BeautifulSoup库也叫beautifulsoap4,或bs4。
- 是解析、遍历、维护“标签树”的功能库,将html文档中的“标签树”转化为BeautifulSoap类。(一个BeautifulSoup类,相当于HTML/XML文档的全部内容)
2.BeautifulSoup库的解析器
3.BeautifulSo
这篇关于python网络爬虫2——BeautifulSoup库信息提取的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!