Python学习 Day45 数据解析-pyquery 09

本文主要是介绍Python学习 Day45 数据解析-pyquery 09，希望对大家解决编程问题提供一定的参考价值，需要的开发者们随着小编来一起学习吧！

pyquery解析数据

一、pyquery概述

pyquery库是jQuery的Python实现，能够以jQuery的语法来操作解析HTML文档，易用性和解析速度都很好
前提条件：了解CSS选择器以及jQuery
非Python标准模块，需要安装
安装方式：pip install pyquery -i http://pypi.douban.com/simple --trusted-host pypi.douban.com
测试方式：import pyquery

二、pyquery的初始化方式

（一）字符串方式

语法

from pyquery import PyQuery as pq
doc = pq(str)
print(doc)
print(type(doc))

具体代码

from pyquery import PyQuery as pq
print('--------------第一种方式：字符串-----------------')
html = '''<html><head><title>PyQuery</title></head><body><h1>水面清圆</h1></body></html>
'''
#创建pyquery对象，实际上就是在进行一个类型转换，将str类型转换为PyQuery类型，才能使用pq对应的方法
doc = pq(html)  #输出HTML中的内容
print(type(html)) #字符串类型 <class 'str'>
print(type(doc)) #<class 'pyquery.pyquery.PyQuery'>
print(doc('title'))

--------------第一种方式：字符串-----------------
<class 'str'>
<class 'pyquery.pyquery.PyQuery'>
<title>PyQuery</title>Process finished with exit code 0

（二）URL方式

语法

from pyquery import PyQuery as pq
doc = pq(url='http://www.baidu.com',encoding='utf-8')
print(type(doc))
print(doc('title')

具体代码

from pyquery import PyQuery as pq
print('---------------第二种方式：URL------------------------')
#创建一个pq对象
doc = pq(url = 'http://www.baidu.com',encoding = 'utf-8') #编码解决乱码问题
print(doc)
print('\n标签名称：',doc('title')) #括号中写上待查询的标签名

---------------第二种方式：URL------------------------
<html> <head><meta http-equiv="content-type" content="text/html;charset=utf-8"/><meta http-equiv="X-UA-Compatible" content="IE=Edge"/><meta content="always" name=