本文主要是介绍Python学习 Day45 数据解析-pyquery 09,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
pyquery解析数据
一、pyquery概述
- pyquery库是jQuery的Python实现,能够以jQuery的语法来操作解析HTML文档,易用性和解析速度都很好
- 前提条件:了解CSS选择器以及jQuery
- 非Python标准模块,需要安装
安装方式:pip install pyquery -i http://pypi.douban.com/simple --trusted-host pypi.douban.com
测试方式:import pyquery
二、pyquery的初始化方式
(一)字符串方式
语法
from pyquery import PyQuery as pq
doc = pq(str)
print(doc)
print(type(doc))
具体代码
from pyquery import PyQuery as pq
print('--------------第一种方式:字符串-----------------')
html = '''<html><head><title>PyQuery</title></head><body><h1>水面清圆</h1></body></html>
'''
#创建pyquery对象,实际上就是在进行一个类型转换,将str类型转换为PyQuery类型,才能使用pq对应的方法
doc = pq(html) #输出HTML中的内容
print(type(html)) #字符串类型 <class 'str'>
print(type(doc)) #<class 'pyquery.pyquery.PyQuery'>
print(doc('title'))
--------------第一种方式:字符串-----------------
<class 'str'>
<class 'pyquery.pyquery.PyQuery'>
<title>PyQuery</title>Process finished with exit code 0
(二)URL方式
语法
from pyquery import PyQuery as pq
doc = pq(url='http://www.baidu.com',encoding='utf-8')
print(type(doc))
print(doc('title')
具体代码
from pyquery import PyQuery as pq
print('---------------第二种方式:URL------------------------')
#创建一个pq对象
doc = pq(url = 'http://www.baidu.com',encoding = 'utf-8') #编码解决乱码问题
print(doc)
print('\n标签名称:',doc('title')) #括号中写上待查询的标签名
---------------第二种方式:URL------------------------
<html> <head><meta http-equiv="content-type" content="text/html;charset=utf-8"/><meta http-equiv="X-UA-Compatible" content="IE=Edge"/><meta content="always" name=
这篇关于Python学习 Day45 数据解析-pyquery 09的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!