本文主要是介绍lxml库和Xpath语法,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
lxml库
lxml库的安装
pip install lxml //这个库似乎目前还不支持python3.7 只能用低版本的python 否则会报错
xpath
节点间的关系
- 父节点
- 子节点
- 平行节点
选取节点的方法
/ 从根节点选取
// 从根节点开始匹配,而不考虑它们的位置。
/text() 选取文本
@ 选取属性
一个xpath的例子:
from lxml import etree
htm = """
<div><ul><li class="item-0"><a href="link1.html">first item</a></li><li class="item-1"><a href="link2.html">second item</a></li><li class="item-inactive"><a href="link3.html">third item</a></li><li class="item-1"><a href="link4.html">fourth item</a></li><li class="item-0"><a href="link5.html">fifth item</a></li><li class="else-0">first item</li></ul>
</div>
"""
selector = etree.HTML(htm
这篇关于lxml库和Xpath语法的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!