本文主要是介绍获取维基百科主页所有词条及链接,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
wiki.py
from urllib.request import urlopen
from bs4 import BeautifulSoup
import re
# 获取维基百科主页所有词条及链接#请求url并把结果用utf-8编码
resp = urlopen("https://en.wikipedia.org/wiki/Main_Page").read().decode("utf-8")
#使用beautifulsoup去解析
soup=BeautifulSoup(resp,'html.parser')
#获取所有以/wiki/开头的a标签的Href属性
listUrls = soup.findAll("a",href=re.compile("^/wiki/"))
#输出所有的词条对应的名称和url
这篇关于获取维基百科主页所有词条及链接的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!