python爬虫世界最好大学_Python编程语言：使用网络爬虫获取大学排名

本文主要是介绍python爬虫世界最好大学_Python编程语言：使用网络爬虫获取大学排名，希望对大家解决编程问题提供一定的参考价值，需要的开发者们随着小编来一起学习吧！

上一篇文章，和大家分享的是如何获取信息标记的知识，这篇文章，小编要和大家分享的是使用Python网络爬虫技术来获取大学排名！

当我们想要了解大学排名时，如何在杂乱的网页信息上，快速获取我们想要的大学排名信息了！

这里就需要用到Python网络爬虫提取信息的技术了！

大学排名的程序代码如下：

u=500733347,508113924&fm=173&app=49&f=JPEG?w=640&h=427&s=CFB327C14443274D0698C89403005090 清华大学

#CrawUnivRankingB.py

import requests

from bs4 import BeautifulSoup import bs4

def getHTMLText(url):

try:

r = requests.get(url, timeout=30)

r.raise_for_status()

r.encoding = r.apparent_encoding

return r.text

except: return "" def fillUnivList(ulist, html):

soup = BeautifulSoup(html, "html.parser")

for tr in soup.find('tbody').children:

if isinstance(tr, bs4.element.Tag):

tds = tr('td')

ulist.append([tds[0].string, tds[1].string, tds[3].string])

def printUnivList(ulist, num): tplt = "{0:^10}\t{1:{3}^10}\t{2:^10}"

print(tplt.format("排名","学校名称","总分",chr(12288)))

for i in range(num): u=ulist[i] print(tplt.format(u[0],u[1],u[2],chr(12288)))

def main(): uinfo = []

url = 'https://www.zuihaodaxue.cn/zuihaodaxuepaiming2016.html'

html = getHTMLText(url)

fillUnivList(uinfo, html)

printUnivList(uinfo, 20) # 20 univs main()

u=1904295834,1158596653&fm=173&app=49&f=JPEG?w=640&h=480&s=CA110DC0972E2AAE1AC8F103030070C0 北京大学

通过运行这段程序代码，小编得到的结果是清华大学排第一！

运用好网络爬虫方便我们快速了解信息！

u=1803932779,2460969079&fm=173&app=49&f=JPEG?w=552&h=320&s=65F2AA624BA19AD846D4291E010080C1 爬虫技术

今天小编知识分享就到这里，就结束了！明天同一时间为大家分享更精彩的知识！请大家多多点赞支持，多多关注和收藏，同时祝大家新年快乐！

这篇关于python爬虫世界最好大学_Python编程语言：使用网络爬虫获取大学排名的文章就介绍到这儿，希望我们推荐的文章对编程师们有所帮助！