本文主要是介绍python爬取彩票网站开奖号码,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
一直以来对python特别感兴趣,但却没有一个目标去好好学习这门语言。昨天突然有个想法,老爸喜欢买七星彩,为何不抓取每一期的开奖号码,通过邮件推送给他呢。这样他既能第一时间知道开奖号码了。
然后就动手开干,但是为什么选择python,其实用php我写得更快一些。还是因为看了点python没有机会实践,或者说懒得去实践。
本次实例安装标题,将每一个方法拆分出来说明,同时这也是开发过程中的思路。
研究目标页面
在动手之前需要了解一些将要抓取页面的结构。
目标地址:http://caipiao.163.com/award/qxc/
网站编码是utf-8,下面开始进入代码。
抓取页面代码
from urllib import request
def getHtml(url): #获取页面的源代码page = request.urlopen(url)html = page.read()html = html.decode('utf-8')return html
print(getHtml('http://caipiao.163.com/award/qxc/'))
获取页面代码其实很简单,引入urllib库。方法中第一行为打开一个url地址,这时拿到的是一个对象,通过read()方法能拿到这个整个页面的代码,再通过utf-8编码(网站编码),使代码中的中文能被看懂。
下面来看一下运行结果。
这篇关于python爬取彩票网站开奖号码的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!