通过爬取豆瓣评分Top250电影数据浅谈对Python爬虫的认识

本文主要是介绍通过爬取豆瓣评分Top250电影数据浅谈对Python爬虫的认识，希望对大家解决编程问题提供一定的参考价值，需要的开发者们随着小编来一起学习吧！

今天在酱酱的带领下接触到了Python爬虫，有点兴趣，探索一下。

Python是如何与Excel表格搭讪哒？

python有专门的库为Excel文件的操作提供支持，这些库包括xlrd,xlwt,xlutils,openpyxl,xlsxwriter等它们可以帮助我们自动化办公。
首先是一个简单的Python与excel交互的代码。

import openpyxl #导入我们要用到的库
import datetime
#生成一个workbook的实例化对象
excel_obj = openpyxl.Workbook()
# 获取活跃的工作表格
excel_obj_active = excel_obj.active
# 我们这里介绍了两种给单元格赋值的方法
# 数据可以直接赋值给单元格
excel_obj_active['A1'] = 666
# 整行添加
excel_obj_active.append([1,2,3])
excel_obj_active['A3'] = datetime.datetime.now()
# 保存文件
excel_obj.save('test.xlsx')

我们保存的文件和代码所在的路径是一致的。
在这里插入图片描述最开始很奇怪为什么自己的A3单元格是#号而不显示时间呢？
原来自己的表格不够长。

Python网络爬虫豆瓣电影

然后，想要我们的测试代码使用这篇参考文章python爬取豆瓣Top250
在这里插入图片描述果真得到了Top250的电影啊。
博主Runner Jxc写Python代码的风格比我好太多了。我还从来都没有使用过if __name__ == '__main__':，自己的风格用成语形容大概就是一马平川吧。面向过程到底吧。

if __name__ == '__main__':start = time.time()top = Top250()try: #Python 使用try exception来捕获异常top.saveToExcel('top250.xlsx')print('抓取成功,用时%4.2f'%(time.time()