通过爬取豆瓣评分Top250电影数据浅谈对Python爬虫的认识

2024-02-23 19:30

本文主要是介绍通过爬取豆瓣评分Top250电影数据浅谈对Python爬虫的认识,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

今天在酱酱的带领下接触到了Python爬虫,有点兴趣,探索一下。

Python是如何与Excel表格搭讪哒?

python有专门的库为Excel文件的操作提供支持,这些库包括xlrd,xlwt,xlutils,openpyxl,xlsxwriter等它们可以帮助我们自动化办公。
首先是一个简单的Python与excel交互的代码。

import openpyxl #导入我们要用到的库
import datetime
#生成一个workbook的实例化对象
excel_obj = openpyxl.Workbook()
# 获取活跃的工作表格
excel_obj_active = excel_obj.active
# 我们这里介绍了两种给单元格赋值的方法
# 数据可以直接赋值给单元格
excel_obj_active['A1'] = 666
# 整行添加
excel_obj_active.append([1,2,3])
excel_obj_active['A3'] = datetime.datetime.now()
# 保存文件
excel_obj.save('test.xlsx')

我们保存的文件和代码所在的路径是一致的。
在这里插入图片描述最开始很奇怪为什么自己的A3单元格是#号而不显示时间呢?
原来自己的表格不够长。
在这里插入图片描述

Python网络爬虫豆瓣电影

然后,想要我们的测试代码使用这篇参考文章python爬取豆瓣Top250
在这里插入图片描述在这里插入图片描述果真得到了Top250的电影啊。
博主Runner Jxc写Python代码的风格比我好太多了。我还从来都没有使用过if __name__ == '__main__':,自己的风格用成语形容大概就是一马平川吧。面向过程到底吧。

if __name__ == '__main__':start = time.time()top = Top250()try: #Python 使用try exception来捕获异常top.saveToExcel('top250.xlsx')print('抓取成功,用时%4.2f'%(time.time()

这篇关于通过爬取豆瓣评分Top250电影数据浅谈对Python爬虫的认识的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/739682

相关文章

Python Transformers库(NLP处理库)案例代码讲解

《PythonTransformers库(NLP处理库)案例代码讲解》本文介绍transformers库的全面讲解,包含基础知识、高级用法、案例代码及学习路径,内容经过组织,适合不同阶段的学习者,对... 目录一、基础知识1. Transformers 库简介2. 安装与环境配置3. 快速上手示例二、核心模

Spring 请求之传递 JSON 数据的操作方法

《Spring请求之传递JSON数据的操作方法》JSON就是一种数据格式,有自己的格式和语法,使用文本表示一个对象或数组的信息,因此JSON本质是字符串,主要负责在不同的语言中数据传递和交换,这... 目录jsON 概念JSON 语法JSON 的语法JSON 的两种结构JSON 字符串和 Java 对象互转

Python正则表达式语法及re模块中的常用函数详解

《Python正则表达式语法及re模块中的常用函数详解》这篇文章主要给大家介绍了关于Python正则表达式语法及re模块中常用函数的相关资料,正则表达式是一种强大的字符串处理工具,可以用于匹配、切分、... 目录概念、作用和步骤语法re模块中的常用函数总结 概念、作用和步骤概念: 本身也是一个字符串,其中

Python使用getopt处理命令行参数示例解析(最佳实践)

《Python使用getopt处理命令行参数示例解析(最佳实践)》getopt模块是Python标准库中一个简单但强大的命令行参数处理工具,它特别适合那些需要快速实现基本命令行参数解析的场景,或者需要... 目录为什么需要处理命令行参数?getopt模块基础实际应用示例与其他参数处理方式的比较常见问http

python实现svg图片转换为png和gif

《python实现svg图片转换为png和gif》这篇文章主要为大家详细介绍了python如何实现将svg图片格式转换为png和gif,文中的示例代码讲解详细,感兴趣的小伙伴可以跟随小编一起学习一下... 目录python实现svg图片转换为png和gifpython实现图片格式之间的相互转换延展:基于Py

Python中的getopt模块用法小结

《Python中的getopt模块用法小结》getopt.getopt()函数是Python中用于解析命令行参数的标准库函数,该函数可以从命令行中提取选项和参数,并对它们进行处理,本文详细介绍了Pyt... 目录getopt模块介绍getopt.getopt函数的介绍getopt模块的常用用法getopt模

Python利用ElementTree实现快速解析XML文件

《Python利用ElementTree实现快速解析XML文件》ElementTree是Python标准库的一部分,而且是Python标准库中用于解析和操作XML数据的模块,下面小编就来和大家详细讲讲... 目录一、XML文件解析到底有多重要二、ElementTree快速入门1. 加载XML的两种方式2.

Python如何精准判断某个进程是否在运行

《Python如何精准判断某个进程是否在运行》这篇文章主要为大家详细介绍了Python如何精准判断某个进程是否在运行,本文为大家整理了3种方法并进行了对比,有需要的小伙伴可以跟随小编一起学习一下... 目录一、为什么需要判断进程是否存在二、方法1:用psutil库(推荐)三、方法2:用os.system调用

使用Python从PPT文档中提取图片和图片信息(如坐标、宽度和高度等)

《使用Python从PPT文档中提取图片和图片信息(如坐标、宽度和高度等)》PPT是一种高效的信息展示工具,广泛应用于教育、商务和设计等多个领域,PPT文档中常常包含丰富的图片内容,这些图片不仅提升了... 目录一、引言二、环境与工具三、python 提取PPT背景图片3.1 提取幻灯片背景图片3.2 提取

C++如何通过Qt反射机制实现数据类序列化

《C++如何通过Qt反射机制实现数据类序列化》在C++工程中经常需要使用数据类,并对数据类进行存储、打印、调试等操作,所以本文就来聊聊C++如何通过Qt反射机制实现数据类序列化吧... 目录设计预期设计思路代码实现使用方法在 C++ 工程中经常需要使用数据类,并对数据类进行存储、打印、调试等操作。由于数据类