python爬虫项目之中国天气网的爬取终极版

2023-12-31 20:10

本文主要是介绍python爬虫项目之中国天气网的爬取终极版,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

说明:此项目替代了我们每天从网页或者其他途径上看全国各地的气温情况(本项目只是爬取的全国各个地区的最低气温,其他扩展功能根据此项目来完善即可!!!)

我们先看一下非常人性化的结果:

在这里插入图片描述用到的模块:

  1. requests
  2. pyecharts
  3. bs4

在这里必须说明一点(必做):我们用到的python版本基本上会在3.6以上,所以在用到pyecharts中的Bar时候会出现问题;为了解决这个问题,作者也有具体的解决步骤:升级版本:仅支持 Python3.6+

cmd命令下执行下面的三条:


1. pip install wheel2. pip install pyecharts==0.1.9.4 或则 pip install pyecharts -U3. pip install pyecharts-snapshot

注:引起这个问题是版本引起的,看了下官方的github发现的。

下面我们直接上完整代码:(具体操作的步骤会在后续文章中发出)

import requests
# from pyecharts import Bar
from bs4 import BeautifulSoup
from pyecharts import Bar
# 目标网站:http://www.weather.com.cn/textFC/hb.shtmlAll_DATE=[]
def parse_url(url):headers = {'User-Agent':'此处需要更改成你本机的User-Agent'}reponse = requests.get(url,headers= headers)text = reponse.content.decode('utf-8')soup = BeautifulSoup(text, 'html5lib')ConMidtab  = soup.find('div',class_='conMidtab')# print(ConMidtab)tables = ConMidtab.find_all('table')for table in tables:# print(table)trs = table.find_all('tr')[2:]for index, tr in enumerate(trs):tds = tr.find_all('td')city_td = tds[0]if index==0:city_td = tds[1]city = list(city_td.stripped_strings)[0]tempt_td = tds[-2]min_tempt  = list(tempt_td.stripped_strings)[0]All_DATE.append({'city':city ,'min_tempt':int(min_tempt)})All_DATE.sort(key=lambda x: x['min_tempt'])data = All_DATE[0:20]  # 取出前20个cities = list(map(lambda x: x['city'],data))tempts = list(map(lambda x: x['min_tempt'], data))# plt.bar(cities, tempts,color ='r')  # 绘制柱状图# plt.show('mytempt.html')# print(cities)# print(tempts)chart = Bar("实时动态华北地区的最低气温柱状图")chart.add("",cities,tempts)chart.render('实时天气.html')def get_url():urls = ['http://www.weather.com.cn/textFC/hb.shtml','http://www.weather.com.cn/textFC/db.shtml','http://www.weather.com.cn/textFC/hd.shtml','http://www.weather.com.cn/textFC/hz.shtml','http://www.weather.com.cn/textFC/hn.shtml','http://www.weather.com.cn/textFC/xb.shtml','http://www.weather.com.cn/textFC/xn.shtml','http://www.weather.com.cn/textFC/gat.shtml']for url in urls:parse_url(url)break    # 为了节省时间我们只获取了第一个华北地区的最低气温情况if __name__ == '__main__':get_url()

结果也会正常的显示!

这篇关于python爬虫项目之中国天气网的爬取终极版的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/557019

相关文章

这15个Vue指令,让你的项目开发爽到爆

1. V-Hotkey 仓库地址: github.com/Dafrok/v-ho… Demo: 戳这里 https://dafrok.github.io/v-hotkey 安装: npm install --save v-hotkey 这个指令可以给组件绑定一个或多个快捷键。你想要通过按下 Escape 键后隐藏某个组件,按住 Control 和回车键再显示它吗?小菜一碟: <template

python: 多模块(.py)中全局变量的导入

文章目录 global关键字可变类型和不可变类型数据的内存地址单模块(单个py文件)的全局变量示例总结 多模块(多个py文件)的全局变量from x import x导入全局变量示例 import x导入全局变量示例 总结 global关键字 global 的作用范围是模块(.py)级别: 当你在一个模块(文件)中使用 global 声明变量时,这个变量只在该模块的全局命名空

如何用Docker运行Django项目

本章教程,介绍如何用Docker创建一个Django,并运行能够访问。 一、拉取镜像 这里我们使用python3.11版本的docker镜像 docker pull python:3.11 二、运行容器 这里我们将容器内部的8080端口,映射到宿主机的80端口上。 docker run -itd --name python311 -p

跨国公司撤出在华研发中心的启示:中国IT产业的挑战与机遇

近日,IBM中国宣布撤出在华的两大研发中心,这一决定在IT行业引发了广泛的讨论和关注。跨国公司在华研发中心的撤出,不仅对众多IT从业者的职业发展带来了直接的冲击,也引发了人们对全球化背景下中国IT产业竞争力和未来发展方向的深思。面对这一突如其来的变化,我们应如何看待跨国公司的决策?中国IT人才又该如何应对?中国IT产业将何去何从?本文将围绕这些问题展开探讨。 跨国公司撤出的背景与

【Python编程】Linux创建虚拟环境并配置与notebook相连接

1.创建 使用 venv 创建虚拟环境。例如,在当前目录下创建一个名为 myenv 的虚拟环境: python3 -m venv myenv 2.激活 激活虚拟环境使其成为当前终端会话的活动环境。运行: source myenv/bin/activate 3.与notebook连接 在虚拟环境中,使用 pip 安装 Jupyter 和 ipykernel: pip instal

【机器学习】高斯过程的基本概念和应用领域以及在python中的实例

引言 高斯过程(Gaussian Process,简称GP)是一种概率模型,用于描述一组随机变量的联合概率分布,其中任何一个有限维度的子集都具有高斯分布 文章目录 引言一、高斯过程1.1 基本定义1.1.1 随机过程1.1.2 高斯分布 1.2 高斯过程的特性1.2.1 联合高斯性1.2.2 均值函数1.2.3 协方差函数(或核函数) 1.3 核函数1.4 高斯过程回归(Gauss

在cscode中通过maven创建java项目

在cscode中创建java项目 可以通过博客完成maven的导入 建立maven项目 使用快捷键 Ctrl + Shift + P 建立一个 Maven 项目 1 Ctrl + Shift + P 打开输入框2 输入 "> java create"3 选择 maven4 选择 No Archetype5 输入 域名6 输入项目名称7 建立一个文件目录存放项目,文件名一般为项目名8 确定

【学习笔记】 陈强-机器学习-Python-Ch15 人工神经网络(1)sklearn

系列文章目录 监督学习:参数方法 【学习笔记】 陈强-机器学习-Python-Ch4 线性回归 【学习笔记】 陈强-机器学习-Python-Ch5 逻辑回归 【课后题练习】 陈强-机器学习-Python-Ch5 逻辑回归(SAheart.csv) 【学习笔记】 陈强-机器学习-Python-Ch6 多项逻辑回归 【学习笔记 及 课后题练习】 陈强-机器学习-Python-Ch7 判别分析 【学

nudepy,一个有趣的 Python 库!

更多资料获取 📚 个人网站:ipengtao.com 大家好,今天为大家分享一个有趣的 Python 库 - nudepy。 Github地址:https://github.com/hhatto/nude.py 在图像处理和计算机视觉应用中,检测图像中的不适当内容(例如裸露图像)是一个重要的任务。nudepy 是一个基于 Python 的库,专门用于检测图像中的不适当内容。该

Vue3项目开发——新闻发布管理系统(六)

文章目录 八、首页设计开发1、页面设计2、登录访问拦截实现3、用户基本信息显示①封装用户基本信息获取接口②用户基本信息存储③用户基本信息调用④用户基本信息动态渲染 4、退出功能实现①注册点击事件②添加退出功能③数据清理 5、代码下载 八、首页设计开发 登录成功后,系统就进入了首页。接下来,也就进行首页的开发了。 1、页面设计 系统页面主要分为三部分,左侧为系统的菜单栏,右侧