Python学习笔记——数据分析之数据可视化工具实战案例:世界高峰数据可视化

本文主要是介绍Python学习笔记——数据分析之数据可视化工具实战案例:世界高峰数据可视化,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

世界高峰数据可视化 (World's Highest Mountains)

参考:https://www.kaggle.com/alex64/d/abcsds/highest-mountains/let-s-climb


import pandas as pd
import matplotlib.pyplot as plt
from matplotlib import stylestyle.use('ggplot')     # 设置图片显示的主题样式# 解决matplotlib显示中文问题
plt.rcParams['font.sans-serif'] = ['SimHei']  # 指定默认字体
plt.rcParams['axes.unicode_minus'] = False  # 解决保存图像是负号'-'显示为方块的问题dataset_path = './dataset/Mountains.csv'def preview_data(data):"""数据预览"""# 数据预览print(data.head())# 数据信息print(data.info())def proc_success(val):"""处理 'Ascents bef. 2004' 列中的数据"""if '>' in str(val):return 200elif 'Many' in str(val):return 160else:return valdef run_main():"""主函数"""data = pd.read_csv(dataset_path)preview_data(data)# 数据重构# 重命名列名data.rename(columns={'Height (m)': 'Height', 'Ascents bef. 2004': 'Success','Failed attempts bef. 2004': 'Failed'}, inplace=True)# 数据清洗data['Failed'] = data['Failed'].fillna(0).astype(int)data['Success'] = data['Success'].apply(proc_success)data['Success'] = data['Success'].fillna(0).astype(int)data = data[data['First ascent'] != 'unclimbed']data['First ascent'] = data['First ascent'].astype(int)# 可视化数据# 1. 登顶次数 vs 年份plt.hist(data['First ascent'].astype(int), bins=20)plt.ylabel('高峰数量')plt.xlabel('年份')plt.title('登顶次数')plt.savefig('./first_ascent_vs_year.png')plt.show()# 2. 高峰vs海拔data['Height'].plot.hist(color='steelblue', bins=20)plt.bar(data['Height'],(data['Height'] - data['Height'].min()) / (data['Height'].max() - data['Height'].min()) * 23,   # 按比例缩放color='red',width=30, alpha=0.2)plt.ylabel('高峰数量')plt.xlabel('海拔')plt.text(8750, 20, "海拔", color='red')plt.title('高峰vs海拔')plt.savefig('./mountain_vs_height.png')plt.show()# 3. 首次登顶data['Attempts'] = data['Failed'] + data['Success']  # 攀登尝试次数fig = plt.figure(figsize=(13, 7))fig.add_subplot(211)plt.scatter(data['First ascent'], data['Height'], c=data['Attempts'], alpha=0.8, s=50)plt.ylabel('海拔')plt.xlabel('登顶')fig.add_subplot(212)plt.scatter(data['First ascent'], data['Rank'].max() - data['Rank'], c=data['Attempts'], alpha=0.8, s=50)plt.ylabel('排名')plt.xlabel('登顶')plt.savefig('./mountain_vs_attempts.png')plt.show()# 课后练习,尝试使用seaborn或者bokeh重现上述显示的结果if __name__ == '__main__':run_main()

这篇关于Python学习笔记——数据分析之数据可视化工具实战案例:世界高峰数据可视化的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/883866

相关文章

Python中的魔术方法__new__详解

《Python中的魔术方法__new__详解》:本文主要介绍Python中的魔术方法__new__的使用,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录一、核心意义与机制1.1 构造过程原理1.2 与 __init__ 对比二、核心功能解析2.1 核心能力2.2

Python虚拟环境终极(含PyCharm的使用教程)

《Python虚拟环境终极(含PyCharm的使用教程)》:本文主要介绍Python虚拟环境终极(含PyCharm的使用教程),具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,... 目录一、为什么需要虚拟环境?二、虚拟环境创建方式对比三、命令行创建虚拟环境(venv)3.1 基础命令3

Python Transformer 库安装配置及使用方法

《PythonTransformer库安装配置及使用方法》HuggingFaceTransformers是自然语言处理(NLP)领域最流行的开源库之一,支持基于Transformer架构的预训练模... 目录python 中的 Transformer 库及使用方法一、库的概述二、安装与配置三、基础使用:Pi

Python 中的 with open文件操作的最佳实践

《Python中的withopen文件操作的最佳实践》在Python中,withopen()提供了一个简洁而安全的方式来处理文件操作,它不仅能确保文件在操作完成后自动关闭,还能处理文件操作中的异... 目录什么是 with open()?为什么使用 with open()?使用 with open() 进行

Python中使用正则表达式精准匹配IP地址的案例

《Python中使用正则表达式精准匹配IP地址的案例》Python的正则表达式(re模块)是完成这个任务的利器,但你知道怎么写才能准确匹配各种合法的IP地址吗,今天我们就来详细探讨这个问题,感兴趣的朋... 目录为什么需要IP正则表达式?IP地址的基本结构基础正则表达式写法精确匹配0-255的数字验证IP地

MySQL高级查询之JOIN、子查询、窗口函数实际案例

《MySQL高级查询之JOIN、子查询、窗口函数实际案例》:本文主要介绍MySQL高级查询之JOIN、子查询、窗口函数实际案例的相关资料,JOIN用于多表关联查询,子查询用于数据筛选和过滤,窗口函... 目录前言1. JOIN(连接查询)1.1 内连接(INNER JOIN)1.2 左连接(LEFT JOI

MySQL 中查询 VARCHAR 类型 JSON 数据的问题记录

《MySQL中查询VARCHAR类型JSON数据的问题记录》在数据库设计中,有时我们会将JSON数据存储在VARCHAR或TEXT类型字段中,本文将详细介绍如何在MySQL中有效查询存储为V... 目录一、问题背景二、mysql jsON 函数2.1 常用 JSON 函数三、查询示例3.1 基本查询3.2

使用Python实现全能手机虚拟键盘的示例代码

《使用Python实现全能手机虚拟键盘的示例代码》在数字化办公时代,你是否遇到过这样的场景:会议室投影电脑突然键盘失灵、躺在沙发上想远程控制书房电脑、或者需要给长辈远程协助操作?今天我要分享的Pyth... 目录一、项目概述:不止于键盘的远程控制方案1.1 创新价值1.2 技术栈全景二、需求实现步骤一、需求

SpringBatch数据写入实现

《SpringBatch数据写入实现》SpringBatch通过ItemWriter接口及其丰富的实现,提供了强大的数据写入能力,本文主要介绍了SpringBatch数据写入实现,具有一定的参考价值,... 目录python引言一、ItemWriter核心概念二、数据库写入实现三、文件写入实现四、多目标写入

Python 迭代器和生成器概念及场景分析

《Python迭代器和生成器概念及场景分析》yield是Python中实现惰性计算和协程的核心工具,结合send()、throw()、close()等方法,能够构建高效、灵活的数据流和控制流模型,这... 目录迭代器的介绍自定义迭代器省略的迭代器生产器的介绍yield的普通用法yield的高级用法yidle