数据分析案例：使用pandas进行自行车销售记录的数据分析+数据分析报告，看不懂你打我（附源码）

本文主要是介绍数据分析案例：使用pandas进行自行车销售记录的数据分析+数据分析报告，看不懂你打我（附源码），希望对大家解决编程问题提供一定的参考价值，需要的开发者们随着小编来一起学习吧！

使用pandas进行自行车销售记录的数据分析，看不懂你打我

本文数据和源代码见github：https://github.com/w1449550206/Pandas-Data-analysis-of-bicycle-sales-record-based-on-pandas.git

文章目录

使用pandas进行自行车销售记录的数据分析，看不懂你打我
- 原始数据
- 详细数据分析过程
- - 思路
- 代码
数据分析报告
- 1. 商品的种类和商品的总销售数量；
- 2. 总销售次数，月份数，月均销售次数；
- 3. 总销售金额，平均每月销售金额，平均每单销售金额；
- 4. 最大和最小日销售金额及对应的日期、最大和最小日销售数量及对应的日期；
- 5. 各个月单独的每日销售金额直方图

原始数据

在这里插入图片描述

详细数据分析过程

思路

导入数据集；
检查数据基本属性；
修改个别表头、舍弃缺失的不完整数据行；
对时间这一列信息进行特殊处理，舍弃星期的信息，然后将时间这一列数据的格式转为时间格式pd.to_datetime()；
“销售数量”、“应收金额”、“实收金额”这三列数据显然不可能有负数，我们要舍弃掉一些异常值的数据行；
对数据按时间升序排序，重置其索引；
计算商品的种类和商品的总销售数量；
计算总销售次数，月份数，月均销售次数；
计算总销售金额，平均每月销售金额，平均每单销售金额；
计算最大和最小日销售金额及对应的日期、最大和最小日销售数量及对应的日期；
画出各个月单独的每日销售金额直方图、每月销售金额直方图、每月销售金额变化直线图、销量前十和最后十名的自行车的直方图。
代码实现

代码

import os
import matplotlib.pyplot as plt
import pandas as pd
from pylab import mpl  # 用于画图时显示中文字符

mpl.rcParams['font.sans-serif'] = ['SimHei']  # 使用matplotlib画图时如果出现中文使用黑体字体
file_data = pd.read_excel("销售记录.xlsx")  # 读取数据文件

file_data

在这里插入图片描述

# 获取文件名
def get_file_name(fl_data):# items()函数以列表返回可遍历的(键, 值)元组数组# globals()是一个字典，存储了所有的全局变量的名字和对应的变量的值# 在这里我们通过判断输入的变量的值与globals()中存储的变量的值是否相等，相等就认为我们输入的变量就是这个globals()中存储的变量# 这样我们就返回这个globals()中存储的变量的变量名，即keyfor var_name, value in globals().items():if value is fl_data:return var_name

# 显示读入的文件数据的一些基本属性
def show_data_basic_description(fl_data):describe_label_shape = get_file_name(file_data) + "文件的shape大小："print(describe_label_shape, file_data.shape)describe_label_index = get_file_name(file_data) + "文件的索引开头和末尾："print(describe_label_index, file_data.index)describe_label_table_head = get_file_name(file_data) + "文件的表头项："print(describe_label_table_head, file_data.columns)describe_label_top_five_line = get_file_name(file_data) + "文件的内容：\n"print(describe_label_top_five_line, file_data.head())describe_label_data_type = get_file_name(file_data) + "文件的各项的数据类型：\n"print(describe_label_data_type, file_data.dtypes)

print("文件预处理前的各项属性：")
show_data_basic_description(file_data)
# 其中一个列的表头重命名一下
file_data.rename(columns={"下单日期": "销售时间"}, inplace=True)

在这里插入图片描述

# 删除所有有缺失数据的行
file_data = file_data.dropna(subset=['订单编号', '客户ID', '客户名称', '客户编号', '客户省份', '销售代表ID', '销售时间', '预计送货日期', '实际送货日期', '产品ID', '产品名称', '数量', '单价', '金额'], how="any")
file_data

在这里插入图片描述

# 删除无效时间的数据,没有
file_data = file_data.dropna(subset=["销售时间"], how="any")
file_data

在这里插入图片描述

# 处理异常值：“数量”、“单价”、“金额”这三列数据显然不可能有负数，因此要去掉不合理的数据
pop = file_data.loc[:, "金额"] > 0
file_data = file_data.loc[pop, :]
file_data

在这里插入图片描述

# 对数据按时间排序,ascending=True表示升序排列
file_data = file_data.sort_values(by="销售时间", ascending=True)
file_data

在这里插入图片描述

# 重置数据的索引
file_data = file_data.reset_index(drop=True)
print("文件预处理后的各项属性：")
show_data_basic_description(file_data)

在这里插入图片描述

# 计算自行车的种类和自行车的总销售数量

这篇关于数据分析案例：使用pandas进行自行车销售记录的数据分析+数据分析报告，看不懂你打我（附源码）的文章就介绍到这儿，希望我们推荐的文章对编程师们有所帮助！

数据分析案例：使用pandas进行自行车销售记录的数据分析+数据分析报告，看不懂你打我（附源码）

使用pandas进行自行车销售记录的数据分析，看不懂你打我

文章目录

原始数据

详细数据分析过程

思路

代码

相关文章

Python使用FastAPI实现大文件分片上传与断点续传功能

MyBatis分页查询实战案例完整流程

Spring Security简介、使用与最佳实践

springboot中使用okhttp3的小结

Java使用Javassist动态生成HelloWorld类

使用Python批量将.ncm格式的音频文件转换为.mp3格式的实战详解

Java使用jar命令配置服务器端口的完整指南

C#使用Spire.Doc for .NET实现HTML转Word的高效方案

Java中的抽象类与abstract 关键字使用详解

MyBatis ParameterHandler的具体使用