数据分析案例:使用pandas进行自行车销售记录的数据分析+数据分析报告,看不懂你打我(附源码)

本文主要是介绍数据分析案例:使用pandas进行自行车销售记录的数据分析+数据分析报告,看不懂你打我(附源码),希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

使用pandas进行自行车销售记录的数据分析,看不懂你打我

本文数据和源代码见github:https://github.com/w1449550206/Pandas-Data-analysis-of-bicycle-sales-record-based-on-pandas.git

文章目录

  • 使用pandas进行自行车销售记录的数据分析,看不懂你打我
    • 原始数据
    • 详细数据分析过程
      • 思路
    • 代码
  • 数据分析报告
    • 1. 商品的种类和商品的总销售数量;
    • 2. 总销售次数,月份数,月均销售次数;
    • 3. 总销售金额,平均每月销售金额,平均每单销售金额;
    • 4. 最大和最小日销售金额及对应的日期、最大和最小日销售数量及对应的日期;
    • 5. 各个月单独的每日销售金额直方图

原始数据

在这里插入图片描述

详细数据分析过程

思路

  • 导入数据集;

  • 检查数据基本属性;

  • 修改个别表头、舍弃缺失的不完整数据行;

  • 对时间这一列信息进行特殊处理,舍弃星期的信息,然后将时间这一列数据的格式转为时间格式pd.to_datetime();

  • “销售数量”、“应收金额”、“实收金额”这三列数据显然不可能有负数,我们要舍弃掉一些异常值的数据行;

  • 对数据按时间升序排序,重置其索引;

  • 计算商品的种类和商品的总销售数量;

  • 计算总销售次数,月份数,月均销售次数;

  • 计算总销售金额,平均每月销售金额,平均每单销售金额;

  • 计算最大和最小日销售金额及对应的日期、最大和最小日销售数量及对应的日期;

  • 画出各个月单独的每日销售金额直方图、每月销售金额直方图、每月销售金额变化直线图、销量前十和最后十名的自行车的直方图。

  • 代码实现

代码

import os
import matplotlib.pyplot as plt
import pandas as pd
from pylab import mpl  # 用于画图时显示中文字符
mpl.rcParams['font.sans-serif'] = ['SimHei']  # 使用matplotlib画图时如果出现中文使用黑体字体
file_data = pd.read_excel("销售记录.xlsx")  # 读取数据文件
file_data

在这里插入图片描述

# 获取文件名
def get_file_name(fl_data):# items()函数以列表返回可遍历的(键, 值)元组数组# globals()是一个字典,存储了所有的全局变量的名字和对应的变量的值# 在这里我们通过判断输入的变量的值与globals()中存储的变量的值是否相等,相等就认为我们输入的变量就是这个globals()中存储的变量# 这样我们就返回这个globals()中存储的变量的变量名,即keyfor var_name, value in globals().items():if value is fl_data:return var_name
# 显示读入的文件数据的一些基本属性
def show_data_basic_description(fl_data):describe_label_shape = get_file_name(file_data) + "文件的shape大小:"print(describe_label_shape, file_data.shape)describe_label_index = get_file_name(file_data) + "文件的索引开头和末尾:"print(describe_label_index, file_data.index)describe_label_table_head = get_file_name(file_data) + "文件的表头项:"print(describe_label_table_head, file_data.columns)describe_label_top_five_line = get_file_name(file_data) + "文件的内容:\n"print(describe_label_top_five_line, file_data.head())describe_label_data_type = get_file_name(file_data) + "文件的各项的数据类型:\n"print(describe_label_data_type, file_data.dtypes)
print("文件预处理前的各项属性:")
show_data_basic_description(file_data)
# 其中一个列的表头重命名一下
file_data.rename(columns={"下单日期": "销售时间"}, inplace=True)

在这里插入图片描述

# 删除所有有缺失数据的行
file_data = file_data.dropna(subset=['订单编号', '客户ID', '客户名称', '客户编号', '客户省份', '销售代表ID', '销售时间', '预计送货日期', '实际送货日期', '产品ID', '产品名称', '数量', '单价', '金额'], how="any")
file_data

在这里插入图片描述

# 删除无效时间的数据,没有
file_data = file_data.dropna(subset=["销售时间"], how="any")
file_data

在这里插入图片描述

# 处理异常值:“数量”、“单价”、“金额”这三列数据显然不可能有负数,因此要去掉不合理的数据
pop = file_data.loc[:, "金额"] > 0
file_data = file_data.loc[pop, :]
file_data

在这里插入图片描述

# 对数据按时间排序,ascending=True表示升序排列
file_data = file_data.sort_values(by="销售时间", ascending=True)
file_data

在这里插入图片描述

# 重置数据的索引
file_data = file_data.reset_index(drop=True)
print("文件预处理后的各项属性:")
show_data_basic_description(file_data)

在这里插入图片描述

# 计算自行车的种类和自行车的总销售数量

这篇关于数据分析案例:使用pandas进行自行车销售记录的数据分析+数据分析报告,看不懂你打我(附源码)的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/590257

相关文章

Python获取中国节假日数据记录入JSON文件

《Python获取中国节假日数据记录入JSON文件》项目系统内置的日历应用为了提升用户体验,特别设置了在调休日期显示“休”的UI图标功能,那么问题是这些调休数据从哪里来呢?我尝试一种更为智能的方法:P... 目录节假日数据获取存入jsON文件节假日数据读取封装完整代码项目系统内置的日历应用为了提升用户体验,

vue使用docxtemplater导出word

《vue使用docxtemplater导出word》docxtemplater是一种邮件合并工具,以编程方式使用并处理条件、循环,并且可以扩展以插入任何内容,下面我们来看看如何使用docxtempl... 目录docxtemplatervue使用docxtemplater导出word安装常用语法 封装导出方

Linux换行符的使用方法详解

《Linux换行符的使用方法详解》本文介绍了Linux中常用的换行符LF及其在文件中的表示,展示了如何使用sed命令替换换行符,并列举了与换行符处理相关的Linux命令,通过代码讲解的非常详细,需要的... 目录简介检测文件中的换行符使用 cat -A 查看换行符使用 od -c 检查字符换行符格式转换将

使用Jackson进行JSON生成与解析的新手指南

《使用Jackson进行JSON生成与解析的新手指南》这篇文章主要为大家详细介绍了如何使用Jackson进行JSON生成与解析处理,文中的示例代码讲解详细,感兴趣的小伙伴可以跟随小编一起学习一下... 目录1. 核心依赖2. 基础用法2.1 对象转 jsON(序列化)2.2 JSON 转对象(反序列化)3.

springboot循环依赖问题案例代码及解决办法

《springboot循环依赖问题案例代码及解决办法》在SpringBoot中,如果两个或多个Bean之间存在循环依赖(即BeanA依赖BeanB,而BeanB又依赖BeanA),会导致Spring的... 目录1. 什么是循环依赖?2. 循环依赖的场景案例3. 解决循环依赖的常见方法方法 1:使用 @La

使用Python实现快速搭建本地HTTP服务器

《使用Python实现快速搭建本地HTTP服务器》:本文主要介绍如何使用Python快速搭建本地HTTP服务器,轻松实现一键HTTP文件共享,同时结合二维码技术,让访问更简单,感兴趣的小伙伴可以了... 目录1. 概述2. 快速搭建 HTTP 文件共享服务2.1 核心思路2.2 代码实现2.3 代码解读3.

Elasticsearch 在 Java 中的使用教程

《Elasticsearch在Java中的使用教程》Elasticsearch是一个分布式搜索和分析引擎,基于ApacheLucene构建,能够实现实时数据的存储、搜索、和分析,它广泛应用于全文... 目录1. Elasticsearch 简介2. 环境准备2.1 安装 Elasticsearch2.2 J

使用C#代码在PDF文档中添加、删除和替换图片

《使用C#代码在PDF文档中添加、删除和替换图片》在当今数字化文档处理场景中,动态操作PDF文档中的图像已成为企业级应用开发的核心需求之一,本文将介绍如何在.NET平台使用C#代码在PDF文档中添加、... 目录引言用C#添加图片到PDF文档用C#删除PDF文档中的图片用C#替换PDF文档中的图片引言在当

Java中List的contains()方法的使用小结

《Java中List的contains()方法的使用小结》List的contains()方法用于检查列表中是否包含指定的元素,借助equals()方法进行判断,下面就来介绍Java中List的c... 目录详细展开1. 方法签名2. 工作原理3. 使用示例4. 注意事项总结结论:List 的 contain

C#使用SQLite进行大数据量高效处理的代码示例

《C#使用SQLite进行大数据量高效处理的代码示例》在软件开发中,高效处理大数据量是一个常见且具有挑战性的任务,SQLite因其零配置、嵌入式、跨平台的特性,成为许多开发者的首选数据库,本文将深入探... 目录前言准备工作数据实体核心技术批量插入:从乌龟到猎豹的蜕变分页查询:加载百万数据异步处理:拒绝界面