安徽某高校数据挖掘作业6

2024-06-05 23:44

本文主要是介绍安徽某高校数据挖掘作业6,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

1 根据附件中year文件,编辑Python程序绘制年销售总额分布条形图和年净利润分布条形图,附Python程序和图像。

2 根据附件中quarter和quarter_b文件,编辑Python程序绘制2018—2020年销售额和净利润折线图,附Python程序和图像。

3 根据附件中month文件,编辑Python程序绘制2020年每月销售额分布和净利润分布条形图,附Python程序和图像。

1. 

import pandas as pd
import matplotlib.pyplot as plt
import os# 确保工作目录正确
os.chdir('C:/Users/SaintJerry/PycharmProjects/pythonProject6')# 读取数据
year_data = pd.read_excel('year.xls')# 设置字体以支持中文
plt.rcParams['font.sans-serif'] = ['SimHei']  # 使用SimHei字体显示中文
plt.rcParams['axes.unicode_minus'] = False  # 解决负号显示问题# 绘制年销售总额分布条形图
plt.figure(figsize=(10, 5))
plt.bar(year_data['年份'], year_data['销售总额'], color='blue', alpha=0.7)
plt.xlabel('年份')
plt.ylabel('销售总额')
plt.title('按年销售总额分布')
plt.show()# 绘制年净利润分布条形图
plt.figure(figsize=(10, 5))
plt.bar(year_data['年份'], year_data['净利润'], color='green', alpha=0.7)
plt.xlabel('年份')
plt.ylabel('净利润')
plt.title('按年净利润分布')
plt.show()

结果:

2.

感谢W同学提供的本题代码:

import matplotlib.pyplot as plt
import pandas as pd
import os# 确保工作目录正确
os.chdir('C:/Users/SaintJerry/PycharmProjects/pythonProject6')# 读取数据
data = pd.read_excel('quarter.xls')
data1 = pd.read_excel('quarter_b.xls')# 设置字体以支持中文
plt.rcParams['font.sans-serif'] = ['SimHei']  # 使用SimHei字体显示中文
plt.rcParams['axes.unicode_minus'] = False  # 解决负号显示问题
# 转置数据
data = pd.DataFrame(data)
dataT = data.T
dataT.columns = dataT.iloc[0]
dataT = dataT.iloc[1:]data1 = pd.DataFrame(data1)
data1T = data1.T
data1T.columns = data1T.iloc[0]
data1T = data1T.iloc[1:]# 绘制图表
dataT.plot(title='quarter')
data1T.plot(title='quarter_b')
plt.show()

结果:

3.

import matplotlib.pyplot as plt
import pandas as pd
import os
import matplotlib
matplotlib.use('TkAgg')# 确保工作目录正确
os.chdir('C:/Users/SaintJerry/PycharmProjects/pythonProject6')# 设置字体以支持中文
plt.rcParams['font.sans-serif'] = ['SimHei']  # 使用SimHei字体显示中文
plt.rcParams['axes.unicode_minus'] = False  # 解决负号显示问题# 读取数据
month_data = pd.read_excel('month.xls')# 绘制2020年每月销售额分布条形图
plt.figure(figsize=(12, 6))
plt.bar(month_data['月份'], month_data['销售额'], color='blue', alpha=0.7)
plt.xlabel('月份')
plt.ylabel('销售额')
plt.title('2020年每月销售额分布')
plt.xticks(rotation=45)
plt.show()# 绘制2020年每月净利润分布条形图
plt.figure(figsize=(12, 6))
plt.bar(month_data['月份'], month_data['净利润'], color='green', alpha=0.7)
plt.xlabel('月份')
plt.ylabel('净利润')
plt.title('2020年每月净利润分布')
plt.xticks(rotation=45)
plt.show()

结果:

这篇关于安徽某高校数据挖掘作业6的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1034507

相关文章

数据挖掘和数据分析

数据挖掘(Data Mining)和数据分析(Data Analysis)是现代计算机科学中两个重要的领域。它们虽然紧密相关,但在概念和应用上有一定的区别。下面将从定义、主要技术、应用领域和挑战四个方面详细阐述这两个领域。 一、定义 **数据挖掘**: 数据挖掘是指从大量数据中提取潜在的、有价值的信息和知识的过程。它综合了统计学、机器学习、数据库技术等多种学科的技术和方法。 **数据分析**

安徽理工大学2计算机考研情况,招收计算机专业的学院和联培都不少!

安徽理工大学(Anhui University of Science and Technology),位于淮南市,是安徽省和应急管理部共建高校,安徽省高等教育振兴计划“地方特色高水平大学”建设高校,安徽省高峰学科建设计划特别支持高校,国家“中西部高校基础能力建设工程”支持高校,入选教育部“卓越工程师教育培养计划”实施高校、中国人民解放军后备军官培养选拔基地、全国首批深化创新创业教育改革示范高校、首

数据挖掘与分析 个别选择题ID3Apriori算法

选择题 1.当不知道数据所带标签时,可以使用哪种技术促使带同类标签的数据与带其他标签的数据相分离?(聚类) 2.关于K-means算法,正确的描述是:初始值不同,最终结果可能不同 3.K-means算法中的初始中心点:直接影响算法的收敛结果 4.处理缺失值的方法包括:不处理、删除记录、插补法 5.神经网络的缺点包括:需要大量的参数,如网络拓扑结构权值和阈值的初始值等;输出的结果难以解释

学生作业管理系统设计文档

一、项目概述 本系统设计文档旨在为学生作业管理系统提供一个全面的设计方案。该系统旨在提高作业管理的效率,减轻教师的工作负担,并为学生提供一个清晰、便捷的作业提交和查看平台。系统需具备作业发布、作业提交、作业批改、成绩查看等基本功能,同时保证系统的稳定性、可扩展性和易用性。 二、系统功能性需求 1.用户管理 用户注册与登录 用户角色管理(教师、学生、管理员) 用户信息修改与查看 2.作业管

Spark on YARN client模式作业运行全过程分析

在前篇文章中我介绍了Spark on YARN集群模式(yarn-cluster)作业从提交到运行整个过程的情况(详情见《Spark on YARN集群模式作业运行全过程分析》),我们知道Spark on yarn有两种模式:yarn-cluster和yarn-client。这两种模式作业虽然都是在yarn上面运行,但是其中的运行方式很不一样,今天我就来谈谈Spark on YARN

Spark on YARN cluster作业运行全过程分析

下面是分析Spark on YARN的Cluster模式,从用户提交作业到作业运行结束整个运行期间的过程分析。 客户端进行操作   1、根据yarnConf来初始化yarnClient,并启动yarnClient   2、创建客户端Application,并获取Application的ID,进一步判断集群中的资源是否满足executor和ApplicationMaster申请的资源,如果不满足

Windows程序设计课程作业-3(文件并发下载)

目录 目录 1.作业内容 2.作业要求 3.主要思路  1)窗体和组件初始化  2)下载管理器实例化 3)按钮点击事件处理 4)窗体加载事件处理  5)下载消息处理  4.主要难点 1)多线程管理: 2) UI更新: 3) 错误处理: 4) 资源管理: 5) 用户体验: 5.不足及改进 参考:  6.代码展示 代码仓库  7.运行结果 ​​​​​ 1.

Unity Shader第二章作业

一、什么是图元,有哪几种图元 图元就是组成图像的基本单元,有点、线、面三种图元。 二、渲染流水线分哪三个概念阶段?每个概念阶段主要任务是什么,由哪个计算部件执行 应用阶段——》几何阶段——》光柵化阶段 应用阶段:应用阶段通常由CPU负责实现,先准备好场景数据,然后去除不可见的物体,提高渲染能力,设置好每个模型的渲染状态后,输出渲染图元(点,线,三角面),传递给几何阶段。 几何阶段:把渲染

Python--python数据挖掘领域工具包

原文:http://qxde01.blog.163.com/blog/static/67335744201368101922991/    Python在科学计算领域,有两个重要的扩展模块:Numpy和Scipy。其中Numpy是一个用python实现的科学计算包。包括: 一个强大的N维数组对象Array;比较成熟的(广播)函数库;用于整合C/C++和Fortran代码的工具包;实用的线性代数

数据挖掘与分析——数据预处理

数据探索 波士顿房价数据集:卡内基梅隆大学收集,StatLib库,1978年,涵盖了麻省波士顿的506个不同郊区的房屋数据。 一共含有506条数据。每条数据14个字段,包含13个属性,和一个房价的平均值。 数据读取方法: import pandas as pdimport matplotlib.pyplot as pltimport seaborn as snsfrom sk