本文主要是介绍用pandas分析电影评分与票房的关系,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
使用Jupyter的API,pandas和matplotlib。pandas进行数据获取,生成dataframe矩阵,matplotlib进行画图。最终得到电影评分与票房的关系。
数据库包括了1000条电影信息,代码如下:
import pandas as pd
import matplotlib.pyplot as plt
from pylab import mpl #设置字体
mpl.rcParams["font.sans-serif"] = ["SimHei"]
mpl.rcParams["axes.unicode_minus"]=False
data = pd.read_csv("E:\\IMDB-Movie-Data.csv") #导入数据
plt.figure(figsize=(20,8),dpi=100) #设置画布尺寸
dataframe=data.sort_values(by='Metascore') #按评分排序
x = dataframe["Metascore"] #设置x坐标轴
y = dataframe["Revenue (Millions)"] #设置y坐标轴
plt.plot(x,y) #绘制折线图
plt.xlabel("评分")
plt.ylabel("票房")
plt.grid(True,linestyle="--",alpha=1) #画网格
plt.title("评分与票房关系图",fontsize=20) #图像标题
plt.savefig("./count.png") #保存图像
plt.show() #显示图像
结果演示:
结果分析:可以看出评分极低和极高的票房都不尽如人意,而高票房电影集中在60-80分,说明大部分人的审美观点是统一的。人们对于烂片肯定抵触,但高评分的好片票房却也不高,因此从侧面证明一部成功的商业片必有瑕疵;那种不食人间烟火的高质量文艺片,还要靠人们的文化审美水平提升去补救啊!!
这篇关于用pandas分析电影评分与票房的关系的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!