Python练习 -- 通过电影票房数据统计不同类型的票房总数

本文主要是介绍Python练习 -- 通过电影票房数据统计不同类型的票房总数，希望对大家解决编程问题提供一定的参考价值，需要的开发者们随着小编来一起学习吧！

Python练习 – 对单元格进行拆分并保留其他行数据

1.需求

从一份电影票房数据中按照电影类型分类，统计出不同类型的票房总数
在这里插入图片描述

2.数据处理

在前期的数据处理中需要将各个电影类型进行拆分，通过以下python代码实现

data = pd.read_csv('movie_metadata.csv')data_new = data.drop(['genres'], axis=1).join(data['genres'].str.split('|', expand=True).stack().reset_index(level=1, drop=True).rename('genres_new'))#代码拆分
# data_1 = data['genres'].str.split('|', expand=True)  #expand表示切分的数据时分列显示
# data_1 = data_1.stack() #进行行转列
# data_1 = data_1.reset_index(level=1, drop=True).rename('genres_new')
# data_new = data.drop(['genres'], axis=1).join(data_1) #删除原列并将新列加入原表#为了呈现效果将新加入末尾的列插入到原列位置
data_lsit = data_new.columns.tolist()for name in data_lsit:if name in ['genres_new']:data_lsit.remove(name)data_lsit.insert(data_lsit.index('gross')+1,name)data_new = data_new.reindex(columns=data_lsit)data_new.head(10)

处理结果如下
在这里插入图片描述
在将每个电影分类拆分后就可以通过groupby来将各个电影类型进行聚合统计

data_new.groupby(by='genres_new',as_index=False)['gross'].sum().sort_values('gross',ascending=False) # data_new.groupby(by='genres_new',as_index=False).sum()[['genres_new','gross']].sort_values('gross',ascending=False) #两种写法得到的结果是一样的#在这里为了更直观的查看结果，通过设置取消科学计数法
pd.set_option('display.float_format', lambda x: '%.2f' % x)
# pd.set_option('display.max_columns', 10000, 'display.max_rows', 10000)  网上有说这个方法也可以，但是我运行完结果还是显示科学计数法