本文主要是介绍Black_Friday数据分析--缺失值,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
一、数据集简介
黑色星期五---通过消费者行为研究销售
数据集包含55万个零售商店在黑色星期五的销售记录,它包含不同种类的变量或数字或分类。它包含缺失的值。数据集来自Analytics Vidhya主办的竞赛。
二、数据导入
使用panda将数据导入为数据框类型,为 bf
三、处理缺失值
1.检查是否存在缺失值
Product_Category_2和Product_Category_3返回值为True,只有该2个字段存在缺失值。而User_ID 和Product_ID不存在缺失值,数据较为完整。
2.计算缺失值的比率
Product_Category_3的缺失值较高,约达70%
3.缺失值填充
Product_Category的取值为数字,可理解为表示商品属于该类别的程度(0-18),使用 0 填充。并检查是否替换成功。
缺失值处理完毕
未完待续。。。。。。
这篇关于Black_Friday数据分析--缺失值的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!