本文主要是介绍Olist巴西电商数据分析(一),希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
Olist巴西电商数据分析
下篇指路:https://blog.csdn.net/jlycd/article/details/114001930
文章目录
- Olist巴西电商数据分析
- 项目背景
- 分析目标
- 搭建数据分析架构
- 数据分析
- 用户维度
- 商家维度
- 商品维度
- 销售维度
- 总结与建议
项目背景
本项目是来自kaggle上的数据集案例,记录了巴西电商平台Olist 2016,2018的真实业务数据数据,包含以下的内容。
分析目标
1.通过用户,商家,产品,销售四个维度分析该平台的总体经营状况和所处阶段
2.发现平台存在的问题,分析原因,给出相应的建议
3.对于异常指标的变化,分析原因
4.对未来的工作给出总体方向,目标和合理化建议
搭建数据分析架构
主要通过用户,商家,产品,销售四个维度来展开分析各项指标。
使用到的工具主要有python,excel,tableau等
数据分析
用户维度
主要分析的方向有用户的地区分布,用户支付方式,分期偏好,下单时间等行为偏好,以及基于RFM模型将用户进行分层
数据导入处理
import numpy as np
import pandas as pd
payments=pd.read_csv('olist_order_payments_dataset.csv')
customers=pd.read_csv('olist_customers_dataset.csv')
orders=pd.read_csv('olist_orders_dataset.csv')
orders.isnull().sum()
payments.isnull().sum()
customers.isnull().sum() #缺失值查看
由于缺失值仅在order_approved_at,order_delivered_carrier_date,order_delivered_customer_date这三个列出现,而这三列与我们分析工作关系不大,所以可以忽略。
po=pd.merge(payments,orders,how='left',on='order_id')
pc=pd.merge(po,customers,how='left',on='customer_id')#数据合并
state=pd.DataFrame(pc['customer_unique_id'].groupby([pc['customer_state']]).count())
#用户地区分布
该平台的用户大多数来自于SP比例高达42%,其次是RJ和MG。这可能与巴西人口密度分布有关,当然也与平台在其他地区程度的普及程度,当地人购物方式有着很大的关系。
p_type_c=pd.DataFrame(pc['customer_unique_id'].groupby([pc['payment_type'],pc['customer_state']]).
这篇关于Olist巴西电商数据分析(一)的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!