【SPSS】基于RFM+Kmeans聚类的客户分群分析

2024-02-17 08:30

本文主要是介绍【SPSS】基于RFM+Kmeans聚类的客户分群分析,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

3f6a7ab0347a4af1a75e6ebadee63fc1.gif

🤵‍♂️ 个人主页:@艾派森的个人主页

✍🏻作者简介:Python学习者
🐋 希望大家多多支持,我们一起进步!😄
如果文章对你有帮助的话,
欢迎评论 💬点赞👍🏻 收藏 📂加关注+


目录

1.项目背景

2.项目简介

2.1分析目标

2.2数据说明

2.3技术工具

3.算法理论

3.1聚类

3.2 RFM模型

4.实验过程

4.1数据探索

4.2构建RFM模型

4.3聚类分群

5.总结

文末推荐与福利


1.项目背景

        随着行业竞争越来越激烈,商家将更多的运营思路转向客户。例如,购物时,常常被商家推荐扫码注册会员;各种电商平台也推出注册会员领优惠券等推销政策,而这些做法都是为了积累客户,以便对客户进行分析。

       那么,在商家积累的大量的客户交易数据中,如何根据客户历史消费记录分析不同客户群体的特征和价值呢?例如,了解哪些是重要保持客户、哪些是发展客户、哪些是潜在客户,从而针对不同客户群体定制不同的营销策略,实现精准营销、降低营销成本,提高销售业绩,使企业利润最大化。例如,淘宝电商客户繁多,消费行为复杂,客户价值很难人工评估,并对客户进行分类,这就霸要通过科学的分析方法评估客户价值,实现智能客户分类,快速定位客户、当然,也要清醒地认识到,即便是预测的客户价值较高,也只能说明其购买潜力较高,同时必须结合实际与客户互动,推动客户追加购买、交叉购买才是电商努力的方向。

2.项目简介

2.1分析目标

随着行业竞争越来越激烈,商家将更多的运营思路转向客户,客户是企业生存的关键,能够把握住客户就能够掌控企业的未来。客户的需求是客户消费的最直接原因,因此我们主要研究以下问题:

1)企业如何细分客户;

2)哪些是重要的保持客户 ;

3)哪些是发展客户;

4)哪些是潜在客户。

从而针对不同客户群体定制不同的营销策略,使企业利润最大化。

2.2数据说明

     实验使用从网络获取的客户数据集进行分析,数据集中共有2417行,4列数据。我们的目标就是细分客户,从而针对不同客户群体定制不同的营销策略,使企业利润最大化。

db74c8a2503b42d1881c5437ae810093.png

2.3技术工具

本次实验主要使用SPSS软件实现KMeans聚类算法和RFM模型。

3.算法理论

3.1聚类

        聚类,即将物理或抽象对象的集合分成由类似的对象组成的多个类的过程。由聚类所生成的簇是一组数据对象的集合,这些对象与同一个簇中的对象彼此相似,与其他簇中的对象相异。聚类分析又称群分析,它是研究(样品或指标)分类问题的一种统计分析方法。聚类分析起源于分类学,但是聚类不等于分类。聚类与分类的不同在于,聚类所要求划分的类是未知的。聚类分析内容非常丰富,有系统聚类法、有序样品聚类法、动态聚类法、模糊聚类法、图论聚类法、聚类预报法等。在数据挖掘中,聚类也是很重要的一个概念。传统的聚类分析计算方法主要有划分方法、层次方法、基于密度的方法、基于网格的方法、基于模型的方法五种。

3.2 RFM模型

R:最近消费时间间隔,表示客户最近一次消费时间与之前消费时间的距离。

R越大,表示客户越久未发生交易,R越小,表示客户最近有交易发生。R越大,则客户越可能会“沉睡”,流失的可能性越大。在这部分客户中,可能有些优质客户,值得通过一些营销手段进行激活。

F:消费频率,表示一段时间内的客户消费次数。F越大,则表示客户交易越频繁,是非常忠诚的客户,也是对公司的产品认同度较高的客户;F越小,则表示客户不够活跃,且可能是竞争对手的常客。针对F较小、且消费额较大的客户,需要推出一定的竞争策略,将这批客户从竞争对手中争取过来。

M:消费金额,表示客户每次消费金额,可以用最近-次消费金额,也可以用过去的平均消费金额,根据分析的目的不同,可以有不同的标识方法。

一般来讲,单次交易金额较大的客户,支付能力强,价格敏感度低,帕累托法则告诉我们,一个公司80%的收入都是由消费最多的20%客户贡献的,所以消费金额大的客户是较为优质的客户,也是高价值客户,这类客户可采取一对一的营销方案。

4.实验过程

4.1数据探索

首先导入数据

1da8830e4c6c430984ede9ecd55113b0.png

做出数据描述性统计

4fa6ae078da74e4fa8041f7a04af9b1d.png

c7009ca989b947c2b6eb1e1d29b030c0.png

从数据描述性统计分析中我们可以看出各个变量的个案总计、最大最小值、均值、标准差、方差、偏度、峰度等信息。

做出各数值变量的直方图进行分析

77e5f936d3d243328cee43f30eba0a62.png

415bcebe9a7e45b68d73020819d4eb9f.png

14093525a1ec4e87b15746314e416679.png

7a7de8dbac6041e19aace5a42d0d9470.png

be68b3cc49f14047bdfeda2a898af8cb.png

892d54104566469ea4a51d0a6fafe486.png

对各变量进行相关性分析

427a309517d149f985651e9383cfcfe3.png

8344987eca314196bd8655dd479bfc6d.png

从相关性结果看出,消费频率和最近消费时间间隔的相关系数较小,从P值看出,消费频率和最近消费时间间隔相关性不显著;消费频率和消费金额呈正相关,从P值看出,消费频率和消费金额相关性很显著。

4.2构建RFM模型

由于我们的原始数据已经符合RFM模型的要求,所以我们将变量名进行更改

35d941bdb5e94ea0b78ac2d756a02a00.png

由于RFM这三个变量的数值分布过于大,所以需要进行标准化处理

f4e427f7e7d048d49cd73d7d815df733.png

cd0f8f4c9c044b63966ea8bb408f7863.png

4.3聚类分群

使用SPSS进行K-均值聚类

af54c4e3262c4165aa2bb2ac7194a10f.png

5d1b749402be45ddb177ff4beaa3eff7.png

从结果中,我们可以看出各个变量的聚类中心。

b5422e5eb19641a58bddb28cd76e590f.png

从结果中可看出各每一次的迭代记录。

a1c36b73262e40bf94230ff593149218.png

从结果中可看出最终的聚类中心以及每个聚类类别的个数。

5.总结

        最后我们将客户群按价值高低进行分类和排名,客户群1是潜在客户;客户群3是一般发展客户,客户群2是一般保持客户,客户群4是重要保持客户。

R

F

M

聚类类别

客户类别

客户数

排名

1

潜在客户

2294

4

3

一般发展客户

120

3

2

一般保持客户

2

2

4

重要保持客户

1

1

根据以上分析,得到客户分类的依据:

(1)重要保持客户:F、M高,R略高于平均分。他们是淘宝电商的高价值客户,是最为理想型的客户类型,他们对企业品牌认可,对产品认可,贡献值最大,所占比例却非常小。这类客户花钱多又经常来,但是最近没来,这表示他们是一段时间没来的忠实客户。淘宝电商可以将这类客户作为VIP客户进行一对一营销,以提高这类客户的忠诚度和满意度,尽可能延长这类客户的高水平消费。

(2)一般保持客户: F高,这类客户消费次数多,是忠实的客户。针对这类客户应多传递促销活动、品牌信息、新品或活动信息等。

(3)潜在客户: R、F和M低,这类客户短时间内在店铺消费过,消费次数和消费金额较少,是潜在客户。虽然这类客户的当前价值并不是很高,但却有很大的发展潜力。针对这类客户应进行密集的营销信息推送,增加其在店铺的消费次数和消费金额。

(4)一般发展客户:低价值客户,R高,F、M低,说明这类客户很长时间没有在店铺进行交易了,而且消费次数和消费金额也较少。这类客户可能只会在店铺打折促销活动时才会消费,要想办法推动客户的消费心理,否则会有流失的危险。

文末推荐与福利

《MATLAB科学计算从入门到精通》免费包邮送出3本!

9da50a94f33f439286f1884391272e4c.jpeg

内容简介:   

        本书从 MATLAB 基础语法讲起,介绍了基于 MATLAB 函数的科学计算问题求解方法,实现了大量科学计算算法。

        本书分为三大部分。第 1 章和第 2 章为 MATLAB 的基础知识,对全书用到的 MATLAB 基础进行了简单介绍。第 3 ~ 12 章为本书的核心部分,包括线性方程组求解、非线性方程求解、数值优化、数据插值、数据拟合与回归分析、数值积分、常微分方程求解、偏微分方程求解、概率统计计算及图像处理与信号处理等内容。第 13 ~ 15 章为实战部分,以实际生活中的数学问题为例,将前文介绍的各类科学计算算法应用其中。

本书内容全面、通俗易懂,适合有一定 MATLAB 基础、想要进行进阶学习的读者。

编辑推荐:

从代码到函数,掌握多种经典算法

跨越多个领域,精通各类科学计算

多种应用实例,高效解决实际问题

  • 抽奖方式:评论区随机抽取3位小伙伴免费送出!
  • 参与方式:关注博主、点赞、收藏、评论区评论“人生苦短,拒绝内卷!”(切记要点赞+收藏,否则抽奖无效,每个人最多评论三次!
  • 活动截止时间:2023-11-1 20:00:00
  • 京东购买链接:https://item.jd.com/14098836.html

 名单公布时间:2023-11-1 21:00:00

ad74f862c1244cf3b5ee1643e466cd8d.png 

 

这篇关于【SPSS】基于RFM+Kmeans聚类的客户分群分析的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/717218

相关文章

性能分析之MySQL索引实战案例

文章目录 一、前言二、准备三、MySQL索引优化四、MySQL 索引知识回顾五、总结 一、前言 在上一讲性能工具之 JProfiler 简单登录案例分析实战中已经发现SQL没有建立索引问题,本文将一起从代码层去分析为什么没有建立索引? 开源ERP项目地址:https://gitee.com/jishenghua/JSH_ERP 二、准备 打开IDEA找到登录请求资源路径位置

客户案例:安全海外中继助力知名家电企业化解海外通邮困境

1、客户背景 广东格兰仕集团有限公司(以下简称“格兰仕”),成立于1978年,是中国家电行业的领军企业之一。作为全球最大的微波炉生产基地,格兰仕拥有多项国际领先的家电制造技术,连续多年位列中国家电出口前列。格兰仕不仅注重业务的全球拓展,更重视业务流程的高效与顺畅,以确保在国际舞台上的竞争力。 2、需求痛点 随着格兰仕全球化战略的深入实施,其海外业务快速增长,电子邮件成为了关键的沟通工具。

SWAP作物生长模型安装教程、数据制备、敏感性分析、气候变化影响、R模型敏感性分析与贝叶斯优化、Fortran源代码分析、气候数据降尺度与变化影响分析

查看原文>>>全流程SWAP农业模型数据制备、敏感性分析及气候变化影响实践技术应用 SWAP模型是由荷兰瓦赫宁根大学开发的先进农作物模型,它综合考虑了土壤-水分-大气以及植被间的相互作用;是一种描述作物生长过程的一种机理性作物生长模型。它不但运用Richard方程,使其能够精确的模拟土壤中水分的运动,而且耦合了WOFOST作物模型使作物的生长描述更为科学。 本文让更多的科研人员和农业工作者

MOLE 2.5 分析分子通道和孔隙

软件介绍 生物大分子通道和孔隙在生物学中发挥着重要作用,例如在分子识别和酶底物特异性方面。 我们介绍了一种名为 MOLE 2.5 的高级软件工具,该工具旨在分析分子通道和孔隙。 与其他可用软件工具的基准测试表明,MOLE 2.5 相比更快、更强大、功能更丰富。作为一项新功能,MOLE 2.5 可以估算已识别通道的物理化学性质。 软件下载 https://pan.quark.cn/s/57

线性代数|机器学习-P36在图中找聚类

文章目录 1. 常见图结构2. 谱聚类 感觉后面几节课的内容跨越太大,需要补充太多的知识点,教授讲得内容跨越较大,一般一节课的内容是书本上的一章节内容,所以看视频比较吃力,需要先预习课本内容后才能够很好的理解教授讲解的知识点。 1. 常见图结构 假设我们有如下图结构: Adjacency Matrix:行和列表示的是节点的位置,A[i,j]表示的第 i 个节点和第 j 个

衡石分析平台使用手册-单机安装及启动

单机安装及启动​ 本文讲述如何在单机环境下进行 HENGSHI SENSE 安装的操作过程。 在安装前请确认网络环境,如果是隔离环境,无法连接互联网时,请先按照 离线环境安装依赖的指导进行依赖包的安装,然后按照本文的指导继续操作。如果网络环境可以连接互联网,请直接按照本文的指导进行安装。 准备工作​ 请参考安装环境文档准备安装环境。 配置用户与安装目录。 在操作前请检查您是否有 sud

线性因子模型 - 独立分量分析(ICA)篇

序言 线性因子模型是数据分析与机器学习中的一类重要模型,它们通过引入潜变量( latent variables \text{latent variables} latent variables)来更好地表征数据。其中,独立分量分析( ICA \text{ICA} ICA)作为线性因子模型的一种,以其独特的视角和广泛的应用领域而备受关注。 ICA \text{ICA} ICA旨在将观察到的复杂信号

【软考】希尔排序算法分析

目录 1. c代码2. 运行截图3. 运行解析 1. c代码 #include <stdio.h>#include <stdlib.h> void shellSort(int data[], int n){// 划分的数组,例如8个数则为[4, 2, 1]int *delta;int k;// i控制delta的轮次int i;// 临时变量,换值int temp;in

三相直流无刷电机(BLDC)控制算法实现:BLDC有感启动算法思路分析

一枚从事路径规划算法、运动控制算法、BLDC/FOC电机控制算法、工控、物联网工程师,爱吃土豆。如有需要技术交流或者需要方案帮助、需求:以下为联系方式—V 方案1:通过霍尔传感器IO中断触发换相 1.1 整体执行思路 霍尔传感器U、V、W三相通过IO+EXIT中断的方式进行霍尔传感器数据的读取。将IO口配置为上升沿+下降沿中断触发的方式。当霍尔传感器信号发生发生信号的变化就会触发中断在中断

kubelet组件的启动流程源码分析

概述 摘要: 本文将总结kubelet的作用以及原理,在有一定基础认识的前提下,通过阅读kubelet源码,对kubelet组件的启动流程进行分析。 正文 kubelet的作用 这里对kubelet的作用做一个简单总结。 节点管理 节点的注册 节点状态更新 容器管理(pod生命周期管理) 监听apiserver的容器事件 容器的创建、删除(CRI) 容器的网络的创建与删除