数模优秀论文总结—2018“大型百货商场会员画像描绘”

本文主要是介绍数模优秀论文总结—2018“大型百货商场会员画像描绘”,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

针对2018年数学建模国赛优秀论文分析思路进行简单总结

  1. 基于RFMT模型的百货商场会员画像描绘
  2. 大型百货商场会员画像描述
  3. 基于RFMS 指标的大型百货商场会员画像数据挖掘

1 基于RFMT模型的百货商场会员画像描绘

点击下载原论文pdf

1.1 待解决问题

1、对该商场的会员消费特征以及会员与非会员差异进行分析,并说明会员给商场带来的价值

2、建立刻画会员购买力的数学模型,对会员的价值进行识别

3、在某个时间窗口,建立会员生命周期和状态划分的数学模型

4、计算会员生命周期中非活跃会员的激活率,并确定激活率和商场促销活动之间的关系模型

5、根据会员的喜好和商品的连带率设计促销方案帮助商家策划促销活动

1.2 解决思路

通过EXCELSQL Server进行数据预处理工作(注意对数据表进行关联)

1、对于问题一,运用数据统计分析的方法来对会员信息进行分析。问题中需要根据会员消费明细表分析会员的消费特征,主要从三个维度来分析:购买力(会员消费金额、会员消费指数、购买数量)、时间偏好(季节性倾向)、消费偏好(特价商品消费占比、高价商品消费占比)。而对于会员与非会员群体之间的差异,从购买力以及购买数量的角度深入分析会员与非会员带给商场的价值差异,进而分析会员给商场带来的价值。——描述性统计

2、对于问题二,在众多的用户价值分析模型中,RFM 模型是衡量客户价值和增益能力的重要工具,考虑到本文研究对象为大型百货商场,相对消费会较为高端,可以增加一个反映会员一次性消费的最高能力的指标,故我们引入改进的RFM 模型——RFMT 模型,对会员购买力进行刻画,并通过RFMT 模型的会员得分对每个会员进行价值等级划分,最终可得知每一位会员对于商场的价值。应用层次分析法计算RFMT模型每个指标的指标权重,构建指标得分规则计算RFMT指标的得分,最终通过K-means 聚类法对会员群体进行价值等级分类。

3、对于问题三,基于问题二中的RFMT模型,选取R(会员最近一次购买商品的时间间隔天数)和F(会员在限定时间内购买商品的频率)指标作为聚类依据,运用Clementine 软件,应用K-means 聚类法对有消费记录的会员进行状态聚类,最终可知每个会员所处的生命周期状态。

4、对于问题四,从问题三的聚类结果中可筛选出非活跃状态的会员,给非活跃会员构建分析指标:R、F、M、T 指标,针对非活跃会员的RFMT 指标进行因子分析,可得到相应指标的因子得分,以每个公因子的方差贡献率作为权重系数,对每个因子进行加权求和,从而计算得到各非活跃会员的激活率。对于非活跃会员激活率和商场促销活动之间的关系模型,考虑到商场促销活动与特价商品有关,结合非活跃会员的激活率和特价商品消费总金额在商品消费总金额中的占比,利用SAS软件相关性分析,得到激活率和商场促销活动之间的关系模型。

5、对于问题五,针对会员消费情况,使用Clementine软件对会员购买的商品进行关联规则挖掘。第一阶段必须先从会员消费数据集中找出所有的高频商品,第二阶段再由这些高频商品中产生关联规则。

1.3 摘要

在这里插入图片描述

1.4 小的注意点

1、变量说明部分两个变量及符号解释在一行,不仅节省空间,也美观

2、重要结果若数据过多,可以只展示一小部分


2 大型百货商场会员画像描述

点击下载原论文pdf

2.1 解决思路

1、对于问题一,首先根据附件一和附件二的单据号,借助SQL Server数据库的存储与处理功能提取出会员与非会员的消费数据,再借助EXCEL统计出会员的消费金额、购买数量及购买商品的平均价格,非会员的消费金额、购买数量及购买商品的平均价格。为了研究会员与非会员之间的消费特征差异,以及会员给商场带来的价值,将两者的消费特征数据进行对比,对于商场而言,消费金额越高,给商场带来的价值就越大。

2、对于问题二,为了对会员的购买力进行刻画,根据会员的消费特征,对会员进行分类,建立分类模型。本题选用K-均值聚类法,运用SPSS软件对筛选整理好的数据进行聚类。

3、对于问题三,在研究会员的生命周期的时候,通过对数据的分析,把最近没有消费行为天数和消费次数,作为划分会员生命周期阶段的指标,把会员生命周期划分为五个阶段:引入期-成长期-成熟期-休眠期-流失期。

4、对于问题四,:定义:激活率=当月活跃人数占比-上月活跃人数占比。会员当月有消费记录则当月为活跃状态,否则当月为非活跃状态。取登记时间为2015年到2016年共13671个会员为研究对象,根据其消费明细统计得到2017年活跃状态矩阵,表1中1代表当月为非活跃状态,2表示当月为活跃状态。基于活跃状态矩阵采用Matlab计算其**马尔科夫状态转移矩阵。**通过线性拟合可得销售量与激活率的关系表达式为一元二次方程。

5、对于问题五,首先根据会员卡号+消费时间+商品编码删除一次消费中商品重复数据,然后根据会员卡号+消费时间提取每次购物篮商品数据,最后采用购物篮数据采用FP-Growth算法,对会员消费明细数据进行关联分析,支持度计数设为50,即规则支持度计数大于等于50才是频繁项集。

2.2 摘要

在这里插入图片描述

2.3 小的注意点

1、对于“会员画像”的描述,可以采用E-R图完成,提供实体(即数据对象)、属性、和联系的方法


3 大型百货商场会员画像描述

点击下载原论文pdf

3.1 解决思路

1、对于问题一,对于该商场会员的消费特征分析,以附件1中本地会员的卡号(kh)作为唯一识别特征,与附件3中会员消费明细表(包括本地会员和非本地会员)进行匹配,筛选出在此期间本地会员的的消费明细,从消费行为特征(会员购买频次、消费总额、平均购买金额和单次最高消费)以及人口学信息特征(会员年龄阶段、性别)分析该商场本地会员的消费特征。对于会员与非会员群体的差异分析,以附件3中会员消费明细表中的会员消费产生的时(dtime)、商品编码(spbm)和消费金额(je)作为识别特征,与附件2销售流水表进行匹配,分离出此期间会员(本地会员)以及非会员(非本地会员和非会员)的消费信息,以消费行为特征(会员购买频次、消费总额、平均购买金额)为指标比较两个群体的差异,并结合具体数据分析会员群体给商场带来的价值。会员价值效应

2、对于问题二,构建每一位会员购买力模型时,基于附件3数据,借鉴传统RFM方法中“购买频次(F)”和“消费总额(M)”指标,结合问题一中直观体现购买能力的“单次最高消费(Single peak consumption,S)”指标,建立**“FMS”会员购买力评价模型**。每个指标按整体会员消费情况百分位阈值赋予不同“评价分数”,并结合各指标的系数计算出每位会员购买力的评分。

3、对于问题三,首先,确定滑动的研究时间窗口,起初为半年,其后以半年为单位逐渐增加,共有6个时间窗口。其次,确定时间窗口后,明确每个会员生命周期的算法;接着,在问题二模型基础上,建立判别会员活跃状态的“RF”模型,算出每个时间窗口内生命周期与活跃状态之间的概率分布关系;最后比较时间窗口滑动后,生命周期与活跃状态随时间变化的关系。

4、对于问题四,:计算激活率同样基于问题三中时间窗口滑动的考量。追踪在原时间窗口中为非活跃的会员、在下一个窗口中变为一般活跃或很活跃的人数占原时间窗口中非活跃会员总数,将其定义为该时段内的非活跃会员激活率。问题三设定了6个时间窗口,因而可得出5个时段内的激活率,依此分析非活跃会员转化为活跃会员的可能性。此外,结合实际销售数据,追踪分析原非活跃会员是否与商场促销活动的相关指标存在关系。

5、对于问题五,需要分别计算出会员的消费偏好以及消费时的连带情况,进而策划促销活动。首先,通过附件3中本地会员消费流水中的商品名称和附件4中匹配,分析所有本地会员的消费品牌编码(不同的名牌标码计算其对应的购买次数),借此得出会员消费时喜爱的品牌类别排行;其次,分析会员喜爱的品牌中商品的连带情况,由该品牌购买总数量和有效单据数确定商品的交叉连带率

3.2 摘要

在这里插入图片描述

3.3 小的注意点

1、对于部分指标的计算,可以自己根据文献或相关资料进行定义


这篇关于数模优秀论文总结—2018“大型百货商场会员画像描绘”的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/274584

相关文章

HarmonyOS学习(七)——UI(五)常用布局总结

自适应布局 1.1、线性布局(LinearLayout) 通过线性容器Row和Column实现线性布局。Column容器内的子组件按照垂直方向排列,Row组件中的子组件按照水平方向排列。 属性说明space通过space参数设置主轴上子组件的间距,达到各子组件在排列上的等间距效果alignItems设置子组件在交叉轴上的对齐方式,且在各类尺寸屏幕上表现一致,其中交叉轴为垂直时,取值为Vert

学习hash总结

2014/1/29/   最近刚开始学hash,名字很陌生,但是hash的思想却很熟悉,以前早就做过此类的题,但是不知道这就是hash思想而已,说白了hash就是一个映射,往往灵活利用数组的下标来实现算法,hash的作用:1、判重;2、统计次数;

透彻!驯服大型语言模型(LLMs)的五种方法,及具体方法选择思路

引言 随着时间的发展,大型语言模型不再停留在演示阶段而是逐步面向生产系统的应用,随着人们期望的不断增加,目标也发生了巨大的变化。在短短的几个月的时间里,人们对大模型的认识已经从对其zero-shot能力感到惊讶,转变为考虑改进模型质量、提高模型可用性。 「大语言模型(LLMs)其实就是利用高容量的模型架构(例如Transformer)对海量的、多种多样的数据分布进行建模得到,它包含了大量的先验

git使用的说明总结

Git使用说明 下载安装(下载地址) macOS: Git - Downloading macOS Windows: Git - Downloading Windows Linux/Unix: Git (git-scm.com) 创建新仓库 本地创建新仓库:创建新文件夹,进入文件夹目录,执行指令 git init ,用以创建新的git 克隆仓库 执行指令用以创建一个本地仓库的

BUUCTF靶场[web][极客大挑战 2019]Http、[HCTF 2018]admin

目录   [web][极客大挑战 2019]Http 考点:Referer协议、UA协议、X-Forwarded-For协议 [web][HCTF 2018]admin 考点:弱密码字典爆破 四种方法:   [web][极客大挑战 2019]Http 考点:Referer协议、UA协议、X-Forwarded-For协议 访问环境 老规矩,我们先查看源代码

二分最大匹配总结

HDU 2444  黑白染色 ,二分图判定 const int maxn = 208 ;vector<int> g[maxn] ;int n ;bool vis[maxn] ;int match[maxn] ;;int color[maxn] ;int setcolor(int u , int c){color[u] = c ;for(vector<int>::iter

整数Hash散列总结

方法:    step1  :线性探测  step2 散列   当 h(k)位置已经存储有元素的时候,依次探查(h(k)+i) mod S, i=1,2,3…,直到找到空的存储单元为止。其中,S为 数组长度。 HDU 1496   a*x1^2+b*x2^2+c*x3^2+d*x4^2=0 。 x在 [-100,100] 解的个数  const int MaxN = 3000

状态dp总结

zoj 3631  N 个数中选若干数和(只能选一次)<=M 的最大值 const int Max_N = 38 ;int a[1<<16] , b[1<<16] , x[Max_N] , e[Max_N] ;void GetNum(int g[] , int n , int s[] , int &m){ int i , j , t ;m = 0 ;for(i = 0 ;

go基础知识归纳总结

无缓冲的 channel 和有缓冲的 channel 的区别? 在 Go 语言中,channel 是用来在 goroutines 之间传递数据的主要机制。它们有两种类型:无缓冲的 channel 和有缓冲的 channel。 无缓冲的 channel 行为:无缓冲的 channel 是一种同步的通信方式,发送和接收必须同时发生。如果一个 goroutine 试图通过无缓冲 channel

9.8javaweb项目总结

1.主界面用户信息显示 登录成功后,将用户信息存储在记录在 localStorage中,然后进入界面之前通过js来渲染主界面 存储用户信息 将用户信息渲染在主界面上,并且头像设置跳转,到个人资料界面 这里数据库中还没有设置相关信息 2.模糊查找 检测输入框是否有变更,有的话调用方法,进行查找 发送检测请求,然后接收的时候设置最多显示四个类似的搜索结果