当我们走进超市,迎面而来的就是货架上琳琅满目的商品。这些商品的摆放,或者不同品类的货架分布是随机排列的吗?答案是NO!
相必都听说过啤酒与尿布的故事,这两个表面上毫不相关的商品,在超市中摆放在一起时二者的销量都大幅度提升。这里就不讨论这个案例的真实性如何,但用它来理解产品之间的关联十分形象,再说好的故事总是更有传播度。
如果购买商品A的客户,对于商品B,相对于其他商品,有更大的购买概率的话,那么AB商品就具有更高的关联度,为了提高销售额,应尽可能将二者摆放到一起。网店也可以将商品A放在商品B的推荐页中。
首先需挖掘出哪些商品之间存在更大的关联度
下面用PowerBI来进行关联度分析:
假设一家超市的某些产品的销售数据,我们要计算出购买商品A的客户中,有多少客户也同时购买了商品B?这些客户购买了商品B的金额有多大?
1.客户关联度
由于要分析的商品A和商品B都在商品名单表中,为了分别计算相互不影响,复制一个商品名单表,这里命名为'商品名单2',与订单表建立虚线关系,数据模型如下图,
将商品名单表中的产品名称拖入到表格中,作为商品A,然后利用下面这个度量值计算商品A的客户数量,
[客户数] =COUNTROWS(VALUES('订单表'[单号]))
然后利用商品名单2表中的商品名称,生成一个切片器,以便选择不同的产品,关联产品假设为商品B。
下面这个是计算关联分析的重点,购买了A的客户中,有多少客户也购买了产品B?
也就是同时购买A和B的客户数,度量值如下:
同时购买A和B的客户数 =
VAR B=
CALCULATETABLE(
VALUES('订单表'[单号]),
USERELATIONSHIP('商品名单2'[商品名称],'订单表'[商品名称]),
ALL('商品名单'[商品名称])
)
RETURN CALCULATE([客户数],B)
通过以上两个度量值相除,就可以计算出关联产品的客户占比,
关联客户占比 = DIVIDE([同时购买A和B的客户数],[客户数])
把上面这几个度量值放入表格中,通过点击不同的关联产品,就可以自动计算出商品A和商品B之间的重复客户占比,
但是 两个商品的客户的重合度高,不代表带来的销售额就更高 ,所以还要分析一下,购买A的客户中,同时购买的商品B销售额有多少?通过金额这个维度来分析一下关联性。
2.销售金额关联性
先来写两个简单的度量值,商品A的销售额和商品B的销售额:
商品A的销售额:
销售额 =SUM('订单表'[销售金额])
商品B的销售额:
关联产品B的销售额 =?
CALCULATE([销售额],
USERELATIONSHIP('商品名单2'[商品名称],'订单表'[商品名称]),
ALL('商品名单'[商品名称]) )
由于商品B来自于商品名单2表,而商品名单2表与订单表是虚线关系,所以用?USERELATIONSHIP来激活关系。它主要是为了计算购买商品A的客户中,购买了商品B的金额有多少?
然后就可以计算同时购买A和B的客户中,购买商品B的金额。
A客户购买B的金额 =
VAR A=
CALCULATETABLE(VALUES('订单表'[单号]))
VAR B=
CALCULATETABLE(
VALUES('订单表'[单号]),
USERELATIONSHIP('商品名单2'[商品名称],'订单表'[商品名称]),
ALL('商品名单'[商品名称]))
RETURN?
CALCULATE([关联产品B的销售额],
NATURALINNERJOIN(A,B)))
这个度量值的含义是, 先找出商品A和商品B的客户列表,然后通过?NATURALINNERJOIN函数找出这两个客户列表的交集,也就是同时购买了这两种商品的客户 ,然后计算这些客户的商品B销售额就可以了。
同样把这个度量值放到表格中,可以看出关联销售额,
有时候, 客户重合比例高的两个产品,带来的关联产品的销售额并不一定高 ,这个跟商品价格、购买数量都有关系。
3.关联度四象限分析
通过上面的几个度量值,获得了相关分析的数据,为了更直观的展示出产品之间的关联度,这里使用 四象限分析法 来展示。
其实就是制作一个散点图,将两个维度: 关联客户占比 作为Y轴, A客户购买B的金额 作为X轴,并按客户占比、关联产品销售额的平均线作为恒线,切割出四个象限,并利用 商品名称 作为图例,显示效果如下:
出现在第一象限(右上角)的产品,就是与切片器选中的商品不仅客户重合度高,而且带来的销售额也更高,具有高相关性,应该特别关注。
该模型还可以分析某一段时间的关联性,比如促销期间、节假日期间,客户的购买特征很可能与平时是不同的。
至此,一个简单的关联商品分析模型建立完成,根据关联商品的不同,动态显示不同的高相关度产品,并且可以随着时间段的变化而变化,
如果有客户画像、销售地点等数据,还可以将这些数据作为外部筛选器,挖掘出不同客户、不同地域的关联产品组合。
当然,这个模型挖掘的关联商品只是初步结果,还应对这个结果进行进一步验证,避免因偶然或人为因素导致的关联性,比如是否有某两种商品的捆绑销售活动等。
关联商品分析是非常有用的数据挖掘方式,能够帮助企业进行商品精准营销、商品组合以及发现更多潜在客户,真正的利用数据,为企业创造价值。