SPSS相关分析在游戏中的应用

SPSS:相关分析在游戏数据分析测试中的应用

借助科技的力量,进入了大数据时代,收集数据的能力大大提高。分析师每天都要处理这些“大”数据。在游戏行业,我们有成熟的AARRR模式,建立从客户获取、活跃度、流失和留存、收入到用户传播的完美闭环。除了常规指标之外,我们还会在分析过程中建立很多临时指标来辅助分析。面对如此多的统计数据,我们会好奇这些指标或变量之间是否存在某种相关性,相关程度如何。这就是我们今天要分享的——相关性分析。

?统计学上用相关系数来描述变量之间的关系。相关系数的符号(+/-)表示关系的方向(正相关/负相关),其值表示关系的强度。下图是对相关系数的解释。

表1解释了相关系数。

相关系数的大小一般解释为0.8 ~ 1.0,非常强相关0.6 ~ 0.8,中等相关0.4 ~ 0.6,弱相关0.2 ~ 0.4,弱相关0.0 ~ 0.2,弱相关或不相关。下面是游戏中关联分析的几个应用场景。

1.玩家的支付能力

?有哪些因素与评价一个玩家的支付能力有关,在多大程度上有关?

?与玩家支付能力相关的因素有性别、年龄、受教育程度、游戏时长、游戏频率甚至游戏中的好友数量。这些或多或少与支付能力有关。应当注意,诸如性别的分类变量不支持以下情况中的实现,并且需要两列相关系数。

2.游戏收入

?可能与游戏日收入相关的因素有付费人数、活跃玩家人数、付费率、ARPU、出售道具数量、道具价格、玩家总时长(玩家日总时长)。哪些因素与收入密切相关,哪些因素只是偶然?这些将在下一个案例中详细讨论。

3.道具销售

?游戏中做关联分析的地方远不止这三个场景。理论上,所有因素都可以进行相关分析,相关程度可以用相关系数来反映。还是建议不要盲目分析,在不同的时间段根据自己的分析目的进行探索性的分析和验证。

?接下来,我们来看一个相关性分析的案例。工具的选择可以根据个人喜好。Excel虽然也可以进行相关分析,但是只列出了相关系数,无法进行统计显著性检验,所以推荐使用SPSS。

?首先,把要分析的数据整理出来。在这里,我们收集一款游戏在两个月内的日收入、玩家数量、日付费率、付费人数、出售道具数量等数据。

?选择分析->;相关-& gt;二元变量,然后选择要研究的变量,如下所示:

?点击确定,得到如下分析结果:

相关性?日付费率付费人数道具销售人数玩家收入人数日付费率皮尔逊相关1.976 * * 542 * * 070+0 * *显著性(两条尾巴)?000.000.586.000N6262626262收款人皮尔逊相关. 976 * * 1.558 * * 276 * . 954 * *显著性(两个尾部). 000?000.030.000N6262626262道具销售皮尔逊相关. 542 * * 558 * * 1.195.609 * *显著性(两个尾巴). 000.000?129.000n 626262626262球员人数的皮尔逊相关. 070.276 * . 1951.142显著性(双尾). 58686.0306606666 272N6262626262皮尔逊相关. 961 * * . 954 * * 609 * * 6509。N6262626262** * *。当置信度(双重检验)为0.01时,相关性显著。*.当置信度(双重检验)为0.05时,相关性显著。?结果稍微复杂一点(SPSS结果比较全面,有些指标不需要关注)。我们只选择需要看的数据,只看最后一行(蓝色部分),也就是收入和其他因素的相关性。

?从以上结果可以看出,收入与日缴费率和缴费人数的相关系数分别为0.961和0.954,具有很强的相关性。收入与道具销售的相关系数为0.609,为中度相关。显著性为0.000,远小于0.05,说明分析结果显著。而收入与玩家数(日活跃)的相关系数为0.142,弱相关,从0.272的显著性检验结果来看大于0.05,说明玩家数与收入的相关性不显著,二者之间存在一定的偶然性。

?以上例子中的分析结果并不代表整个游戏行业的数据表现。本文只是传达一种分析方法,在游戏运营中做一些探索性的关联分析,或许能发现巨大的价值和规律。另外,相关性分析只是分析变量之间是否相关以及相关到什么程度,并不意味着变量之间一定有因果关系。就像卖冰棍和火灾次数有很大的相关性一样,都和高温(炎热的夏天)有关。下一篇文章将讨论回归分析,用数据模型量化这种相关性,并做一些预测。

以上是边肖分享的关于SPSS相关分析在游戏中应用的相关内容。更多信息可以关注环球常春藤,分享更多干货。