格兰杰因果检验详细步骤_如何判断格兰杰因果关系

2024-12-1205:00:30创业资讯1

在产品的数据管理中,除了活跃数据外,留存数据的价值亦不可忽视。优化留存策略同样能提升用户的活跃度。数据分析师常常面临的问题之一便是:我们该如何提升我们的用户留存率?这个问题频繁出现,是否让您感到困扰呢?

互联网思维强调用户至上,只有留住用户才能进一步推动业务的发展。那么,我们应如何利用数据来挖掘提升留存的关键行为呢?如何解决这一令我们感到困扰的问题呢?

我们的探究目标:具体涉及哪些行为是影响留存的关键因素?这些行为与留存之间哪一方面的相关性最为突出?这些关键行为与留存之间是否存在因果关系?

分析思路与方法:

关键行为的提取过程颇为繁复。这需要通过SQL从数据仓库中筛选出与留存相关的数据行为,这既复杂又耗时。

采用统计学的方法计算行为与留存的相关性。行为与留存的相关性系数越大,说明该行为对留存的影响越大。例如,抖音使用频率和留存的相关系数比较中,刷抖音的时长(0.8的相关系数)比刷抖音的次数(0.6的相关系数)更能反映留存情况。

值得注意的是,数据中的相关关系不等于因果关系。比如喜欢的粉丝与他唱歌好听是相关的,但我们不能直接断定后者是前者的原因,可能还有其他因素如颜值等影响。类似地,我们分析出的关键行为不一定就是决定留存的真正原因,可能只是与其有相关性。

为了进一步明确原因关系,我们会利用Granger因果检验的方法来推断。例如,当我们确认了某一行为是留存的原因时,如一周内刷抖音的时间决定着用户下一周是否会继续留存,接下来就需要找出这一行为中影响留存的“magic number”。

这个“magic number”如同一个神秘的阈值,如一周内刷抖音达到288分钟时,用户下周的留存率会显著提高。在互联网行业中,“magic number”常被用来描述影响产品留存的关键指标。

以某直播app为例,与留存相关的行为包括登录、观看、弹幕互动和付费行为等大类。在这些大类下,我们再细究具体的指标描述。例如,描述登录行为时,我们使用30天和7天的登录天数;还可能使用比率型指标,如最近30天与过去30天的登录天数比值,以此反映用户的活跃度变化。

经过上述步骤提取出所有与留存相关的行为特征后,接下来就要计算这些特征与留存的相关性。根据分析结果得出以下四个影响留存的主要因素:

  1. 30天或7天的登录天数(相关度:0.66)
  2. 30天观看的品类数量(相关度:0.44)
  3. 30天观看的不同主播数(相关度:0.37)
  4. 30天的日均观看时长(相关度:0.26)

虽然我们找出了与留存相关的行为特征,但要确定这些特征是否是真正的原因还需要通过Granger因果检验的方法来验证。

格兰杰因果关系的定义在经济学中常被应用:若包含变量X和Y的过去信息后,X的加入能更准确地预测Y的未来变化,那么认为X是引起Y变化的格兰杰原因。在此情境下,对于我们是否接受X和Y间不存在因果关系的原假设——当检验出的P值大于0.05时我们接受原假设;反之则拒绝原假设。

结论要点:在探寻了影响留存的原因后,我们致力于找到这些行为特征的具体阈值以更好地预测留存概率的上升点。为此我们研究了30天登录天数、7天登录天数、月日均观看时长、30天观看主播数、30天观看品类数等指标与留存的关系。

下面为相应的数据图示:以30天登录天数为例,横轴表示不同的登录天数,纵轴表示留存率。当横轴数值为7时,我们发现留存率趋于稳定状态,这就是所谓的aha moment。

在分析过程中我们发现了几个关键的“magic number”:

<ul

  • 版权说明:
  • 本文内容由互联网用户自发贡献,本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 295052769@qq.com 举报,一经查实,本站将立刻删除。