流失用户召回没有成效?流失率居高不下?何不防患于未然,早早进行预警干预?
一、为什么要进行流失用户预警?
用户在使用产品的过程中是存在着生命周期的,用户接触产品、了解产品、到体验到产品的核心价值而使用产品,但最终由于各方面因素的影响,可能还是会离开产品,转移到竞品或者其他的解决方案,流失是不可避免的。
虽然流失不可避免,但并不意味着流失不需要关注,拉新不容易,但是流失却很容易,一个新用户的拉新成本是维系一个老用户成本的5倍以上,我们希望用户池能够不断地扩大。
所以很多公司都把重心放在用户的拉新上,但是忽略了老用户的流失,甚至用户流失的速度已经超过了新用户的增长速度,业务已经变成了极度不健康的状态,白花花的银子和心血都付之东流了。
所以我们不能只盯着拉新,还要时刻关注用户流失的状态,不能强求无流失,但要根据产品的特点把用户流失率控制在风险点以下。如何控制流失率呢?
一个用户的流失可能是因为缺乏新手引导,还没体验到产品的核心价值就流失了,也有可能是老用户经历了一次大改版,觉得产品不再像以前用的那么顺手了,但无论什么原因流失,用户一旦离开产品,触达到用户的方式和渠道就非常有限了,想要对用户进行召回就变得非常困难。
所以我们不能做事后诸葛亮,而是要在用户出现了流失的先兆,在用户还未流失之前进行预警,及时地进行干预,这样才能更大可能性地挽回用户。
二、 如何定义流失?
进行用户流失预警之前,首先要明确用户流失应该如何定义。
一般来说,用户如果长时间未使用产品,那么这个用户大概率是流失掉了。
但这个“长时间”到底是多长?这个“未使用产品”是指用户没有产生什么行为?对于不同类型的产品,这两点都有很大区别的。
以社交类产品为例,比如微信,由于社交场景天然具有高频高粘性特点,用户每天都在使用微信进行交流沟通,所以一般情况下如果用户一周没有使用可能就算流失了。
而对于工具类产品而言,比如哈罗单车,可能用户一个月甚至更久才能骑一次,所以这个时间就要放的长一些。
另外,对于“未使用功能”不同类型的产品也有区别,比如电商类产品可能是“未下单”这个行为,而对于短视频类产品,可能是“未观看视频”等。
一般来说,这个功能应该是产品的核心功能,长时间未使用产品的核心功能就可以认定为该用户流失了。
三、用户为什么会流失?
凡事必有因,用户之所以选择离开必然是觉得产品未能解决ta的问题,满足不了ta的需求,转而寻求其他的产品。
这里可能有以下几个方面的原因:
1. 产品价值
用户下载注册一个产品是带着需求来的,是想解决自己的问题的。但是这个需求可能有所不同,有可能只是用户的一个普通需求,也有可能是个刚性需求,还有可能是个痛点需求。
举例来说,最近太累,想去马尔代夫放松一下,这是个普通需求,到了马尔代夫玩了半天有点饿了,想吃东西了,这个是刚性需求。
于是上网看了一下推荐,刚好附近有家餐厅,但是评价不好而且很贵,有家味道很好的但是离得又很远,找一个离得近、味道不错而且又实惠的餐厅就是个痛点需求。
所以,普通需求→刚需→痛点是一个逐层递进的过程,逐层体现用户希望解决问题的迫切程度,所以如果产品可以解决刚需就不要满足于仅解决普通需求,如果可以解决用户痛点就不要仅停留在解决刚需问题。
用户越迫切,产品价值就更容易得以体现,用户的粘性自然就会更强,流失的概率也会小很多。
2. 用户体验
解决用户的痛点是产品存在的根本,但产品同质化严重的当下,良好的用户体验也是产品的核心竞争力。
在产品都差不多的情况下,用户体验差的产品用户流失肯定会更严重。用户体验主要体现在以下几个方面:
- 视觉体验差:产品的UI太low,配色很山寨,一眼看上去就很没有质感,第一印象就很差,没用继续使用的欲望。
- 交互体验差:产品的交互违背用户的使用习惯,明明可以上下滑动翻屏的,却要不断地点击下一页,用户使用不顺畅。
- 注册流程复杂:复杂冗长的注册流程是吓退用户的一个重要的障碍,一些信息完全不必要在注册环节就要收集,用户注册时填写的信息越多越隐私,越容易在注册中途流失。
- 用户预期未能达到:产品提供的功能未能很好地满足用户的需求,或者内容质量差,导致用户无法获得所需而流失。
只有了解不同用户流失的不同原因,才能更精准地描述用户流失前的先兆特征,进而预测流失概率,提前进行挽回。
四、用户流失预警模型搭建
流失用户预警本质上就是通过分析用户可能流失的原因,将这些原因通过数据的形式具象出来作为原因,从而给用户打上流失概率标签结果的一个过程,抽象出来就是一个由特征到标签的机器学习的分类问题。
既然是分类问题,就少不了以下几个关键的环节。
1. 样本选择、数据处理
观察期定义流失:由于机器学习需要训练集和测试集,所以要定义一个足够长、样本量足够多的观察期,采集观察期内用户的数据以及用户流失概率的样本作为训练集和测试集。
比如可以取过去半年以来用户的数据作为样本,由于用户是否流失结果已知,可以给用户打上流失概率的标签,这些样本经过特征工程后作为分类模型的输入样本,是模型学习分类规则的重要数据来源。
表现期采集用户行为:观察期数据的规律已经被模型学习到,就需要采集下一个窗口的用户行为数据,基于此预测发生这些行为的用户的流失概率。
2. 特征工程
紧接着上一环节样本的选择,接下来就是最重要而且是最具有决定意义的环节了—特征工程,机器学习的上限是由特征工程决定的,任何形式的调优只是无限接近这个上限。
特征工程一定是基于业务的深刻理解和剖析!一定是基于对业务的深刻理解和剖析!一定是基于对业务的深刻理解和剖析!重要的事情说三遍!
机器学习的效果取决于特征工程,特征工程的关键在于业务的熟悉程度。
只有对业务足够熟悉,才能将可能影响用户流失的原因准确的数字化、具象化,才能从本质上找到原因,而不是原因的表象,进而才能找到影响留存的关键特征。
举例来说,用户的活跃时长看似是一个和流失非常相关的特征,但是时长并不是用户流失的原因,可能只是产品迭代后用户找不到常用功能这个原因的表象。
因为常用功能变了位置没有找到,觉得产品不好用了,逐渐开始寻找其他的替代产品,才导致使用时长变短,这个才是根因,而找到根因的过程无疑是需要对业务有深刻理解的。
一般来说,我们需要考虑的特征可能有以下几个类别:
(1)用户的基本属性
性别、年龄、收入水平、区域等,不同类型的用户可能流失也有所区别。
(2)用户的产品行为
所处产品的生命周期、活跃的频次、关键功能的使用频次等,这些我们称之为基础指标,基础指标一般是流失原因的表象和流失具有相关性,但不具备因果性,不是导致流失的关键特征。
(3)其他加工指标
基础指标可能不能很好地挖掘到影响留存的关键特征,需要基于业务理解加工出新的指标,并和基础指标一起作为模型训练的特征。常见的加工方法有:
①深度指标
反应用户使用深度的指标,用户不仅要用,而且要用的比较深入,比如关键功能的使用次数,有的用户可能只是用了一些边缘性的功能,还未接触到关键功能就流失了。
这是很可惜的,所以用这个深度指标可以预测用户是否可能流失的。
②频次指标
用户不仅要用的深,还要用的频繁,这个频繁的定义依据不同的产品类型而有不同的定义,有的产品可能需要每天都要用,甚至一天要用几次,有的可能要求一周要用几次,不一而足。
但是可以根据产品的特点加工出一个频次指标,比如日/周均使用次数或者日/周均使用天数,这样用户的使用频次得以表征。
③趋势指标
用户使用产品的趋势变化,用户使用的趋势直接关系着用户的流失,如果一个用户使用的越来越少了,那大概率用户是要流失了。
所以一些常见的趋势指标如近三个月每周平均活跃天数的变化率,可以理解为一个斜率,如果每周的平均活跃天数在一直减少,斜率应该是负值,否则斜率应该是正值,以此表征用户使用情况的变化趋势。
3. 模型选择
特征构造完成后,就需要进行模型的选择了,对于分类模型,一般常用的有逻辑回归,决策树,SVM,XGboost等,每种模型都有各自的优缺点,也对特征有一定的要求,我们无需在模型选择上花费太多精力。
可以预选一些模型,带入样本进行训练,观察不同模型的分类效果,选取效果最好的一个作为训练模型即可。
这里的效果主要通过分类模型的评估标准来评价,比如混淆矩阵,f1值,还要考虑模型的泛化能力等。
流失预警模型构造的重点在于特征工程,而非模型选择,所以这部分不是重点,不再详细展开,需要的可以学习相关的资料。
4. 模型训练与预测
特征加工完成,训练模型确定后就需要将样本进行训练,并通过调参等不断优化模型效果。
当各项指标满足要求后,模型训练完成,就可以上线进行预测了,对表现期的用户进行预测,评估其流失的可能性,进而进行针对性的运营动作,到这里就完成了用户流失预警模型的搭建。
五、流失用户召回
进行流失预警并不是目的,目的是为了发现将要流失的用户并及时地进行召回,防患于未然。
然而,现实情况是,大部分的资源和经费都投入在拉新和活跃用户的运营上,对于特别耗费精力和资源、出力不讨好的流失用户召回能得到的资源支撑就非常有限了,所以资源要用到刀刃上。
要对流失用户进行分层,优先召回那些高价值的用户,以获得最大的投入回报。
流失用户的分层可以基于RFM模型,简单易操作,不需要过于复杂的模型,对预测出来的可能流失的用户,通过最后一次距今的时长(Recency)、产品的使用频率(Frequency)、对产品的有效价值贡献(Monetary),把用户分成高、中、低价值用户,按照分层由高到低逐层对用户进行进行短信、邮件或者push召回。
这部分需要产品、运营共同参与,开发和流失预警配套的用户自动化触达系统,这样才算是完成了流失用户预警的闭环和落地。