要处理数据异常,我们要先知道什么是数据异常,首先要有数据,才能知道什么是“异常”。
百度百科的解释是:指非正常的,不同于平常的。比方如突然的涨,突如其来的跌。数据涨跌是我们在日常工作中,最容易被发现的现象,也是我们平时工作中要去分析的。
也就是说,平时数据没有波动,也许我们不需要去分析,但是如果数据有涨或者跌我们都需要去查出原因的。
一、为什么涨和跌都要关注?
相信很多朋友跟我一样,起初接触到数据,我只关心跌,为什么昨天的数据跌了?并去分析其原因,也会关心涨,但并不关心为什么涨,就像买股票一样,跌了痛心疾首,并分析原因,涨了满心欢喜,后悔自己为什么不买入多一点儿。
在数据分析的过程中,我们不仅仅要关心跌,以便采取相应动作,减缓跌的趋势,也更要关心涨,弄清楚涨的原因,并放大它,或者说是复制它!
在数据分析的过程中,一定要搞明白每一次数据涨跌的原因。
一、数据异动分析方法论
面对数据异常通常有五步:
(1)发现异常
就像你发现昨天数据跟往前不一样,猛涨了还是猛跌了,通过观测数据发现异常。
(2)确定问题
发现异常之后,我们要确定这个异常是不是一个问题,有多严重,这里呢我们可对按照第一篇讲的对比分析法那篇文章里的方法,从时间维度上进行周同比、月同比或者是年同比。
(3)确定原因
用咱第二篇讲的多维度拆解法,对于这个异常的指标从不同的维度去拆解,找出原因。
(4)针对性解决问题
找到原因之后,就是针对性的解决问题了,根据问题的原因,动用公司的相关资源,去解决这个问题。
(5)执行
最后呢,就是把解决方案执行出来,把这个异常数据真正的从异常到执行,完成一个闭环。
下面呢我们来结合一个案例,讲一下这五步怎么走。
二、案例解析
举个栗子:你近期入职了某互联网公司,公司的业务方向是做陌生人社交的,在处理数据的过程中,你发现在你入职的前一天,数据是异常的,特别想分析出原因是什么?那如何操作?
下面咱们一起来按照上面的方法论进行分析吧:
第一步,发现问题:上面说了你已经发现某一天的数据异常了。
第二步,确定问题:数据跌了那么多,问题是不是很严重呢?往期有没有这么大的浮动?我们来运用第一篇讲的对比分析法来看看周同比等数据。
由上图的周同比可以看出,往期是没有这个问题的,那说明这是一个严重的个例,这表示这一天确实发生了什么。那下面咱们来用第二篇文章讲到的多维度拆解法来确定原因。
第三步,确定原因:那是不是哪个省份出了问题呢?
下面我们按省份进行查看,看是不是某一些省份的数据出了问题,由下图可以看出,这次数据的猛跌是全国范围内的,基本上所有的省份都有下迭。这里咱排除了某个区域下跌的原因。
那是不是设备出问题了呢?
下面咱再来看不同操作系统的数据有什么不同,由下图可以看出安卓和iOS在这天出现了下跌。所以,我们排除了设备出问题的情况。
那是不是服务挂了呢?咱们按小时或者分钟来查看,看数据是不是符合平时流量规律?
通过上图我们可以看出,在这一天的0:01分,平台的数据为0,出现了断崖式下跌,我们是一款陌生人社交产品,以往这个时候活跃用户还是挺多的啊,由此可以看出,这一天的数据异常确实是因为服务挂了。
那第四、五步就一起说啦,由上图可以看出,服务挂了,相关负责人及时确定了问题,并针对性的解决了问题,且执行了下去,因为在零晨1点左右数据又恢复了正常。
以上5步看起来简单,但是它是基于你对自己的业务要有所洞察的基础之上的。你只有对自己的业务有所洞察,有以往的经验,你才能做出这些判断 。
如果对自己的业务不了解,给你再多的数据或者是工具,抑或是方法论,都是没有用的。所以,建议大家把这个方法用到工作中,不断的积累,不断的验证。
通过上面的案例解析,你有没有发现,在确定问题时,咱们提了很多假设,往期有没有这个问题?是不是哪个省份出了问题?是不是设备出了问题?
其实数据只是验证咱们想法的支撑工具,首先需要有一个假设。
当然,就像前面所说,这些假设是基于你对业务了解的基础之上的,在这个过程中,你需要不断的去试错,不断的积累你的行业及业务的洞察,才能做出这些假设。
虽然说假设是基于对业务的积累,但还是有一些常见的假设的,如果你能掌握下面这几种假设,通常能解决你工作中关于数据异动的大部分问题。
三、那常见的假设有哪些呢?
常见的假设有下面五种:
(1)活动影响:查对应活动页面及对应动作的数据波动,关注活动是否有地域属性。
通常咱们的市场或者运营会去做一些活动,所以如果数据出现问题,先看看PV、UV等数据,看是不是活动的影响。
(2)版本发布:将版本号作为维度,区分查看。
有时候数据出现异常也有可能是新版本的发布带来的波动,所以咱们也可以把版本拎出来看,如果发布的是V1.5,我们可以对比着看看V1.3、V1.4这三个版本数据,看是否正常。
(3)渠道投放:查看渠道来源变化。
WEB端的渠道来源有很多很多,但是像APP就有点困难,这时咱们可以看看新增的渠道来源,来看看变化影响。
(4)策略调整:策略上线时间节点,区分前后关键指标波动
工作中我们会经常改变策略,比如说搜索策略,推荐策略等等,但是呢策略改变之后上线,它肯定有上线时间节点的,这时候咱们可以把这个时间节点像刚才讲的案例那样,拆分成分钟来观察。
(5)服务故障:明确故障时间,按时间维度进行小时或者分钟级别进行拆分
通过上面的案例你也可以看出来,服务故障出问题是有一个明确时间的,按照上面案例讲的方法来观察,按分钟来查看,看有没有出现断崖式下跌,这个时候咱们就可以明确是不是服务出现了故障。
好啦,数据异常如何分析这篇文章到这就完结啦,下面是本篇的思维导图~