我翻阅了一些数据分析师的招聘要求,几乎所有的招聘要求中,都会有这么一条,叫做“逻辑思维能力强”。但是又很少有人能说清楚到底什么叫做“逻辑思维能力强”。
中国的教育在逻辑这一块上是非常欠缺的,即使是很多接受过高等教育的人,思路依然是非常没有条理的。日常工作中的数据分析,运用最多的逻辑方法就是逻辑推理,从一堆数据中推理出和业务有关的信息。
今天就来说一下数据分析必备的第二种思维——逻辑推理思维。
逻辑推理一般有演绎法、归纳法、类比法,我简单介绍一下数据分析工作中比较常用的演绎法和归纳法。
演绎法
首先要明确,数据分析最终产出的最小单位应该不是一个数据,而是数据背后的信息。换句话说,数据分析的产出需要一个论述。
所以,“黑名单用户占比0.5%”不是一个完整的数据产出。
“黑名单用户占比0.5%,影响比较小。”这才是一个完整的数据产出。其中包括论据“用户占比”,也包括论点“影响比较小”。
这种句式就是一个论述,一个简单的论述就需要用到基本的逻辑推理方法。
上述这种最常见的数据结论就需要用到逻辑推理中的演绎法。
演绎法,常见的类型有三段论、假言推理、选言推理等。本文主要介绍一下最常见的三段论。
有关三段论最常见的案例是“苏格拉底三段论”,几乎所有讲逻辑思维的书里都会提到这个案例。
著名的「苏格拉底三段论」:
(大前提)所有的人都是要死的
(小前提)苏格拉底是人
(结论)所以苏格拉底是要死的
这实际上就是逻辑推理中的演绎法。
演绎法就是由「因」推导出「果」,由一般推导出特殊的思维方式。
苏格拉底三段论中,一般的情况是“所有人都要死”,特殊的情况是“苏格拉底是人”,所以从一般演绎到特殊,“苏格拉底是要死的。”
不过我们平时不这么说话,因为很多大前提是约定俗成的,没必要特别交代。
比如前面的例子“黑名单用户比例0.5%,影响比较小。”
大前提:占比1%以下的影响不大。
小前提:黑名单用户占比0.5%
结论:黑名单用户的影响不大。
是因为这个大前提人人都知道,我们平时说话是默认别人也知道这个前提的,所以我们往往不会说,但是脑子里会想。
如何质疑演绎法
演绎法的特点是,只要大前提和推理过程都正确,那么结果必然正确。
所以质疑演绎法的方法也很简单,质疑大前提、小前提或者质疑论证过程。
比如有这样一个数据分析的结论:当前需要提升新用户数,所以要进行广告投放。
大前提是:获取新用户必须进行广告投放。
小前提是:当前需要提升新用户数。
结论:当前必须进行广告投放。
如何质疑这个论断?
大前提错误:获取新用户必须依靠广告投放吗?
小前提错误:真的需要提升新用户数吗?
如何质疑论证过程?
三段论有五项基本原则:
四项错误
中项两不周延
大项扩大,小项扩大
前提都为否,结论不必然
前提有一否,结论必为否
这里主要讲一下四项错误和中项两不周延。
四项错误:
一个三段论中,只能有三个不同的概念。有四个,就一定错了。
比如:人已经存在几百万年了;而你没有存在几百万年;所以你不是人。
这个三段论中,看上去有三个概念“人,几百万年,你”,但因为前后两个“人”违反了“同一律”,是不同的,所以其实一共出现了四个概念“人类,几百万年,你,人体”。
在实际工作中,可能就会有这样的论述:
新用户人均付费金额超过50元就可以在渠道A进行投放获得新用户,
付费新用户的人均付费金额超过50元,
所以可以在渠道A进行投放获得新用户。
这个论述中,渠道A的新用户指的是进入APP的新用户,而付费新用户指的是首次付费的新用户,所以这个论述中有两个新用户的概念。一共出现了“APP新用户人均付费金额、渠道A投放获得APP新用户、付费新用户的人均付费金额、渠道A投放获得付费新用户”四个概念,犯了四项错误的问题。
中项两不周延
什么叫中项?
“所有人都是要死的,苏格拉底是人”,这里的“人”就是中项,用来联系大前提和小前提。
那什么叫周延?“所有中国人”指全部,是周延的概念;“一部分中国人”,是不周延的概念。
认真听这个三段论:
一部分中国人很有钱,北京人是一部分中国人,所以北京人很有钱。
“一部分中国人”是联系大前提、小前提的中项,但是不周延,所以犯了“中项两不周延”的逻辑错误。北京人是一部分中国人,但不一定是有钱的那一部分中国人。
所以“新用户喜欢使用A功能,甲是新用户,所以甲喜欢A功能”这句话也是错的。
因大前提“新用户喜欢使用A功能”实际上是“大部分新用户会使用A功能”,这是可以通过数据得出的结论,比如60%的新用户都会用这个功能。等同于“一部分中国人很有钱”
小前提“甲是新用户”,实际上是“甲是一部分新用户”。等同于“北京人是一部分中国人”
所以这句话就是犯了中项两不周延的错误。
本文仅做为一个逻辑推理的入门引导,其他的错误类型有兴趣可以自己去百度一下。
归纳法
还有一种基本的逻辑推理方法是归纳法。什么是归纳法?
上面三段论中,大前提往往就是归纳法得出来的结论。
因为我们见过的所有人都是会死的,所以我们归纳出一个结论:所有人都是会死的。
所以,归纳法由「果」推导出「因」,由特殊推导出一般的思维方式。
我们平时最常用的逻辑推理方法就是归纳法,因为这种逻辑能力是写入我们基因中的一种本能。
比如几百万年前,原始人看到老虎、狼等猛兽伤人,那么他下次再遇到长着利爪和尖牙的动物的时候,就知道赶紧躲起来。这就是归纳法在起作用,“利齿尖牙的动物代表着危险”。如果人类没有这种能力,根本活不到现在。
我们很小就有了这样的能力,比方说小孩曾经摸过冒热气的杯子很烫,下次再看到冒热气的汤碗,他就知道这个东西也很烫。我们天然就具有这种能力,并不需要经过特别的教育。
但是归纳法有一个问题,就是哪怕你所有的论据都是正确的,结论也可能是错误的。
英国哲学家罗素提出过一个问题,被称为“罗素的火鸡”,用来讽刺那些归纳主义通过有限的观察,得出自以为正确的结论。
在一个火鸡饲养场里,一只火鸡发现,不管是艳阳高照还是狂风暴雨,不管是天热还是天冷,不管是星期三和星期四,每一天上午的9点钟,主人都会准时出现,并给它喂食。于是,它得出了一个惊天大定律:“主人总是在上午9点钟给我喂食。”
时间来到圣诞节的前一天,上午9点,主人又一次准时出现,但是这一次,主人带来的并不是食物,而是把它变成了食物….
归纳法最常见的就是这类“以偏概全”的错误。但我们日常生活中经常犯这样的错误。
比如:
交了几个男朋友都是人渣,所以男人没有一个好东西。
这只基金过去每年盈利超过10%,所以今年也会超过10%。
这个区块链货币,我大姨赚钱了,我二舅赚钱了,所以我也会赚钱。
这些结论我们感觉理所当然,几乎都不用经过思考,但是稍加思考就会发现这些结论是有问题的。
现在很多的机器学习模型的做法是通过大数据分析找出一些人群的共同点,不带任何大前提,我觉得这种建立在归纳法基础上的模型很难说会有怎样的效果。
我们在做数据分析的时候,因为思维的怠惰,很容易进入归纳法这种思考方式,我们必须警惕这种不经过思考的归纳推理。
人性偏向归纳法,但是分析更需要演绎法。
用更权威的大前提
为什么数据分析要多用演绎法?
之前提到过,演绎法的推理,只要大前提小前提和论证过程正确,那么结论必为真。
但是归纳法只能得出尚未被证伪的结论。一旦发现一个反例,那么这个结论就会被证明是错误的,或者限制结论的使用条件。
所以,演绎法更容易把握结论的正确性。
不过还是既然演绎法的大前提往往还是来自于归纳法,怎么样保证结果的正确性的?
我们可以尽量采用那些前人已经总结过的结论,这些结论经历了时间的考验,相比自己临时归纳的结论更加可靠。
比如:
大前提:你通过自己的使用经历发现,如果APP界面的交互风格差别比较大,自己用起来体验不好。
小前提:现在,自家APP的不同功能之间交互风格有差异。
结论:所以自家APP体验不好。
这个结论是建立在你自己的感受上的,是你过去经历的归纳。虽然其他人也可能有类似的感觉,但是总感觉听起来没那么有说服力。
如果你把大前提改成权威人物的研究,结果就不一样了。
大前提:根据尼尔森十大交互原则的一致性原则,功能应该保持一种类似的结构,规则的排列顺序能减轻用户的思考负担。
小前提:自家APP的不同功能之间的交互风格有差异。
结论:自家APP加重了用户的思考负担。
这样看起来是不是就更加有说服力了?
这是因为你的逻辑基础更加扎实,大前提是一个前人经过大量研究得出的结论,相比自己总结的感受,要更加准确。
搞清对方到底用的是什么逻辑
有些时候,两种逻辑推理方法不太容易分辨。因为有些话听起来是一样,但是背后推理的逻辑是不同的。
比如“A和B都说附近新开的那个饭店不好吃,那肯定不好吃。”
有些人是基于归纳法的思路:
论据:A说那个店不好吃,B说那个店不好吃
结论:所以那个饭店不好吃。
有些人是基于演绎法的思路:
大前提:A和B对美食的要求比较低
小前提:A和B说那个新开的店不好吃
结论:新开的饭店肯定不好吃
这个大前提在他的脑海中,并没有说出来。
基于归纳法的人说这句话的时候,重音往往会在“都”字上。
基于演绎法的人说这句话的时候,重音往往会在“A和B”上。
你可以体会一下,重新读一遍这句话,注意重音的不同:A和B都说附近新开的那个饭店不好吃,那肯定不好吃。
你看,同样一句话,不同的人的内心思路很可能是不同。所以,在和别人沟通的时候,你必须知道对方的逻辑到底是什么。
如果是当面沟通,还能通过语音语调大概猜出对方的逻辑。如果是在网络上通过文字沟通,那么就要多想想对方到底是什么意思。
组合运用
我们平时的数据分析结论,往往就是演绎法和归纳法层层叠加起来的一座逻辑大厦。
比如:
大前提:A公司的拉新策略是社群裂变
小前提:我们的拉新策略要模仿A公司的拉新策略
结论:我们的拉新策略要模仿社群裂变
那么大前提是怎么来的?小前提怎么来的?
拆解一下,可以得出这样一幅逻辑结构图。
以上是一个简单的案例,通过这样梳理一下思路,我们就能知道自己结论的逻辑基础和推理结构到底是什么。
然后遇到归纳法就反思是否有犯以偏概全的问题,或者能不能用更公认的事实做大前提改成演绎法。
排查演绎法时,看看有没有大前提、小前提、论述过程等错误,根据文章前面提到的错误类型一一排查。
这样思考一遍,我们很容易就可以找到自己或他人推理的薄弱环节。
如果你拥有以上这样的逻辑思考方式,是不是会发现自己可以轻松应对数据分析师岗位要求里“逻辑推理能力强”这一项要求了。
最后说一个三段论。