首页 » 社会知识 » 为什么说概率有时不靠谱

为什么说概率有时不靠谱

 

说起概率我们都不陌生,但它的真正含义你却未必搞得懂。比如说,天气预报说,明天降雨的概率是30%,这是什么意思呢?难不成我们可以把生活倒带重来,反复地把明天过上100次,其中大约有30次会下雨吗?又比如,体检结果表明,某人换上肝癌的可能性是70%,这又是什么意思呢?得了就得了,没得就没得,70%的可能性患病,这到底是得了还是没得呢?

你可能会说:这大概是气象局和医生在描述对事情发生的信心吧。比如气象局想说的是,对于明天会下雨这件事,数据带给我们的信心不足;而医生想说的是,根据体检结果,我们对这人得了肝癌还是挺有把握的。

但再想想你就会觉得不对,作为权威的气象局或者医生,既然都已经给出一个具体的数字了,肯定是有原因的呀?没错,对于个人的健康啊或者具体某一天的天气啊这类的,只能通过过去有限的测量来推测它们发生的概率,这种分析概率的方法叫做贝叶斯分析。

最近,科普达人卓老板卓克,在“卓老板聊科技”专栏里,就跟大家详细介绍了这种方法,它不仅对预测生活中的各种事情有重要的意义,有时还十分出人意料,我来给您讲讲。

什么叫做通过过去的测量来推测事情发生的概率呢?比如,如果人得了肝癌,在一些身体指标上就会有异常。而贝叶斯分析,就会通过各种测量本身的概率,比如如果这人指标有异常了,仪器测出来的概率是多少,测不出来的概率又是多少,仪器误测出异常的概率又是多少,等等这些间接的知识,来综合分析一个人患病的概率。

这种称为贝叶斯分析的方法,数学形式非常复杂,但我给您举个例子,会有助于您的理解。比如如果人得了肝癌,有一项指标会呈阳性,通过测量这项指标,就知道这人是不是有肝癌了。但是即使是正常人,医学上也有0.1%的可能性被误测成阳性,而真的肝癌患者,这项指标也有1%的可能性误测成阴性。那么,如果现在有一个人做筛查的结果是阳性,你觉得他患有肝癌的可能性是多少?

你可能会觉得,这测量准确率都99.9%了,误测几乎可以忽略不计了吧?所以你觉得这人肯定有肝癌了对不对?但我们用贝叶斯分析算一下,实际上,肝癌在人群中的发病率大约是每10000个人中有4个,如果这10000人全都去做筛查,那么其中的9996个正常人会有9到10个人因为误测而体现出阳性,咱们就算10个吧;而那4个真的有肝癌的人,由于人数太少,误测忽略不计,就算4人全测出阳性吧。所以在10000个人中,总共还会有14个人会被查出阳性,而其中10个人是因为误测导致的。这么算下来,一个查出是阳性的人,真正是肝癌患者的可能性是4除以14,还不到30%。

你看,这筛查的正确性都到了99%以上了,通过体检判断有没有得病的概率却还不到三成。同样的例子还有艾滋病,如果一个人的艾滋病检测结果呈阳性,考虑到仪器误测和艾滋病的人群发病率,那么通过贝叶斯分析,这人真正患有艾滋病的可能性大约是50%,可能有也可能没有。

你可能会说,再也不相信那些吹的天花乱坠的技术了,说好了筛查准确率那么高,结果筛查的结果对于确诊疾病一点用都没有,这还要医学技术干什么?没错,这就是贝叶斯分析告诉我们的。再拿肝癌做例子吧,由于发生肝癌实在是小概率事件,所以当我们对一大群人做肝癌筛查时,虽说准确率有99%,但仍然会有相当一部分人因为误测而被诊断为肝癌,这一部分人在人群中的数目甚至比真正肝癌患者的数目还要高。

你肯定要问了,那该怎样纠正测量带来的这么高的误诊呢?刚刚我们也说了,造成这么不靠谱的误诊的原因,是我们无差别地给一大群人做筛查,而不论测量准确率有多高,因为正常人的数目远大于实际的患者,所以误测造成的干扰就非常大了。

解决的办法也很简单,就是是锁定可疑的样本,比如10000人中检查出现问题的那14个人,再独立重复检测一次,因为正常人连续两次体检都出现误测的概率极低,这时筛选出真正患者的准确率就很高了,这也是为什么许多疾病的检测,往往还要送交独立机构多次检查的原因。

你看,我们平时都觉得很奇怪,说很多像医院这样的权威机构,按理说它们给出的数据肯定没问题,不会错,为什么还总是出现偏差呢?知道了贝叶斯分析这种方法后,你就会发现,概率有时候是不靠谱的,或者说,概率是有局限性的。只有利用更科学的统计分析方法,才能最大程度地避免误判带来的影响。

本文源自:“得到”App订阅专栏“卓老板聊科技”

原文链接:为什么说概率有时不靠谱,转载请注明来源!

0