刚看了侯同学的 blog,大受启发。然后联想到一个 CET6 考试的概率模型。
毫无疑问,我们参加 CET6 考试是为了拿到证书。因为 CET6 使用的是标准分,为了拿到证书,一般来说你需要考到当次考试 top20% 的成绩。
那么,什么因素决定了考试成绩呢?当然是考生的实力。通常,考生 i 的实力可以用一个服从正态分布的随机变量 Xi ~ N(μi, σi) 来近似。也就是说,该考生平均来说可以考到成绩 μi,但是会有波动,方差为 σi。
于是,N 个考生就对应了 N 个随即变量 X1, X2, …, XN。一般来说,当考生数量足够多的时候,这 N 个考生构成的成绩分布也会近似满足正态分布,不妨设为 D。
这样,要判断一个考生 i 有多大概率拿到 CET6 证书,只要对分布 D 从负无穷积分到 Xi,看有多大概率 > 0.8。所以,一般英语好的同学,算一下属于自己的积分(当然啦,估一下就够了),发现 > 0.8 没啥问题,就基本可以确保通过 CET6 了。
但是,问题出在,一种新的职业出现了,那就是“枪手”——在金融领域叫做“基金” @.@
枪手一般来说英语还都挺好的,否则就害人了。然后,一些本来通过 CET6 无望的人开始请枪手代考,于是很多弱弱的随机变量 Xj 被替换成了强强的随机变量 Xk 。如果枪手只是个别现象,那么找枪手很容易,因为枪手一般都估计过自己的通过率,发现通过率很高,才会做枪手的。
但是,当枪手数量增加后,考生的成绩分布也变了,变成了一个奇怪的分布 D’,不再是 D 了。所以,原来在 D 上的估计方法就不对了。很多英语牛人 CET6 考挂了。更有甚者,有些不大牛的枪手居然也挂了……枪手越来越不 work,人们对自己对枪手的信心都没了。CET6 考试陷入一片混乱……
PS1. 就 CET6 而言,D’ 这个分布还比较好估计,大致可以认为是原分布 D 和枪手分布 D0 的叠加。但是对于更复杂的情况,如何去估计 D’ 无疑是很头疼的事情——如果我会算,我就去拯救世界了~~
PS2. 为啥统计模型告诉我们万年一遇的情况一个月内能发生三次。是模型错了吗?模型只是一个工具,无所谓对错。但是,每个模型都有它的假设。模型告诉我们的是,当满足模型假设的前提下,某情况万年一遇。所以,随着模型被正确地使用(即现实世界满足模型假设),世界会逐渐被模型改变,世界不再满足模型的假设,于是模型被错误地使用了。一旦模型被错误地使用,模型说的话就都不对了。
PS3. 人还是很聪明的,会设计出新的模型来适应新的世界,所以危机只是暂时的。人又早晚会被新的胜利冲昏头脑,所以新的危机早晚会因为新的模型被错误地使用而到来。
PS4. 本文只考虑统计意义,绝无赞美或诋毁任何对象之意。