美妙的统计数据谎言.docx
- 文档编号:17412201
- 上传时间:2023-07-25
- 格式:DOCX
- 页数:22
- 大小:2.28MB
美妙的统计数据谎言.docx
《美妙的统计数据谎言.docx》由会员分享,可在线阅读,更多相关《美妙的统计数据谎言.docx(22页珍藏版)》请在冰点文库上搜索。
美妙的统计数据谎言
世界上有三种谎言:
谎言、该死的谎言,还有统计数据。
——本杰明.迪斯累里(Benjamin Disraelis)
首先要掌握事实,然后你可以随意歪曲他们。
——马克.吐温
失业者按照其来源不同进行统计,数据或多或少;
癌症风险和臭氧黑洞不断增加;
1/3的人生活在最低生活水平线以下;
一个联邦德国公民一年内吃掉了5.8升食用冰;
音乐家可以比其他人更长寿;
农村的空气有益于健康,或者农村的空气不利于健康;
全球到2020年将会有100亿人口;
道琼斯指数又涨了30点;
网球运动员B在与一个左手握拍、带着眼镜的选手比赛时从未输过,该选手比B年轻;
与男性相比,超过25%的女性经常错误地拐入单行道;
恐龙灭绝于6000万年前;
吃猪肉会导致心脏病;外国人更容易成为罪犯;
绿党的选民经常阳萎(这绝对不是开玩笑—这是一个汉堡的性学研究者在德国联邦议会上所做的说明);
人们在纽约睡觉时,最安全的地方是中央公园;
还有30年我们就要与下一次的核灾害分别了,目前存在着气候灾害的威胁;
如果在下一个星期天投票,某党X不会进入联邦议会。
统计学是一门完全特别的、完全稀奇古怪的科学。
——威廉.拉贝(Wilhelm Raabe)
1909年4月6日,美国人罗伯特·埃迪温·皮尔里(RobertE.Peary)到达地球的北极,从而成为世界上第一个到达北极的人。
至少皮尔里本人是相信这一点的。
说得确切一些,他希望全世界的人都相信他所取得的这个结果,所以,他确定了他到达北极的位置是北纬89度57分11秒,距离北极点大约5公里—这些数据对于皮尔里的实际目标来说已经是一个巨大的成功了,并且准确地说,这种效果也是他精心策划出来的。
实际上,皮尔里根本不可能把他自己的位置精确到30米的距离(因为11秒不会发生任何事情)。
即使在今天,借助于卫星定位这种现代化的辅助手段,也不可能取得如此微小的、精确的结果。
所以,这件事情在那个时候根本就是不可能的。
就连皮尔里的朋友也承认,在最理想的情况下,皮尔里通过其有限的工具也只能准确地标注到6分(纬度)或10公里,其他指标干脆就是他自己杜撰的。
一位在孟加拉国种植水稻的农民每年可以挣98马克13芬尼,
这个数字完全不是有意暗示这个调查研究会精确到一分一毫,因为事实上人们从来没有这样计算过。
研究者只是做了一个猜测,即9100万居民平分20亿塔卡的国民收入,然后再按照当时的塔卡与马克的汇率换算成马克,从而得出上面的结论:
98马克13芬尼。
在这些附加的资料中,只有一项是精确无误的,即当时的货币汇率。
国内生产总值和居民数量都是粗略的估计。
如果把所有资料都集中到一起,那就会重新产生出一个(被误认为是)精确的数字。
世界历史有多久远?
不为人知的计算
错误的误导
76%的交通事故是由没有饮酒的驾驶者造成的,
所以酒后驾车也没有关系。
76%的交通事故是由没有饮酒的驾驶者造成的,
所以酒后驾车也没有关系。
德国《经济周刊》(Wirtschaftswoche)成功地进行了相关研究,以每10个月为一个周期,描述了德国纺织工业向坏的和向好的景象。
左图表达的意思是,“纺织品在联邦德国私人消费那里,早在几年前就已经下降了。
这种情形即便在1989年也几乎没有什么改变。
在预测私人消费会实现实际增长2.5%的条件下,纺织品消费与前一年相比增长不会超过1.5%。
”这种比较悲观的预测在图形当中得到了反映:
曲线起始于高峰,终止于谷底。
这个图表形成后,没过几个月就出现了完全相反的情形:
曲线先是起始于谷底,然后持续地上升;图表旁边的文字说明是:
“联邦德国的纺织工业在1990年也呈现出强劲地上升趋势。
纺织工业在这一年的销售增长预计能够达到5%~6%。
”
犯罪率和死亡率
一家美国报纸用哲理推论了发生在美国的暴力犯罪。
绝大多数暴力犯罪发生在家中,即厨房、起居室和卧室。
这家报纸的结论是:
晚上,人们只有睡在中央公园才是比较安全的。
伦敦《时报》(Times)文章“50%的女性被害者是被自己的男朋友或丈夫杀死的”对婚姻生活的危险性进行了推论。
只有约10%的被害妇女是由完全不认识的人谋杀的,一般来说,犯罪嫌疑人来自受害人的家庭生活圈(特别是在周末或度假中,“这时家庭成员是在一起的”)。
与老年人相比,青少年被误认为是具有较多自杀倾向的一类人群,这一基本判断就是建立在错误的比较基础上的。
一家德国报纸文章“老年时会变得更幸福”分析论证了下面的结果:
在20岁以下的青少年中,自杀在所有死亡中所占的比例最大,共计25%。
而30~40岁的人自杀率占到10%,超过70岁的老年人自杀率不足2%。
“年龄越大,决定自杀的比率就越低,”这家报纸如此写道,因此我们会随着年龄的不断增长而变得越来越幸福。
诡诈的曲线
某企业10年销售额飞速增长:
标致发动机惊人的省油
非凡的牛市
貌似精确的百分数
“在我们的全部议员中,女性议员的比例已经提高了50%!
”在联邦德国自由民主党(FDP)的党主席选举后,新闻媒体这样报道。
联邦德国议会中的全体自由民主党成员异常兴奋,并为之鼓掌喝采。
“嗯,是这样的”,其中一个议员轻声地说:
“以前我们有4个女性议员,而现在增加到6个……”。
一个农场主,在他所饲养的全部家畜中,57%是牛,14%是猪,其余的畜类占29%。
但是,有谁能够想到,这位骄傲的农场主实际上只养着4头牛、2只羊和1头猪?
这就是他的全部家畜。
、
第二次世界大战中一位负责雷达业务的军官非常紧张的状态,这位军官长时间徒劳地一再向上级机关请求加强7名技术人员组成的雷达小组的力量,可是一直没有结果。
但当其中一名成员的神经崩溃时,这位军官只是非常言简意赅地报告:
“14%的人员由于过重的负担而变得精神恍惚,甚至出现神经错乱的现象”。
每两个人中就会有一个独居
“近100年,人们的生活方式发生了剧烈的变动,”《南德意志报》写道。
“20世纪初,大家庭成员之间彼此共同生活在一起是非常正常的现象。
几乎有一半的居民……是生活在拥有5个人或者更多人的家庭中。
而今天的德国与以前完全不同:
2/3的居民独居或者是两个人一起生活。
”证据是:
66%的家庭人口小于3个人……
在美茵河畔的法兰克福,甚至有77.5%的家庭人口小于3个人,其中49.2%的家庭只有1个人。
因此得出结论:
半数的人在独居!
两个灼眼的百分数
增长率的增长率:
人们利用百分数很容易在和风细雨的现象中制造出一种狂风暴雨的幻象。
现在假设一个公司的销售额如下:
100101102.5
从上面的数据可以得出结论:
销售额先增长了1%,然后又增长了1.49%(1.5/101)。
客观地说,这两个增长率数字非常小,也可以说,后一个增长率几乎贴在前一个数据之上,原则上我们不能用“具有活力”这个词来描述这个公司的销售情形。
相反,如果我们不从增长率这个初始数据出发,而改用增长率的增长率来表示,那么,情况就会发生根本性的改变。
如果销售额在第1年增长了1%,第2年比第1年又增长了1.49%,那么,第2年的销售额比第1年的销售额拥有令人骄傲的成绩:
增长了49%
小样本的百分数:
百分数也给误解提供了肥沃的土壤。
和小数一样,它也能为不确切的事物蒙上精确的面纱。
美国劳工部(TheUnitedStatesDepartmentofLabor)的《每月劳动回顾》(Monthly LabarReview)曾经指出,在华盛顿,某个特定月份中支付交通费用的兼职家庭帮工中,4.9%的人周收入是18美元。
实际上,4.9%的兼职家庭帮工仅指2个帮工。
也就是说,以上结果仅含有41 个被调查对象。
任何建立在小样本容量上的百分数都可能产生误导,直接给出具体数值的大小将更有价值。
如果再将百分数表示成小数点后几位的小数形式,你可能正将天平从愚蠢的一端移向欺诈。
鬼知道的权重
如果在一个村庄中有10个农民,其中1个农民拥有40头牛,其他9个农民一头牛也没有。
平均每人有4头牛
一家公司,女员工每小时的收入是20元,男员工的收入是每小时30元,那么,这个公司的员工平均每小时的工资就不是25元,因为这要取决于男女员工的比例。
真正的平均也就是所谓的“均衡的”算术平均值,即20和30的加权平均值,如果有7位女员工和3位男员工,那么,平均工资水平就是:
0.7×20+0.3×30=23。
飞机和火车哪个更危险
标准的分母是全部计算在内的乘客—公里数。
这样我们就会得到:
火车:
9人遇难
每100亿乘客公里数
飞机:
3人遇难
每100亿乘客公里数
如果以乘客小时数做分数中的分母。
死亡的平均值就应该是:
火车:
7人遇难
每1亿乘客小时数
飞机:
24人遇难
每1亿乘客小时数
其实床上最危险,因为人们死在床上的可能性几乎是99%
骗人的虚假趋势
神一样的乌龟
阿基米德和乌龟赛跑谬论
假设阿基米德的速度是乌龟的10倍,乌龟速度为1米/小时,乌龟先跑100米,当阿基米德跑到乌龟的位置时,乌龟向前跑了10米,阿基米德跑完这10米时,乌龟向前跑1米,阿基米德跑完1米时,乌龟向前跑0.1米,阿基米德跑完0.1米时,乌龟向前跑0.01米,照此趋势,阿基米德永远都追不上他前面那只乌龟。
假设有一口10尺深的井,井壁非常光滑,一只青蛙从井底向上爬,白天爬4尺,晚上下滑1尺,这个趋势,青蛙几天能爬出来?
黄金价格的走势
不靠谱的股市
公理式的抽样
如果人们通过对2000人进行访问调查,从而得到6000万人在想什么的结果,这种方式的效果直到今天为止对于我来说仍然是一个谜。
对此我不能做任何解释。
事情就是这样的。
——伊丽莎白.诺艾尔-诺依曼
随机样本的检验标准是:
总体中的每个名字或事物是否具有相同的几率被选进样本?
第二次世界大战期间,美国国家民意调查中心,(TheNationalOpinionResearchCenter)派出两组调查人员对一个南方城市的500 名黑人进行提问,一组调查人员由白人组成,另一组是黑人。
问题一共有3 个。
其中一个问题是:
“如果日本占领美国,你认为黑人的境况会得到改善还是变得更糟?
”黑人调查组中,9%的被调查者回答“变好”,而白人调查组该比例只有2%。
回答“变坏”的比例也不相同,黑人调查组是25%,而白人调查组则是45%。
第二个问题是用“纳粹分子”替代“日本”,两组的结果大体相同。
第三个问题试图探寻被调查者对前两个问题的真正态度。
“你认为目前致力于打败轴心国比在本国内进一步推进民主更重要吗?
”黑人调查组中,选择“打败轴心国”的比例是39%,而白人调查组则是62%。
民意调查最终将演变为一场与误差的遭遇战。
所有信誉良好的调查公司将不可避免地投入到这场战斗中。
民意制作
你喜欢加班吗?
公司效益不错,如果有加班,你可以接受吗?
您是否认为一个企业中所有的工人都应该加入公会?
赞成:
44%
反对:
20%
弃权:
36%
你是否认为一个企业所有的工人都应该加入公会,或者人们自己来决定他是否愿意加入公会?
赞成:
24%
反对:
70%
弃权:
6%
你同意堕胎合法化吗?
你同意人工流产合法化吗?
我可以祈祷的时候吸烟吗?
我可以吸烟的时候祈祷吗?
您赞成弹劾总统吗?
总统应该受到参议员的质询吗?
(盖洛普,尼克松)
您同意下面的观点吗?
对于德国不断增长的刑事犯罪现象来讲,首先负有责任的是社会关系,而并非是具有错误举止行为的人。
(60%)
春晚谁有理
近年来,关于央视春节联欢晚会的观众满意度调查,网上会盛传两种版本,一种是CTR央视市场研究公司除夕午夜发布的同步电话调查的结果,另一种是春节期间一些网站,例如新浪网,发布的网络调查的结果。
这两种调查的结果一般都是大相径庭的,例如在2010年,认为春晚办得好的比例分别是CTR公布的81.6%和新浪网公布的13.4%,相差非常大。
比较CTR和新浪网的调查总体和方法,也有诸多的不同,例如:
1、总体:
CTR的调查总体是全国电视人口,包括农村和城市;新浪的调查总体是全国网民;
2、方法:
CTR采用的是电话调查的方式,新浪网采用的是网络调查的方式;
3、时间:
CTR采用的是同步调查,从除夕夜20:
30开始,23:
30结束,当天午夜就发布调查结果;而新浪网采用的是持续几天的调查,初四公布调查结果;
4、受访对象:
CTR采用电话调查的方式,在家庭中接听电话的可能多为中老人,而主动填答新浪网调查问卷的网民可能多为年轻人,平均来说,这些网民的教育程度也可能高于CTR的电话调查样本。
因此,CTR的调查和新浪网的调查有截然不同的调查结果,是必然的。
反过来,如若这两个不同的调查得到了大致相同的结果,那反而是不正常的。
七十二变的概率
从概率统计的角度出发,足球大门肯定会被攻破。
——足球教练,克里斯托夫.道慕(Christof Daum)
“总之您的情况很严重。
您病得很厉害。
从统计学的角度看,患这种病的病人,10个人中会有9人会死亡”
“您是说我一定会死吗?
”
“不是,您是比较幸运的,在您之前我已经治疗了9个患有这种症状的病人,他们全都死了。
”
一个系统分析师和数学家喝酒回家被警察巡逻队拦了下来,这位科学家信誓旦旦的说,他给他的妻子打电话,请她开车来接他。
然后他锁上车就离开了。
警察巡逻队不久回到刚才的地方,发现他坐在车上准备离开。
“我没有计算到会有第二次检查,此前我刚刚被警察检查了一次,那么按照概率统计的法则,第二次检查在100年后才能发生…….”
一位妇女相继生四个小男孩的可能性实际的确很小,概率是(1/2)4=1/16。
如果这个妇女已经有了3个小男孩,之后在生一个小男孩的概率不是1/16,依然是1/2。
这个概率不是取决于他的三个哥哥,而是取决于跟他母亲睡在一起的那个男人。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 美妙 统计数据 谎言
![提示](https://static.bingdoc.com/images/bang_tan.gif)