应用统计学课件(书摘).ppt
- 文档编号:12663159
- 上传时间:2023-06-07
- 格式:PPT
- 页数:49
- 大小:1.26MB
应用统计学课件(书摘).ppt
《应用统计学课件(书摘).ppt》由会员分享,可在线阅读,更多相关《应用统计学课件(书摘).ppt(49页珍藏版)》请在冰点文库上搜索。
,大数据时代-生活、工作与思维的大变革,分类:
网络趋势/大数据时代书名:
大数据时代(BigData:
ARevolutionThatWillTransformHowWeLive,Work,andThink)作者:
英维克托迈尔-舍恩伯格(ViktorMayer-Schnberger)著盛扬燕周涛译,引言一场生活、工作与思维的大变革,大数据,变革公共卫生故事:
谷歌搜索与流感预测(p2)文摘:
以一种前所未有的方式,通过对海量数据进行分析,获得有巨大价值的产品和服务,或深刻的洞见,引言一场生活、工作与思维的大变革,大数据,变革商业故事:
Farecast与飞机票价预测系统(p4)文摘:
【大数据的力量】到2012年为止,预测准确度高达75%,平均每张机票可节省50美元,引言一场生活、工作与思维的大变革,大数据,变革思维文摘:
【大数据洞察】事实上,一旦思维转变过来,数据就能被巧妙地用来激发新产品和新型服务。
文摘:
大数据是人们获得新的认知、创造新的价值的源泉;大数据还是改变市场、组织机构,以及政府与公民关系的方法。
引言一场生活、工作与思维的大变革,大数据,开启重大的时代转型故事:
天文学,信息爆炸的起源(p10)小知识:
KB-MB-GB-TB-PB-EB-ZB-YB-BB-,引言一场生活、工作与思维的大变革,预测,大数据的核心观点:
在不久的将来,世界许多现在单纯依靠人类判断力的领域都会被计算机系统所改变甚至取代。
引言一场生活、工作与思维的大变革,大数据,大挑战三个转变:
第一个转变就是,在大数据时代,我们可以分析更多的数据,有时候甚至可以处理和第一个转变就是,在大数据时代,我们可以分析更多的数据,有时候甚至可以处理和某个特别现象相关的所有数据,而不再依赖于随机采样。
这部分内容将在第1章阐述。
引言一场生活、工作与思维的大变革,大数据,大挑战三个转变:
第二个改变就是,研究数据如此之多,以至于我们不再热衷于追求精确度。
第二个改变就是,研究数据如此之多,以至于我们不再热衷于追求精确度。
这部分内容将在第2章阐述。
引言一场生活、工作与思维的大变革,大数据,大挑战三个转变:
第三个转变因前两个转变而促成,即我们不再热衷于寻找因果关系。
第三个转变因前两个转变而促成,即我们不再热衷于寻找因果关系。
这部分内容将在第3章阐述。
引言一场生活、工作与思维的大变革,第一部分大数据时代的思维变革,第一部分大数据时代的思维变革CH01更多:
不是随机样本,而是全体数据,小数据时代的随机采样,最少的数据获得最多的信息故事:
穿孔卡片与美国人口普查(p32)观点:
统计学家们证明:
采样分析的精确性随着采样随机性的增加而大幅提高,但与样本数量采样分析的精确性随着采样随机性的增加而大幅提高,但与样本数量的增加关系不大。
CH01更多:
不是随机样本,而是全体数据,小数据时代的随机采样,最少的数据获得最多的信息故事:
大数据与乔布斯的癌症治疗(p36)观点:
随机采样取得了巨大的成功,成为现代社会、现代测量领域的主心骨。
但这只是一条捷径,是在不可收集和分析全部数据的情况下的选择,它本身存在许多固有的缺陷。
CH01更多:
不是随机样本,而是全体数据,全数据模式,样本全数据模式,样本=总体故事:
Xoom与跨境汇款异常交易报警(p39)观点:
【大数据洞察】我们总是习惯把统计抽样看做文明得以建立的牢固基石,就如同几何学定理和万有引力定律一样。
但是统计抽样其实只是为了在技术受限的特定时期,解决当时存在的一些特定问题而产生的,其历史尚不足一百年。
如今,技术环境已经有了很大的改善。
在大数据时代进行抽样分析就像是在汽车时代骑马一样。
CH01更多:
不是随机样本,而是全体数据,第一部分大数据时代的思维变革CH02更杂:
不是精确性,而是混杂性,允许不精确故事:
微软与语料库数据添加(p50)观点:
【大数据洞察】“大数据”通常用概率说话,而不是板着“确凿无疑”的面孔。
整个社会要习惯这种思维需要很长的时间,其中也会出现一些问题。
但现在,有必要指出的是,当我们试图扩大数据规模的时候,要学会拥抱混乱。
CH02更杂:
不是精确性,而是混杂性,大数据的简单算法比小数据的复杂算法更有效故事:
无所不包的谷歌翻译系统(p53)观点:
数据多比少好,更多数据比算法系统更智能还要重要。
CH02更杂:
不是精确性,而是混杂性,纷繁的数据越多越好故事:
麻省理工与通货紧缩预测软件(p57)观点:
【大数据洞察】如今,我们已经生活在信息时代。
我们掌握的数据库越来越全面,它不再只包括我们手头现象的一点点可怜的数据,而是包括了与这些现象相关的大量甚至全部数据。
我们不再需要那么担心某个数据点对整套分析的不利影响。
我们要做的就是要接受这些纷繁的数据并从中受益,而不是以高昂的代价消除所有的不确定性。
CH02更杂:
不是精确性,而是混杂性,混杂性,不是竭力避免,而是标准途径观点:
要想获要想获得大规模数据带来的好处,混乱应该是一种标准途径,而不应该是竭力避免的。
观点:
传统的关系数据库是为数据稀缺的时代设计的,所以能够也需要仔细策划。
CH02更杂:
不是精确性,而是混杂性,新的数据库设计的诞生故事:
Hadoop与VISA的13分钟(p63)观点:
【大数据洞察】大数据要求我们有所改变,我们必须能够接受混乱和不确定性。
精确性似乎一直是我们生活的支撑,就像我们常说的“钉是钉,铆是铆”。
但认为每个问题只有一个答案的想法是站不住脚的,不管我们承不承认。
一旦我们承认了这个事实甚至拥护这个事实的话,我们离真相就又近了一步。
CH02更杂:
不是精确性,而是混杂性,第一部分大数据时代的思维变革CH03更好:
不是因果关系,而是相关关系,林登与亚马逊推荐系统观点:
知道人们为什么对这些信息感兴趣可能是有用的,但这个问题目前并不是很重要。
但是,知道知道“是什么是什么”可以创造点击率,这种洞察力足以重塑很多行业,不仅仅只是电子商可以创造点击率,这种洞察力足以重塑很多行业,不仅仅只是电子商务。
CH03更好:
不是因果关系,而是相关关系,关联物,预测的关键故事:
沃尔玛,请把蛋挞与飓风用品摆在一起(p73)观点:
【大数据洞察】相关关系的核心是量化两个数据值之间的数理关系。
相关关系强是指当一个数据值增加时,另一个数据值很有可能也会随之增加。
我们已经看到过这种很强的相关关系,比如谷歌流感趋势:
在一个特定的地理位置,越多的人通过谷歌搜索特定的词条,该地区就有更多的人患了流感。
相反,相关关系弱就意味着当一个数据值增加时,另一个数据值几乎不会发生变化。
例如,我们可以寻找关于个人的鞋码和幸福的相关关系,但会发现它们几乎扯不上什么关系。
CH03更好:
不是因果关系,而是相关关系,关联物,预测的关键故事:
沃尔玛,请把蛋挞与飓风用品摆在一起(p73)观点:
【大数据洞察】相关关系的核心是量化两个数据值之间的数理关系。
相关关系强是指当一个数据值增加时,另一个数据值很有可能也会随之增加。
我们已经看到过这种很强的相关关系,比如谷歌流感趋势:
在一个特定的地理位置,越多的人通过谷歌搜索特定的词条,该地区就有更多的人患了流感。
相反,相关关系弱就意味着当一个数据值增加时,另一个数据值几乎不会发生变化。
例如,我们可以寻找关于个人的鞋码和幸福的相关关系,但会发现它们几乎扯不上什么关系。
CH03更好:
不是因果关系,而是相关关系,关联物,预测的关键故事:
美国折扣零售商塔吉特与怀孕预测(p77)观点:
通过给我们找到一个现象的良好的关联物,相关关系可以帮助我们捕捉现在和预测未通过给我们找到一个现象的良好的关联物,相关关系可以帮助我们捕捉现在和预测未来。
CH03更好:
不是因果关系,而是相关关系,关联物,预测的关键故事:
UPS与汽车修理预测(p79)观点:
当收集、存储和分析数据的成本比较高的时候,应该适当地丢弃一些数据。
CH03更好:
不是因果关系,而是相关关系,“是什么”,而不是“为什么”观点:
【大数据先锋】幸福的非线性关系多年来,经济学家和政治家一直错误地认为收入水平和幸福感是成正比的。
我们从数据图表上可以看到,虽然统计工具呈现的是一种线性关系,但事实上,它们之间存在一种更复杂的动态关系:
对于收入水平在1万美元以下的人来说,一旦收入增加,幸福感会随之提升;但对于收入水平在1万美元以上的人来说,幸福感并不会随着收入水平提高而提升。
如果能发现这层关系,我们看到的就应该是一条曲线,而不是统计工具分析出来的直线。
CH03更好:
不是因果关系,而是相关关系,改变,从操作方式开始改变故事:
纽约大型沙井盖爆炸预测观点:
【大数据洞察】我们需要改变我们的操作方式,使用我们能收集到的所有数据,而不仅仅是使用样本。
我们不能再把精确性当成重心,我们需要接受混乱和错误的存在。
另外,我们应该侧重于分析相关关系,而不再寻求每个预测背后的原因。
CH03更好:
不是因果关系,而是相关关系,大数据,改变人类探索世界的方法观点:
就是因为不受限于传统的思维模式和特定领域里隐含的固因为不受限于传统的思维模式和特定领域里隐含的固有偏见,大数据才能为我们提供如此多新的深刻洞见。
观点:
大数据时代将要释放出的巨大价值使得我们选择大数据的理念和方法不再是一种权大数据时代将要释放出的巨大价值使得我们选择大数据的理念和方法不再是一种权衡,而是通往未来的必然改变。
CH03更好:
不是因果关系,而是相关关系,第二部分大数据时代的商业变革,第二部分大数据时代的商业变革CH04数据化:
一切皆可“量化”,莫里的导航图,大数据的最早实践之一,CH04数据化:
一切皆可“量化”,数据,从最不可能的地方提取出来故事:
日本先进工业技术研究所的坐姿研究与汽车防盗系统,CH04数据化:
一切皆可“量化”,数据化,不是数字化量化一切,数据化的核心观点:
数字化带来了数据化,但是数数字化带来了数据化,但是数字化无法取代数据化。
CH04数据化:
一切皆可“量化”,当文字变成数据当方位变成数据当沟通变成数据,CH04数据化:
一切皆可“量化”,世间万物的数据化观点:
一旦世界被数据化,就只有你想不到,而没有信息做不到的事情了。
莫里通过艰辛的人工分析才揭示了隐藏在数据中的价值,而今天,拥有了数据分析的工具(统计学和算法)以及必需的设备(信息处理器和存储器),我们就可以在更多领域、更快、更大规模地进行数据处理了。
在大数据时代,惊喜无处不在!
CH04数据化:
一切皆可“量化”,第二部分大数据时代的商业变革CH05价值:
“取之不尽,用之不竭”的数据创新,数据就像一个神奇的钻石矿,当它的首要价值被发掘后仍能不断给予。
它的真实价值就像漂浮在海洋中的冰山,第一眼只能看到冰山的一角,而绝大部分都隐藏在表面之下。
CH05价值:
“取之不尽,用之不竭”的数据创新,【大数据先锋】IBM,电动汽车动力与电力供应系统优化预测Hitwise,通过流量判断消费者喜好亚马逊,让数据的价值再大一点移动运营商与数据再利用谷歌街景与GPS采集微软与谷歌的拼写检查谷歌,从大的“噪音”数据中受益,CH05价值:
“取之不尽,用之不竭”的数据创新,第二部分大数据时代的商业变革CH06角色定位:
数据、技术与思维的三足鼎立,微软以1.1亿美元的价格购买了大数据公司Farecast,而两年后谷歌则以7亿美元的价格购买了给Farecast提供数据的ITASoftware公司。
如今,我们正处在大数据时代的早期,思维和技术是最有价值的,但是最终大部分的价值还是必须从数据本身中挖掘。
CH06角色定位:
数据、技术与思维的三足鼎立,【大数据先锋】ITAsoftware与数据授权VISAMasterCard与商户推荐微软研究中心与再入院率分析埃森哲与无线传感监测系统FlightCaster的大数据思维谷歌与亚马逊,三者兼备数据中间商,交通数据处理公司Inrix,CH06角色定位:
数据、技术与思维的三足鼎立,D与商品价格预测大数据价值链的3大构成大数据掌控公司大数据技术公司大数据思维公司和个人全新的数据中间商专家的消亡与数据科学家的崛起,CH06角色定位:
数据、技术与思维的三足鼎立,第三部分大数据时代的管理变革,无处不在的“第三只眼”我们的隐私被二次利用了预测与惩罚,不是因为“所做”,而是因为“将做”数据独裁挣脱大数据的困境,CH07风险:
让数据主宰一切的隐忧,管理变革1:
个人隐私保护,从个人许可到让数据使用者承担责任管理变革2:
个人动因VS预测分析管理变革3:
击碎黑盒子,大数据算法师的崛起管理变革4:
反数据垄断大亨,CH08掌控:
责任与自由并举的信息管理,
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 应用 统计学 课件 书摘