大数据导论题库习题试卷及答案.docx
- 文档编号:78446
- 上传时间:2023-04-28
- 格式:DOCX
- 页数:53
- 大小:59.83KB
大数据导论题库习题试卷及答案.docx
《大数据导论题库习题试卷及答案.docx》由会员分享,可在线阅读,更多相关《大数据导论题库习题试卷及答案.docx(53页珍藏版)》请在冰点文库上搜索。
《大数据导论》
教材配套习题和答案
第1章 大数据概述
一、单选题
1、下面关于数据的说法,错误的是:
(B)
A.数据的根本价值在于可以为人们找出答案
B.数据的价值会因为不断使用而削减
C.数据的价值会因为不断重组而产生更大的价值
D.目前阶段,数据的产生不以人的意志为转移
2、第3次信息化浪潮的标志是:
(C)
A.个人计算机的普及
B.互联网的普及
C.云计算、大数据和物联网技术的普及
D.人工智能的普及
3、物联网的发展最终导致了人类社会数据量的第三次跃升,使得数据产生方式进入了:
(D)
A.手工创建阶段
B.运营式系统阶段
C.用户原创内容阶段
D.感知式系统阶段
4、英国的大数据发展战略是:
(D)
A. 稳步实施“三步走”战略,打造面向未来的大数据创新生态
B. 通过发展创新性解决方案并应用于实践来促进大数据发展
C. 以大数据等技术为核心应对第四次工业革命
D. 紧抓大数据产业机遇,应对脱欧后的经济挑战
5. 以下哪个不是大数据的“4V”特性:
(D)
A.数据量大
B.数据类型繁多
C.处理速度快
D.价值密度高
二、多选题
1、数据的类型主要包括:
(ABCD)
A.文本
B.图片
C.音频
D.视频
2、计算机系统中的数据组织形式主要有两种,分别是:
(AD)
A.文件
B.视频
C.音频
D.数据库
3、为了让数据变得可用,需要对数据进行三个步骤的处理,分别是:
(ACD)
A.数据清洗
B.数据抽样
C.数据管理
D.数据分析
4、信息科技为大数据时代提供技术支撑,主要体现在哪三个方面:
(ABD)
A.存储设备容量不断增加
B.CPU处理能力大幅提升
C.量子计算机全面普及
D.网络带宽不断增加
5、人类社会的数据产生方式大致经历了哪三个阶段:
(BCD)
A.手工生产阶段
B.运营式系统阶段
C.用户原创内容阶段
D.感知式系统阶段
6、关于“大数据摩尔定律”,以下说法正确的是:
(ABC)
A.人类社会产生的数据一直都在以每年50%的速度增长
B.人类社会的数据量大约每两年就增加一倍
C.人类在最近两年产生的数据量相当于之前产生的全部数据量之和
D.人类社会的数据量以每年10%的速度增长
7、人类自古以来在科学研究上先后历经了哪几种范式:
(ABCD)
A.实验科学
B.理论科学
C.计算科学
D.数据密集型科学
8、大数据将会对社会发展产生深远的影响,具体表现在以下哪几个方面:
(ABCD)
A.大数据决策成为一种新的决策方式
B.大数据成为提升国家治理能力的新途径
C.大数据应用促进信息技术与各行业的深度融合
D.大数据开发推动新技术和新应用的不断涌现
9、大数据产业是指一切与支撑大数据组织管理和价值发现相关的企业经济活动的集合。
以下哪些属于大数据产业的某个环节(ABCD):
A.IT基础设施层
B.数据源层
C.数据管理层
D.数据分析层
第2章 大数据与其他新兴技术之间的关系
一、单选题
1、早期的云计算产品AWS是由哪家企业提出的:
(C)
A.IBM
B.微软
C.亚马逊
D.谷歌
2、云计算包括3种类型。
面向所有用户提供服务,只要是注册付费的用户都可以使用,这种云计算属于:
(A)
A.公有云
B.私有云
C.混合云
D.独立云
3、云计算包括3种类型。
只为特定用户提供服务,比如大型企业出于安全考虑自建的云环境,只为企业内部提供服务,这种云计算属于:
(B)
A.公有云
B.私有云
C.混合云
D.独立云
4、以下关于大数据、云计算和物联网的区别,描述错误的是:
(C)
A.大数据侧重于对海量数据的存储、处理与分析,从海量数据中发现价值,服务于生产和生活
B.云计算本质上旨在整合和优化各种IT资源并通过网络以服务的方式,廉价地提供给用户
C.云计算旨在从海量数据中发现价值,服务于生产和生活
D.物联网的发展目标是实现物物相连,应用创新是物联网发展的核心
5、以下关于机器学习,描述错误的是:
(C)
A.是一门涉及统计学、系统辨识、逼近理论、神经网络、优化理论、计算机科学、脑科学等诸多领域的交叉学科
B.研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能
C.机器学习强调三个关键词:
算法、模型、训练
D.基于数据的机器学习是现代智能技术中的重要方法之一
6、以下关于知识图谱,描述错误的是:
(C)
A.又称为科学知识图谱
B.在图书情报界称为知识域可视化或知识领域映射地图
C.知识图谱属于密码学研究范畴
D.知识图谱可用于反欺诈、不一致性验证、组团欺诈等公共安全保障领域
7、以下关于人机交互,描述错误的是:
(B)
A.人机交互是一门研究系统与用户之间的交互关系的学科
B.人机交互界面通常是指用户不可见的部分
C.系统可以是各种各样的机器,也可以是计算机化的系统和软件
D.用户通过人机交互界面与系统交流,并进行操作
8、以下关于计算机视觉,描述错误的是:
(D)
A.计算机视觉是一门研究如何使机器“看”的科学
B.是指用摄影机和电脑代替人眼对目标进行识别、跟踪和测量的机器视觉
C.计算机视觉是一门综合性的学科
D.语音识别属于计算机视觉的典型应用
9、关于大数据与区块链的联系,下面描述错误的是:
(D)
A.区块链使大数据极大降低信用成本
B.区块链是构建大数据时代的信任基石
C.区块链是促进大数据价值流通的管道
D.区块链会提升大数据的信用成本
二、多选题
1、传统的IT资源获取方式的主要缺点是:
(ABC)
A.初期成本高,建设周期长
B.后期需要自己维护,使用成本高
C.IT资源供应量有限
D.IT资源供应量无限
2、云计算的主要优点是:
(BCD)
A.初期投入大,需要用户自己维护
B.初期零成本,瞬时可获得
C.后期免维护,使用成本低
D.在供应IT资源量方面“予取予求”
3、云计算包括哪3种典型的服务模式:
(ABD)
A.IaaS(基础设施即服务)
B.PaaS(平台即服务)
C.MaaS(机器即服务)
D.SaaS(软件即服务)
4、云计算包括哪3种类型:
(ACD)
A.公有云
B.独立云
C.私有云
D.混合云
5、从技术架构上看,物联网主要包括哪几层:
(ABCD)
A.感知层
B.网络层
C.处理层
D.应用层
5、以下关于大数据、云计算和物联网的联系,描述正确的是:
(ABCD)
A.从整体上看,大数据、云计算和物联网这三者是相辅相成的
B.大数据根植于云计算,大数据分析的很多技术都来自于云计算
C.大数据为云计算提供了“用武之地”
D.物联网需要借助于云计算和大数据技术,实现物联网大数据的存储、分析和处理
6、以下关于大数据与人工智能的联系,描述正确的是:
(ABCD)
A.人工智能需要数据来建立其智能,特别是机器学习
B.人工智能应用的数据越多,其获得的结果就越准确
C.大数据为人工智能提供了海量的数据,使得人工智能技术有了长足的发展
D.大数据技术为人工智能提供了强大的存储能力和计算能力
7、下面关于比特币和区块链之间关系的描述,正确的是:
(BC)
A.比特币和区块链没有任何关系
B.区块链是比特币的底层技术
C.比特币是区块链的一种应用
D.比特币是比区块链更先进的一种技术
8、比特币要解决的两个核心问题是:
(AD)
A.防篡改
B.防丢失
C.防贬值
D.去中心化记账
9、在比特币区块链中关于如何争夺记账权的问题,下面描述正确的是:
(ABCD)
A.采用的是POW机制,也就是“工作量证明机制”
B.记账节点通过计算数学题,来争夺记账权
C.对于数学公式的计算,除了从零开始遍历随机数碰运气以外,没有其他办法
D.解题的过程,又叫“挖矿”,记账节点被称为矿工。
谁先解对,谁就获得记账权
10、区块链的三要素是:
(ABC)
A.交易
B.区块
C.链
D.比特币
第3章 大数据基础知识
一、单选题
1、下面关于大数据安全问题,描述错误的是:
(D)
A.大数据的价值并不单纯地来源于它的用途,而更多地源自其二次利用
B.对大数据的收集、处理、保存不当,会加剧数据信息泄露的风险
C.大数据成为国家之间博弈的新战场
D.大数据对于国家安全没有产生影响
2、下面关于棱镜门事件描述错误的是:
(C)
A.棱镜计划(PRISM)是一项由美国国家安全局(NSA)自2007年起开始实施的绝密电子监听计划
B.在该计划中,美国国家安全局和联邦调查局利用平台和技术上的优势,开展全球范围内的监听活动
C.该计划的目的是为了促进世界和平与发展
D.该计划对全世界重点地区、部门、公司甚至个人进行布控
3、下面关于手机软件采集个人信息的描述错误的是:
(C)
A.在我们的日常生活中,部分手机APP往往会“私自窃密”
B.有的APP在提供服务时,采取特殊方式来获得用户授权,这本质上仍属“未经同意”
C.在微信朋友圈广泛传播的各种测试小程序是安全的,不会窃取用户个人信息
D.手机APP过度采集个人信息呈现普遍趋势,最突出的是在非必要的情况下获取位置信息和访问联系人权限
4、下面描述错误的是:
(D)
A.“探针盒子”就是一款自动收集用户隐私的产品
B.许多顾客在使用WiFi之后会收到大量的广告信息,甚至自己的手机号码也会被当做信息进行多次买卖
C.在免费上网的背后,其实也存在着不小的信息安全风险,或许一不小心,就落入了电脑黑客们设计的WiFi陷阱之中
D.免费WIFI都是安全的,可以放心使用
5、下面关于机械思维的核心思想,描述错误的是:
(B)
A.世界变化的规律是确定的
B.世界变化的规律是无法确定的
C.规律不仅是可以被认识的,而且可以用简单的公式或者语言描述清楚
D.这些规律应该是放之四海而皆准的,可以应用到各种未知领域指导实践
6、我们在使用智能手机进行导航来避开城市拥堵路段时,体现了哪种大数据思维方式:
(A)
A.我为人人,人人为我
B.全样而非抽样
C.效率而非精确
D.相关而非因果
7、谷歌采用搜索引擎大数据进行流感趋势预测,体现了哪种大数据思维方式:
(B)
A.我为人人,人人为我
B.全样而非抽样
C.效率而非精确
D.相关而非因果
8、“啤酒与尿布”的故事,体现了哪种大数据思维方式:
(D)
A.我为人人,人人为我
B.全样而非抽样
C.效率而非精确
D.相关而非因果
9、大数据的简单算法比小数据的复杂算法更有效,体现了哪种大数据思维方式:
(A)
A.以数据为中心
B.全样而非抽样
C.效率而非精确
D.相关而非因果
10、迪士尼MagicBand手环,体现了哪种大数据思维方式:
(A)
A.我为人人,人人为我
B.全样而非抽样
C.效率而非精确
相关而非因果
11、下面关于大数据伦理的描述,错误的是:
(D)
A.大数据伦理属于科技伦理的范畴
B.大数据伦理问题是指由于大数据技术的产生和使用而引发的社会问题
C.作为一种新的技术,大数据技术像其他所有技术一样,其本身是无所谓好坏的,而它的“善”与“恶”全然在于对大数据技术的使用者
D.大数据技术本身就存在“善”和“恶”的区分
12、现在的互联网,基于大数据和人工智能的推荐应用越来越多,越来越深入,我们一直被“喂食着”经过智能化筛选推荐的信息,久而久之,会导致什么问题:
(A)
A、信息茧房问题
B、隐形偏差问题
C、大数据杀熟问题
D、隐私泄露问题
13、下面哪一个不属于大数据伦理问题:
(D)
A.隐私泄露问题
B.数据安全问题
C.数字鸿沟问题
D.数据冗余问题
14、下面关于政府数据孤岛描述错误的是:
(D)
A.有些政府部门错误地将数据资源等同于一般资源,认为占有就是财富,热衷于搜集,但不愿共享
B.有些部门只盯着自己的数据服务系统,结果因为数据标准、系统接口等技术原因,无法与外单位、外部门联通
C.有些地方,对大数据缺乏顶层设计,导致各条线、各部门固有的本位主义作祟,壁垒林立,数据无法流动
D.即使涉及到工作机密、商业机密,政府也应该毫不保留地共享数据
15、关于推进数据共享开放的描述,错误的是:
(D)
A.要改变政府职能部门“数据孤岛”现象,立足于数据资源的共享互换,设定相对明确的数据标准,实现部门之间的数据对接与共享
B.要使不同省区市之间的数据实现对接与共享,解决数据“画地为牢”的问题,实现数据共享共用
C.在企业内部,破除“数据孤岛”,推进数据融合
D.不同企业之间,为了保护各自商业利益,不宜实现数据共享
16、下面关于数据权的描述,错误的是:
(D)
A.数据权的概念发起于英国,主要将其视为信息社会的一项基本公民权利
B.数据权包括两个方面:
数据主权和数据权利
C.数据主权的主体是国家,是一个国家独立自主对本国数据进行管理和利用的权力
D.数据主权的主体是公民,是相对应于公民数据采集义务而形成的对数据利用的权利
17、下面关于政府信息公开与政府数据开放的描述,错误的是:
(B)
A.政府信息公开与政府数据开放是一对既相互区别又相互联系的概念
B.信息是没有经过任何加工与解读的原始记录,没有明确的含义,而数据则是经过加工处理并被赋予一定含义的
C.政府信息公开主要是为了对公众知情权的满足而出现的
D.政府数据开放强调的是数据的再利用,公众可以分享数据利用创造的经济和社会价值
18、关于公民的隐私权,下面描述错误的是:
(A)
A.修改权是隐私权利人具有的依法了解自身信息资料是否被行政主体利用的权利
B.支配权是隐私权利人的基本权利之一,隐私权利人对自己的个人信息的收集、储存、传播、使用、开放等享有支配权
C.保障权是指公民有权要求政府在数据开放的过程中保障涉及其个人隐私的信息资料不被开放、不被滥用和不被泄露
D.救济权是公民在自身的合法权益受到侵害时,按照法定程序采取法律手段维护自身权益的权利
19、关于大数据交易在发展过程中遇到的问题,下面描述错误的是:
(D)
A.互联网数据马太效应显现
B.市场信用体系缺失、监管有待加强
C.大数据交易规则和标准缺乏
D.数据质量评价与估值定价已经很完善
20、目前大数据交易市场上存在很多种定价机制,但是不包括以下哪项:
(D)
A.平台预定价
B.自动计价
C.拍卖式定价
D.随机性定价
21、我国首家大数据交易所是:
(A)
A.贵阳大数据交易所
B.上海数据交易中心
C.华东江苏大数据交易中心
D.浙江大数据交易中心
二、多选题
1、传统的数据安全的威胁主要包括:
(ABC)
A.计算机病毒
B.黑客攻击
C.数据信息存储介质的损坏
D.数据复制
2、大数据安全表现出与传统数据安全不同的特征,具体来说包括哪几个方面:
(ABCD)
A.大数据成为网络攻击的显著目标
B.大数据加大隐私泄露风险
C.大数据技术被应用到攻击手段中
D.大数据成为高级可持续攻击(APT)的载体
3、舍恩伯格在《大数据时代:
生活、工作与思维的大变革》一书中明确指出,大数据时代最大的转变就是思维方式的3种转变,具体包括:
(ABC)
A.全样而非抽样
B.效率而非精确
C.相关而非因果
D.务实而非务虚
4、下面关于搜索引擎“点击模型”的描述正确的是:
(ABCD)
A.随着数据量的积累,点击模型对搜索结果排名的预测越来越准确,它的重要性也越来越大
B.点击模型的准确性取决于数据量的大小
C.一个搜索引擎使用的时间越长,数据的积累就越充分,对于长尾搜索就做得越准确
当整个搜索行业都意识到点击数据的重要性后,这个市场上的竞争就从技术竞争变成了数据竞争
5、下面关于隐私泄露问题的描述,正确的是:
(ABCD)
A.大数据时代下的隐私与传统隐私的最大区别在于隐私的数据化,即隐私主要以“个人数据”的形式出现
B.用户在使用搜索引擎时,搜索引擎可以精确地刻画出该用户的“数字肖像”
C.通过数据预测,可以预测个体“未来的隐私”
D.“数据痕迹”往往永远无法彻底消除,会被永久保留记录
6、下面关于数字鸿沟问题的描述,正确的是:
(ACD)
A.数字鸿沟被认为是信息时代的“马太效应”,即先进技术的成果不能为人公正分享,于是造成“富者越富、穷者越穷”的情况
B.数字鸿沟因为大数据技术的诞生而趋向弥合
C.数字鸿沟是一个涉及公平公正的问题
D.在我国,东中西部地区、城乡之间等都可以明显感受到数字鸿沟的存在
7、下面关于数据独裁的描述,正确的是:
(ABCD)
A.所谓的“数据独裁”是指在大数据时代,由于数据量的爆炸式增长,导致做出判断和选择的难度徒增,迫使人们必须完全依赖数据的预测和结论才能做出最终的决策
B.从某个角度来讲,数据独裁就是让数据统治人类,使人类彻底走向唯数据主义
C.数据独裁最终将导致人类思维被“空心化”,进而是创新意识的丧失
D.数据独裁还可能使人们丧失了人的自主意识、反思和批判的能力,最终沦为数据的奴隶
8、因数据而产生的垄断问题,主要包括哪几种类型:
(ABCD)
A.数据可能造成进入壁垒或扩张壁垒
B.拥有大数据形成市场支配地位并滥用
C.因数据产品而形成市场支配地位并滥用
D.涉及数据方面的垄断协议
9、企业数据孤岛产生的原因主要包括哪两个方面:
(AB)
A.以功能为标准的部门划分导致数据孤岛
B.不同类型、不同版本的信息化管理系统导致数据孤岛
C.机构设置不合理
D.各个部门责权利不清晰
10、消除数据孤岛对于政府具有哪些重要的意义:
(ABCD)
A.有助于提升资源利用率
B.有助于推动政府转型
C.有助于提高行政效率
D.有助于促进跨部门合作
11、消除数据孤岛对于企业具有哪些重要的意义:
(ABC)
A.有助于企业做出有利于生产要素组合优化的决策,使企业能够合理配置资源,实现企业利益最大化
B.有利于企业获得更好的经营发展能力
C.企业信息的增多可以增加做出正确选择的能力,从而提高经济效率
D.不利于企业长远的发展
12、实现数据共享,在政府层面面临的挑战包括:
(ABCD)
A.不愿共享开放
B.不敢共享开放
C.不会共享开放
D.数据中心共享开放作用不强
13、实现数据共享,在企业层面面临的挑战包括:
(ABC)
A.系统孤岛挑战
B.组织架构挑战
C.数据合作挑战
D.利润风险挑战
14、关于政府数据开放的意义,下面描述正确的是:
(ABC)
A.政府开放数据有利于促进开放透明政府的形成
B.政府开放数据有利于创新创业和经济增长
C.政府开放数据有利于社会治理创新
D.政府开放数据将会对政府正常运作产生威胁
15、目前进行数据交易的形式主要包括哪几种:
(ABC)
A.大数据交易公司
B.数据交易所
C.API 模式
D.PPT模式
16、大数据交易平台的类型主要包括哪两种:
(AD)
A.综合数据服务平台
B.实时数据交易平时
C.零散数据交易平台
D.第三方数据交易平台
17、交易数据的来源主要包括哪些:
(ABCD)
A.政府公开数据
B.企业内部数据
C.数据供应方数据
D.网页爬虫数据
18、交易产品的类型主要包括哪几种:
(ABCD)
A.API
B.数据包
C.云服务
D.解决方案
19、大数据交易平台的运营模式主要包括哪两种:
(BC)
A.具有交易实时显示功能的交易平台
B.兼具中介和数据处理加工功能的交易平台
C.只具备中介功能的交易平台
D.只具备数据处理加工功能的交易平台
20、可以从哪些维度评价数据价值:
(ABCD)
A.数据样本量
B.数据品种
C.数据完整性
D.数据实时性
第4章 大数据应用
一、单选题
1、下面关于推荐系统的描述错误的是:
(D)
A.推荐系统是自动联系用户和物品的一种工具
B.和搜索引擎相比,推荐系统通过研究用户的兴趣偏好,进行个性化计算
C.推荐系统可发现用户的兴趣点,帮助用户从海量信息中去发掘自己潜在的需求
D.推荐系统是一种只能通过专家进行人工推荐的系统
2、以下推荐方法中,哪一个是基于内容的推荐:
(C)
A.由资深的专业人士来进行物品的筛选和推荐
B.基于统计信息进行推荐
C.通过机器学习的方法去描述内容的特征,并基于内容的特征来发现与之相似的内容
D.对多种推荐算法进行有机组合,然后给出推荐结果
3、以下哪项不属于大数据在城市管理中的应用:
(D)
A.智能交通
B.环保监测
C.城市规划
D.比赛预测
4、以下哪项不属于大数据在零售领域的应用:
(A)
A.大数据征信
B.发现关联购物行为
C.客户群体划分
D.供应链管理
二、多选题
1、一个完整的推荐系统通常包括哪3个组成模块:
(ABC)
A.用户建模模块
B.推荐对象建模模块
C.推荐算法模块
D.可视化模块
2、智慧医疗具有哪些优点:
(ABCD)
A.促进优质医疗资源的共享
B.避免患者重复检查
C.促进医疗智能化
D.有助于实现全民免费医疗
3、下面关于智能物流的描述,正确的是:
ABCD
A.又称智慧物流,是利用智能化技术,使物流系统能模仿人的智能,具有思维、感知、学习、推理判断和自行解决物流中某些问题的能力
B.可以帮助实现物流资源优化调度和有效配置,并且提升物流系统效率
C.智能物流概念源自2010年IBM发布的研究报告《智慧的未来供应链》
D.智能物流概念经历了自动化、信息化、网络化3个发展阶段
4、智能物流具有哪几个方面的重要作用:
(ABC)
A.提高物流的信息化和智能化水平
B.降低物流成本和提高物流效率
C.提高物流活动的一体化
D.提高了物流的复杂性
5、大数据在金融领域的应用主要包括:
(ABCD)
A.高频交易
B.市场情绪分析
C.信贷风险分析
D.大数据征信
6、大数据在餐饮行业的应用主要包括:
(ABCD)
A.大数据驱动的团购模式
B.利用大数据为用户推荐消费内容
C.利用大数据调整线下门店布局
D.利用大数据控制店内人流量
第5章 数据采集与预处理
一、单选题
1、以下哪个步骤不属于数据的采集与预处理:
(D)
A.利用ETL工具将分布的、异构数据源中的数据,抽取到临时中间层后进行清洗、转换、集成,最后加载到数据仓库或数据集市中
B.利用日志采集工具把实时采集的数据作为流计算系统的输入,进行实时处理分析
C.利用网页爬虫程序到互联网网站中爬取数据
D、对分析结果进行可视化呈现,帮助人们更好地理解数据、分析数据
2、以下哪项不属于数据清洗的内容:
(B)
A.一致性检查
B.精确度校验
C.无效值和缺失值的处理
D.成对删除
3、以下哪个不是Flume的核心组件:
(A)
A.数据块(Block)
B.数据源(Source)
C.数据通道(Channel)
D.数据槽(Sink)
6、下面关于网络爬虫的描述错误的是:
(D)
A.网络爬虫是一个自动提取网页的程序
B.为搜索引擎从万维网上下载网页,是搜索引擎的重要组成部分
C.爬虫从一个或若干个初始网页的URL开始,获得初始网页上的URL,在抓取网页的过程中,不断从当前页面上抽取新的URL放入队列,直到满足系统的一定停止条件
D.网络爬虫的行为和人们访问网站的行为是完全不同的
7、下面关于网络爬虫的描述正确的是:
(D)
A.网络爬虫由控制节点、爬虫节点和资源库构
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据 导论 题库 习题 试卷 答案