国家开放大学《财务大数据分析与决策》形考任务1-4答案.docx
- 文档编号:12221551
- 上传时间:2023-06-04
- 格式:DOCX
- 页数:7
- 大小:25KB
国家开放大学《财务大数据分析与决策》形考任务1-4答案.docx
《国家开放大学《财务大数据分析与决策》形考任务1-4答案.docx》由会员分享,可在线阅读,更多相关《国家开放大学《财务大数据分析与决策》形考任务1-4答案.docx(7页珍藏版)》请在冰点文库上搜索。
国家开放大学《财务大数据分析与决策》形考任务1-4答案
形考任务1
1.下列哪个选项不属于大数据的特点?
()
A.海量化的数据
B.大数据都是有价值的数据
C.数据类型的多样化
D.大数据的价值密度相对较低
2.下列哪个选项不属于大数据处理的环节?
()
A.数据模型
B.数据预处理
C.数据分析
D.数据可视化
3.下列不属于大数据思维的是()。
A.全样思维
B.容错思维
C.抽样思维
D.相关思维
4.下列关于JupyterNotebook,说法不正确的是()
A.JupyterNotebook是Anaconda集成环境中自带的代码编辑器
B.JupyterNotebook是一个网页程序
C.JupyterNotebook页面单元格中不仅可以输入代码还可以输入文字
D.JupyterNotebook的Markdown单元中只能输入文字
5.下列print语句使用正确的是()。
A.print(“你好,大数据”)
B.print(你好,大数据)
C.print([你好,大数据])
D.print'你好,大数据'
6.JupyterNotebook中每个代码单元可书写()行代码。
A.一至多
B.一
C.十
D.至多一
7.大数据产生的原因包括()。
A.全球所有人都是信息的接收者和产生者
B.各类传感器24小时不停地产生数据
C.人类活动的进一步扩展使数据规模急剧膨胀
D.大数据以每年50%的速度增长
8.大数据的“4V”特点具体指()。
A.Volume
B.Variety
C.Velocity
D.Value
9.Value是指大数据的价值密度。
与结构化数据相比,大数据的价值密度相对较高。
(×)
10.有多种方法可以启动JupyterNotebook。
(√)
形考任务2
1.下面代码中x的值最终等于()。
x=10
x=20
x=x+1
A.21
B.20
C.11
D.10
2.定义变量a=888,该变量值的类型是()。
A.整型
B.浮点型
C.字符型
D.布尔型
3.下面代码中,print()输出值的数量为()。
str1='Hello!
'
str2='World!
'
print(str1,str2)
A.1个
B.2个
C.3个
D.4个
4.定义cList2=[1,2,3,4],则cList2[0]的执行结果为()。
A.0
B.1
C.2
D.3
5.下面代码中,首次进入for循环体的输出结果是()。
foriin[0,1,2,3]:
print('i的值为{}'.format(i))
A.i=1
B.i=2
C.i=3
D.i=0
6.下列Python变量名书写符合命名规则的是()。
A.11num
B.num11
C.print
D.Num11
7.在Python的双分支结构语法格式中,当if条件表达式为()时,将执行if分支体中的语句。
A.真
B.假
C.True
D.False
8.程序的三种基本控制结构是()。
A.逻辑结构
B.分支结构
C.循环结构
D.顺序结构
9.运行如下代码,输出结果是()。
foriinrange(3,6):
print('*')
A.输出三行,每行各一个*
B.输出一行,包括三个*
C.输出四行,每行各一个+*
D.输出一行,包括四个*
10.划线处的正确代码是()。
if():
print("cROE小于roeAvg.")
A.cROE==roeAvg
B.cROE C.cROE>roeAvg D.cROE>=roeAvg 形考任务3 1.下面不属于Series创建方法的是()。 A.通过一维数组创建序列 B.通过字典的方式创建序列 C.通过DataFrame中的某一行或某一列创建序列 D.通过二维数据创建 2.关于Pandas数据读写的说法中,下列描述错误的是()。 A.read_csv()能够读取所有文本数据 B.read_sql()可以读取数据库中的数据 C.to_csv()能够将结构化数据写入到csv文件中 D.to_excel()能够将结构化数据写入到excel文件中 3.下列代码正确的执行结果是()。 s=pd.Series([1,2,4],index=['a','b','c']) print(s) A.a1b2c4 B.a1c2b3 C.abc124 D.a1b3c2 4.下列函数中,不属于Pandas统计计算函数的是()。 A.mean() B.sum() C.min() D.print() 5.下列选项中,()函数可以一次性输出多个统计指标。 A.describe() B.mean() C.input() D.sum() 6.现有如下工资数据集,求最高工资,正确代码是()。 data={'李伟': 10000,'张妍': 12000,'赵丽': 13000,'杨朋': 9000} s=pd.Series(data) print(s) A.s.max() B.s.max(axis=1) C.s.min() D.s.min(axis=1) 7.下列关于Pandas数据排序说法正确的是()。 A.sort_values()可以按值排序 B.sort_values()可以按索引排序 C.sort_index()可以按索引排序 D.sort_index()可以按值排序 8.下列选项中,关于groupby()的操作正确的是()。 A.list(df.groupby('系部')) B.df.groupby(by='系部') C.df.groupby('系部',sort=True) D.df.groupby('系部','性别') 9.loc方法是基于索引的数据访问方法,iloc方法是基于位置索引的访问方法。 (√) 10.groupby方法可以使用多个分组标签。 (√) 形考任务4 1.下列关于数据预处理的描述中,描述不正确的是()。 A.数据清洗的目的是为了提高数据质量 B.空值一定要删除 C.数据预处理包括数据的清洗、合并、重塑与转换 D.在Pandas中,缺失值使用NaN表示 2.下面关于dropna()的axis参数描述中,说法正确的是()。 A.默认axis=0,删除包含缺失值的列 B.默认axis=0,删除包含缺失值的行 C.默认axis=1,删除包含缺失值的列 D.默认axis=1,删除包含缺失值的行 3.下列关于Matplotlib库的描述中,说法不正确的是()。 A.Matplotlib是当前用于数据可视化的最流行的Python包之一 B.Matplotlib提供了绘制散点图、条形图、折线图、饼图、直方图的方法 C.可通过交互方式实现数据可视化 D.Matplotlib不能支持中文显示 4.plot(x,y)的命令含义是()。 A.打印 B.输出 C.绘图 D.计算 5.想要在数据集df第1列前插入一列[88,90,69,65,89,82],列标签是“C语言”。 下列代码正确的是()。 A.df.insert(1,"C语言",[88,90,69,65,89,82]) B.df.insert(0,"C语言",[88,90,69,65,89,82]) C.df.add(1,"C语言",[88,90,69,65,89,82]) D.df.append(1,"C语言",[88,90,69,65,89,82]) 6.Pandas提供了isnull()函数和notnull()函数来检测数据中是否存在缺失值。 (√) 7.在Pandas中可以实现数据合并的方法只有concat(×)。 8.数据转置是指对数据的行列进行互换,在这个过程中数据的形状改变,数据逻辑也发生变化。 (√) 9.有如下数据集df, 要增加一列“总成绩”,实现如下图的效果: 那么正确的代码是()。 A.df['总成绩']=0 B.df[总成绩]=0 C.df['总成绩']=[0,0,0,0,0,0] D.总成绩=0 10.从如下程序生成的数据集中只提取语文和数学这两列,下列选项中代码正确的是()。 importpandasaspd data={'语文': [86,99,68,83,79,91], '数学': [78,66,58,75,77,59], '英语': [68,99,68,83,79,91], '地理': [88,90,78,63,100,71]} df=pd.DataFrame(data,index=['李东','李力','王平','赵平','张也','马云',]) df A.df['语文','数学'] B.df[['语文','数学']] C.df[{'语文''数学'}] D.df.iloc[['语文','数学']] 7/7
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 财务大数据分析与决策 国家 开放 大学 财务 数据 分析 决策 任务 答案
![提示](https://static.bingdoc.com/images/bang_tan.gif)