11810061张亚洲年下半年数据库技术作业1.doc
- 文档编号:16111669
- 上传时间:2023-07-10
- 格式:DOC
- 页数:6
- 大小:167KB
11810061张亚洲年下半年数据库技术作业1.doc
《11810061张亚洲年下半年数据库技术作业1.doc》由会员分享,可在线阅读,更多相关《11810061张亚洲年下半年数据库技术作业1.doc(6页珍藏版)》请在冰点文库上搜索。
数据库原理作业1
综合练习五
一、选择题
1.(C)就是能从这许多查询策略中找出最有效的查询执行计划的一种处理过程。
A.查询分析
B.查询翻译
C.查询优化
D.查询执行
2.因为每个中间运算的结果被创建,然后用于下一层的运算,这种查询表达式的计算方法被称为(A)计算。
A.实体化
B.流水线
C.双缓冲
D.临时区
3.下面哪条是选择运算的级联定律(A)。
A.σF1^F2(E)≡σF1(σF2(E))
B.σF1(σF2(E))≡σF2(σF1(E)
C.ПA1(ПA2(…(ПAn(E))…)≡ПA1(E)
D.ПA(E1∪E2)≡ПA(E1)∪ПA(E2)
二、填空题
1.关系查询处理可以分4个步骤,包括查询分析和检查、查询翻译、查询优化、查询执行。
2.对于线性搜索,如果该数据文件中有N个磁盘块数,在码属性上进行选择运算,则它的理想情况的代价为1,平均代价为N/2,最坏情况的代价为N。
3.典型的启发式优化规则有:
尽早执行选择运算、尽早执行投影运算。
三、思考题
1.名词解释。
关系表达式 查询处理 查询优化 查询处理代价
查询树 流水线 等价规则
答:
n关系表达式:
用关系运算符连接若干个算术表达式,叫关系表达式;
n查询处理:
查询处理是指从数据库中提取数据所涉及的一系列过程和活动,这些活动是由数据库自动完成的,不需要人的参与。
它的作用是把用户提交的关系查询语句转化为系统可执行的查询执行计划。
n查询优化:
查询优化就是能从这些多策略中找出最有效的查询执行计划的一种处理过程。
n查询处理代价:
查询处理代价是指查询处理过程中每个操作消耗的时间和空间代价,查询查询处理代价可以通过该查询对各种资源的使用情况进行测量,这些资源包括磁盘存取、执行一个查询所用CPU时间、在分布式数据库系统或并行数据库系统中通信开销。
n查询树:
查询树又称语法分析树,它建立在扩展的关系代数的基础上的。
n流水线:
通过减少查询执行中产生的临时文件数,可以提高查询执行的效率。
减少临时文件数据是通过将多个关系运算组合成一个运算的流水线来实现,即将多个运算的结果传送到一下个运算,这样的运算叫流水线运算。
n等价规则:
两个关系表达式是等价的是指在任何一种有效数据库实例中它们都会产生相同的元组集。
等价规则指出两种不同形式的表达式是等价的。
2.简述查询优化的一般准则。
答:
查询优化的一般准则如下:
n选择运算应尽可能先做;
n在执行连接前对关系适当的预处理
n把投影运算和选择运算同时进行
n投影同双目运算结合
n选择同某些笛卡尔积结合起来构成一个连接运算
n找出公共子表达式
3.证明以下等价式成立。
说明如何用它们提高某些查询的效率。
(1)E1F(E2–E3)≡(E1FE2–E2FE3)。
(2)σF1^F2^F3(E)≡σF1(σF2(σF3(E)))。
(3)σF1^F2(E1FE2)≡σF1(E1F(σF2(E2))),其中F2仅使用E2的属性。
综合练习六
一、选择题
1.不满足(A)的数据库就不是关系数据库。
A.第一范式 B.第二范式 C.第三范式 D.第四范式
2.设计不好的数据库有可能会(D)。
A.插入异常
B.删除异常、数据冗余度大
C.更新困难
D.插入异常、删除异常、数据冗余度大、更新困难
3.若要求分解具有无损连接性,那么模式分解一定能够达到(B)。
A.2NF B.4NF C.BCNF D.3NF
二、填空题
1.第一范式是指同一列中不能有多个值,即实体中的某个属性必须是原子项
2.分解具有无损连接性和分解保持函数依赖是两个互相独立的标准。
具有无损连接性的分解不一定能够保持函数依赖。
同样,保持函数依赖的分解也不一定具有无损连接性。
3.范式是衡量模式优劣的标准,范式表达了模式中数据依赖之间应满足的联系。
三、思考题
1.什么是范式?
为什么需要范式?
答:
(1)构造数据库必须遵循一定的规则。
在关系数据库中,这种规则就是范式。
范式是符合某一种级别的关系模式的集合。
关系数据库中的关系必须满足一定的要求,即满足不同的范式。
目前关系数据库最重要的范式有五种:
1NF、2NF、3NF、BCNF,4NF,它们之间的关系是4NFBCNF3NF2NF1NF。
满足最低要求的范式是第一范式(1NF)。
在第一范式的基础上进一步满足更多要求的称为第二范式(2NF),其余范式以次类推。
一般说来,数据库只需满足第三范式(3NF)就可以了。
(2)没有经过规范化的关系模式通常容易产生诸如数据冗余度高、插入异常、删除异常、更新困难等毛病,这样的关系模式显然是要避免的,由此而产生了一整套规范化理论。
通过对原有的关系模式进行规范化,使之达到一定级别的范式,便可在一定程度上消除上述毛病。
在实际应用中,并不是规范化程度越高越好,要视实际情况而定。
2.给出函数依赖的形式化定义,并理解函数依赖的意义。
答:
函数依赖:
设R(U)是属性集U上的关系模式。
,是U的子集。
若对于R(U)的任意一个可能的关系r,r中不存在两个元组在上的属性值相等,而在上的属性值不等,则称函数决定或函数依赖于,记为→。
函数依赖是一个在语义范畴上的概念,即只能根据语义来确定一个函数依赖。
例如:
员工姓名→性别,这个函数依赖只有在该部门没有同姓名的员工的前提下才成立,然而如果在设计的时候对这种事实作强制规定,如不允许同姓名的人存在,那么该函数依赖是存在的,现实生活中函数依赖是普遍存在的。
3.已知学生关系模式Student(Sno,Sname,Sdept,MN,Course,Grade),其中:
Sno:
学号,Sname:
学生姓名,Sdept:
系名,MN:
系主任名,Course:
课程名,Grade:
成绩。
(1)写出关系模式Student的基本函数依赖及其主码。
答:
该关系模式存在以下函数依赖:
Sno→Sname,Sdept→MN,Sno→Sdept,(Sno,Course)→Grade
显然关系模式的码为Sno,Course。
(2)将关系模式分解为2NF,并说明为什么?
答:
原关系模式是属于1NF的,非主属性Grade完全按函数依赖于码,而其他非主属性对码的函数依赖均为部分函数依赖,所以不属于2NF。
可将该关系模式分解为2NF如下:
Student1(Sno,Sname,Sdept,MN)
Student2(Sno,Course,Grade)
(3)将关系模式分解为3NF,并说明为什么?
答:
(2)中的关系模式Student1中存在Sno→Sdept,Sdept→MN,即非主属性MN传递依赖于码Sno,所以Student1可以进一步分解为3NF如下:
Student11(Sno,Sname,Sdept)
Student12(Sdept,MN)
而Student2中不存在非主属性对码的传递依赖,故已经属于3NF。
最终原关系模式分解为3NF得到:
Student11(Sno,Sname,Sdept)
Student12(Sdept,MN)
Student2(Sno,Course,Grade)
4.什么是多值依赖?
什么是4NF?
答:
(1)多值依赖定义:
设R(U)是一个属性集U上的一个关系模式,、和分别为U的子集,且有=U--,多值依赖→→(读作多值决定)成立当且仅当对R的任意一个关系r,r在(,)上的每个值对应一组的值,这组值仅仅由值决定而与值无关。
多值依赖(MVD)是两个属性或属性集合之间相互独立的断言。
它是广义的函数依赖(或者说函数依赖是多值依赖的一种特殊情况)。
(2)4NF定义:
关系模式R(U)1NF,若对于R的任意非平凡多值依赖→→(),都含有码,则称R(U)4NF。
4NF就是限制关系模式属性之间不允许有非平凡的且非函数依赖的多值依赖。
5已知关系模式R,其中U={A,B,C,D,E,G},F={AB→C,D→EG,C→A,BE→C,BC→D,CG→BD,ACD→B,CE→AG},求。
答:
由算法:
(1)令=BD;
(2)计算,逐一扫描F中的各个函数依赖,找到左部为B、D或BD的函数依赖,得到D→EG,故=BD∪EG=BDEG。
(3)计算,逐一扫描F中的各个函数依赖,找到左部为BDEG或BDEG子集的函数依赖,得到BE→C,故=BDEG∪C=BCDEG。
(4)计算,逐一扫描F中的各个函数依赖,找到左部为BCDEG或BCDEG子集的函数依赖,得到C→A,CG→BD,ACD→B,CE→AG,故=BCDEG∪ADBG=U,算法终止。
故最终求得=U。
6.已知关系模式R,其中U={A,B,C,D,E,G},F={A→B,C→G,E→A,CE→D},现对其作如下分解:
={R1
(1)求R的码,并判断分解是否具有无损连接性。
答:
(1)可以求解得R的码为CE,因为=U,并且在CE中不存在一个真子集能决定R的全体属性U,故R为码。
由于中只含有两个关系模式,故可使用定理6-6判断的无损连接性:
ABE∩CDEG=E,ABE—CDEG=AB,CDEG—ABE=CDG
因为E→A,A→B,故E→B(传递律),由E→A,E→B得E→AB(合并律)。
故E→AB∈,由定理知具有无损连接性。
(2)R1,R2属于第几范式。
答:
R1的码为E,显然R1属于2NF,但R1中存在非主属性对码的传递依赖,故R1不属于3NF。
R2的码为CE,由于函数依赖C→G中G对码部分依赖,故R2不属于2NF,即R2属于1NF。
7.证明在关系数据库中,任何二元关系模式必定是BCNF。
证明:
假设R为一个二元关系R(A1,A2),则属性A1和A2之间可能存在以下几种依赖关系:
(1)A1→A2,但A2A1,则关系R的码为A1,函数依赖的左部包含码,所以R∈BCNF。
(2)A1A2,A2→A1,则关系R的码为A2,同样R∈BCNF。
(3)R的码为(A1,A2),则显然R∈BCNF。
综合练习七
一、选择题
1.数据字典的内容应包括(C)。
A.数据项,数据结构
B.数据流,数据存储,处理过程
C.数据项,数据结构,数据流,数据存储,处理过程
D.数据结构,数据流
2.对于经常在查询条件中出现的属性或者经常在聚集函数中出现的属性,可以考虑在这些属性上建立(D)。
A.视图 B.关系 C.连接 D.索引
3.局部E-R图中实体类的冲突主要类型是(A)。
A.属性冲突、命名冲突和结构冲突
B.命名冲突和属性冲突
C.属性冲突
D.结构冲突和命名冲突
二、填空题
1.数据字典是关于数据库中数据的描述,即对元数据的描述。
2.对于1:
1的联系,两个实体中任何一个实体的标识符都可以作为关系模式的键。
3.如果实体间的联系名相同但联系类型不同,就产生了联系类冲突。
三、思考题
1.简述数据库设计的过程。
答:
根据规范设计的原则,一般可以把数据库设计分为以下五个阶段:
需求分析、概念设计、逻辑设计、物理设计和验证设计等,其中验证设计阶段包括数据库实施、数据库的运行和维护两个子阶段。
2.进行需求分析调查的主要方法有哪些?
答:
在调查分析的过程中,根据不同的化境和条件,可以使用不同的调查方法。
比较常见的调查方法包括:
现场作业、开调查会、专人介绍、询问、问卷调查、查阅记录报表等。
3.概念设计的重要性体现在哪里?
答:
如果没有概念设计阶段,开发人员的注意力往往不能集中在最重要的信息组织结构和处理模式上,而被牵扯到更多的细节限制方面。
因此在设计依赖于具体的DBMS的模式后,当外界环境发生变化时,设计结果就难以适应这个变化。
增加了概念设计阶段时候,开发设计人员仅从用户的角度看待数据机处理需求的约束,而后产生一个反应用户观点的感念模式。
在客观环境下,概念模式相对稳定,应当用系统需要更换DBMS时,只需重新设计逻辑结构,而概念模式可以保持不变。
这样就能有效控制设计的复杂程序,便于组织管理。
4.简述逻辑设计的一般过程。
答:
逻辑设计的一般过程包括将E-R图转换成一般数据模型,建立特定DBMS支持下的模式和子模式,模型评价和优化。
5.为什么要进行数据库试运行?
答:
数据库设计要考虑很多方面,但是在设计时这些方面只是近视估计,与很实际数据库系统有一定偏差,数据库试运行阶段的意义在于测试系统的性能指标,市级测量和评价系统性能指标是否达到设计目标的要求。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 11810061 亚洲 年下 半年 数据库技术 作业