数据库知识点整理笔记wordWord文档下载推荐.docx
- 文档编号:3024120
- 上传时间:2023-05-01
- 格式:DOCX
- 页数:75
- 大小:311.94KB
数据库知识点整理笔记wordWord文档下载推荐.docx
《数据库知识点整理笔记wordWord文档下载推荐.docx》由会员分享,可在线阅读,更多相关《数据库知识点整理笔记wordWord文档下载推荐.docx(75页珍藏版)》请在冰点文库上搜索。
是数据库的主要特征之一,也是数据库系统与文件系统的本质区别。
(整体结构化:
不再仅仅针对某一个应用,而是面向全组织;
不仅数据内部结构化,整体是结构化的,数据之间具有联系)
数据的共享性高,冗余度低,易扩充:
数据库系统从整体角度看待和描述数据,数据面向整个系统,可以被多个用户、多个应用共享使用。
数据共享的好处:
减少数据冗余,节约存储空间;
避免数据之间的不相容性与不一致性;
使系统易于扩充
数据独立性高:
物理独立性:
指用户的应用程序与存储在磁盘上的数据库中数据是相互独立的。
当数据的物理存储改变了,应用程序不用改变。
逻辑独立性:
指用户的应用程序与数据库的逻辑结构是相互独立的。
数据的逻辑结构改变了,用户程序也可以不变。
数据独立性是由DBMS的二级映像功能来保证的
数据由DBMS统一管理和控制:
DBMS提供的数据控制功能
(1)数据的安全性(Security)保护
(2)数据的完整性(Integrity)检查
(3)并发(Concurrency)控制
(4)数据库恢复(Recovery)
数据模型就是现实世界数据特征的抽象。
数据模型是用来描述数据、组织数据、对数据进行操作。
数据模型应满足三方面要求:
能比较真实地模拟现实世界、容易为人所理解、便于在计算机上实现
数据模型分为两类(模型应用的不同目的)
(1)概念模型:
也称信息模型,它是按用户的观点来对数据和
信息建模,用于数据库设计。
(2)逻辑模型和物理模型
逻辑模型:
按计算机系统的观点对数据建模,用于DBMS实现。
物理模型:
对数据最底层的抽象,存储方式和存取方法。
客观对象的抽象过程---两步抽象
1、现实世界中的客观对象抽象为概念模型;
2、把概念模型转换为某一DBMS支持的数据模型。
数据模型的组成要素:
数据结构:
描述数据库的组成对象,以及对象之间的联系。
人们通常按数据结构的类型来命名数据模型(层次模型、网状模型、关系模型)。
数据操作:
对数据库中各种对象(型)的实例(值)允许执行的,操作的集合及有关的操作规则。
类型分为:
查询、更新(包括插入、删除、修改)
完整性约束条件:
数据的完整性约束条件:
一组完整性规则的集合。
是给定的数据模型中数据及其联系所具有的制约和依存规则,用以限定符合数据模型的数据库状态以及状态的变化,以保证数据的正确、有效、相容。
数据模型对完整性约束条件的定义:
反映和规定本数据模型必须遵守的基本的通用的完整性约束条件。
例如在关系模型中,任何关系必须满足实体完整性和参照完整性两个条件。
提供定义完整性约束条件的机制,以反映具体应用所涉及的数据必须遵守的特定的语义约束条件。
概念模型的用途:
概念模型用于信息世界的建模
是现实世界到机器世界的一个中间层次
是数据库设计的有力工具
数据库设计人员和用户之间进行交流的语言
对概念模型的基本要求
能够方便、直接地表达应用中的各种语义知识(模拟现实世界)
简单、清晰、易于用户理解(容易为人们所理解)
可以用实体---联系图(E-R)来表示概念模型
信息世界中的基本概念
(1)实体(Entity):
客观存在并可相互区别的事物称为实体。
可以是具体的人、事、物或抽象的概念。
(人、银行账户)
(2)属性(Attribute):
实体所具有的某一特性称为属性。
一个实体可以由若干个属性来刻画。
(实体通过属性集合描述)(某个账户)
(3)码(Key):
唯一标识实体的属性集称为码。
(4)域(Domain):
属性的取值范围称为该属性的域。
(5)实体型(EntityType):
用实体名及其属性名集合来抽象和刻画同类实体称为实体型
(6)实体集(EntitySet):
同一类型实体的集合称为实体集
(7)联系(Relationship):
现实世界中事物内部以及事物之间的联系在信息世界中反映为实体内部的联系和实体之间的联系。
实体内部的联系通常是指组成实体的各属性之间的联系
实体之间的联系通常是指不同实体集之间的联系
二、两个实体型之间的联系
一对一联系:
如果对于实体集A中的每一个实体,实体集B中至多有一个(也可以没有)实体与之联系,反之亦然,则称实体集A与实体集B具有一对一联系,记为1:
1
一对多联系:
如果对于实体集A中的每一个实体,实体集B中有n个实体(n≥0)与之联系,反之,对于实体集B中的每一个实体,实体集A中至多只有一个实体与之联系,则称实体集A与实体集B有一对多联系,记为1:
n
多对多联系:
如果对于实体集A中的每一个实体,实体集B中有n个实体(n≥0)与之联系,反之,对于实体集B中的每一个实体,实体集A中也有m个实体(m≥0)与之联系,则称实体集A与实体B具有多对多联系,记为m:
实体-联系方法(Entity-Relationshipapproach)
用E-R图来描述现实世界的概念模型
E-R方法也称为E-R模型
E-R图提供了表示实体型、属性和联系方法。
实体型:
用矩形表示,矩形框内写明实体名。
属性:
用椭圆形表示,并用无向边将其与相应的实体连接起来
联系:
联系本身:
用菱形表示,菱形框内写明联系名,并用无向边分别与有关实体连接起来,同时在无向边旁标上联系的类型(1:
1、1:
n或m:
n)
联系的属性:
联系本身也是一种实体型,也可以有属性。
如果一个联系具有属性,则这些属性也要用无向边与该联系连接起来
最常用的数据模型:
1、非关系模型(格式化模型)
层次模型(HierarchicalModel):
数据库系统中最早出现的数据模型,用树形结构来表示各类实体以及实体间的联系。
(层次模型的完整性约束条件:
无相应的双亲结点值就不能插入子女结点值
如果删除双亲结点值,则相应的子女结点值也被同时删除
更新操作时,应更新所有相应记录,以保证数据的一致性
层次模型的数据结构比较简单清晰
查询效率高,性能优于关系模型,不低于网状模型
层次数据模型提供了良好的完整性支持
多对多联系表示不自然
对插入和删除操作的限制多,应用程序的编写比较复杂
查询子女结点必须通过双亲结点
由于结构严密,层次命令趋于程序化)
(网状模型(NetworkModel):
网状数据库系统采用网状模型作为数据的组织方式。
网状模型是满足下面两个条件的基本层次联系的集合:
1.允许一个以上的结点无双亲;
2.一个结点可以有多于一个的双亲。
(表示方法(与层次数据模型相同)
用记录类型描述
每个结点表示一个记录类型(实体)
用字段描述
每个记录类型可包含若干个字段
用结点之间的连线表示记录类型(实体)之
间的一对多的父子联系
网状模型与层次模型的区别
网状模型允许多个结点没有双亲结点
网状模型允许结点有多个双亲结点
网状模型允许两个结点之间有多种联系(复合联系)
网状模型可以更直接地去描述现实世界
层次模型实际上是网状模型的一个特例
能够更为直接地描述现实世界,如一个结点可以有多个双亲
具有良好的性能,存取效率较高
结构比较复杂,而且随着应用环境的扩大,数据库的结构就变得越来越复杂,不利于最终用户掌握
DDL、DML语言复杂,用户不容易使用)
2、关系模型(RelationalModel):
关系数据库系统采用关系模型作为数据的组织方式。
计算机厂商新推出的数据库管理系统几乎都支持关系模型。
在用户观点下,关系模型中数据的逻辑结构是一张二维表,它由行和列组成。
(关系(Relation):
一个关系对应通常说的一张表
元组(Tuple):
表中的一行即为一个元组
属性(Attribute):
表中的一列即为一个属性,给每一个属性起一个名称即属性名
主码(Key):
表中的某个属性组,它可以唯一确定一个元组。
域(Domain):
属性的取值范围。
分量:
元组中的一个属性值。
关系模式:
对关系的描述、关系名(属性1,属性2,…,属性n)、学生(学号,姓名,年龄,性别,系,年级)
关系模型中,实体以及实体之间的联系都是用关系来表示
关系必须是规范化的,满足一定的规范条件。
最基本的规范条件:
关系的每一个分量必须是一个不可分的数据项,不允许表中还有表
数据操作是集合操作,操作对象和操作结果都是关系,即若干元组的集合
存取路径对用户隐蔽,用户只要指出“干什么”,不必详细说明“怎么干”
关系的完整性约束条件:
包括实体完整性、参照完整性、用户定义的完整性
实体及实体间的联系都用表来表示
表以文件形式存储
优点
1、建立在严格的数学概念的基础上
2、概念单一:
实体和各类联系都用关系来表示;
对数据的检索结果也是关系
3、关系模型的存取路径对用户透明:
具有更高的数据独立性,更好的安全保密性;
简化了程序员的工作和数据库开发建立的工作
缺点
1、存取路径对用户透明导致查询效率往往不如非关系数据模型
2、为提高性能,必须对用户的查询请求进行优化增加了开发DBMS的难度)
面向对象模型(ObjectOrientedModel)
对象关系模型(ObjectRelationalModel)
数据库系统结构
从数据库管理系统角度看,数据库系统通常采用三级模式结构,是数据库系统内部的系统结构
从数据库最终用户角度看(数据库系统外部的体系结构),数据库系统的结构分为:
单用户结构、主从式结构、分布式结构、客户/服务器、浏览器/应用服务器/数据库服务器多层结构等
数据库管理系统的一个主要作用就是隐藏关于数据存储和维护的某些细节,而为用户提供数据在不同层次上的抽象视图,这就是数据抽象,即不同的使用者从不同的角度去观察数据库中的数据所得到的结果。
对用户来说,了解数据库中用来表示数据的复杂的数据结构没有太大的必要。
数据库管理系统通过如下三个层次的抽象来向用户屏蔽复杂性,简化系统的用户界面。
1、物理层抽象:
最低层次的抽象,描述数据实际上是如何存储的。
物理层详细描述复杂的低层数据结构,是开发DBMS的数据库供应商应该研究的事情。
(内模式)
2、逻辑层抽象:
比物理层稍高层次的抽象,描述数据库中存储什么数据以及这些数据间存在什么关系。
因而整个数据库可通过少量相对简单的结构来描述。
虽然简单的逻辑层结构的实现涉及到复杂的物理层结构,但逻辑层的用户不必知道这种复杂性。
逻辑层抽象是由数据库管理员和数据库应用开发人员使用的,他们必须确定数据库中应该保存哪些信息。
(模式)3、视图层(概念层)抽象:
最高层次的抽象,但只描述整个数据库的某个部分。
尽管在逻辑层使用了比较简单的结构,但由于数据库的规模巨大,所以仍存在一定程度的复杂性。
数据库系统的多数用户并不需要关心所有的信息,而只需要访问数据库的一部分。
视图抽象层的定义正是为了使用户与系统的交互更简单。
系统可以为同一数据库提供多个视图,而视图又保证了数据的安全性。
(外模式)
数据库系统模式的概念
型(Type):
对某一类数据的结构和属性的说明
值(Value):
是型的一个具体赋值
模式(Schema):
数据库逻辑结构和特征的描述;
是型的描述;
反映的是数据的结构及其联系;
模式是相对稳定的
实例(Instance):
模式的一个具体值;
反映数据库某一时刻的状态;
同一个模式可以有很多实例;
实例随数据库中的数据的更新而变动
数据库系统的三级模式结构:
模式(Schema)、外模式(ExternalSchema)、内模式(InternalSchema)
模式(也称逻辑模式):
数据库中全体数据的逻辑结构和特征的描述,所有用户的公共数据视图。
综合了所有用户的需求。
一个数据库只有一个模式
模式的地位:
是数据库系统模式结构的中间层,与数据的物理存储细节和硬件环境无关,与具体的应用程序、开发工具及高级程序设计语言无关
模式的定义:
包括数据的逻辑结构(数据项的名字、类型、取值范围等)、数据之间的联系、数据有关的安全性、完整性要求
外模式(也称子模式或用户模式):
是数据库用户(包括应用程序员和最终用户)能够看见和使用的局部数据的逻辑结构和特征的描述,是数据库用户的数据视图,是与某一应用有关的数据的逻辑表示
外模式的地位:
介于模式与应用之间
模式与外模式的关系:
一对多
外模式通常是模式的子集
一个数据库可以有多个外模式。
反映了不同的用户的应用需求、看待数据的方式、对数据保密的要求
对模式中同一数据,在外模式中的结构、类型、长度、保密级别等都可以不同
外模式与应用的关系:
同一外模式也可以为某一用户的多个应用系统所使用
但一个应用程序只能使用一个外模式
外模式的用途:
保证数据库安全性的一个有力措施;
每个用户只能看见和访问所对应的外模式中的数据
内模式(也称存储模式):
是数据物理结构和存储方式的描述,是数据在数据库内部的表示方式。
包括:
记录的存储方式(堆存储,按某个属性值升、降序存储,聚簇存储)、索引的组织方式(按照B树结构存储,按hash方法存储)、数据是否压缩存储、数据是否加密、数据存储记录结构的规定(变长、定长)
一个数据库只有一个内模式
数据库的二级映像功能与数据独立性
三级模式是对数据的三个抽象级别
二级映象在DBMS内部实现这三个抽象层次的联系和转换:
外模式/模式映像、模式/内模式映像
外模式/模式映像:
每一个外模式,数据库系统都有一个外模式/模式映象,定义外模式与模式之间的对应关系
映象定义通常包含在各自外模式的描述中
保证数据的逻辑独立性:
1、当模式改变时(新关系、属性等),数据库管理员修改有关的外模式/模式映象,使外模式保持不变。
2、应用程序是依据数据的外模式编写的,从而应用程序不必修改,保证了数据与程序的逻辑独立性,简称数据的逻辑独立性。
模式/内模式映象:
定义了数据全局逻辑结构与存储结构之间的对应关系。
数据库中模式/内模式映象是唯一的
该映象定义通常包含在模式描述中
保证数据的物理独立性:
1、当数据库的存储结构改变了(例如选用了另一种存储结构),数据库管理员修改模式/内模式映象,使模式保持不变
2、应用程序不受影响。
保证了数据与程序的物理独立性,简称数据的物理独立性。
数据与程序之间的独立性,使得数据的定义和描述可以从应用程序中分离出去
数据的存取由DBMS管理:
用户不必考虑存取路径等细节;
简化了应用程序的编制;
大大减少了应用程序的维护和修改
数据库系统的组成:
数据库、数据库管理系统(及其开发工具)、应用系统、数据库管理员
一、硬件平台及数据库
数据库系统对硬件资源的要求
(1)有足够大的内存,来存放操作系统、DBMS的核心模块、数据缓冲区、应用程序。
(2)足够大的外存,要有足够大的磁盘或磁盘阵列来存放数据库,有足够大的光盘、磁带作数据备份
(3)较高的通道能力,提高数据传送率
二、软件
DBMS,DBMS是为数据库的建立、使用和维护配置的软件
支持DBMS运行的操作系统
与数据库接口的高级语言及其编译系统,便于开发应用程序
以DBMS为核心的应用开发工具。
应用开发工具是为应用开发人员和最终用户提供的高效率、多功能的应用生成器、第四代语言等各种软件工具。
它们为数据库系统的开发和应用提供了良好的环境。
为特定应用环境开发的数据库应用系统
三、人员
数据库管理员:
具体职责:
1.决定数据库中的信息内容和结构
2.决定数据库的存储结构和存取策略
3.定义数据的安全性要求和完整性约束条件
4.监控数据库的使用和运行:
周期性转储数据库(数据文件、日志文件);
系统故障恢复;
介质故障恢复;
监视审计文件
5.数据库的改进和重组:
性能监控和调优;
定期对数据库进行重组织,以提高系统的性能;
需求增加和改变时,数据库须需要重构造
系统分析员和数据库设计人员
系统分析员:
负责应用系统的需求分析和规范说明:
与用户及DBA协商,确定系统的硬软件配置:
参与数据库系统的概要设计
数据库设计人员:
加用户需求调查和系统分析,确定数据库中的数据设计数据库各级模式
应用程序员:
设计和编写应用系统的程序模块、进行调试和安装
用户:
是指最终用户(EndUser)。
最终用户通过应用系统的用户接口使用数据库。
1.偶然用户:
不经常访问数据库,但每次访问数据库时往往需要不同的数据库信息(企业或组织机构的高中级管理人员)
2.简单用户:
主要工作是查询和更新数据库(银行的职员、机票预定人员、旅馆总台服务员)
3.复杂用户:
直接使用数据库语言访问数据库,甚至能够基于数据库管理系统的API编制自己的应用程序(工程师、科学家、经济学家、科技工作者等)
关系数据库
关系数据库应用数学方法来处理数据库中的数据。
关系数据结构及形式化定义
从集合论的角度给出关系数据结构的形式化定义。
1.域(Domain):
域是一组具有相同数据类型的值的集合。
笛卡尔积(CartesianProduct):
给定一组域D1,D2,…,Dn,这些域中可以有相同的。
D1,D2,…,Dn的笛卡尔积为:
D1×
D2×
…×
Dn={(d1,d2,…,dn)|di
Di,i=1,2,…,n}
笛卡尔积中每一个元素(d1,d2,…,dn)叫作一个n元组(n-tuple)或简称元组(Tuple)
分量(Component):
笛卡尔积元素(d1,d2,…,dn)中的每一个值di叫作一个分量
基数(Cardinalnumber):
若Di(i=1,2,…,n)为有限集,其基数为mi(i=1,2,…,n),则D1×
Dn的基数M等于所有mi的和。
笛卡尔积的表示方法:
笛卡尔积可表示为一个二维表
表中的每行对应一个元组,表中的每列对应一个域
3.关系(Relation):
D1×
Dn的子集叫作在域D1,D2,…,Dn上的
关系,表示为R(D1,D2,…,Dn)R:
关系名n:
关系的目或度(Degree)
元组:
关系中的每个元素是关系中的元组,通常用t表示。
单元关系与二元关系
当n=1时,称该关系为单元关系(Unaryrelation)或一元关系
当n=2时,称该关系为二元关系(Binaryrelation)
关系的表示:
关系也是一个二维表,表的每行对应一个元组,表的每列对应一个域。
关系中不同列可以对应相同的域,为了加以区分,必须对每列起一个名字,称为属性(Attribute),n目关系必有n个属性
候选码(Candidatekey):
若关系中的某一属性组的值能唯一地标识一个元组,则称该属性组为候选码。
简单的情况:
候选码只包含一个属性
全码(All-key):
最极端的情况:
关系模式的所有属性组是这个关系模式的候选码,称为全码
主码(Primarykey):
若一个关系有多个候选码,则选定其中一个为主码(Primarykey)
主属性(Primeattribute):
候选码的诸(所有)属性称为主属性(Primeattribute)
不包含在任何侯选码中的属性称为非主属性(Non-Primeattribute)或非码属性(Non-keyattribute)
D1,D2,…,Dn的笛卡尔积的某个子集才有实际含义
三类关系
基本关系(基本表或基表):
实际存在的表,是实际存储数据的逻辑表示
查询表:
查询结果对应的表
视图表:
由基本表或其他视图表导出的表,是虚表,不对应实际存储的数据
基本关系的性质
①列是同质的(Homogeneous)
②不同的列可出自同一个域
③列的顺序无所谓,,列的次序可以任意交换
④任意两个元组的候选码不能相同
⑤行的顺序无所谓,行的次序可以任意交换
⑥分量必须取原子值
关系模式(RelationSchema)是型,关系是值
关系模式是对关系的描述
◆元组集合的结构:
属性构成、属性来自的域、属性与域之间的映象关系
◆元组语义以及完整性约束条件
◆属性间的数据依赖关系集合
关系模式可以形式化地表示为:
R(U,D,DOM,F)
R关系名U组成该关系的属性名集合D属性组U中属性所来自的域
DOM属性向域的映象集合F属性间的数据依赖关系集合
关系模式通常可以简记为R(U)或R(A1,A2,…,An)
R:
关系名A1,A2,…,An:
属性名
注:
域名及属性向域的映象常常直接说明为属性的类型、长度
对关系的描述,静态的、稳定的
关系:
关系模式在某一时刻的状态或内容,动态的、随时间不断变化的
关系模式和关系往往统称为关系。
通过上下文加以区别
并关系数据库模式,对关系数据库的描述。
关系数据库模式包括:
若干域的定义、在这些域上定义的若干关系模式
关系数据库的值:
关系模式在某一时刻对应的关系的集合,简称为关系数据库
关系模型给出了关系操作的能力的说明:
不对RDBMS语言给出具体的语法要求,不同RDBMS可以定义和开发不同的语言来实现这些操作。
常用的关系操作:
查询:
选择、投影、连接、并、交、差、除,黑体是5中基本操作
数据更新:
插入、删除、修改
查询的表达能力是其中最主要的部分
关系操作的特点:
集合操作方式:
操作的对象和结果都是集合。
关系代数语言(代数方式):
用对关系的运算来表达查询要
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据库 知识点 整理 笔记 word