SQL数据库重点知识汇总.docx
- 文档编号:1943306
- 上传时间:2023-05-02
- 格式:DOCX
- 页数:35
- 大小:38.01KB
SQL数据库重点知识汇总.docx
《SQL数据库重点知识汇总.docx》由会员分享,可在线阅读,更多相关《SQL数据库重点知识汇总.docx(35页珍藏版)》请在冰点文库上搜索。
SQL数据库重点知识汇总
绪论:
数据库原理与应用
Ø经历了三代演变:
层次/网状系统、关系系统、新一代数据库系统家族
Ø造就了三位图灵奖turingaward得主:
C.W.Bachman、E.F.Codd和JamesGray
Ø发展了一门计算机基础学科:
以数据模型和DBMS核心技术为主,内容丰富、领域宽广
Ø形成了一个巨大的软件产业:
DBMS及其相关工具产品、应用解决方案
Ø当前,在大、中、小、微型计算机上都有数据库系统在运行。
Ø信息资源已成为各部门的重要财富和资源,各行各业均需应用信息系统,而数据库是信息系统的核心。
Ø数据库是其它很多系统的核心或重要组成部分,如:
MIS(ManagementInformationSystem)管理信息系统DSS(DecisionSupportSystem)决策支持系统,知识库,规则库,专家系统,智能数据库计算机辅助设计与制造工程数据库计算机集成制造
Ø数据库技术与其他学科相结合,涌现出各种新型的数据库系统,如:
分布式数据库系统并行数据库系统面向对象数据库系统知识库系统多媒体数据库系统模糊数据库系统网络数据库系统
第一章:
数据库系统概述
1.1.1.1信息(Information)
①信息的定义:
信息是关于现实世界事物的存在方式或运动状态的反映的综合,具体说是一种被加工为特定形式的数据,但这种数据形式对接收者来说是有意义的,而且对当前和将来的决策具有明显的或实际的价值。
②信息的特征
Ø信息源于物质和能量,它不可能脱离物质而存在,信息的传递需要物质载体,信息的获取和传递要消耗能量。
Ø信息是可以感知的,不同的信息源有不同的感知形式。
Ø信息是可存储、加工、传递和再生的。
1.1.1.2数据(Data)
①数据的定义:
数据是用来记录信息的可识别的符号,是信息的具体表现形式。
②数据的表现形式:
a。
可用多种不同的数据形式表示同一信息,而信息不随数据形式的不同而改变。
b。
数据的概念在数据处理领域中已大大地拓宽了,其表现形式不仅包括数字和文字,还包括图形、图象、声音等。
这些数据可以记录在纸上,也可记录在各种存储器中。
1.1.1.3数据与信息的联系:
数据是信息的符号表示或载体,信息则是数据的内涵,是对数据的语义解释。
1.1.2数据处理:
将数据转换成信息的过程,包括对数据的收集、存储、加工、检索、传输等一系列活动。
其目的是从大量的原始数据中抽取和推导出有价值的信息,作为决策的依据。
信息、数据与数据处理的关系:
信息=数据+数据处理。
数据是原料,是输入,而信息是产出,是输出结果。
“信息处理”的真正含义应该是为了产生信息而处理数据。
1.2.1数据库技术的产生与发展
Ø数据处理的中心问题是数据管理。
Ø数据管理是指对数据的组织、分类、*编码、存储、检索和维护。
Ø随着计算机硬件和软件的发展,数据管理经历了人工管理、文件系统和数据库系统三个发展阶段。
1.2.1.1人工管理阶段(50年代中期以前)
Ø这一阶段计算机主要用于科学计算。
Ø硬件中的外存只有卡片、纸带、磁带,没有磁盘等直接存取设备。
Ø软件只有汇编语言,没有操作系统和管理数据的软件。
Ø数据处理的方式基本上是批处理。
人工管理阶段的特点如下:
1.数据不保存
Ø因为当时计算机主要用于科学计算,对于数据保存的需求尚不迫切。
2.系统没有专用的软件对数据进行管理
Ø每个应用程序都要包括数据的存储结构、存取方法、输入方式等,程序员编写应用程序时,还要安排数据的物理存储,因此程序员负担很重。
3.数据不共享
Ø数据是面向程序的,一组数据只能对应一个程序。
Ø多个应用程序涉及某些相同的数据时,也必须各自定义,因此程序之间有大量的冗余数据。
4.数据不具有独立性
Ø程序依赖于数据,如果数据的类型、格式、或输入输出方式等逻辑结构或物理结构发生变化,必须对应用程序做出相应的修改。
1.2.1.2文件系统阶段(50年代后期至60年代中期)
Ø这一阶段,计算机不仅用于科学计算,还大量用于信息管理。
Ø大量的数据存储、检索和维护成为紧迫的需求。
Ø硬件有了磁盘、磁鼓等直接存储设备。
Ø在软件方面,出现了高级语言和操作系统。
Ø操作系统中有了专门管理数据的软件,一般称为文件系统。
Ø处理方式有批处理,也有联机处理。
文件管理数据的特点如下:
1.数据以文件形式可长期保存下来
Ø用户可随时对文件进行查询、修改和增删等处理。
2.文件系统可对数据的存取进行管理
Ø程序员只与文件名打交道,不必明确数据的物理存储,大大减轻了程序员的负担。
3.文件形式多样化
Ø有顺序文件、倒排文件、索引文件等,因而对文件的记录可顺序访问,也可随机访问,更便于存储和查找数据。
4.程序与数据间有一定独立性
Ø由专门的软件即文件系统进行数据管理,程序和数据间由软件提供的存取方法进行转换,数据存储发生变化不一定影响程序的运行。
与人工管理阶段相比,文件系统阶段对数据的管理有了很大的进步,但一些根本性问题仍没有彻底解决,主要表现在以下三方面:
1.数据冗余度大
Ø各数据文件之间没有有机的联系,一个文件基本上对应于一个应用程序,数据不能共享。
2.数据独立性低
Ø数据和程序相互依赖,一旦改变数据的逻辑结构,必须修改相应的应用程序。
Ø而应用程序发生变化,如改用另一种程序设计语言来编写程序,也需修改数据结构。
3.数据一致性差
Ø由于相同数据的重复存储、各自管理,在进行更新操作时,容易造成数据的不一致性。
1.2.1.3数据库系统阶段(60年代末开始)
Ø60年代后期,计算机应用于管理的规模更加庞大,数据量急剧增加;
Ø硬件方面出现了大容量磁盘,使计算机联机存取大量数据成为可能;
Ø系统的的需要。
Ø为解决多用户、多个应用程序共享数据的需求,出现了统一管理数据的专门软件系统,即数据库硬件价格下降,而软件价格上升,使开发和维护系统软件的成本增加。
Ø文件系统的数据管理方法已无法适应开发应用管理系统。
数据库系统管理数据的特点如下:
1.数据共享性高、冗余少
这是数据库系统阶段的最大改进,数据不再面向某个应用程序而是面向整个系统,当前所有用户可同时存取库中的数据。
这样便减少了不必要的数据冗余,节约存储空间,同时也避免了数据之间的不相容性与不一致性。
2.数据结构化
按照某种数据模型,将全组织的各种数据组织到一个结构化的数据库中,整个组织的数据不是一盘散沙,可表示出数据之间的有机关联。
3.数据独立性高
Ø数据的独立性是指逻辑独立性和物理独立性。
Ø数据的逻辑独立性是指当数据的总体逻辑结构改变时,数据的局部逻辑结构不变,由于应用程序是依据数据的局部逻辑结构编写的,所以应用程序不必须修改,从而保证了数据与程序间的逻辑独立性。
Ø数据的物理独立性是指当数据的存储结构改变时,数据的逻辑结构不变,从而应用程序也不必改变。
4.有统一的数据控制功能
Ø数据库为多个用户和应用程序所共享,对数据存取往往是并发的,即多个用户可以同时存取数据库中的数据,甚至可以同时存取数据库中的同一个数据,为确保数据库数据的正确有效和数据库系统有效运行,提供下述四方面的数据控制功能。
(1)数据安全性(security)控制:
防止不合法使用数据造成数据泄露和破坏,保证数据安全和机密;
(2)数据完整性(integrity)控制:
系统通过设置一些完整性规则以确保数据的正确性、有效性和相容性。
v正确性是指数据的合法性,如年龄属于数值型数据,只能含0,1,…9,不能含字母或特殊符号;
v有效性是指数据是否在其定义的有效范围,如月份只能用1~12之间的正整数表示;
v相容性是指表示同一事实的两个数据应相同,否则就不相容,如一个人不能有两个性别。
(3)并发(concurrency)控制:
多用户同时存取或修改数据库时,防止相互干扰而提供给用户不正确的数据,并使数据库受到破坏。
(4)数据恢复(recovery):
当数据库被破坏或数据不可靠时,系统有能力将数据库从错误状态恢复到最近某一时刻的正确状态。
从文件系统管理发展到数据库系统管理是信息处理领域的一个重大变化。
在文件系统阶段,人们关注的是系统功能的设计,因此程序设计处于主导地位,数据服从于程序设计;而在数据库系统阶段,数据的结构设计成为信息系统首先关心的问题。
1.2.2数据库技术的研究领域
1.数据库管理系统软件的研制
ØDBMS是数据库系统的基础。
DBMS的研制包括研制DBMS本身及以DBMS为核心的一组相互联系的软件系统,包括工具软件和中间件。
研制的目标是提高系统的性能和提高用户的生产率。
2.数据库设计
Ø数据库设计的研究范围包括:
数据库的设计方法、设计工具和设计理论的研究,数据模型和数据建模的研究,计算机辅助数据库设计及其软件系统的研究,数据库设计规范和标准的研究等。
3.数据库理论
数据库理论的研究主要集中于关系规范化理论、关系数据理论等。
1.3.1数据库系统的组成:
数据库系统通常是指数据库和相应的软硬件系统。
主要由数据(库)、用户、软件和硬件四部分组成。
1.3.1.1数据(库)
Ø数据库是长期存储在计算机内有组织的共享的数据的集合。
Ø它可以供用户共享,具有尽可能小的冗余度和较高的数据独立性,使得数据存储最优,数据最容易操作,并且具有完善的自我保护能力和数据恢复能力。
数据库特点:
①集成性:
把某特定应用环境中的各种应用相关的数据及其数据之间的联系全部地集中地并按照一定的结构形式进行存储,或者说,把数据库看成为若干个单个性质不同的数据文件的联合和统一的数据整体。
②共享性:
数据库中的一块块数据可为多个不同的用户所共享,即多个不同的用户,使用多种不同的语言,为了不同的应用目的,而同时存取数据库,甚至同时存取同一块数据,即多用户系统。
1.3.1.2用户
Ø用户是指使用数据库的人,即对数据库的存储、维护和检索等操作。
用户分为三类:
①终端用户(EndUser)主要是使用数据库的各级管理人员、工程技术人员、科研人员,一般为非计算机专业人员;②应用程序员(ApplicationProgrammer)负责为终端用户设计和编制应用程序,以便终端用户对数据库进行存取操作。
③数据库管理员(DadabaseAdministrator,简称DBA)DBA是指全面负责数据库系统的“管理、维护和正常使用的”人员,其职责如下:
(1)参与数据库设计的全过程,决定数据库的结构和内容;
(2)定义数据的安全性和完整性,负责分配用户对数据库的使用权限和口令管理;(3)监督控制数据库的使用和运行,改进和重新构造数据库系统。
当数据库受到破坏时,应负责恢复数据库;当数据库的结构需要改变时,完成对数据结构的修改。
ØDBA不仅要有较高的技术专长和较深的资历,并应具有了解和阐明管理要求的能力。
特别对于大型数据库系统,DBA极为重要。
对于常见的微机数据库系统,通常只有一个用户,常常不设DBA,DBA的职责由应用程序员或终端用户代替。
1.3.1.3软件(Software)①负责数据库存取、维护和管理的软件系统,即数据库管理系统(DataBaseManagementSystem,简称DBMS),②数据库系统的各类人员对数据库的各种操作请求,都由DBMS完成,③DBMS是数据库系统的核心软件。
1.3.1.4硬件(Hardware)
Ø存储和运行数据库系统的硬件设备。
Ø包括CPU、内存、大容量的存储设备、外部设备等。
数据库系统层次结构图:
1.3.2数据库系统的结构:
①从数据库管理系统的角度看,数据库系统通常采用三级模式结构,这是数据库系统内部的体系结构;②从数据库最终用户的角度看,数据库系统的结构分为集中式结构、分布式结构和客户/服务器结构,这是数据库系统外部的体系结构。
1.3.2.1数据库系统的三级模式结构
Ø模式(Schema)是数据库中全体数据的逻辑结构和特征的描述。
模式只是对记录型的描述,而与具体的值无关。
Ø在数据库系统中,对于同一意义下的数据,从计算机中处理的二进制表示到用户处理的数据之间,存在着许多抽象和转换。
Ø通常DBMS把数据库从逻辑上分为三级,即外模式、模式和内模式,它们分别反映了看待数据库的三个角度。
三级模式结构如图1.5所示。
1.模式
Ø模式(Schema)是数据库中全体数据的逻辑结构和特征的描述,又称概念模式或概念视图。
视图可理解为一组记录的值,用户或程序员看到和使用的数据库的内容。
Ø模式处于三级结构的中间层,它是整个数据库实际存储的抽象表示,也是对现实世界的一个抽象,是现实世界某应用环境(企业或单位)的所有信息内容集合的表示,也是所有个别用户视图综合起来的结果,所以又称用户共同视图。
Ø它表示了数据库的整体数据。
Ø由多个“概念记录”组成,包含数据库的所有信息,也称“概念数据库”、“DBA视图”。
ØDBMS提供模式描述语言(模式DDL)来定义模式。
2.外模式
Ø又称子模式或用户模式或外视图,是三级结构的最外层,个别用户只对整个数据库的一部分感兴趣,所以外视图是个别用户看到和使用的数据库内容,因此也常把外视图称为用户数据库。
Ø它由多种外记录值构成,这些记录值是概念视图的某一部分的抽象表示。
即个别用户看到和使用的数据库内容,也称“用户DB”。
Ø由多个“外记录值”组成,是概念视图的某一部分的抽象表示。
Ø从逻辑关系上看,外模式包含于概念模式。
ØDBMS提供子模式描述语言(子模式DDL)来定义子模式。
3.内模式
Ø又称存储模式或内视图,是三级结构中的最内层,也是靠近物理存储的一层,即与实际存储数据方式有关的一层,由多个存储记录组成,但并非物理层,不必关心具体的存储位置。
ØDBMS提供内模式描述语言(内模式DDL)来定义内模式。
Ø在数据库系统中,外模式可有多个,而概念模式、内模式只能各有一个。
Ø内模式是整个数据库实际存储的表示,而概念模式是整个数据库实际存储的抽象表示,外模式是概念模式的某一部分的抽象表示。
4.三级结构的优点
(1)保证数据的独立性。
将模式和内模式分开,保证了数据物理独立性;将外模式和模式分开,保证了数据逻辑独立性。
(2)简化了用户接口。
按照外模式编写应用程序或敲入命令,而不需了解数据库内部的存储结构,方便用户使用系统。
(3)有利于数据共享。
在不同的外模式下可有多个用户共享系统中数据,减少了数据冗余。
(4)利于数据的安全保密。
在外模式下根据要求进行操作,不能对限定的数据操作,保证了其他数据的安全。
1.3.2.2数据库系统的二级映象:
数据库系统的三级模式是对数据的三个抽象级别,它使用户能逻辑地抽象地处理数据,而不必关心数据在计算机内部的存储方式,把数据的具体组织交给DBMS管理。
为了能够在内部实现这三个抽象层次的联系和转换,DBMS在三级模式之间提供了二级映象功能。
1.模式/内模式映象
Ø数据库中的模式和内模式都只有一个,所以模式/内模式映象是唯一的。
Ø它确定了数据的全局逻辑结构与存储结构之间的对应关系。
2.外模式/模式映象
1数据库中的同一模式可以有任意多个外模式,对于每一个外模式,都存在一个外模式/模式映象。
2它确定了数据的局部逻辑结构与全局逻辑结构之间的对应关系。
1.4数据库管理系统(DBMS)
Ø数据库管理系统是对数据进行管理的大型系统软件,它是数据库系统的核心组成部分。
Ø用户在数据库系统中的一切操作,包括数据定义、查询、更新及各种控制,都是通过DBMS进行的。
ØDBMS就是实现把用户意义下的抽象的逻辑数据处理转换成计算机中的具体的物理数据的处理软件,这给用户带来很大的方便。
DBMS的主要功能:
1.数据定义:
DBMS提供数据定义语言DDL(DataDefineLanguage),定义数据的模式、外模式和内模式三级模式结构,定义模式/内模式和外模式/模式二级映象,定义有关的约束条件,2.数据操纵:
DBMS提供数据操纵语言DML(DataManipulationLanguage)实现对数据库的基本操作,包括检索、插入、修改、删除等。
SQL语言就是DML的一种。
3.数据库运行管理:
DBMS对数据库的控制主要通过四个方面实现:
a数据的安全性控制b数据的完整性控制c多用户环境下的并发控制d数据库的恢复4.数据库的建立和维护功能:
包括数据库的初始数据的装入,数据库的转储、恢复、重组织,系统性能监视、分析等功能。
5.数据通信:
DBMS提供与其他软件系统进行通信的功能。
实现用户程序与DBMS之间的通信,通常与操作系统协调完成。
1.4.2DBMS的组成
ØDBMS是许多“系统程序”所组成的一个集合。
Ø每个程序都有自己的功能,共同完成DBMS的一件或几件工作。
1.语言编译处理程序:
(1)数据定义语言DDL及其编译程序:
它把用DDL编写的各级源模式编译成各级目标模式,这些目标模式是对数据库结构信息的描述,而不是数据本身,它们被保存在数据字典中,供以后数据操纵或数据控制时使用。
(2)数据操纵语言DML及其编译程序,实现对数据库的基本操作。
DML有两类:
一类是宿主型,嵌入在高级语言中,不能单独使用;另一类是自主型或自含型,可独立地交互使用。
2.系统运行控制程序,主要包括以下六部分:
①系统总控程序:
是DBMS运行程序的核心,用于控制和协调各程序的活动;②安全性控制程序:
防止未被授权的用户存取数据库中的数据;③完整性控制程序:
检查完整性约束条件,确保进入数据库中的数据的正确性、有效性和相容性;④并发控制程序:
协调多用户、多任务环境下各应用程序对数据库的并以操作,保证数据的一致性;⑤数据存取和更新程序:
实施对数据库数据的检索、插入、修改、删除等操作;⑥通信控制程序:
实现用户程序与DBMS间的通信。
3.系统建立、维护程序:
主要包括以下三部分:
装配程序:
完成初始数据库的数据装入;重组程序:
当数据库系统性能变坏时(如查询速度变慢),需要重新组织数据库,重新装入数据;系统恢复程序:
当数据库系统受到破坏时,将数据库系统恢复到以前某个正确的状态。
4.数据字典(DataDictionary,简称DD):
用来描述数据库中有关信息的数据目录;包括数据库的三级模式、数据类型、用户名、用户权限等有关数据库系统的信息;起着系统状态的目录表的作用;帮助用户、DBA、DBMS本身使用和管理数据库。
1.4.3DBMS的数据存取的过程:
在数据库系统中,DBMS与操作系统、应用程序、硬件等协同工作,共同完成数据各种存取操作,其中DBMS起着关键的作用。
1.5DBMS对数据的存取通常需要以下四步:
1.用户使用某种特定数据操作语言向DBMS发出存取请求;2.DBMS接受请求并解释;3.DBMS依次检查外模式、外模式/模式映象、模式、模式/内模式映象及存储结构定义;4.DBMS对存储数据库执行必要的存取操作.
上述存取过程中还包括安全性控制、完整性控制,以确保数据的正确性、有效性和一致性。
1.5.1数据模型的组成要素
Ø数据模型是模型一种,是现实世界数据特征的抽象。
Ø数据模型通常由数据结构、数据操作和数据的约束条件三个要素组成。
1.数据结构
Ø数据结构用于描述系统的静态特性。
Ø数据结构是所研究的对象类型的集合,它是刻画一个数据模型性质最重要的方面。
Ø在数据库系统中,人们通常按照其数据结构的类型来命名数据模型。
Ø数据结构有层次结构、网状结构和关系结构三种类型,按照这三种结构命名的数据模型分别称为层次模型、网状模型和关系模型。
2.数据操作
Ø数据操作用于描述系统的动态特性。
Ø数据操作是对数据库中各种数据操作的集合,包括操作及相应的操作规则。
v如数据的检索、插入、删除和修改等。
Ø数据模型必须定义这些操作的确切含义、操作规则以及实现操作的语言。
3.数据的约束条件
Ø数据的约束条件是一组完整性规则的集合。
Ø完整性规则是给定的数据模型中数据及其联系所具有的制约和依存规则,用以限定符合数据模型的数据库状态以及状态的变化,以保证数据的正确、有效、相容。
Ø数据模型还应该提供定义完整性约束条件的机制,以反映具体应用所涉及的数据必须遵守的特定的语义约束条件。
1.5.2数据之间的联系
1三个世界的划分
Ø由于计算机不能直接处理现实世界中的具体事物,所以人们必须将具体事物转换成计算机能够处理的数据。
Ø在数据库中用数据模型来抽象、表示和处理现实世界中的数据。
Ø数据库即是模拟现实世界中某应用环境(一个企业、单位或部门)所涉及的数据的集合,它不仅要反映数据本身的内容,而且要反映数据之间的联系。
Ø这个集合或者包含了信息的一部分(用用户视图模拟),或者包含了信息的全部(用概念视图模拟),而这种模拟是通过数据模型来进行的。
Ø为了把现实世界中的具体事物抽象、组织为某一DBMS支持的数据模型,在实际的数据处理过程中,
Ø首先将现实世界的事物及联系抽象成信息世界的信息模型,
Ø然后再抽象成计算机世界的数据模型。
Ø信息模型并不依赖于具体的计算机系统,不是某一个DBMS所支持的数据模型,它是计算机内部数据的抽象表示,是概念模型;
Ø概念模型经过抽象,转换成计算机上某一DBMS支持的数据模型。
所以说,数据模型是现实世界的两级抽象的结果。
Ø在数据处理中,数据加工经历了现实世界、信息世界和计算机世界三个不同的世界,经历了两级抽象和转换。
现实世界→认识抽象→信息世界→计算机世界
2基本概念——宏观:
①实体(Entity)客观存在并且可以相互区别的“事物”称为实体.实体可以是可触及的对象.②属性(Attributes)实体的某一特性称为属性。
属性有"型"和“值”之分,"型"即为属性名,值”即为属性的具体内容.③实体型(EntityType)若干个属性型组成的集合可以表示一个实体的类型,简称实体型。
④实体集(EntitySet)同型实体的集合称为实体集。
⑤键(Key)能唯一标识一个实体的属性或属性集称为实体的键。
⑥域(Domain)属性值的取值范围称为该属性的域。
⑦联系(Relationship)在现实世界中,事物内部以及事物之间是有联系的,这些联系同样也要抽象和反映到信息世界中来;在信息世界中将被抽象为实体型内部的联系和实体型之间的联系;实体内部的联系通常是指组成实体的各属性之间的联系;实体之间的联系通常是指不同实体集之间的联系;反映实体型及其联系的结构形式称为实体模型,也称作信息模型,它是现实世界及其联系的抽象表示。
2.1两个实体型之间的联系有如下三种类型:
1)一对一联系(1:
1)实体集A中的一个实体至多与实体集B中的一个实体相对应,反之亦然,则称实体集A与实体集B为一对一的联系。
记作1:
1。
2)一对多联系(1:
n)实体集A中的一个实体与实体集B中的多个实体相对应,反之,实体集B中的一个实体至多与实体集A中的一个实体相对应。
记作1:
n。
3)多对多(m:
n)实体集A中的一个实体与实体集B中的多个实体相对应,反之,实体集B中的一个实体与实体集A中的多个实体相对应。
记作(m:
n)。
E-R图:
零件供应系统
选课管理系统
选课管理系统
3、数据库系统描述基本概念—微观:
①字段(Field)对应于属性的数据称为字段,也称为数据项。
字段的命名往往和属性名相同。
②记录(Record)对应于
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- SQL 数据库 重点 知识 汇总