空间数据库Geodatabase复习资料考试要点老师整理.docx
- 文档编号:12157429
- 上传时间:2023-06-04
- 格式:DOCX
- 页数:29
- 大小:1.51MB
空间数据库Geodatabase复习资料考试要点老师整理.docx
《空间数据库Geodatabase复习资料考试要点老师整理.docx》由会员分享,可在线阅读,更多相关《空间数据库Geodatabase复习资料考试要点老师整理.docx(29页珍藏版)》请在冰点文库上搜索。
空间数据库Geodatabase复习资料考试要点老师整理
一、为什么不能用传统的数据库管理(两者区别)结合空间数据库特点分析。
1.空间数据库概念
空间数据库是某一区域内一定地理要素特征的相关空间数据集合;是地理信息系统在计算机物理存储介质上存储的与应用相关的地理空间数据的总和,一般是以特定结构的文件的形式组织在存储介质上的。
2.用传统数据库系统管理空间数据不足之处:
(1)传统数据库管理的是不连续的相关性较小的数字或字符,而空间数据是连续的,并且有很强的空间相关性;
(2)传统数据库管理的实体类型较少,并且实体类型间关系简单固定,而GIS数据库的实体类型繁多,实体间存在着复杂的空间关系;
(3)传统数据库存储的数据通常为等长记录的数据,而空间数据的目标坐标长度不定,具有变长记录,并且数据项可能很多,很复杂;
(4)传统数据库只查询和操作数字和文字信息,而空间数据库需要大量的空间数据操作和查询。
3.空间数据特征:
空间特征、空间关系、非结构化、抽象特征、多时空性特征、分类编码特征、海量数据特征、多尺度与多态性。
4.空间数据组织方式:
(1)数据分层式(DataLayer)
图层定义:
将同区域的数据分成不同的类型或层级储存,例如依不同地类、专题、年代等,各储存类别称作“图层”;可按照:
专题、时间、高度等分层。
专题图定义:
传统纸质地图通常依不同的专题,如人口分布图、地质图、地形图等,来表现不同的人文活动或是地表现象,这些图称作专题图(ThematicMap);
数据层:
目前大多GIS数字图则以数据项目分层,称作数据层(DataLayer),但也常被称作图层或专题图层。
层:
空间数据处理的一个工作单元,不同的系统工作处理层方式不同;
逻辑层:
当一个层所包含的内容太多(如管线层),为了方便于显示、制图和查询,对其中的部分要素定义逻辑层,逻辑层不改变存储关系,仅建立对照表,每个逻辑层包含了哪些指向地物类的指针。
数据分层式优缺点:
–这种方式是目前颇为普遍的数据组织方法,方便使用者选择合适的数据,适合与栅格或矢量数据数据结构,目前大多数GIS软件采用这一方法。
–其缺点是层与层之间的数据必须经过层叠置(Overlay)处理才能关联在一起,在叠置处理中,对栅格数据常需要大量存储空間来完成操作,而矢量数据则需大量的计算处理。
–同一图层内的图形数据的空间关系较为简单并易于处理,但不同图层之间的空间关系难以处理。
(2)空间分区式(DataTiling)
定义:
将大规模区域的数据划分为若干规则或不规则的小区域(工作区)来存储。
传统地图也通常采用这一方法来分区记录,它的划分称作图幅(Mapsheet)。
为了不使数据量太大而影响数据读取的效率,也常以分区方式来存储GIS数据。
数据分区式-优缺点:
–分区式与分层式可同时采用,并不冲突。
–分区式也是目前大部份商业软件所采用的方法,适合与栅格和矢量数据结构,在数据量大的系统中,分区方法可提高数据存取的效率。
–图幅或区块间的衔接问题是分区法最大的困扰,尤其在空间数据查询、分析操作时更是这样。
(3)实体式(EntityBased)
以人所认知的实体(Entity)或对象(Object)为组织单元;
GIS之精神所在;
目前大多GIS都以点、线、面要素为单元,代表二维空间的实体,例如以点代表城市、学校或单位等;以线代表道路、河流、或电力线等;以面代表行政区域、湖泊或地籍宗地等。
实体方式优缺点:
–该组织法符合人对现实世界空间现象的认知,同时便于与空间关系以及属性数据的联系,而形成所谓的实体关系(Entity-Relationship)数据组织模式,因此适合于空间数据的查询分析和空间关系的推导。
–可配合分区及分层的方式来建立效率高并符合GIS操作的数据组织方式。
–由于人对地物或现象的认知或推理会随数据或应用的目的而改变,因此并无固定或标准的程序来把数据以实体的方式组织。
(4)面向对象式(ObjectOriented)
5.属性数据组织方式:
虽然属性数据可由RDBMS管理,但不同GIS的实现策略不同:
(1)ARC/INFO:
属性存储在coverage目录之下,在工作区目录下,通常有一个记录属性数据文件信息包括目录路径的文件,而且,一个Coverage仅有一个AAT或PAT表,还支持按每个地物类建立扩展属性表,通过PAT或AAT连接;
(2)MGE:
一个地物类对应于一个属性表文件,而且所有属性文件都在工程目录下,不要求每个地物类都具有属性;
(3)Geostar:
一个地物类有一个属性表,或多个地物类公用一个属性表。
一个属性文件包含了工程内所有同类空间对象的属性。
二、空间数据库管理方式。
(几种方案)
1、文件关系数据库混合管理方案
定义:
用一组文件形式来存储地理空间数据及其拓扑关系,利用通用关系数据库存储属性数据,通过唯一的标识符来建立它们之间的连接。
软件:
ARC/INFO、MapInfo、MicroStation
局限性:
由于空间数据和属性数据的分开存储,在表现地理空间数据方面缺乏完整的表达语义和存储机制,难以保证数据的存储和操作的统一。
这种方式实际上不能建立真正意义上的空间数据库。
文件关系数据库混合管理方案优点:
(1)GIS可通过DBMS提供的高级编程语言的接口,直接操纵属性数据,查询属性数据库,并在GIS的用户界面下,显示查询结果。
(2)在ODBC(OpenDataBaseConnectivity,开放式数据库互连)推出后,GIS软件商只需开发GIS与ODBC的接口软件,就可将属性数据与任何一个支持ODBC的RDBMS连接。
这样用户可在一个界面下处理图形和属性数据。
文件关系数据库混合管理方案缺点:
(1)属性数据和图形数据通过ID联系起来,使查询运算,模型操作运算速度慢;
(2)数据发布和共享困难;
(3)属性数据和图形数据分开存储,数据的安全性、一致性、完整性、并发控制以及数据损坏后的恢复方面缺少基本的功能;
(4)缺乏表示空间对象及其关系的能力。
目前,空间数据管理正在逐步走出文件管理模式。
2、全关系式数据库管理方案
基于关系模型方式,将图形数据按关系模型组织。
图形数据和属性数据统一存储在通用关系数据库中,即将图形文件转成关系存放在目前大部分关系型数据库提供的二进制块中。
将图形数据变长部分处理成BinaryBlock字段(多媒体或变长文本)
软件:
System9,SmallWorld、OracleSpatial
全关系式数据库管理方案优点:
(1)在全关系型数据库中加入了二进制数据块形式省去大量关系连接操作,可提高查询速度;
(2)便于数据的维护。
全关系式数据库管理方案缺点:
(1)不定长记录造成存储效率的下降;
(2)实现SQL查询要附加接口,因此它只适用于功能简单的GIS。
3、面向对象数据库管理方案
面向对象型空间数据库管理系统最适合空间数据的表达和管理。
面向对象型数据库系统的优点:
(1)支持变长记录,还支持对象的嵌套,信息的继承和聚集。
(2)面向对象数据库管理系统允许定义合适的数据结构和数据操作。
面向对象型数据库系统的缺点:
(1)不支持SQL语言,在通用性上受局限。
(2)面向对象型空间数据库管理系统还不够成熟,价格又昂贵,目前在GIS领域还不通用领域还不通用。
4、对象关系数据库管理方案
采用通用关系数据库管理系统效率低,面向对象型空间数据库管理系统又不够成熟,随着空间信息系统的发展,许多数据库管理系统的软件商纷纷对关系数据库进行扩充,使之能直接存储非结构化的空间数据,形成对象—关系型数据库GIS系统。
采用对象关系数据模型,对现有的关系数据库进行扩展,增加空间数据类型;
将空间坐标存在变长记录中,解决了空间数据变长记录的存储问题,由数据库软件商开发,效率较高;
用户不能根据GIS要求进行空间对象的再定义,因而不能将设计的拓扑结构进行存储,没有解决数据的嵌套记录问题;
建立高效的空间索引;
软件:
ARCGISSDE;MapInfo;Spatialware等
对象—关系型空间数据库优点:
(1)解决了空间数据的变长记录管理,使数据管理效率大大提高;
(2)空间和属性之间联结有空间数据管理模块解决,不仅具有操作关系数据的函数,还具有操作图形的API函数;
(3)对象—关系型空间数据库是在标准的关系数据库上加一层空间数据管理模块;用该层功能将地理结构查询语言转化成标准的SQL查询,空间数据查询速度快。
对象—关系型空间数据库:
缺点
空间数据对象还不能有用户任意定义,用户使用受一定限制。
如定义的空间函数支持的对象不带拓扑关系,用户不能定义带拓扑关系的数据模型。
另,空间数据库管理方式:
基于文件的空间数据库:
Coverages、Shapefiles、Grids、TINs、Images(各种格式的)、VectorProductFormat(VPF)Files、CAD文件、表(各种格式的)。
基于数据库的空间数据库:
Oracle、OraclewithSpatial、DB2withitsSpatialType、InformixwithitsSpatialType、SQLServer、PersonalGeodatabases(微软的Access)、EnterpriseGeodatabases。
空间数据库存在问题:
1、数据共享问题:
数据文件格式统一性、地理信息的标准化、数据共享的政策
2、数据“瓶颈问题”
3、数据更新问题
4、数据安全问题
三、ARC/INFO数据管理方式的异同(*Geodatabase框架体系)Coverage数据管理方式与Geodatabase的异同(发展演变)、优缺点是什么
1.ARC/INFO数据模型基础
采用一种混合数据模型/统一数据模型定义和管理空间数据。
“ARC”是指定义地物空间位置和关系的拓朴数据结构;
“INFO”是指定义地物属性的表格数据(关系)数据结构。
支持空间目标的矢量表示和栅格表示:
(1)位置数据用矢量和栅格数据表示;
(2)属性数据存储在一组数据库表格中/空间属性统一存储在表格中;
(3)通过空间和属性数据连接实现对空间数据查询、分析和制图输出。
2.ARC/INFO数据模型支持六种重要的数据结构
Coverage:
矢量数据的主要表现形式
GRID:
栅格数据的主要表现形式
TIN:
适合于表达连续表面
属性表
影像:
用作地理特征的描述性数据
CAD图像:
用作地理特征的描述性数据
3.ARC/INFO的数据空间特征
(1)基本空间特征:
a.点:
定义为空间的一套XY或XYZ坐标
b.线:
定义为一系列有顺序的坐标点
c.面:
由一组或多组线构成的多边形
d.结点:
线的起点或终点(结点是一复杂的特征,不能单独存在,通过检查结点:
类型可以知道线与线的关系和多边形特征是否能正确完成。
)
e.注记
(2)高级空间特征
a.区划(Region)
如行政区划上的群岛,地籍上的飞地。
定义为一组互不重叠的多边形,用于描述具有相同属性单元的不连续多边形。
b.事件(Event)
定义为基于基本线特征基础上离起点或终点一定距离的一点。
如要找高速公路200公里处的事故点不需直接求出这一点的坐标,同时对线路或事件点修改不会造成不一致性问题。
c.路径(Route)
定义为基于基本线特征基础上的路由。
如在道路网上划分出的公共汽车线路,不同的公共汽车线路公用部分时不用重复输入线特征。
路径的起点或终点可不与线特征起点或终点重合,可定义为线路上离起点或终点一定距离的点,这样就不用断开线特征。
4.ARC/INFO的数据模型:
(1)地理相关模型(GeoRelationalModel,Coverage)
1.在ARC/INFO7.X及更早期的版本中使用;
2.强调的是空间要素的拓朴关系:
要关心点、线和多边形这些几何类型,几何与拓朴存储在二进制文件中,而与之相关的属性数据存储在关系数据库(DBMS)中。
地理相关模型(Coverage)-描述
Coverage定义:
ARC/INFO7.X以前版本以Coverage作为矢量数据的基本存储单元。
一个Coverage存储指定区域内地理要素的位置、拓朴关系及其专题属性。
每个Coverage一般只描述一种类型的地理要素(一个专题Theme),位置数据用X,Y表示,相互关系用拓朴结构表示,属性信息用二维关系表存储。
地理相关模型(Coverage)-数据组织
1.标示点
a.位置数据:
Cover#,Cover_ID,和X、Y存储在LAB文件中。
b.属性数据:
包含四个基本的数据项(Cover#,Cover_ID,Area,Perimeter),存储在点属性表PAT文件中。
2.结点
a.位置数据:
不明显地存储,而是作为弧段的起始结点和终止结点存储在ARC文件中。
Cover#,Cover_ID。
b.属性数据:
存储在结点属性表NAT文件中,它包含三个基本数据项。
Cover#,Cover_ID,ARC#。
3.弧段
a.位置数据:
Cover#,Cover_ID,FNODE#,TNODE#,LPOLY#,RPOLY#,坐标串,存储在ARC文件中。
b.属性数据:
存储在弧段属性表AAT文件中;它包含7个标准数据项。
Cover#,Cover_ID,FNODE#,TNODE#,LPOLY#,RPOLY#,Lengh。
4.多边形
a.位置数据:
由一组弧段和位于多边形内的一个标示点来表示。
它不直接存储坐标信息,坐标信息存储在ARC和LAB文件中。
Cover#,Cover_ID,Lab#,Arc#1…Arc#n。
b.属性数据:
存储在多边形属性表PAT文件中,它包含四个基本数据项。
Cover#,Cover_ID,Area,Perimeter。
5.控制点
存储于tic文件中。
6.覆盖范围
存储于bnd文件中。
7.投影信息
存储于prj文件中。
地理相关模型(Coverage)-优点
1.空间数据与属性数据关联
空间数据放在建立了索引的二进制文件中,属性数据则放在DBMS表(Tables)里面,二者以公共的标识号相连。
2.矢量数据间的拓朴关系得以保存
由此拓朴关系信息可以获知多边形是由哪些弧段(线)组成,弧段(线)由哪些点组成,两条弧段(线)是否相连,以及一条弧段(线)的左右多边形是谁?
这是通常所说的“平面拓朴”。
地理相关模型(Coverage)-新技术条件下的缺陷
1.模型可取的方面,有的已经可以不再继续作为强调的因素;
a.拓朴关系的建立可用面向对象技术来解决(记录在对象中);
b.硬件的发展,不再将存储空间的节省与否作为考虑问题的重心;
c.计算机运算能力提高,已经可以实时地通过计算直接获得分析结果。
2.空间数据不能很好的与其行为相对应;
3.以文件形式保存空间数据,而将属性数据放在另外的DBMS系统中。
这种方式对于日益趋向企业级和社会级的GIS应用而言,已很难适应(如海量数据,并发等)。
4.Coverage模型拓朴结构不够灵活,局部的变动必须对全局的拓朴关系重新建立(build);“牵一发而动全身”,且费时。
5.在不同的Coverage之间无法建立拓朴关系。
比如河流与国界;人井与管道等。
(2)地理数据库(GeoDataBase)
描述(定义):
GeoDataBase是ARC/INFO8引入的一个全新的空间数据模型;
是建立在DBMS之上的统一的、智能化的空间数据库。
在实现上使用了标准的关系-对象数据库技术。
它支持一套完整的拓朴特征集,提供了大型数据库系统在数据管理方面的所有优势(如数据的一致性、连续的空间数据集合、多用户并发操作等)。
介绍:
1.面向对象的数据模型
对象具有属性和行为
2.属性存储在DBMS中
a.要素的几何形状和属性
b.规则,关系,分类,元数据,等等
3.行为由客户端来实现
a.由ArcObjects的客户端系统来操作属性
b.Geodatabase的完整性由客户端来保证维持
4.空间数据和属性数据的容器
a.GIS数据存储在关系数据库(RDBMS)中
b.可升缩的解决方案(个人GDB或企业GDB)
c.支持数据完整性规则
5.ArcGIS有工具可用来移植现有的GIS数据
6.空间数据和属性数据的容器
用RDBMS存储空间和属性数据
7.可升缩的解决方案(个人GDB或企业GDB)
a.个人geodatabase
–构件在MicrosoftJetEngine上
–MicrosoftAccess文件
b.企业geodatabase
–存储在RDBMS中
–需要ArcSDE
c.区别:
–个人GDB容量限制:
2GB
–企业GDB支持版本管理和多用户编辑
8.具有互操作性
a.多种数据集成
b.多种DBMS
c.多种数据格式
1.具有简单几何图形的特征类和表可以被直接存放在geodatabase或特征(或称要素)数据集中。
1.1点特征类:
是点状或多点状简单特征的群集。
1.2线。
。
。
。
。
。
。
。
。
。
有折线组成的简单特征的群集。
1.3多边形。
。
。
。
。
。
。
。
多边形组成的。
。
。
。
。
。
。
。
。
。
。
。
。
1.4对象类:
是附含行为的表。
它是一个矩阵,行表示对象,列表示属性。
1.5特征数据集:
是具有公共空间参考的特征类,图和关系的群集。
(几何网络和网络特征类必须位于同一个特征数据集中)
1.5.1接合特征类:
包含简单接合特征或复杂结合特征,这些接合特征是几何网络的一部分。
1.5.2边特征类:
包含简单边特征或复杂边特征,这些边特征是几何网络的一部分。
1.5.3几何网络:
定义了一组接合特征类和边特征类,它们共同组成一维网络。
1.5.4关系类:
是两个特征类中特征间的关系的群集。
(关系类可以放在特征数据集中或直接放在geodatabase中。
)
地理数据库(GeoDataBase)-模型结构
1.对象类(Table)
a.行列的集合:
没有空间要素;保存了属性值,地址,x/y位置,路径事件,等等。
b.GDB表中的字段中可以包含行为:
记录的子类型;属性的缺省取值;属性的取值域。
c.可参与到关系中
2.要素类(Feature)
a.同类空间要素的集合称为要素类。
如:
河流、道路、电缆等。
b.存储了要素形状的表:
每条记录代表一个要素和她的属性存储了要素和她的单一几何形状(点,线,或多边形);除了x,y值,还允许有z和m值
c.有个相关联的空间参考:
投影,坐标系统,和空间范围
3.要素坐标(Feature)
a).x,y坐标(必须)
定义2维空间中的顶点的位置;所有的顶点都包含
b).z坐标(可选)
通常用于高程值;必须设置“Containszvalues”
c).m坐标(可选)
通常用于线性参考的度量值;必须设置“Containsmvalues”
4.空间参考
a.要素类和要素数据集的属性(用来定义要素类的坐标值)
b.独立的要素类和要素数据集都需要
c.组成(地理坐标系统,投影坐标系统,坐标域)。
d.空间参考有三个重要组成部分:
1.坐标系:
定义了地图投影及其参数;2.空间区域:
限定了X与Y值的取值范围及可选的Z值和m值;3.比例尺:
定义了多少整数单位对于一个地图单位,并定义了坐标精度。
【空间参考与特征类相关联。
如果特征类是在特征数据集中组织的,那么所有的特征类具有相同的空间参考。
geodatabase可以有多种空间参考,每个特征数据集和单个单独的特征类都有特征参考。
一旦将空间参考赋予某个特征类或特征数据集,你就能更新坐标系,但不能更新空间区域和比例尺。
】
5.要素(特征)数据集(FeatureDataSet)
a.是由一组具有相同空间参考的要素类组成。
b.包含了要素类:
共享相同的空间参考;并非表格;没有几何形状
c.在创建空间关系时需要:
Geodatabase拓扑;几何网络
c.1.专题归类表示
当不同的要素类属于同一个主题范畴(如水系的点线面要素)
c.2.创建几何网络
在同一几何网络中充当连接点和边的各种要素类(如配电网络中有各种开关、变压器、电缆等)
c.3.考虑平面拓朴
共享公共几何特征的要素类(如水系、行政区界等)
6.有效规则(ValidationRule)
对要素的行为和取值加以约束的规则。
(如规定不同管径的水管要连接,必须通过一个合适的转接头。
规定一块地可以有一到三个主人。
)
a).Geodatabase能存储属性,连通性,和对象间的关联规则
b).预定义,参数驱动;包括:
b.1.属性域
b.1.1定义属性有效取值范围。
值域(连续变化区间)和码域(离散取值集合)。
b.1.2定义一个属性字段的合法属性值;两种类型:
<1>范围属性域:
从最小值到最大值;杆高=10米到15米
<2>编码值属性域:
一组值的列表;土地利用=居住,商用,或工业用
b.1.3分割和合并的方针
b.1.4是Geodatabase的属性
<1>可把属性域应用在多个字段上;<2>子类型可应用在所有的记录上。
b.1.5设置属性域的步骤:
<1>选择一种属性(短整型、长整型等)<2>设定域的类型(取值范围、编码值等)<3>设定分割和合并原则(几何比例、加权平均等)
b.2.子类型
要素类或表中对对象进行分组,按某个整数型属性分组,自动符号化要素类
每种子类型可根据不同的规则来分配属性取值域,拓扑规则,网络规则等等.
b.3.关系类
b.3.1关系类是什么?
定义两个不同要素类或对象类之间的关联关系。
(房主&房子)一个类可以参与在多个关系类之中。
当对象被删除或者移动时,geodatabase使用对象间的关系来保持对象的指示完整性。
当对象发生变化时,相关对象可以相互发送通知。
b.3.2两个对象类之间的一种关联
一个类可以参与在多个关系类之中;
源表&目标表(公共字段:
主键&外键);
关联基数:
一对一、一对多、多对多(基于属性);
b.3.3关联完整性&关联类属性
b.3.4关联类型(源类&目标类):
简单关联&复杂关联
b.3.5关系类标注(前向标注&后向标注)
b.3.6关系消息(相关联的对象之间可以彼此将消息通知对方)
从源到目标,从目标到源,双向,或者都不
可以触发行为(层叠删除,movetofollow,自定义,等等.)
b.3.7关系类中关联规则(基于子类定义)
7.注记(Annotation)
8.尺寸(Dimension)
9.栅格数据集(RasterDataSets)
a.用于存放栅格数据,支持影像镶嵌,可以通过建立“金字塔”索引,并在使用时指定可视范围提高检索和显示效率。
b.栅格数据存储方案:
栅格数据集、栅格目录、栅格属性字段
四、Geodatabase几何网络(*创建、分析过程)
a.用来为网络系统建模;确定要素类之间的连通性关系
b.在网络中每个要素都是一个角色:
边&接点
c.多个要素类可以充当同样的角色
d.连通性基于几何图形的空间一致性,始终是动态的
e.要素类必须是位于同一个要素数据集中
f.一个要素类只能参与到一个几何网络中
g.可以在网络里加入相关联的连通性规则
1.几何网络-网络要素和连通性规则
a.网络要素类型
<1>简单接点&复杂接点
<2>简单边线&复杂边线
<3>孤立交汇点
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 空间 数据库 Geodatabase 复习资料 考试 要点 老师 整理