基于校园网的信息集成系统Word文件下载.docx
- 文档编号:7756679
- 上传时间:2023-05-09
- 格式:DOCX
- 页数:88
- 大小:2.33MB
基于校园网的信息集成系统Word文件下载.docx
《基于校园网的信息集成系统Word文件下载.docx》由会员分享,可在线阅读,更多相关《基于校园网的信息集成系统Word文件下载.docx(88页珍藏版)》请在冰点文库上搜索。
本学位论文作者完全了解学校有关保留、使用学位论文的规定,并同意以下事项:
1、学校有权保留并向国家有关部门或机构送交论文的复印件和磁盘,允许论文被查阅和借阅。
2、学校可以将学位论文的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存、汇编学位论文。
同时授权清华大学“中国学术期刊(光盘版)电子杂志社”用于出版和编入CNKI《中国知识资源总库》,授权中国科学技术信息研究所将本学位论文收录到《中国学位论文全文数据库》。
(保密的学位论文在解密后适用本授权书)
学位论文作者签名:
导师签字:
签字日期:
年月日签字日期:
摘要
异构数据的集成有很重要的现实意义,在现实社会中,很多单位和企业有多个独立运行的信息系统,然后这些系统由于硬件、网络、操作系统等种种原因、协同工作的效果并不是很好,而异构信息集成系统的目的正是解决这个问题,为用户提供透明的服务。
本文分为两个大的部分,前一部分介绍了机构系统的相关技术及概念,后半部分通过实现一个具体的系统,从这个系统中可以看出,经过异构集成,整个系统的协调工作效率确实提高了许多。
信息集成系统的设计目标是实现异构数据源的集成,提供给用户统一的数据资源,对用户屏蔽数据源的异构特征。
既然是异构系统,就必须有多个不同的系统参与,所以本系统先实现三个可以独立的系统,分别是图书馆系统、教务系统、财务系统,然后在这三个系统的基础上在现实一个集成系统,负责集成异构数据,并且当在异构集成系统上做任何操作的时候,都要保证各个独立系统能照常运行并且能保证数据的一致性和完整性。
集成系统的主要有两部分组成,一种是对应规则,对应规则我们采用XML格式存储,采用XML的优点是独立于操作系统和数据库。
一种是中间件系统,中间件负责其实是集成系统和底层系统之间的一个逻辑层,对于上层提供无差别的服务,屏蔽异构源差异,对下把上层指令翻译成对应各个独立系统的具体指令分别执行。
根据中间件的向上和向下的不同功能,把其分为两部分,对上提供服务的,称作向上中间件,向上中间件的主要作用是组织各个底层系统传过来的数据,转换成上层理解的XML格式。
并去除其中的冗余。
假如上层需要查询某学生的全部信息,那么经过向下中间件的翻译之后,一条指令翻译成三条指令分别发送到财务系统、图书馆系统和教务系统,财务系统中的SQL语句执行结果返回的是:
该学生的学号、姓名、应该缴纳的住宿费金额、应该缴纳的学费金额、住宿费是否已经缴纳、学费是否已经缴纳。
而图书馆系统中返回的信息是:
该学生的学号、该学生的姓名、该学生所借图书编号及图书名、该学生的图书馆账号余额。
教务系统中返回的查询结果是:
该学生的学号、该学生姓名、该学生性别、民族、电话、电子邮箱、入学日期、所学专业、所在班级、以及其所选的课程。
不难看出,这些数据集合有很多的冗余。
并且可能字段值不一样,比如财务系统返回的学号字段是student_num,而图书馆系统和教务系统返回的学号字段都是student_id,其实他们的意思是一样的,这时候就需要根据集成系统中的映射表挑出所有意思相同的字段,只选其中一项,并且采用上层理解的字段,最后形成XML的格式返回给上层用户。
关键词:
异构信息集成、XML、中间件
Campus-basedIntegratedInformationSystem
Abstract
Integrationofheterogeneousdatahaveimportantpracticalsignificance,inreality,alotofunitsandenterprisestorunmultipleindependentinformationsystems,andthesesystemsduetohardware,network,operatingsystemandotherreasons,nottheeffectofworkWell,whiletheintegrationofheterogeneousinformationsystemsaredesignedtosolvethisproblemistoprovideuserswithatransparentservice.Thisarticleisdividedintotwomajorparts,thefirstpartofthebodysystemintroducedtheconceptofrelatedtechnologiesand,secondhalfbyimplementingaspecificsystem,canbeseenfromthesystem,throughheterogeneousintegration,efficiencyandcoordinationofthewholesystemIndeedimprovedalot.
totheuser,theuserheterogeneousdatasourcesshieldedcharacteristics.Sinceitisaheterogeneoussystem,theremustbeanumberofdifferentsystemsinvolved,sothesystemcanbethefirsttoachievethreeseparatesystems,namely,thelibrarysystem,educationalsystem,financialsystem,andthenonthebasisofthethreesystemsinRealityanintegratedsystem,responsibleforintegratingheterogeneousdata,andwheninheterogeneousintegratedsystems,whentodoanything,wemustensurethatalltheseparatesystemscanrunasusualandcanensuredataconsistencyandintegrity.
InformationintegrationsystemisdesignedtointegrateheterogeneousdatasourcestoprovideaunifieddataresourcesIntegratedsystemhastwoparts,oneisthecorrespondingrules,correspondingtotherulesweuseXMLformattostore,theadvantagesofusingXMLisindependentoftheoperatingsystemanddatabase.Oneisthemiddlewaresystem,middlewareisresponsibleforsystemintegrationbetweensystemsandalogicalbottomlayer,toprovidenon-discriminatoryservicesfortheuppershieldbetweenheterogeneoussources,thenextinstructiontobetranslatedintothecorrespondingtopofeachindependentsystemSpecificinstructionswereexecuted.
Upanddownaccordingtothemiddlewarethedifferentfunctions,tobedividedintotwoparts,toprovideservicesfor,calledupthemiddleware,upthemainroleofmiddlewareistoorganizeallthedataunderlyingthesystempassover,intotheupperUnderstandingtheXMLformat.Andremoveoneoftheredundancy.Ifthetopneedtocheckalltheinformationastudent,thendownthroughthetranslationofthemiddleware,theoneinstructionweretranslatedintothreecommandssenttothefinancialsystem,librarysystemsandacademicsystems,financialsystems,resultsoftheimplementationoftheSQLstatementisreturned:
thestudent'
sstudentnumber,name,accommodationshouldbepaidtheamountoftuitionfeeshouldbepaid,accommodationisalreadypaid,tuitionfeesarealreadypaid.Thelibrarysysteminthereturnmessageis:
sstudentnumber,thestudent'
sname,thestudentnumberandlibrarybooksborrowedbythenameofthestudent'
slibraryaccountbalance.Educationalsystemtoreturnsearchresultsare:
sstudentnumber,thenameofstudent,thestudentgender,nationality,telephone,email,dateofadmission,specialty,wheretheclassesandcoursesoftheirchoice.Itisobviousthatthesedatasetshavealotofredundancy.Andfieldvaluesmaybedifferent,suchasthefinancialsystemreturnsthestudentIDfieldisstudent_num,thelibrarysystemandeducationalsystemreturnsthestudentIDfieldsarestudent_id,infact,whattheymeanisthesame,thistimeontheneedtoSystemIntegrationMappickofallthefieldsmeanthesame,chooseoneonly,understandingandusingtheupperfield,thefinalformXMLformatbacktothetopusers.
Keywords:
Heterogeneousinformationintegration,XML,middleware
1绪论9
1.1课题的提出9
1.2现有异构数据库集成解决方案10
1.3相关技术发展12
1.4本文研究的对象13
1.5本文结构14
2异构信息集成系统中的中间件技术15
2.1中间件概念及特点15
2.2中间件技术分类16
2.2.1RPC中间件16
2.2.2ORB中间件17
2.2.3消息中间件MOM17
2.2.4数据库中间件18
2.2.5事务处理中间件19
2.2.6Web中间件19
2.3中间件应用20
3XML技术及其在异构数据库集成中的应用22
3.1XML概述22
3.1.1XML定义22
3.1.2XML特性23
3.1.2.1可扩展性23
3.1.2.2灵活性24
3.1.2.3自描述性24
3.1.2.4简明性24
3.2XML的显示及转换25
3.2.1XML的显示25
3.2.2xml的转换26
3.3XML的web模型和解析27
3.3.1XML格式数据的生成过程27
3.3.2XML与异构数据库28
3.3.3XML的解析29
3.4XML的标准体系和应用30
3.4.1XML的标准体系30
3.4.2XML的应用31
4java技术及其在异构数据库集成中的应用33
4.1java是什么33
4.2为何选择java33
4.2.1java的特点33
4.2.1.1简单性:
33
4.2.1.2面向对象:
4.2.1.3健壮性:
34
4.2.1.4安全性:
4.2.1.5体系结构中立:
4.2.1.6可移植性:
4.2.1.7高性能:
35
4.2.1.8多线程:
4.2.2java操作数据库35
4.3EnterpriseJavaBean40
4.3.1EJB概述40
4.3.2EJB分类42
4.3.2.1实体Bean42
4.3.2.2会话Bean43
4.3.2.3消息驱动Bean43
4.3.3EJB的应用44
5信息集成系统的需求分析及设计47
5.1需求分析47
5.1.1财务系统47
5.1.2图书馆系统48
5.1.3教务系统49
5.1.4集成系统51
5.2架构设计54
6信息集成系统的实现56
6.1财务系统56
6.2图书馆系统59
6.3教务系统64
6.4集成系统71
6.4.1集成系统界面71
6.4.2映射表72
6.4.3中间件76
7系统测试83
7.1测试环境83
7.2测试结果83
8总结与展望84
8.1总结84
8.2展望84
1绪论
1.1课题的提出
过去的20年间,我们的生活发生了巨大的变化,悄然间我们已经从工业社会进入了信息社会。
各种网络资源海量涌现,在网上人们可以找到大部分自己需要的信息和资源。
但是在发展的过程中,也出现了些许问题。
互联网以其开发性促进了很多相关技术的发展,但是在其发展的同时,标准也相应的出现差异化,各种技术之间的标准似乎并不一致,这就导致一个问题,不同标准之间的通信沟通问题。
本文所讨论的是其中的一部分,异构信息系统的集成,具体的说就是异构数据库的集成。
随着互联网的快速发展,各个公司、企业、学校都建立了自己的信息系统,并且自己的信息系统内部又分为多个小的信息系统,因为开发的时候由于多种因素,比如开发团队不同、所采用的技术不同、构架风格不同导致这些信息系统之间没有统一的接口。
久而久之,各个系统之间的访问变的非常困难,各个信息系统逐渐形成了多个信息孤岛,信息孤岛自己可以独立运行,但是对于相互之间的联系则变的越来越困难。
而很多情况下,现实又要求这些信息系统必须实时同步,协同工作,这时就会出现严重的问题,因为没有统一的接口及解决方案,导致整个大系统工作效率低下。
并且经常导致信息的不一致和冗余。
传统的数据集成系统已经远远不能满足人们的需求,人们需要一种新型的数据集成系统,这种系统不仅能够集成web上大量的结构化的、半结构化的甚至非结构化的信息、并且还要兼容传统的数据库中的数据。
在这种大背景下,异构集成系统越来越成为一个研究应用的热点。
异构数据集成不仅仅指不同数据库之间的的数据集成,如Oracle和sqlServer、Access和Mysql等,也包括不同结构之间的数据集成,想传统数据库中的数据信息和XML等半结构化的数据信息集成。
这些异构的数据经过异构数据系统的集成后,统一存储、查询和管理,底层的差异经过异构数据集成系统已经被过滤掉,对用户透明,用户所看到的是一个统一的数据系统。
1.2现有异构数据库集成解决方案
异构数据库集成的解决方案有多种,比较常见的分别是数据仓库方式和异构中间件集成方式。
数据仓库的解决方案是把原来各个孤立的信息孤岛中的数据抽取出来,以数据仓库中规定的结构和标准存储,用户需要访问数据时之间通过数据仓库进行。
此方法的优点是查询直接,但是如果想更新数据库的话比较繁琐,需要对原来的各个孤立信息数据库进行操作。
另外,在抽取各个独立的信息系统中数据注入数据仓库的时候要保持数据的完整性。
具体包括数据的完整性和约束完整性,数据完整性即指每个数据对象,也可以称为每条数据的各个字段和值要完整。
约束完整性则是指各个联系的表之间的相互约束关系要完整,不能因为数据的转移而破坏这种完整性。
另外一方面,建立数据仓库的同时要解决好语义冲突,这是因为在原来各个孤立的信息系统中,彼此之间可能会有同名字段,或者同样的字段意义却用不同的字段名来表示,比如图书馆系统中用ID来表示学号,在教务系统中可能用学生ID来标示,在这种情况下,由图书馆系统和教务系统构见校园的数据仓库的时候就会产生语义冲突,在这种情况下,可以设置一张映射表,统一标识,并且可以在逆向映射的时候准确的找到原象。
语义冲突的解决非常关键,如果解决不好可能会导致整个系统的混乱和导致严重的后果。
在建成数据仓库之后,要定期对数据仓库进行维护,因为数据仓库中的数据来自于各个子信息系统,并不是实时更新的,正是由于这种特性,对于某些实时性要求较高的系统,数据仓库的方式显然并不合适。
数据集成原理如图1所示。
图1数据仓库集成
另一种解决方案是利用系统集成中间件技术。
此种方法不会改变原信息系统的存储结构和数据。
利用异构集成中间件,向下屏蔽了各个异构数据库之间的差异。
向上提供了统一的服务接口和数据结构。
当用户提交了一条查询请求的时候,这条请求首先被传送给中间件,经过中间件分析并且生成对应的多个子查询请求并且经过包装,去操作各个底层的异构数据库,各个子查询把查询结果返回给中间件,中间件再以上层理解的数据结构组织包装这些数据,最后提供给上层。
当选用了中间件作为异构数据源集成的解决方案后,必须为中间件系统选择
一种全局的数据模式。
负责集成的中间件系统必须提供一种全局数据模式来统一
异构的源数据模式。
过去,异构数据源的集成系统,例如多数据库系统(如CIMS
中的多数据库系统)或联合数据库系统通常采用关系或对象的数据模式作为全局
模式。
然而,它们并不能满足网络时代的Intranet/Internet应用所提出的高标准。
一般来说,异构数据集成的全局模式必须满足:
(1)能够描述各种数据格式,无论其是结构化的还是半结构化的,无论其
是否支持所有的查询语言还是简单的文本查询。
(2)易于发布和进行数据交换,集成后的数据可以方便的以多种格式发布
和便于应用交换数据。
随着XML及其相关技术和应用的发展,XML不仅成为了应用间交换数据
的一种标准,也是Internet重要的信息交换标准和表示的技术之一。
XML的产生给不同的信息格式的统一带来了深刻的影响。
XML提供了一种信息交换模式,
这种格式是可编辑,易解析,并且可以表示为任何类型的结构或半结构化信息。
现在很多的异构集成系统都使用XML作为统一的数据模型。
1.3相关技术发展
异构数据集成的研究在国外已经有了一定的成果,其中InformationManifold(IM),TSIMMIS都实现了对不同数据源的统一存取。
InformationManiflod(IM)由贝尔实验室研发。
对数据源采用容易理解的说明性描述,并且通过算法生成查询语句。
目前已经经常了上百个web数据源。
其架构图如图2:
图2IM架构图
由图中可以清晰地看到,此系统中大致是三层结构。
其中旁边还有一个辅助的模块。
其中有KnowledgeBase,负责提供对识信息。
用户接口和查询计划生成器(QueryPlanGenerator)也通过其规划查询计划。
WorldView提供对异构数据库的统一视图,查询几乎可以根据统一视图经行统一查询。
查询规划生成器(QueryPlanGenerator)参照SourceDescriptions、利用查询处理运算法则为给定的查询选定有用的数据源并生成查询规划,并将查询规划送往执行引擎(ExecutionEngine),由执行引擎负责协调子查询的执行并将结果数据返回用户使用。
TSIMMIS是由IBM和斯坦福大学联合开发的异构信息集成系统。
其目的是快速开发异构信息集成系统,包括结构化的和半结构化的数据信息。
其结构图如图3所示:
图3TSIMMIS架构图
其中最重要的是包装器Wrapper和中间件mediator。
由图中可以看出,每一个数据源上面都有一个包装器,包装器负责把数据源中的数据包装成统一的格式,供中间件识别。
中间件由中间件产生器产生。
负责对接受用户的查询指令并且对各个包装器进行查询。
注意,中间件查询的不是异构数据源本身,而是经过包装器包装的可以供中间件统一识别的数据结构。
其中中间件和包装器都由MSL描述。
中间件把从各个包装器查询的结果经过重新组织以后,以上层能够识别的数据结构反馈给用户,查询操作完成。
1.4本文研究的对象
随着信息技术的不断发展,各个政府单位、学校、公司都建立了自己的信息系统,在各个信息系统结构不同,存储方式不同,甚至存储数据不同的情况下如何整合这些异构的数据信息源是
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 校园网 信息 集成 系统
![提示](https://static.bingdoc.com/images/bang_tan.gif)