档案数据库建设.ppt
- 文档编号:15376008
- 上传时间:2023-07-04
- 格式:PPT
- 页数:101
- 大小:8.70MB
档案数据库建设.ppt
《档案数据库建设.ppt》由会员分享,可在线阅读,更多相关《档案数据库建设.ppt(101页珍藏版)》请在冰点文库上搜索。
数字档案管理,1,第五章档案数据库建设,第一节档案数据库涵义、类型第二节档案目录数据库的结构与规范第三节档案目录数据库管理平台的选择第四节基于目录数据库的档案管理系统的开发第五节档案目录数据库的数据录入,数字档案管理,2,第1节档案数据库的涵义、类型1.数据库概念,数据库:
记录保存系统(强调了数据库是若干记录的集合)数据仓库(形象、不严谨)按照数据结构来组织、存储和管理数据的仓库(侧重于数据的结构)按照某种方式组织、存储在一起的相关数据的集合(较科学),数字档案管理,3,第1节档案数据库的涵义、类型1.数据库概念,数据库系统的构成:
数据数据库管理系统操作系统平台应用软件系统硬件、存储设备系统,数据,数据库管理系统,操作系统平台,硬件、存储系统,应用软件系统,用户,维护和管理数据库的系统软件,运行在操作系统平台之上,将大量结构化、非(半)结构化数据按一定模式组织、存储起来,为用户提供建立、操作、维护数据库的命令和方法,数字档案管理,4,第1节档案数据库的涵义、类型1.数据库概念,数据库系统的数据有不同的类型:
结构化数据非结构化数据半结构化数据,能够用统一的数据结构加以表示的数据集合。
如:
关系型数据库、面向对象数据库中的数据,无法用统一的数据结构加以表示的数据集合如:
图片、声音、视频等。
介于完全结构化数据和完全无结构的数据之间的数据。
数字档案管理,5,第1节档案数据库的涵义、类型1.数据库概念,数据库管理系统也有不同的类型:
结构化数据库管理系统层次数据库管理系统网状数据库管理系统关系数据库管理系统非结构化数据库管理系统一般的做法是:
建立一个包含三个字段的表(编号number、内容描述varchar(1024)、内容blob)。
引用通过编号,检索通过内容描述。
例如:
内容管理器在处理连续信息(包括全文信息)和非结构化信息(包括各种多媒体信息)中有着传统关系型数据库所无法比拟的优势,数字档案管理,6,第1节档案数据库的涵义、类型1.数据库概念,数据库管理系统也有不同的类型:
结构化数据库管理系统层次数据库管理系统网状数据库管理系统关系数据库管理系统非结构化数据库管理系统半结构化数据库管理系统,例如:
XML数据库。
XML数据库是一种支持对XML格式文档进行存储和查询等操作的数据管理系统。
在系统中,开发人员可以对数据库中的XML文档进行查询、导出和指定格式的序列化。
数字档案管理,7,资料:
结构化数据与非结构化数据,结构化数据库具有数据结构化、最低冗余度、较高的程序与数据独立性、易于编制应用程序等优点,但处理的数据对象只局限于数字、字符等,对多媒体信息的处理停留在简单的二进制代码(大数据对象)。
非结构化数据库是指其字段长度可变,并且每个字段的记录又可以由可重复或不可重复的子字段构成。
采用子字段、多值字段以及变长字段的机制,允许创建许多不同类型的任意格式的字段,即非结构化字段,从而突破了关系数据库严格的表结构,能够方便地存储和管理非结构化的全文数据。
数字档案管理,8,非结构化数据库和关系数据库的比较结果,:
数字档案管理,9,第1节档案数据库的涵义、类型2.档案数据库,档案数据库:
从广义上讲,是以特定方式组织起来的档案数据集合。
具体地讲,就是为了满足多个用户多种应用需要,按照一定的数据模型将本单位所保管的档案信息存贮在计算机中以备使用的数据形式。
杨公之主编:
档案信息化建设实务是数字档案信息的组织形式是档案信息系统的核心,数字档案管理,10,第1节档案数据库的涵义、类型3.档案数据库的类型,
(1)根据档案数据的类型档案一次信息:
档案全文数据库、多媒体档案数据库档案二次信息:
档案目录数据库(机读档案目录库)案卷目录文件目录专题目录档案三次信息:
档案编研信息库、档案专题资料库档案元数据信息:
档案元数据库,数字档案管理,11,第1节档案数据库的涵义、类型3.档案数据库的类型,
(2)根据档案数据库的数据模型档案文档库:
档案全文资源树(树状模型)结构化数据库:
各类档案目录数据库关系数据库网状数据库树状数据库层次数据库等等半结构化档案数据库档案元数据库档案文本数据库非结构化档案数据库多媒体数据库,使用某种半结构化数据库管理系统组织管理起来的,按照档案元数据标准采集、置标的档案元数据集。
使用某种半结构化数据库管理系统组织管理起来的,可实现全文检索的档案文本数据库。
数字档案管理,12,第1节档案数据库的涵义、类型3.档案数据库的类型,(3)根据档案数据库所用管理系统的品牌VFP,VFP是Microsoft推出的可视化数据库管理系统1992年收购Fox公司后改良其FoxBase而成最新版本为VisualFoxPro9.0。
提供了功能完备的工具、极其友好的用户界面、简单的数据存取方式、良好的兼容性和较强的安全性。
目前最快捷、最实用的数据库管理系统软件之一,数字档案管理,13,第1节档案数据库的涵义、类型3.档案数据库的类型,(3)根据档案数据库所用管理系统的品牌VFPACESS,微软推出的基于Windows的桌面RDBMSOffice套件之一,与Office集成具有强大、灵活的数据管理功能可利用Web检索发布数据,实现与Internet的连接界面友好、易学易用、开发简单、接口灵活适用于中小型系统,或作为C/S的客户端数据库最新版本为Access2007,数字档案管理,14,第1节档案数据库的涵义、类型3.档案数据库的类型,(3)根据档案数据库所用管理系统的品牌VFPACESSSQLserver,微软开发的的RDBMS具有较高性能和良好的扩展性采用客户机/服务器模式实现与WindowsNT的有机结合最新版本为SQLServer2008,数字档案管理,15,第1节档案数据库的涵义、类型3.档案数据库的类型,(3)根据档案数据库所用管理系统的品牌VFPACESSSQLserverORACLA,目前最流行的大型RDBMSOracle公司开发采用客户机/服务器体系结构在数据完整性检查、安全性、一致性上表现优异在高档平台上可支持成百上千用户的同步查询提供分布式数据库管理能力支持对大量多媒体数据的管理提供POWERBUILD等优秀的前台开发工具最新版本为Oracle11g。
数字档案管理,16,第1节档案数据库的涵义、类型3.档案数据库的类型,(3)根据档案数据库所用管理系统的品牌VFPACESSSQLserverORACLASybase,Sybase公司研制的RDBMS基于客户/服务器体系结构,通常与SybaseSQLAnywhere配套,前者为服务器数据库,后者为客户机数据库真正开放的数据,提供一套应用程序编程接口,可以与非Sybase数据源及服务器集成名气不如Oracle、SQLServer大,但在我国大中型系统中占较大比例最新版为SybaseASE12.5.2,数字档案管理,17,第1节档案数据库的涵义、类型3.档案数据库的类型,(3)根据档案数据库所用管理系统的品牌VFPACESSSQLserverORACLASybaseInformix,IBM公司出品的RDBMS在线事务处理(OLTP)旗舰级数据服务系统最早支持UNIX的数据库管理系统简单、轻便、适应性强,但安全性、稳定性不如ORACLA等目前使用者较少,数字档案管理,18,第1节档案数据库的涵义、类型3.档案数据库的类型,(3)根据档案数据库所用管理系统的品牌VFPACESSSQLserverORACLASybaseInformixLotusNotes,是目前最为流行的文档数据库系统全面实现了对非结构化信息的管理和共享分布式的数据库管理安全性高、易于管理提供了丰富的开发工具在企业、政府办公自动化方面的应用越来越广,数字档案管理,19,第1节档案数据库的涵义、类型3.档案数据库的类型,(3)根据档案数据库所用管理系统的品牌VFPACESSSQLserverORACLASybaseInformixLotusNotesTRS,拓尔思公司具有自主核心技术和知识产权的国产软件包括全文数据库系统(TRSDatabaseServer)、数据处理工具(TRSDP)、内容发布应用服务器(TRSWAS)TRSDatabaseServer:
实现对非结构化信息的全文检索和统一存储,是面向互联网应用,满足电子政务、电子商务等最新需求的数据库系统。
TRSDataProcessor:
加工、标引、加载各种类型的数据到TRS数据库中,优化后续的检索、发布和服务TRSWAS:
基于WEB方式、组织、管理和发布多种信息资源,实现信息资源的分类导航,并提供基于内容的全方位检索功能。
数字档案管理,20,第1节档案数据库的涵义、类型3.档案数据库的类型,(3)根据档案数据库所用管理系统的品牌VFPACESSSQLserverORACLASybaseInformixLotusNotesTRSiBASE,ibase是国信贝斯拥有自主版权的数据库管理软件包括ibase数据库管理系统、ibaseweb网上资源管理系统、ibaseocx数据库系统开发工具、ibasereport电子报表系统,ibaseeds电子文档管理系统等系列产品。
侧重非结构化数据的存储、检索,同时紧跟数据库网络技术的发展潮流,将网络服务器和数据库服务器紧密集成,提出“网络就是数据库”的概念,实现数据库在web上的信息管理和检索。
数字档案管理,21,第1节档案数据库的涵义、类型4.档案数据库建设,是档案信息化建设的主要内容和重点其中,档案目录数据库的是档案信息化建设的起点,是开发利用档案信息资源的关键。
是一项长期任务需要投入大量人力、物力、财力目前存在库结构和数据格式不规范、数据质量差等问题,数字档案管理,22,第2节档案目录数据库的结构设计,档案目录数据库:
又称为“档案机读目录”或“档案电子目录”,是存储在计算机内,使用某种数据库管理系统组织管理的档案目录数据集合。
根据著录对象的不同,分为:
文件级目录数据库、案卷级目录数据库和专题目录数据库三类。
数字档案管理,23,1、确定档案目录数据库的著录项目有哪些字段(著录项目)、字段名等,行业标准档案著录规则中著录项目共分7项,22个著录小项,其中正题名、责任者、时间项、分类号、档号、电子文档号、缩微号、主题词或关键词等8项为必要项目,其余为选择项目,如:
江苏省地方标准文书档案文件级目录数据库结构与数据交换格式;辽宁省文书档案目录数据库结构与交换格式等,第2节档案目录数据库的结构设计,2、确定每个著录项目的格式字段类型、字段长度和约束条件等,数字档案管理,24,数字档案管理,25,1、档案目录数据库通常选择RDBMS对于结构化数据,RDBMS(关系数据库管理系统)在可靠性、冗余度、一致性和并发控制方面具有优势。
因此,档案目录数据库管理系统通常选择主流的RDBMS。
第3节档案目录数据库管理平台的选择,数字档案管理,26,2、主流RDBMS的特点比较开放性,第3节档案目录数据库管理平台的选择,SQLServer、Access只能运行在Windows平台,没有丝毫的开放性;Oracle完全开放,对硬件和软件的独立性很强,能在所有主流平台上运行;DB2具有较好开放性,从PC到大型机,从IBM到非IBM的各种平台都可运行;VFP可以运行于Windows平台,也可以运行于Unix平台;SybaseASE可用于各种平台,早期Sybase在多平台混合环境中可能出现问题。
指DBMS对不同操作系统和软、硬件环境的兼容性,能否在多种操作系统平台上使用。
数字档案管理,27,2、主流RDBMS的特点比较开放性并发控制,第3节档案目录数据库管理平台的选择,SQLServer并发用户太多时性能不佳;Oracle是多用户系统,并发控制能力和并行性很好;Sybase的并发控制性能接近SQLServer,但在UNIX平台下优于SQLServer;DB2支持多任务并行查询,具有很好的网络支持能力,可同时激活上千个活动线程,具有很好的并行性和并发控制能力;VFP和Access较少有网络应用,其并发控制较SQLServer或Oracle差很多。
是指数据库管理系统有效控制多用户对相同数据同时访问的能力。
数字档案管理,28,2、主流RDBMS的特点比较开放性并发控制安全性,第3节档案目录数据库管理平台的选择,SQLServer安全性与windows网络集成,但没有获得任何安全证书;Oracle具有良好的访问控制机制,安全性较高,获得了最高认证级别的ISO标准认证,;Sybase、DB2均具有较高的安全性,获得最高认证级别的ISO标准认证;Access和VFP的安全性较逊色。
通过用户身份鉴定和存取权限控制来保证数据和系统的安全。
数字档案管理,29,应用模式有双层C/S(客户端/服务器)和多层C/S,2、主流RDBMS的特点比较开放性并发控制安全性应用模式和客户端支持,第3节档案目录数据库管理平台的选择,SQLServe与Oracle既可是双层模型,也可以是多层模型SQLServe只支持Windows客户,可以用ADO、DAO、OLEDB、ODBC连接;Oracle支持Windows、Unix、Linux客户,不同的客户可通过ODBC、JDBC、OCI驱动程序访问数据库;Sybase支持ODBC、Jconnect、Ct-library等网络客户;DB2可采用多层结构,支持ODBC、JDBC等客户;VFP和Access一般不作网络数据库使用,不存在客户端和应用模式问题。
数字档案管理,30,2、主流RDBMS的特点比较开放性并发控制安全性应用模式和客户端支持对操作人员的要求,第3节档案目录数据库管理平台的选择,SQLServe、Oracle、Sybase、DB2等大、中型数据库要求其管理人员具备丰富的计算机知识和扎实的数据库及编程功底,需要由计算机专业人员担当。
VFP和Access是桌面数据库系统,其管理者即使不了解编程也可方便地设计、构造数据库,对操作人员的要求相对较低。
数字档案管理,31,2、主流RDBMS的特点比较开放性并发控制安全性应用模式和客户端支持对操作人员的要求价格,第3节档案目录数据库管理平台的选择,数据库管理系统的售价差别很大,大型数据库价格较贵。
数字档案管理,32,目前市场主流关系型DBMS的报价:
第3节档案目录数据库管理平台的选择,数字档案管理,33,3、选择档案目录数据库管理平台的要求高安全性良好的开放性大数据量处理能力操作简便支持多用户共享具有高性价比和适用性,第3节档案目录数据库管理平台的选择,一般档案馆优先考虑SQLServer普通档案室也可选择Access或VFP国家级综合档案馆也可考虑Oracle等,数字档案管理,34,数据库管理系统只是管理数据库的工具,为了有效管理档案目录信息,通常需要在作为工具的“数据库管理系统”和“操作系统”平台之上进一步开发实用的档案管理系统(应用软件)。
第4节基于目录数据库的档案管理系统的开发,数字档案管理,35,1、档案管理系统的基本功能目录数据库的建立、修改和删除,第4节基于目录数据库的档案管理系统的开发,数字档案管理,36,数字档案管理,37,数字档案管理,38,数字档案管理,39,数字档案管理,40,数字档案管理,41,数字档案管理,42,数字档案管理,43,数字档案管理,44,数字档案管理,45,数字档案管理,46,1、档案管理系统的基本功能目录数据的输入、存储、修改、删除,第4节基于目录数据库的档案管理系统的开发,数字档案管理,47,数字档案管理,48,数字档案管理,49,数字档案管理,50,数字档案管理,51,数字档案管理,52,数字档案管理,53,数字档案管理,54,数字档案管理,55,数字档案管理,56,数字档案管理,57,数字档案管理,58,数字档案管理,59,数字档案管理,60,数字档案管理,61,数字档案管理,62,数字档案管理,63,数字档案管理,64,1、档案管理系统的基本功能对目录数据进行多途径查询(题名、责任者、形成时间、主题词、分类号、文件编号、档号等)和多条件组合检索,模糊查询对查询结果进行显示、排序、转存、打印,第4节基于目录数据库的档案管理系统的开发,数字档案管理,65,数字档案管理,66,数字档案管理,67,1、档案管理系统的基本功能类目结构自由设置,第4节基于目录数据库的档案管理系统的开发,数字档案管理,68,数字档案管理,69,1、档案管理系统的基本功能能自动按照类目结构对档案目录进行分类和排序,第4节基于目录数据库的档案管理系统的开发,数字档案管理,70,1、档案管理系统的基本功能对查询结果进行显示、排序、转存、打印类目结构自由设置,能自动按照类目结构对档案目录进行分类和排序,生成、输出符合档案工作标准的各类目录和备考表统计功能,能生成并输出各种统计报表主题词(或关键词)、分类表管理功能,能够增设主题词及分类号,并具有一定程度的主题词和分类号自动标引功能具有数据访问控制、数据保护和系统安全保密监控等功能,第4节基于目录数据库的档案管理系统的开发,数字档案管理,71,数字档案管理,72,1、档案管理系统的基本功能生成、输出符合档案工作标准的各类目录和备考表,第4节基于目录数据库的档案管理系统的开发,数字档案管理,73,数字档案管理,74,数字档案管理,75,数字档案管理,76,1、档案管理系统的基本功能统计功能,能生成并输出各种统计报表。
第4节基于目录数据库的档案管理系统的开发,数字档案管理,77,数字档案管理,78,数字档案管理,79,1、档案管理系统的基本功能主题词(或关键词)、分类表管理功能,能够增设主题词及分类号,第4节基于目录数据库的档案管理系统的开发,数字档案管理,80,数字档案管理,81,数字档案管理,82,数字档案管理,83,1、档案管理系统的基本功能具有数据访问控制、数据保护和系统安全保密监控等功能,第4节基于目录数据库的档案管理系统的开发,数字档案管理,84,数字档案管理,85,数字档案管理,86,数字档案管理,87,数字档案管理,88,数字档案管理,89,数字档案管理,90,数字档案管理,91,数字档案管理,92,数字档案管理,93,数字档案管理,94,2、档案管理系统开发的基本要求:
库结构符合规范库结构设计符合档案著录规则和相应的库结构规范良好的实用性界面友好操作简单,提供诸如代码输入、数据携带等功能,能自动纠错良好的兼容性和可扩展性对软、硬件平台的独立性强能以DBF文件格式或通过XML文档进行数据交换在软、硬件环境发生变化时能够完整、安全地迁移,第4节基于目录数据库的档案管理系统的开发,数字档案管理,95,1、入库文件范围的确定首先要根据档案的利用预期来科学确定哪些档案需要建立文件级档案目录,哪些建立案卷级目录,哪些建立专题目录:
国家规定:
“有条件的省级档案馆全部馆藏档案案卷级目录都要实现机检,重要全宗档案逐步实现文件级目录机检”。
随着归档文件整理规则的实施,档案实体整理中已不再形成新的案卷,文件目录正逐步替代案卷目录成为最重要的检索手段。
为避免目录共享时的信息冗余,减少重复劳动,档案目录建设应以“我”为主,收存的文件并非每一份都需要著录。
第5节档案目录数据的著录、标引和录入,数字档案管理,96,2、前处理和著录标引初步鉴定原始档案及其已有的纸质目录,确认其完整、准确对目录中缺失项目或不规范、不准确内容对照档案原件逐个修改、补充对于尚未形成纸质目录的档案文件,对照原件逐一著录、标引著录、标引常规过程:
录入人员在档案管理系统著录界面上完成简单著录项目的录入著录人员对照原件补充主题词、分类号等复杂的标引项目著录人员检查、修改录入人员所著录的文件题名、责任者等项目,第5节档案目录数据的著录、标引和录入,数字档案管理,97,2、前处理和著录标引目录著录、标引的注意事项:
题名要准确反映文件内容忌用简称文号等要统一规格,注意全角、半角、大小写等的统一,第5节档案目录数据的著录、标引和录入,数字档案管理,98,3、目录数据的录入通常由专门的录入人员来完成严格按照档案管理系统中设定的项目、格式录入必须实行严格的质量控制:
录入员要进行规范培训实施质量抽检“二审”技术防错“双机对录,第三方校对”数据录入工作的组织引入市场化运作机制“两头在外,中间在内”分解任务入室、入库前要求同时提供文件目录,第5节档案目录数据的著录、标引和录入,数字档案管理,99,1、档案著录标引方面的规范档案著录规则档案分类标引规则档案主题标引规则中国档案分类法中国档案主题词表专门档案的著录、标引标准或规范,第6节档案目录数据库规范,数字档案管理,100,2、档案目录数据库结构的规范如:
浙江省综合档案馆电子目录数据库结构与交换格式;又如:
军队文书档案目录数据库结构与著录格式,第6节档案目录数据库规范,数字档案管理,101,3、档案目录数据交换的规范中国档案机读目录格式,第6节档案目录数据库规范,4、档案目录库的引用规范档号编制规则等,
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 档案 数据库 建设
![提示](https://static.bingdoc.com/images/bang_tan.gif)