信息技术管理中心运维制度及流程精选.docx
- 文档编号:18560110
- 上传时间:2023-08-19
- 格式:DOCX
- 页数:23
- 大小:57.97KB
信息技术管理中心运维制度及流程精选.docx
《信息技术管理中心运维制度及流程精选.docx》由会员分享,可在线阅读,更多相关《信息技术管理中心运维制度及流程精选.docx(23页珍藏版)》请在冰点文库上搜索。
信息技术管理中心运维制度及流程精选
运行维护管理制度
一、总则-2-
二、编制方法-3-
三、运维部工作职责-3-
四、运维服务管理体系-5-
4.1运维服务管理对象-5-
4.2运维系统功能框架-6-
4.3运维管理组织结构-7-
4.3.1项目负责人-8-
4.3.2项目经理-8-
4.3.3技术主管-9-
4.3.4服务台-9-
4.3.5网络管理员-10-
4.3.5应用、数据库管理员-10-
4.3.7终端管理员-11-
4.4.运维服务流程-11-
4.4.1服务台-11-
4.4.2事件管理-12-
4.4.3工单管理-12-
4.4.4问题管理-12-
4.4.5变更管理-13-
4.4.6配置管理-13-
4.4.7知识库管理-14-
4.4.8统计及工作报告-14-
4.5运维服务内容-14-
4.5.1服务目标-14-
4.5.2软硬件资产统计服务-15-
4.5.3网络、安全系统运维服务-15-
4.5.4主机、存储系统运维服务-16-
4.5.5数据库系统运维服务-17-
4.5.6中间件运维服务-17-
4.5.7终端、外设运维服务-18-
五、运维现场管理-18-
5.1、信息机房管理-18-
5.1.1硬件配备及巡检-18-
5.1.2出入管理-19-
5.1.3安全管理-19-
5.1.4操作管理-20-
5.1.5运行管理-20-
5.2服务器管理-21-
5.2.1服务器管理-21-
5.2.2、服务器病毒防范制度-22-
5.3信息系统变更管理-23-
5.4维护作业计划管理-24-
5.5信息化检查管理-24-
5.6技术档和资料管理-25-
5.7备份及日志管理-25-
5.8信息系统安全保密管理-26-
六、应急服务响应措施-28-
6.1应急预案实施基本流程-28-
6.2突发事件应急策略-28-
七、服务管理制度规范-29-
7.1服务时间-29-
7.2行为规范-30-
一、总则
第一条为保障信息系统软硬件设备的良好运行,使员工的运维工作制度化、流程化、规范化,特制订本制度。
第二条运维工作总体目标:
立足根本促发展,开拓运维新局面。
在企业发展壮大时期,通过对网络、桌面、系统等的运维,促进企业稳定可持续性发展。
第三条运维管理制度的适用范围:
运维部全体人员。
二、编制方法
本实施细则包括运维服务全生命周期管理方法、管理标准/规范、管理模式、管理支撑工具、管理对象以及基于流程的管理方法。
本实施细则以20000为基础,以信息化项目的运维为目标,以管理支撑工具为手段,以流程化、规范化、标准化管理为方法,以全生命周期的循环为提升途径,体现了对运维服务全过程的体系化管理。
三、运行维护管理工作的基本任务
1、进行信息系统的维护管理,实时监控系统运行状态,保证系统各类运行指标符合相关规定。
2、迅速而准确地定位和排除各类故障,保证信息系统正常运行,确保所承载的各类应用和业务正常。
3、进行系统安全管理,保证信息系统的运行安全和信息的完整、准确。
4、在保证系统运行质量的情况下,提高维护效率,降低维护成本。
四、运维服务管理体系
运维服务管理体系规定了运维活动涉及的各类实体,以及这些实体间的相互关系。
相关的实体按照运维服务管理体系进行有机组织,并协调工作,按照服务协议要求提供不同级别的运维服务。
4.1运维服务管理对象
运维服务管理对象包括基础设施、应用系统、用户、供应商、以及运维部门和人员,具体内容如下:
(1)基础设施包括网络、主机系统、存储/备份系统、终端系统、安全系统、以及机房动力环境等。
(2)应用系统包括内部办公系统、门户网站、面向公众的应用系统等。
(3)用户包括使用如上应用系统的用户。
(4)供应商包括基础设施和应用系统的供应商以及运维服务的供应商。
(5)运维部门和人员包括内部参与运维活动的相关部门和人员,以及提供运维服务的企业和相关人员。
4.2运维系统功能框架
根据建设单位的系统结构和业务开展需要,运维项目组将项目的维护框架分为9个具体组成部分,分别为:
服务台、时间管理。
工单管理、问题管理、变更管理、配置管理、工程师考核、知识库管理、统计、系统管理等9个子项。
而具体运维流程将以此为依据开展工作。
4.3运维管理组织结构
本运维项目的运维管理结构为三层模式,具体如下图所示。
由项目负责人与甲方进行业务内容的接洽,并将沟通结果向下传递。
项目经理负责项目的整体运维工作,包括各种制度的制定和实施,其他运维相关技术人员与非技术人员则在项目经理的指导下开展职责内工作。
4.3.1项目负责人
职责:
负责项目商务与其他相关业务方面的事宜协调。
职位描述:
1)、整体负责建设单位运维项目服务计划的制定,领导项目经理并安排项目工作,指导项目经理完成具体维护工作,每周听取项目经理的工作汇报,负责考核项目经理工作完成情况。
2)、协助建设单位完成新增项目的调研、方案设计并指导项目经理进行具体实施。
4.3.2项目经理
职责:
规划、执行、完善信息化项目的具体运维工作,直接管理服务台并指导网络、终端以及数据库管理人员开展工作。
职位描述:
1、根据公司战略目标,指导下属开展客户服务工作,确保运维工作能够满足客户的实际需要;
2、建立和持续完善运维管理体系,优化运维流程,解决运维服务中出现的特殊问题;
3、规划并提升运维工程师专业服务能力,在整体上提高客户满意度;
4、制定和持续完善绩效考核体系;
5、制定、整理运维项目的应急预案系统,并指导运维工程师实施;
6、提高自身专业技能,在业务方面给予网络管理员和数据库管理员指导。
4.3.3技术主管
职责:
数据库管理,性能调优,实现应用负载均衡。
职位描述:
1、负责数据库性能分析与调优,数据库运行状态监控,及时发现异常并快速处理。
2、熟练掌握10G的技术,能够实现部署及调优。
3、掌握、、、等中间件的工作原理,能够实现部署调优及故障解决。
4、熟练掌握、等操作系统,部署10g、数据库。
熟练掌握技术,保证数据库冗灾、数据保护、故障恢复。
5、负责应用负载均衡的部署和调试。
6、负责指导数据库工程师管理员开展工作。
4.3.4服务台
职责:
故障电话受理,文档管理。
职位描述
1、负责业务方面的救助电话受理工作;
2、故障处理的发起人,同时进行维护工程师指派,跟踪事件后续处理;
3、进行维护故障统计、用户满意度统计、工作报表输出等工作;
4、协助项目经理,进行文档整理、归类、保存等工作。
4.3.5网络管理员
职责:
维护建设单位网络系统正常,解决网络相关故障。
职位描述:
1、对现有服务器、局域网络及机房、配线间的日常管理维护;
2、对信息安全建设提出相关建议,确保网络的安全;
3、保证外网光纤线路正常,保证局域网运行正常;
4、对网络系统和网络设备的运行状态进行监控;
5、熟练掌握域策略设置、、、服务器、权限设置等;
6、编写网络部分的应用处理预案并实施。
4.3.6应用、数据库管理员
职责:
维护建设单位业务系统运行正常,解决应用和数据库故障。
职位描述:
1、监测业务系统运行状况,对应用系统和数据库性能的监视及优化;
2、规划不同数据的生命周期,制订备份、恢复和灾备策略,根据业务的需要执行数据转换及迁移等操作;
3、保证应用和数据库系统的安全性、完整性和运行效率。
4、负责数据库平台的整体架构及解决方案的制定和实施;
5、工作认真、细致,积极主动有条理性,具有良好的沟通能力及团队合作精神.
4.3.7终端管理员
职责:
维护建设单位桌面系统运行正常,解决终端、外设故障。
职位描述:
1、各部门电脑、打印机、传真机的维护;
2、对各部门职员进行电脑相关的技术支持及培训工作;
3、精通及的使用,能够熟练使用2003、2007及以上版本,能够制作相应教程对其他部门员工进行培训。
4.4.运维服务流程
运维服务管理流程涉及服务台、事件管理、问题管理、配置管理、变更管理、发布管理、服务级别管理、财务管理、能力管理、可用性管理、服务持续性管理、知识管理及供应商管理等,随着运维活动的不断深入和持续改进,其他流程也会逐步独立并规范。
4.4.1服务台
服务台是支持运维服务的核心功能,与各个流程联系密切。
所有管理流程都要通过服务台为用户提供单点联系,解答用户的相关问题和需求并为用户寻求相应的支持人员。
在本系统中,服务台是接收各种来源服务请求和相关信息反馈的唯一入口和出口,同时服务台还负责通过知识库(历史事件)解决相应请求,由此可看出服务台也是问题二次处理的主要输出方式。
4.4.2事件管理
事件管理流程的主要目标是尽快恢复服务提供并减少其对业务的不利影响,尽可能保证最好的服务质量和可用性等级。
事件管理流程通常涉及事件的侦测和记录、事件的分类和支持、事件的调查和诊断、事件的解决和恢复以及事件的关闭。
本系统把所有服务请求和报警归结为事件。
事件管理是提供服务台和事件管理者对于事件记录、处理、查询、审核、派发等功能。
它也包括通过和第三方监控系统对接,完成发送报警从而形成事件的功能。
4.4.3工单管理
工单管理:
工单是现场运维、二线支持的任务载体,运维工程依据所接收工单进行运维工作。
工单管理是对工单实现创建、变更、查询、浏览、派发、监督等功能的模块。
4.4.4问题管理
问题管理流程的主要目标是预防问题和事故的再次发生,并将未能解决的事件的影响降低到最小。
问题管理流程包括诊断事件根本原因和确定问题解决方案所需要的活动,通过合适的控制过程,尤其是变更管理和发布管理,来确保解决方案的实施。
问题管理还将维护有关问题、应急方案和解决方案的信息。
问题管理是针对已处理事件的遗留问题或处理事件的方案只是治标不治本的不能彻底解决问题而考虑的模块。
根据事件、及处理方案,问题处理人经过调查、诊断并提出最终解决方法。
4.4.5变更管理
变更管理实现所有基础设施和应用系统的变更,变更管理应记录并对所有要求的变更进行分类,应评估变更请求的风险、影响和业务收益。
其主要目标是以对服务最小的干扰实现有益的变更。
变更管理是要对重大资源的新增、变更、升级等运维活动进行审核的功能,以免这些活动对现有资源的可用性造成没有必要的影响和破坏;同时,他还要实现在工单中产生的变化进行后审计的功能。
4.4.6配置管理
配置管理流程负责核实基础设施和应用系统中实施的变更以及配置项之间的关系是否已经被正确记录下来;确保配置管理数据库能够准确地反映现存配置项的实际版本状态。
配置管理实际上是全部资源的统一管理的功能,包括资源整个生命周期的参数或配置的变化记录的管理。
管理信息主要涉及分类、型号、版本、位置,状态、相关资料等基本信息还包括核心参数等
4.4.7知识库管理
知识库管理:
知识库是提供给运维人员重要的技术资料内容,他汇集在工作的遇到的典型案例归纳总结的知识要点和全面实用资料手册。
在本系统中,知识库管理提供便于使用的人机接口、快速查询的技术手段和维护手段。
4.4.8统计及工作报告
运维管理系统提供一线解决率统计、客户满意度统计、按分类的事件汇总统计、工作报告生成的功能,按照一定格式根据事件数据、工单数据、问题数据、配置数据、变更数据可以帮助运维管理者能把运维的所做的工作内容清晰的罗列出来。
4.5运维服务内容
4.5.1服务目标
运维项目组提供的运行维护服务包括,信息系统相关的主机设备、操作系统、数据库和存储设备的运行维护服务,保证用户现有的信息系统的正常运行,降低整体管理成本,提高网络信息系统的整体服务水平。
同时根据日常维护的数据和记录,提供用户信息系统的整体建设规划和建议,更好的为用户的信息化发展提供有力的保障。
用户信息系统的组成主要可分为两类:
硬件设备和软件系统。
硬件设备包括网络设备、安全设备、主机设备、存储设备等;软件设备可分为操作系统软件、典型应用软件(如:
数据库软件、中间件软件等)、业务应用软件等。
服务项目范围覆盖的信息系统资源以下方面的关键状态及参数指标:
Ø运行状态、故障情况
Ø配置信息
Ø可用性情况及健康状况性能指标
4.5.2软硬件资产统计服务
服务内容包括:
Ø硬件设备型号、数量、版本等信息统计记录
Ø软件产品型号、版本和补丁等信息统计记录
Ø网络结构、网络路由、网络地址统计记录
Ø综合布线系统结构图的绘制
Ø其它附属设备的统计记录
4.5.3网络、安全系统运维服务
从网络的连通性、网络的性能、网络的监控管理三个方面实现对网络系统的运维管理。
Ø设备基础性能检测:
、内存使用情况监测;
Ø设备日志查看;
Ø设备状态;
Ø测试,等工具的连通性;
Ø网络安全策略应用是否正常;
Ø带宽流量的实时监测;
Ø网络拓扑链路状态监测;
Ø异常网络数据包流量;
Ø、等网络攻击情况监测;
Ø线路的误码率、丢包率监测;
4.5.4主机、存储系统运维服务
提供的主机、存储系统的运维服务包括:
主机、存储设备的日常监控,设备的运行状态监控,故障处理,操作系统维护,补丁升级等内容。
进行监控管理的内容包括:
Ø性能管理;
Ø内存使用情况管理;
Ø硬盘利用情况管理;
Ø系统进程管理;
Ø主机性能管理;
Ø实时监控主机电源、风扇的使用情况及主机机箱内部温度;
Ø监控主机硬盘运行状态;
Ø监控主机网卡、阵列卡等硬件状态;
Ø监控主机运行状况;
Ø主机系统文件系统管理;
Ø监控存储交换机设备状态、端口状态、传输速度;
Ø监控备份服务进程、备份情况(起止时间、是否成功、出错告警);
Ø监控记录磁盘阵列、磁带库等存储硬件故障提示和告警,并及时解决故障问题;
Ø对存储的性能(如高速缓存、光纤通道等)进行监控。
4.5.5数据库系统运维服务
提供的数据库运行维护服务是包括主动数据库性能管理,数据库的主动性能管理对系统运维非常重要。
通过主动式性能管理可了解数据库的日常运行状态,识别数据库的性能问题发生在什么地方,有针对性地进行性能优化。
同时,密切注意数据库系统的变化,主动地预防可能发生的问题。
进行监控管理的内容包括:
Ø数据库基本信息:
文件系统、碎片、死锁、占用率较大或时间较长的语句。
Ø表空间使用信息监测;
Ø数据库文件0读写情况;
Ø连接数量监控;
Ø数据库监听运行状态监测;
Ø查看每日数据备份、数据同步是否正常;
Ø报警日志监测;
Ø对表和索引进行,检查表空间碎片;
Ø检测数据库后台进程;
Ø数据库对象的空间扩展情况监测;
4.5.6中间件运维服务
中间件管理是指对、、等中间件的日常维护管理和监控工作,提高对中间件平台事件的分析解决能力,确保中间件平台持续稳定运行。
中间件监控指标包括配置信息管理、故障监控、性能监控。
Ø执行线程:
监控中间件配置执行线程的空闲数量。
Ø内存:
内存曲线正常,能够及时的进行内存空间回收。
Ø连接池:
连接池的初始容量和最大容量应该设置为相等,并且至少等于执行线程的数量,以避免在运行过程中创建数据库连接所带来的性能消耗。
Ø检查中间件日志文件是否有异常报错
Ø如果有中间件集群配置,需要检查集群的配置是否正常。
4.5.7终端、外设运维服务
负责对终端、笔记本以及工作站的操作系统、应用软件和硬件的维护,解决使用人员在应用过程中遇到的问题并进行简单培训,完成打印机等其他外设的故障处理工作。
5、运维现场管理
5.1、信息机房管理
5.1.1硬件配备及巡检
1、各单位信息机房按规定配备防静电地板、、恒温设备、温湿度感应器、消防设备、防鼠设施等相关基础设施。
2、各单位机房管理人员应定期(如每月或每季度)对机房硬件设备设施进行巡检,以保证其有效性。
3、各单位机房应建立相关的出入登记、设备机历登记、设备巡检、重大故障等记录,并认真填写。
5.1.2出入管理
1、严禁非机房工作人员进入机房,特殊情况需经信息中心批准,并认真填写登记表后方可进入。
2、进入机房人员应遵守机房管理制度,更换专用工作鞋。
2.3、进入机房人员不得携带任何易燃、易爆、腐蚀性、强电磁、辐射性、流体物质等对设备正常运行构成威胁的物品。
5.1.3安全管理
1、操作人员随时监控中心设备运行状况,发现异常情况应立即按照应急预案规程进行操作,并及时上报和详细记录。
2、未经批准,不得在机房设备上随意编写、修改、更换各类软件系统及更改设备参数配置;
3、软件系统的维护、增删、配置的更改,必须按规定详细记入相关记录,并对各类记录和档案整理存档。
4、机房工作人员应恪守保密制度,不得擅自泄露信息资料与数据。
5、机房内严禁吸烟、喝水、吃食物、嬉戏和进行剧烈运动,保持机房安静。
6、严禁在机房计算机设备上做与工作无关的事情(如聊天、玩游戏),对外来存储设备(如U盘、移动硬盘等),做到先杀病毒后使用。
7、机房严禁乱拉接电源,应不定期对机房内设置的消防器材、烟雾报警、恒温设备进行检查,保障机房安全。
5.1.4操作管理
1、机房的工作人员不得擅自脱岗,遇特殊情况离开时,需经机房负责人同意方可离开。
2、机房工作人员在有公务离开岗位时,必须关闭显示器;离开岗位1小时以上,必须关闭主机及供电电源。
3、每周对机房环境进行清洁,以保持机房整洁;每季度进行一次大清扫,对机器设备检查与除尘。
4、严格做好各种数据、文件的备份工作。
服务器数据库要定期进行双备份,并严格实行异地存放、专人保管。
所有重要文档定期整理装订,专人保管,以备后查。
5.1.5运行管理
1、机房的各类计算机设备,未经负责人批准,不得随意编写、修改、更换各类软件系统及更改设备参数配置。
2、各类软件系统的维护、增删、配置的更改,各类硬件设备的添加、更换必需经负责人书面批准后方可进行;必须按规定进行详细登记和记录,对各类软件、现场资料、档案整理存档。
3、为确保数据的安全保密,对各业务单位、业务部门等送交的数据及处理后的数据都必须按有关规定履行交接登记手续。
4、部门负责人应定期与不定期对制度的执行情况进行检查,督促各项制度的落实,并作为人员考核之依据。
5.2服务器管理
5.2.1服务器管理
1、服务器、路由器和交换机以及通信设备是信息网络的关键设备,须放置在机房内,不得自行配置或更换,更不能挪作它用。
2、服务器机房要保持清洁、卫生,并由专人负责管理和维护除系统维修和维护时间外,要保障服务器24小时正常运行。
3、不得在服务器上使用不安全的软件、U盘和移动存贮设备,使用上述设备前一定要先做好病毒检测。
4、不得利用服务器从事工作以外的事情,无工作需要不得擅自拆卸服务器零部件,严禁更换服务器配套设备。
5、不得擅自删除、移动、更改服务器数据;不得故意破坏服务器系统;不得擅自修改服务器系统时间。
6、定期进行服务器系统扫描,及时关闭可疑的端口与服务,经常查看服务器运行日志,检查服务器磁盘空间(或其它存储设备)的使用情况,及时发现服务器异常运行情况并做好记录。
7、管理员对服务器管理员账户与口令应严格保密、定期修改,以保证系统安全,防止对系统的非法入侵。
8、对服务器数据实施严格的安全与保密管理,防止系统数据的泄露、丢失及破坏。
9、及时处理服务器软硬软件系统运行中出现的各种错误,对所有工作中出现的大小故障均要作详细的登记,包括故障时间,故障现象、处理方法和结果。
10、双休日、节假日,要安排专人在机房值班,如发现问题及时解决,并做好记录处理。
5.2.2、服务器病毒防范制度
1、服务器管理人员应有较强的病毒防范意识,定期进行病毒检测,发现病毒立即处理。
2、未经上级管理人员许可,不得在服务器上安装新软件,若确需要安装,安装前应进行病毒例行检测。
3、经远程通信传送的程序或数据,必须经过检测确认无病毒后方可使用。
4、及时关注行业病毒防治情况和提示,根据行业提示调节服务器安全参数,避免服务器被侵袭。
5、建立病毒防护体系。
在系统执行拷贝、运行等操作前,检测文件是否感染病毒,发现病毒自动清除或由管理员选择处理。
6、定期实施静态杀毒,对服务器统一杀毒处理。
发现系统遭到严重病毒攻击并形成一定破坏时,应立即向单位负责人报告,同时向信息中心反映情况,并尽快采取有效措施组织抢救,最大限度控制受损面。
5.3信息系统变更管理
1、信息系统变更包括硬件扩容、冗余改造、软件升级、系统升级及模块更改、搬迁、数据维护等工作以及电子表格模板、文档模板、安全策略、部署的改变等
2、维护人员应保证在线系统的软件版本及硬件设备的稳定,未经过审批通过的方案,不得自行对系统软件版本及硬件设备进行任何变更及调整。
3、变更包括紧急变更和普通变更。
紧急变更指由于故障处理等的迫切需求而引起的,目的是保持或者恢复正常工程,无法进行书面请求和审批。
普通变更指非紧急变更,例如系统模块的更改。
对于普通变更,应有执行人员根据变更影响的范围和深度通知服务单位,经审核同意后进行变更;变更前应制定相应的执行措施,如出现错误如何回退等情况。
4、原则上,变更必须在夜间非主要工作时间进行,维护人员可以在备用服务器上进行先期模拟变更,对变更中出现的间题,对其解决方案应有备案。
5、对于紧急变更需求,允许口头申请、审批后组织具体突施。
事后,对变更后的系统及硬件设备进行一定时间的测试,确认无误后,向用户单位进行汇报。
并完成相关文档资料的更新工作。
5.4维护作业计划管理
1、要求在每次维护结束后填写维护记录,对维护中发现的问题及时记录并解决。
2、维护时间,原则上应在晚上或非工作时间进行。
如果出现紧急情况应对受影响的部室通知后,进行解决。
5.5信息化检查管理
维护人员每月至少一次对信息系统相关的机房环境、计算机硬件、配套网络、基础软件和应用软件进行一次检查。
信息系统的检查的具体突施:
1、制定技术检查计划,列出检査重点、内容、要求,形成固定检查表格。
2、收集设备运行故障和隐患。
根据检查重点、内容,调查设备运行情况,统计出各类型设备在运行过程中曾出现的故障。
对反馈的问题进行分析、评估,做好相应的技术准备;对一些需要厂家解决的问题列出清单,及时与厂家沟通,制定解决方案,以供检查过程中实施、解决。
3、检查完毕后应对本次检査填写详细记录和问题汇总。
4、组织相关人员对信息化检査中暴露的问题进行解决,牵扯到相关部门的,应与相关部门进行沟通后进行处理。
5.6技术档和资料管理
1、维护人员负责技术档案和资料的管理,应建立健全必要的技术资料和原始记录,包括但不限于
1.1信息系统相关技术资料;
1.2机房平面图、设备布置图、地址分布图
1.3网络连接图和相关配置资料
1.4各类软硬件设备配置清单;
1.5设备或系统使用手册、维护手册等资料
1.6上述资料的变更资料
2、软件资料管理应包含以下内容
2.1所有软件的介质、许可证、版本资料及补丁资料
2.2所有软件的安装手册、操作使用手册、应用开发手册等技术资料;
2.3上述资料的变更记录。
5.7备份及日志管理
1、原则上,应对各项操作均应进行日志记录,内容应包括操作人、操作时间和操作内容等详细信息。
维护人员应定时对操作日志、安全日志进行审查,对异常事件及时
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 信息技术 管理中心 制度 流程 精选