大型数据中心一体化运维管理平台的建设模式研究Word格式.doc
- 文档编号:4654022
- 上传时间:2023-05-03
- 格式:DOC
- 页数:3
- 大小:6.56KB
大型数据中心一体化运维管理平台的建设模式研究Word格式.doc
《大型数据中心一体化运维管理平台的建设模式研究Word格式.doc》由会员分享,可在线阅读,更多相关《大型数据中心一体化运维管理平台的建设模式研究Word格式.doc(3页珍藏版)》请在冰点文库上搜索。
largedatacenterintelligentoperationandmaintenanceintegratedoperationandmaintenance
1引言
随着移动互联网、大数据、云计算的飞速发展,全国各地数据中心的规模迅速扩张,如何建设和运营一个高效的数据中心,是数据中心管理人员的重大挑战[1]。
dcim(datacenterinfrastructuremanagement,数据中心基础设施管理)是近年兴起的数据中心基础设施管理工具,不同的机构有不同的解读。
本文在dcim的理念基础上,针对大型数据中心(即在全国各地拥有多个基地的大型数据中心),就其一体化运维管理的建设模式提出探讨性方案。
2基地运维面临的挑战与趋势
数据中心运维管理的主要目的是保障基础设施的可用性及降低风险,提高资产的利用率,降低能耗消耗和运维成本,提高服务水平以及数据中心的效率和效益[2]。
作为承载信息系统运行的数据中心,运维管理的关键是对it设备以及支撑it设备运行的风火水电等场地基础设施的管理,包括:
对这些基础设施的日常监控和维护;
对这些设备进行全生命周期的管理;
运维业务管理的流程与规则;
对数据中心内基础设施日常运行数据的分析、对比与挖掘。
对于大型数据中心产业基地,特征为辐射全国、规模分布、虚拟资源、弹性调度、安全防护、绿色节能。
随着数据中心的发展,功能需求越来越多,管理的规模越来越大,系统间的数据交互越来越广,系统对接口的复杂度急剧上升。
由于业务、维护复杂,对管理系统的要求也更高。
现阶段大型数据中心运维面临的挑战如下:
(1)经济性:
资源如何有效利用,包括网络、空间、动环资源;
如何缩减运行费用,包括能源、维护人员。
(2)灵活性:
如何识别及降低过度部署和冗余;
如何灵活扩展容量(空间、制冷和供电);
如何更快响应业务。
(3)可用性:
如何实现精细化管理;
如何及时排除隐患,处理复杂故障;
如何实现动态资源管理和电子流管理。
(4)管理性:
需要有效的数据分析支撑决策和规划;
如何实现系统一体化,统一协作、快速响应;
如何满足大客户sla(service-levelagreement,服务等级协议)和自服务管理。
面对以上挑战,数据中心应建设“集中化运维、一体化管理、智能化分析、流程化控制”的it支撑系统,才能实现智能化运维的管理目标,减少运维人员和维护成本,优化资源管理,提升运维效率。
3平台系统架构、组织架构和技术架构
3.1平台系统架构
一体化运维管理平台系统架构采用“集中化、一体化、智能化”的设计模式,分层设计,实现功能总集成、流程总调度、资源全监控。
一体化运维管理平台系统架构图如图1所示:
基础设施、it系统全方位监控:
包括it设备和供配电、空调环境、消防等场地基础设施的日常运行监控及数据采集。
总部综合监控管理人员全方位管理与监控,对用户、权限进行配置管理,对整体运行情况查询、分析,对故障原因分析判断、智能决策。
各基地监控中心人员进行基地全局监控、资源管理、分析报告。
机房运维值守人员对运行状态、性能、系统告警进行监测,从而进行运维管理、故障处理[3]。
资源管理系统3d可视化:
实现对所辖数据中心的资源信息管理、调度和配置。
基于物联网技术(rfid、二维码等)实现对idc(internetdatacenter,互联网数据中心)资源自动化全生命周期管理,同时为其它应用管理系统提供有效的资源信息共享[4];
基于3d可视化进行机房状态显示、监测、数据展现及交互管理;
通过与监控系统的集成,建立业务拓扑、应用拓扑、基础设施拓扑,定义所涉及到的服务器、数据库、中间件之间的资源配置逻辑关系;
为业务规划、业务开通、idc运维保障等提供全面的支撑[5]。
功能包括:
资源信息、资源容量、资源配置、资源管控、资源生命周期、资源服务请求、资源可视化、电子盘点等功能。
流程管理系统的设计符合itil(itinfrastructurelibrary,it基础架构库)规范:
依照itil规范,建立itsm(itservicemanagement,it服务管理)体系;
建立完整的电子工单流(包含各类服务请求及标准流程);
实现自动化运维[6]。
统一运行门户:
统一门户作为一体化运维管理平台的统一入口,通过界面集成、数据集成及功能集成等技术将各个子系统中的功能和信息有效组织起来,提供统一的信息服务功能入口以及用户、授权、认证管理,并根据需求定制开发各种呈现内容[7]。
运维大数据分析:
针对数据中心基础设施和网络的日常运行建立数据仓库;
采用聚类算法,全面应用数据挖掘技术;
建立完整的案例库,深度分析,以提升运维质量[8]。
安全监控系统:
物理、网络、信息等安全保障,建立idc/isp(internetserviceprovider,互联网服务提供商)信息安全监控系统[9]。
3.2平台组织架构
运维管理平台搭建一级结构,实行集中管理、模块化发展的建设思路。
管理中心集中设置,分支被管控点为各基地,在远景规划中可建设备份管理中心。
以机房为单位进行扩展,增加被管机房只需要相应增加采集模块即可实现。
一体化运维管理平台组织架构图如图2所示:
3.3平台技术架构
系统采用it云化架构,远端的桌面用户或大屏显示终端只需要通过ie浏览器登录到各子系统服务器即可访问和浏览各子系统,无需安装独立客户端。
平台包含三部分,系统硬件由虚拟的和物理的计算、存储、网络资源组成;
系统引擎由统一数据库以及中间件组成;
平台应用由各功能系统组成。
一体化运维管理平台技术架构图如图3所示。
4平台接口关系
系统内部接口包括统一门户系统、流程管理系统、资源管理系统、集中监控系统、运维大数据分析系统、安全监控系统之间的信息交互,可向esb(enterpriseservicebus,企业服务总线)开放的api(applicationprogramminginterface,应用程序编程接口)实现互联的方向发展。
一体化运维管理平台内各系统接口关系示意图如图4所示:
一体化运维管理平台内各系统之间的接口关系如表1所示。
5平台组网方案
运维管理平台采用虚拟技术搭建,单独建设资源池(专享云)。
采用基于x86架构的服务器构建,建议以计算节点和存储节点合设的超融合方式建设[10]。
网络建设主要分为业务网络、存储网络、管理内网及带外管理(ipmi)网络;
从物理组网来看,网络建设分为业务及管理接入网络、带外管理(ipmi)接入网络和汇聚网络。
业务网络:
承载资源池内部之间的网络互访流量以及用户访问外部网络的业务承载,建议采用万兆网络承载,同时考虑双链路实现冗余保护。
分布式存储网络:
用于存储业务数据及系统数据,计算服务器需频繁与存储交互,建议采用万兆网络承载,同时考虑双链路实现冗余保护。
管理网络:
用于资源池内部计算服务器、存储服务器之间管理流量,在计算节点上创建集群、创建虚拟机、添加存储等以及与管理平台的互通。
物理组网上建议可与存储网络共用。
带外管理网络:
目的为方便维护管理人员及时地远程维护,千兆网络承载即可。
6结束语
随着时代的发展,传统运维模式正向“一体化、集中化、智能化”方向发展。
本文通过介绍建设一体化运维管理平台,实现集中一体化监控和各系统数据信息的透明、关联、共享,从而实现智能化处理、自动化管理,以达到快速响应、高效管控、增值降本的目的。
同时,能实现数据整合与智能分析,多维度运维大数据的采集、统计、分析及深度挖掘,实现智能运维;
建立能力优势,增强服务提供能力、保障能力、成本控制能力、跨技术协同能力,从而进一步增强云数据中心的竞争能力,提高各种业务的业务量,增加企业的经济效益。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 大型 数据中心 一体化 管理 平台 建设 模式 研究