银行业运维指标体系建设实战Word文档下载推荐.docx
- 文档编号:5708813
- 上传时间:2023-05-05
- 格式:DOCX
- 页数:10
- 大小:339.97KB
银行业运维指标体系建设实战Word文档下载推荐.docx
《银行业运维指标体系建设实战Word文档下载推荐.docx》由会员分享,可在线阅读,更多相关《银行业运维指标体系建设实战Word文档下载推荐.docx(10页珍藏版)》请在冰点文库上搜索。
o
统筹全局运维数据源的挑战
持续创新智能算法库的挑战
跟跑智能运维新理论的挑战
银行指标管理体系落地实战
一套完善的指标管理体系应基于企业业务和IT运维管理的顶层规划,将各个业务系统的孤立数据进行分类、分层管理,从而通过更系统、更有层次的方式来展示业务场景的指标数据,使之成为以数据为驱动、面向业务运维监控与管理的落地抓手,让IT管理员能够将繁杂的IT管理工作升维从简,在改善IT管理方式的同时提升企业整体的IT运营效率。
01
落地实施方案
某银行指标管理体系的实施落地项目基于顶层指标管理驱动,从业务视角切入,以业务场景为主题、以业务连续性为宗旨,通过直面业务场景、正向梳理IT调用链、逆向接入数据源等实施步骤,最终构建了一套具备概览所有业务场景健康度、俯瞰多维立体化IT指标等能力的指标管理体系。
首先,从银行的核心业务场景开始,通过专业运维数据库平台对应用系统的IT数据源及业务数据源进行统一数据采集、指标提取和数据存储;
之后,针对银行业务的特点及业务部门的需求,进行指标管理体系咨询、调研,对IT数据和业务数据进行指标梳理和方案建设,形成指标规范与实施制度;
然后,结合指标规范与实施制度进行指标体系管理,最终以功能模块及平台模式的方式完成该银行指标管理体系的建设。
同时,根据银行业日常运维场景,在指标管理体系平台的上层应用中实现工作台、可视化管控和AIOps等功能模块的落地。
02
指标体系建设
1.业务调研:
聚焦业务场景、梳理业务指标
通过业务调研,梳理该银行的核心业务,包括线下支付(比如:
柜面存款)、线上支付(比如:
手机银行)、财富管理等,根据业务关注度和用户体验影响度,同时结合业务部门的汇报报表和领导决策时参考的业务指标,梳理出核心业务场景的关键指标,示例如下:
2.数据接入:
拓扑IT调用链、度量技术指标
经过调研银行IT系统及自动化配置平台的数据,梳理出支撑银行核心业务的应用系统,比如全渠道支付系统、支付前置系统、支付清算系统等;
每个业务系统都有完备的IT系统,根据核心业务系统的监控现状和指标关注度,按照自上而下调用链的依赖关系分为五层的技术指标监控体系:
应用层、服务层、中间件层、进程层(虚拟层)、主机层,结合多个银行案例的指标管理体系建设经验对监控源进行指标管理体系建设,搭建各层指标之间依赖拓扑的关系矩阵,示例如下:
上述各层的技术指标都是一条独立的实时序列数据流,通过银行自动化配置平台的配置项数据建立各层技术指标之间的调用链拓扑关系网,示例如下:
3.模型配置:
量化业务关注度、建模指标健康度
搭建完成指标管理体系的架构分层后,结合核心业务指标,以结果导向的逆向思维对各层指标的权重进行评定:
业务指标的稳定依赖业务子系统的稳定、业务子系统的稳定依赖IT应用系统的稳定、IT应用系统的稳定依赖IT系统各层级的稳定、IT系统各层级的稳定依赖于各项技术指标的稳定,那么当原子级的技术指标不稳定时如何风险升级向上渗透呢?
通过对技术指标进行级别评定、权重分配的方式加权计算量化各项技术指标的影响力。
例如,柜面存款是最核心的基础业务系统,需要从生死线指标、关键指标和标准指标三个维度对柜面存款业务的健康度进行模型配置:
柜面存款的生死线指标:
交易成功率;
体现业务可用性的单个指标。
交易成功率的计算方式:
单位时间内的交易成功数除以相同单位时间的交易总数。
柜面存款的关键指标:
请求成功率、平均响应时间;
直接影响业务态势的一组技术指标。
指标解读:
当成功率低于预期阈值时,直接说明终端用户在使用柜面存款功能时,业务操作频繁失败,进而影响用户的使用体验,导致客户流失率提升。
柜面存款的标准指标:
内存使用率、CPU使用率;
与业务态势相关的单个监控类技术指标。
当主机层物理资源的CPU使用率、内存使用率突升时,可能会引起IT应用系统单节点的不稳定,但在微服务化、分布式架构的背景下该风险不会蔓延影响到业务层。
对指标进行生死线指标、关键指标、标准指标的分类评级是为了更准确的量化定义每个指标对业务主题健康度的权重,是建模业务场景健康度的重要影响因子,即通过加权计算所有技术指标的权重获得业务场景的健康度评分。
经过定义健康度、设置权重后,建立起覆盖柜面存款业务的健康度模型,示例如下:
4.全局概览:
工作台概览业务场景、应用墙俯瞰指标态势
工作台作为指标管理体系的上层应用,承载了指标体系管理的设计理念,即支持从业务场景墙、应用墙、服务墙、中间件墙、主机墙等页签查看各层的健康度态势;
通过统一管理业务指标与IT指标的健康度,进而支持从业务场景墙联动查看IT系统各层的技术指标健康状态,最终保障业务运维的连续性。
•
业务部门的运维视角
业务部门通过业务场景墙概览各个业务场景的健康度评分,点击业务场景下查看该业务场景依赖的子业务系统拓扑图,通过颜色标识(绿色表示健康、橙色表示危险、红色表示灾难)直观地了解业务子系统中各IT应用系统的运行态势,点击IT应用系统支持查看各项关键指标的运行状态及趋势图,赋能分析业务场景的健康状态,精准定位源头、提升跨部门沟通效率。
业务视角-业务子系统依赖拓扑图
业务视角-业务子系统运维态势深度分析
技术部门的运维视角
运维部门通过应用墙、服务墙、中间件墙、主机墙概览IT应用系统各层技术指标的健康度评分,点击查看部门负责的IT应用系统后看到该IT系统各层的指标体系拓扑图,点击各层的实例对象查看该实例对象的各个指标对象的运行状态、趋势图等实时数据,赋能排查IT系统技术指标的异常项,预防于事前、告警于事中、回溯于事后,改变运维方式、提升运维效率。
运维视角-应用系统的立体拓扑图
运维视角-实例对象指标态势的深度分析
总结与展望
上述银行指标管理体系实战取得的成果可归纳为如下两方面:
通过分层串联调用链的立体化构建理念增强了运维流程的完整度:
打通了IT运维流程各层级应用系统的调用关联,做到端到端覆盖,保障IT系统运维连续性、提升整体系统运维效率。
通过结合业务与运维的拓扑可视化设计理念提升了业务运维效率:
提高了业务黏合衔接运维的透明度,基于度量驱动流程进行优化,从而建立高效协作、高度授权和持续改进的组织文化。
银行业的IT系统建设正在升级演进阶段,业务运维的瓶颈点也在“闪转腾挪”。
指标管理体系也会在流程精细化、算法智能化、运维一体化的方向上乘胜追击、乘势而为。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 银行业 指标体系 建设 实战