ITSS实例文件vCenterOperationsManager使用说明手册工具模板.docx
- 文档编号:14593196
- 上传时间:2023-06-24
- 格式:DOCX
- 页数:18
- 大小:1.44MB
ITSS实例文件vCenterOperationsManager使用说明手册工具模板.docx
《ITSS实例文件vCenterOperationsManager使用说明手册工具模板.docx》由会员分享,可在线阅读,更多相关《ITSS实例文件vCenterOperationsManager使用说明手册工具模板.docx(18页珍藏版)》请在冰点文库上搜索。
ITSS实例文件vCenterOperationsManager使用说明手册工具模板
运维工具应用情况说明
VMwarevCenterOperationsManager
VMwarevCenterOperationsManager
文档修订记录
版本编号
*变化
状态
简要说明
日期
变更人
批准日期
批准人
*变化状态:
A——增加,C——创建,M——修改,D——删除
1
简介
vCenterOperationsManager用于为您的虚拟环境提供监控功能。
了解vCenterOperationsManager的重要功能和概念有助于您高效地使用此产品。
1.1目的
通过该工具的使用,可以实现对客户系统的远程访问和跟踪监控,有利于对客户的运维整体情况进行把握和进行及时的事件或问题的修复,提高客户满意度。
1.2适用范围
本文档的适用于运维项目的远程访问和跟踪监控。
1.3术语表
无
2vCenterOperationsManager功能
vCenterOperationsManager从虚拟环境每个级别的每个对象(从单个虚拟机和磁盘驱动器到整个群集和数据中心)收集性能数据。
它存储并分析这些数据,而且使用该分析提供关于虚拟环境中任意位置的问题或潜在问题的实时信息。
vCenterOperationsManager可与现有VMware产品配合使用来添加以下功能:
将关键衡量指标组合成环境运行状况和效率以及容量风险的单个评分。
计算每个衡量指标的正常行为范围,并突出显示异常。
根据入站数据调整动态阈值,以便更好地定义衡量指标的正常值。
以图形表示整个虚拟环境或选定部分的当前和历史状况。
在虚拟环境层次结构中显示关于变动的信息。
例如,将某个虚拟机移至其他ESX主机后,您可查看这些变动如何影响所涉及对象的性能。
用于按照环境的结构定义“组”容器来组织受监控对象。
2.1属性和衡量指标
vCenterOperationsManager为每个清单对象收集多个种类的数据。
例如,对于虚拟机,vCenterOperationsManager可能会接收有关可用磁盘空间、CPU负载和可用内存的数据。
vCenterOperationsManager所收集的每个数据类型称为一个属性。
特定清单对象的属性实例称为衡量指标。
例如,某一特定虚拟机的可用内存就是一个衡量指标。
对于每个衡量指标,vCenterOperationsManager将随时间收集和存储读取到的多个值。
例如,vCenterOperationsManager服务器每五分钟轮询一次有关每个虚拟机CPU负载的信息。
vCenterOperationsManager所收集的每条数据称为一个衡量指标值。
2.2动态阈值
vCenterOperationsManager将根据每个衡量指标的当前值和历史值为其定义动态阈值。
由于周期性使用和行为的不同,衡量指标的正常值范围在不同日期的不同时间也会有所不同。
vCenterOperationsManager将跟踪这些正常值周期并相应地设置动态阈值。
较高的衡量指标值在某一时刻可能是正常的,而在其他时刻则可能表示存在潜在问题。
例如,星期五下午生成每周报告时CPU使用量较高,这属于正常现象。
而如果在星期日早上办公室无人时也表现为相同的值,则可能表示出现问题。
vCenterOperationsManager会不断调整动态阈值。
通过新的入站数据,vCenterOperationsManager可更好地定义衡量指标的正常值。
动态阈值为衡量指标添加了范围,便于vCenterOperationsManager区分正常行为与异常行为。
通过动态阈值,用户无需手动为成百上千的衡量指标配置硬阈值。
更重要的是,它们比硬阈值更精确。
通过动态阈值,vCenterOperationsManager可根据对象的实际正常行为(而不是根据一组随意的限制)来检测偏差。
分析算法计算动态阈值的初始值需要七天的时间。
动态阈值将在“详细信息”页面和“记分板”页面上使用情况衡量指标条形图下显示为线段。
动态阈值线段的长度和位置取决于为选定使用情况衡量指标计算的正常值。
动态阈值还会在“所有衡量指标”页面上使用情况衡量指标图中显示为灰色阴影区域。
2.3硬阈值
与动态阈值不同,硬阈值是您为定义对象的正常行为而输入的固定值。
除非您手动更改这些任意值,否则它们不随时间变化。
您不能使用vCenterOperationsManager固定硬阈值。
2.4关键性能指标
vCenterOperationsManager将对于对象性能至关重要的属性定义为关键性能指标(KPI)。
在用于确定对象运行状况的计算情形中,KPI更为重要。
KPI性能图形显示在产品多个方面的其他衡量指标之前。
2.5警示和故障
当受监控对象上发生事件、数据分析结果指示偏离正常衡量指标值或vCenterOperationsManager的某一组件出现问题时,vCenterOperationsManager将生成警示。
vCenterServer发布的事件是故障的主要来源。
这些事件可能产生于vCenterServer自身,或者可能由ESX服务器生成,并且vCenterServer可能会在外部发布这些事件。
只有vCenter事件的子集被视为对故障生成十分重要。
3vCenterOperationsManager的衡量指标概念
准备使用vCenterOperationsManager监控环境涉及在一定程度上熟悉可帮助您发现问题的衡量指标。
vCenterServer提供基于使用量的衡量指标模型。
vCenterOperationsManager提供基于需求量的衡量指标模型。
懂得一些会影响数据和图表的衡量指标方面的知识对于确定工作流中的后续操作非常有用。
衡量指标
描述
已置备
用户配置的资源量。
置备量衡量指标可能适用于主机的物理内存量或虚拟机的vCPU数量。
可用资源量
对象可使用的实际资源量。
可用量小于或等于置备量。
置备量和可用量之间的差异源于虚拟化开销。
该开销可能包括ESX主机用于运行主机、支持虚拟机的预留以及为高可用性添加缓冲区的内存。
可用量衡量指标不适用于虚拟机。
使用情况
对象消耗的资源量。
使用量小于或等于可用量。
需求
对象在不受任何现有限制的情况下可能消耗的物理资源量。
对象可能会因置备不足或与消耗资源的其他对象争用资源而受到限制。
某个虚拟机可能需要10GB内存,但由于必须与主机上的其他虚拟机共享资源,因此该虚拟机只能获得5GB。
需求量小于使用量时,环境中可能存在浪费的资源。
需求量大于使用量时,环境中可能会出现延迟和性能下降。
争用
对象需要的资源量与对象获得的资源量之间的差异。
该衡量指标测量消耗资源的对象之间争夺资源的效果。
争用测量获得资源使用权的延迟时间或所需时间。
该测量值反映丢弃的网络数据包。
限制
对象可获得的最大资源量。
该限制对在vCenterServer中分配和配置的CPU、内存或磁盘I/O资源设置了上限。
使用量小于或等于限制量。
需求量可大于限制量。
限制量小于或等于置备量。
默认限制量是无限制。
规则:
使用情况<=限制需求量可大于限制量。
预留
对象的保证资源量。
如果没有该预留量,则对象不会启动。
默认量为0。
可用量
根据在虚拟化配置中设置的资源消耗对象的相对优先级,得出该虚拟机可使用的资源量。
该衡量指标是已置备量、限制量、预留量、份额和需求量的函数。
份额与表示虚拟机重要性的比例权重有关。
可用量小于或等于限制量。
可用量衡量指标仅适用于虚拟机。
规则:
可用量<=限制<=已置备可用量>=预留
4使用vCOps监控虚拟环境
要使用vCenterOperationsManager监控虚拟环境,首先需要了解清单窗口对象图标、统一控制面板、主要徽标和次要徽标的定义。
4.1清单窗格中的对象类型图标
对象类型图标
图标
描述
环境“域”对象是vCenterOperationsManager中所有受监控对象的逻辑容器。
vCenterServer系统
数据中心
集群
处于关闭电源状态的ESX主机
处于打开电源状态的ESX主机
数据存储
处于关闭电源状态的虚拟机
处于打开电源状态的虚拟机
由vCenterOperationsManager或管理员创建的自定义组
默认情况下,清单窗格中的对象按主机和群集分组。
您可以从清单窗格顶部的下拉菜单中选择数据存储,来切换对象的分组方式。
4.2vCOps统一控制面板
统一控制板是vCenterOperationsManager数据的启动台。
此用户界面通过在“Health”(运行状况)、“Risk”(风险)及“Efficiency”(效率)等主要主题下组织您的环境视图而简化日常操作。
从主控制板中,您可以深入了解所关注的区域。
例如,您可以查看可能正在导致低分的故障并使用综合视图快速确定问题的根本原因。
每一个主要徽标都有不同的次要徽标,为您提供有关度量指标构成情况的详细信息。
vCenterOperationsManager简化和自动化操作管理的集成方法使用具有专利权的分析机制,提供所需的智能化信息和可见性,以主动确保服务水平、减少停机风险以及优化您的环境,进而提高效率并降低成本。
统一控制板图例:
统一控制板被分为不同的两个部分。
左侧部分用于分析当前问题,右侧部分则用于确定短期和长期容量。
●在左侧,您可以看到表示“Health”(运行状况)的主要徽标以及与之相关的次要徽标:
“Workload”(工作负载)、“Anomalies”(异常)和“Faults”(故障)等。
您可以将其称之为“Operations”(运行)视图。
该视图会为您显示当前问题,并且将以图表和数字的形式指出您可能需要关注的区域。
●右侧的两个主要徽标“Risk”(风险)和“Efficiency”(效率)表示前瞻状况。
您可以在此管理容量,预测所需变更,以便随时间变化适当调整基础结构的大小。
4.3vCOps中的主要徽标和次要徽标
统一控制板图被水平分为两个主要部分。
上半部分显示了三个主要徽标:
“Health”(运行状况)、“Risk”(风险)和“Efficiency”(效率)。
交通灯式的图表让您可以快速查看应关注的区域。
绿色代表良好,而红色则表示需要关注的区域。
●每个主要徽标的分数代表不同的含义,对于“Health”(运行状况)徽标来说,高分代表最佳。
而对于“Risk”(风险)徽标来说,分数则越低越好,因为您希望自己的环境处于低风险状态。
那么针对“Efficiency”(效率)来说,优化环境的目标非常关键,因此高分才有价值。
借助这些徽标,您便可以快速查看对象的调配是过度还是不足。
●次要徽标位于下半部分。
次要徽标的度量指标和分数用于计算主要徽标得分。
例如,“Workload”(工作负载)、“Anomalies”(异常)和“Faults”(故障)次要徽标结合起来构成“Health”(运行状况)徽标总分数。
4.3.1运行状况监控
“Health”(运行状况)徽标用于确定系统的运行状况。
●该对象的当前状态:
●此徽标确定系统中的当前问题
●确定需要立即解决的问题,避免出错。
●高表示运行状况良好(0-100)。
●热图
●一次提供多个对象的快速视图
●显示所有父对象和子对象的运行状况
●回顾(长达6小时)检查虚拟基础架构的状况
●运行状况分数根据其次要徽标计算所得:
●工作负载
●异常
●故障
1)运行状况的次要徽标-(工作负载)使用
vCenterOperationsManager的分析算法将一些显示虚拟机或其他对象的资源需求的度量指标合并为一个值,即工作负载。
这些度量指标包括CPU利用率、内存使用或磁盘I/O等。
vCenterOperationsManager通过基于定义的徽标分数阈值的彩色图标表示工作负载。
选择一个需要观察对象后,点击运行状态下的工作负载会显示此组件的CUP、内存、磁盘、网络IO数据,与其父级主要徽标(“Health”(运行状况)徽标)不同,工作负载的分数为0时表示状态良好,为100时表示状态不良。
2)运行状况的次要徽标-(异常)使用
“Anomalies”(异常)徽标会根据对象的历史度量指标数据指出该对象行为的异常程度。
点击相应对象(我们要查看的VMs)会显示异常状态,异常和工作负载不同之处在于,工作负载是计算对象工作困难程度的绝对度量指标,而异常则计算对象的行为异于正常行为的程度。
工作负载和异常对于发现和排除性能问题都很有用。
3)运行状况的次要徽标-(故障)使用
故障分数是根据从vCenterServer检索的事件计算的。
此分数涉及的事件包括NIC或HBA冗余丢失、内存校验和错误、HA故障切换问题、CIM事件,等等。
如图所示:
选择对象后点击故障图标会显示产生的故障,Linkstatedown提示物理机网卡状态down
4.3.2风险状况监控
用于容量规划。
●概括了系统和虚拟基础架构存在的风险
●确定了可能最终影响整体性能的潜在问题
●0到100的范围内风险分数低表示状况良好
●风险分数根据其次要徽标计算所得:
●剩余时间
●剩余容量
●及压力
●风险图
●显示过去7天的风险趋势
1)“Risk”(风险)的次要图标“TimeRemaining”(剩余时间)
该分数根据资源类型计算,例如,CPU使用情况或磁盘I/O,基于该资源类型使用模式的历史数据。
剩余时间分数使您能够为所选对象计划物理或虚拟资源的配置,或重新组织您虚拟环境中的工作负载。
图中UIVM剩余时间为〉1年,结合磁盘、内存、CPU取最小值计算出剩余时间。
2)“Risk”(风险)的次要图标“CapacityRemaining”(剩余容量)
剩余虚拟机数表示可部署于所选对象之上的虚拟机数目,基于未使用资源的当前数量和过去"n"周的平均虚拟机配置文件。
剩余虚拟机数是用于计算剩余时间分数的CPU、内存、磁盘I/O、网络I/O及磁盘空间的相同计算资源的功能。
如图显示AETEC-Cluster集群剩余虚拟机容量为53。
3)“Risk”(风险)的次要图标““Stress”(压力)
压力分数计算为一段时间内资源需求与可用容量之间的比率。
压力分数可帮助您确认未分配足够资源的主机和虚拟机,或正在运行过多虚拟机的主机。
高压力分数并不意味着当前存在性能问题,但会突出显示可能导致未来性能问题的潜在因素。
如图显示AETEC-Cluster集群压力为0
4.3.3效率计算
“Efficiency”(效率)徽标用于容量规划
●用于规划容量
●考量一下三种资源:
●CPU、内存、磁盘空间
●运行精简型数据中心
●通过提高资源利用率来节约资金
●0到100的范围内效率分数高表示状况良好
●效率分数根据以下这些次要徽标计算得出:
●可回收的已浪费资源
●密度
●形图按照百分比列出VM图标
●最佳–优化调配的虚拟机
●已浪费资源–过度调配的虚拟机
●压力–调配不足的虚拟机
1)“Efficiency”(效率)的次要徽标“Density”(密度)
度量整合比率以评估成本节省以在不影响性能或服务级别协议的情况下获得最大整合比率。
影响该计算的因素:
●资源需求
●已配置的虚拟容量
●以及已部署的物理可用容量
选择相应对象(集群或主机)查看密度
右侧图表中可看到密度整合比率:
1.虚拟机/主机比率
2.vCPU/物理CPU比率
3.vMEN/物理内存比率
对于每一项整合比都有最佳的建议。
2)“Efficiency”(效率)的次要徽标“ReclaimableWaste”(可回收的已浪费资源)
可回收的已浪费资源针对环境中每个对象的每个资源类型(例如CPU、内存及磁盘)进行计算。
它确定可回收并配置给您环境中其他对象的资源的数量。
右侧图表显示可回收的废弃资源:
度量对象的过度配置确定可回收资源数量
1.CPU
2.内存
3.磁盘
较低的可回收已浪费资源表示状态良好
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- ITSS 实例 文件 vCenterOperationsManager 使用说明 手册 工具 模板
![提示](https://static.bingdoc.com/images/bang_tan.gif)