检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
事件管理是对应用的所有事件进行管理,包含事件的受理、驳回、转单、处理到闭环整个生命周期管理。事件来源包含流转规则产生的事件、通过告警创建的事件及人工创建的事件。 事件管理同时支持配置SLA规则,若需配置请参考基础配置-SLA管理。 事件处理流程: 事件被创建后状态为“未受理”状态,未受理状态下
包括租户委托首次同步租户RMS资源、查询租户的资源信息等 自动化运维 包括自定义脚本的创建、修改、删除、查询等 事件管理 包括事件的创建、处理、验证及查询 集成管理 主要为用户上报自监控系统的告警至COC 补丁管理 包括补丁管理合规性报告查询相关接口
批量ECS资源切换镜像报错如何处理? 工单执行报错"code":"Ecs.0021","message":"Failed to check Cinder quotas because the number of Gigabytes exceeded the upper limit
完成自定义SLA创建。 1、仅自定义SLA支持创建,公共SLA会自动预置在系统里,仅对租户开启“启用”,“禁用”,“查看”功能。 2、创建或修改SLA后,将对新进入SLA流程的工单开始生效,对已处于SLA流程中的工单不会生效。 3.、相同条件“SLA类型+应用+重要级别”的SLA模板不可重复创建。
总览页面中提供用户查看到账号下的安全监控信息。从安全评分、安全监控、安全趋势三个维度呈现安全概览,并支持自定义看板。 查看安全概览 云监控 总览页面中支持资源监控总览,以及资源告警详情的查看。故障管理中,支持接入云监控服务产生的告警,并在云运维中心中进行流转处理。混沌演练中,支持在演练过程中查看云监控的指标数据。如需正常使用需先开通云监控服务。
操作场景 事件单处理完成后,通过故障是否恢复或达到预计效果,在验证关闭事件中填写验证结果,选择未解决可以驳回事件,驳回后需事件处理人重新定位并处理该故障。 验证事件 登录云运维中心。 在左侧导航栏选择“故障管理 > 事件管理”。 在“待处理的”页签,选择需要处理的事件单,单击事件标题。
事件---该规则是默认启用的,支持关闭该规则。 2.流转规则生成汇聚告警,在窗口期内若没有收到原始告警,系统会将之前窗口期内的告警作为历史告警(即当前告警状态默认设置为“已处理”) 图1 流转规则转事件/告警示意图 表3 触发条件key参数说明表 key参数 描述 对应CES告警字段
常规变更(指非紧急、能通过正常程序化的申请、评估、批准、排序、计划、测试、实施和回顾的变更)。 紧急变更(为了处理生产环境不可用或机器不可用、紧急满足业务需求而提出的计划外变更,无法满足计划性要求,或者来不及走正常流程进行评估审批的变更)。 审批环节上的区别 支持针对常规变更、紧急变更两个场景配置审批环节。
书。 处理流程 Warroom处理流程如下: 启动Warroom:在事件管理处理事件页面启动WarRoom。 故障定界和恢复:分析故障影响范围,恢复所有受影响应用。 若分析还有其他应用受影响,使用新增影响应用增加。 通过应用诊断可以快速定位故障根因,使用执行预案能够快捷处理故障。
告警的异常数据,并提供资源核心指标查看与实例诊断能力。 前提条件 已完成在CMDB的应用创建和资源关联,并完成应用拓扑。 确保已接入CES监控,请到集成管理进行配置。 已创建事件单。 如果需要展示CCE集群中的负载,pod信息,需要在CCE中对负载进行标签配置(每个分组只能添加一
补丁操作出现lsb_release not found异常如何处理? 1.请确认ECS实例上有是否有lsb_release命令包,若没有,则安装相应命令包。 2.若ECS实例上有lsb_release命令包,则确认使用的UniAgent版本是否高于1.1.0版本,若高于1.1.0则降UniAgent版本为1
补丁修复后合规性报告仍然为不合规如何处理? 单击修复后生成的合规性报告摘要 图1 合规性报告摘要 查看不合规的补丁状态,根据状态不同查看不同解决方案 表1 不同合规性状态的解决方案 不合规状态 解决方案 失败 查看生成此合规性报告的补丁工单日志,根据失败的日志解决此问题 已安装待重启
总览 为用户提供资源健康度、资源监控信息、安全概览、运维态势感知、系统公告等相关信息,呈现基于资源一站式的信息概览,同时您可通过总览页面右上角“自定义设置”灵活配置页面楼层的展示和排序。 运维概览 快速配置中心 资源看板 资源监控 优化顾问 安全评分 运维态势感知
应用拓扑以图形的形式呈现,其中节点表示应用层次结构和资源,连线表示之间的关系。为您更加直观地展示应用层次结构和资源之间的相互关系,便于资源的使用、监控和管理。 注意事项 修改拓扑仅支持修改组件之间的连线关系。 修改拓扑不影响应用和组件的层级和功能。 查看和修改拓扑 登录云运维中心。 在左侧导航栏选择“资源管理
如果资源无法在资源管理页面中查询到,如何处理? 在资源管理页面中进行同步资源。具体操作详见同步资源。 父主题: 资源管理常见问题
审批变更单 操作场景 变更单创建后,需要进行审批流程,同意或驳回变更单,请按如下操作进行。 审批变更单 登录云运维中心。 在左侧导航栏选择“变更管理 > 变更中心”。 在“待处理的”页签,选择需要审批的变更单,单击操作列“处理”。 单击“审批”。 设置“审批意见”。 是否审批通过:可选项“同意”、“驳回”。
提前制定的产品立项、产品设计、产品上线三个阶段的检查项信息。 选择PRR检查项,单击“添加检查项”,可选项“从系统中选择”、“自定义添加”,可以同时使用“从系统中选择”和“自定义添加”设置检查大类。 从系统中选择:选择云运维中心提供的预定义检查项,支持多选。选择完成后展开检查项,可以添加指标。 自
补丁工单日志中出现all mirrors were tried异常如何处理? 一般由网络原因引发,确认机器网络是否能和机器上所配置的补丁源联通,或机器网络是否出现异常。 父主题: 补丁管理常见问题
告警管理 统计参与处理告警的人数 去重计算集成告警的责任人数量 天/月 人 人均告警处理量 告警管理 统计人均处理的告警数量 选择时间范围内,告警总数量/告警参与人数 天/月 人 告警自动化处理率 告警管理 统计告警的自动化处理情况 选择时间范围内,自动化处理告警/告警总数*100%
更异常及时介入处理,实现变更实施全过程可控、可视、可管。 确定性故障管理 统一事件中心:提供事件发现、事件处理、恢复验证及持续改进的全流程标准化机制。 承载Warroom和故障回溯能力:现网事件智能启动Warroom,缩短故障处理非必要耗时,指挥中心实时观测故障处理进展。故障回溯