正在生成
详细信息:
检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
新增起会规则 操作场景 WarRoom拉起会议通过起会规则拉起,本节介绍如何创建起会规则。 操作步骤 登录COC。 左侧菜单栏选择“故障管理 > WarRoom”,选择“起会规则”页签,进入“起会规则”列表。 图1 起会规则列表 在起会规则列表上方,单击“新建起会规则”,输入规则
为快速恢复业务的运作机制,支撑运维、研发、运营联合作战,保障业务快速恢复而组建的会议。已受理的事件可以启动Warroom,具体参考启动WarRoom。 Warroom使用指导,请参考WarRoom管理。 父主题: 故障管理常见问题
不满足项 检查项不通过时的不满足项信息,当评估方式为自动时,可查看不满足项的详细信息 会议发起人 PRR评审会议的发起人 与会成员 PRR评审会议的与会成员 会议纪要人 PRR评审会议的会议纪要人 填写完PRR评审的检查项信息后,可以选择上传自检材料,单击 “添加自检材料”,进行自检材料上传。
而组建的会议。在Warroom页面可以添加与会成员、发送故障进展、添加影响应用等操作。 前提条件 该应用下有正在处理的事件单,在事件处理页面启动WarRoom。 WarRoom状态 故障信息 影响应用管理 与会成员 进展通告 新增起会规则 修改起会规则 父主题: 故障管理
String 审批消息通知协议,用于通知审批人 DEFAULT:默认 SMS:短信 EMAIL:邮件 DING_TALK:钉钉 WE_LINK:welink WECHAT:微信 CALLNOTIFY:语言 NOT_TO_NOTIFY:不通知 枚举值: DEFAULT SMS EMAIL DING_TALK
String 审批消息通知协议,用于通知审批人 DEFAULT:默认 SMS:短信 EMAIL:邮件 DING_TALK:钉钉 WE_LINK:welink WECHAT:微信 CALLNOTIFY:语言 NOT_TO_NOTIFY:不通知 枚举值: DEFAULT SMS EMAIL DING_TALK
String 审批消息通知协议,用于通知审批人 DEFAULT:默认 SMS:短信 EMAIL:邮件 DING_TALK:钉钉 WE_LINK:welink WECHAT:微信 CALLNOTIFY:语言 NOT_TO_NOTIFY:不通知 枚举值: DEFAULT SMS EMAIL DING_TALK
String 审批消息通知协议,用于通知审批人 DEFAULT:默认 SMS:短信 EMAIL:邮件 DING_TALK:钉钉 WE_LINK:welink WECHAT:微信 CALLNOTIFY:语言 NOT_TO_NOTIFY:不通知 枚举值: DEFAULT SMS EMAIL DING_TALK
源管理驾驶舱。 全生命周期管理:打通用户资源管理全旅程断点,提升用户资源管理流畅度和运维效率。 资源管理驾驶舱:从全局视角实现用户资源可视化管理,支持多云和跨账号集中运维能力。 图2 资源全生命周期管理 变更风控&作业可信 融合华为SRE安全生产最佳实践的管控模型,助力客户作业可信和稳定可靠。
维诉求。承载华为云确定性运维业务场景,提供变更管理、批量运维等核心特性,实现在安全合规的前提下,提升用户运维能力成熟度和云上运维效率。 COC提供以下功能: 运维态势感知大屏,面向不同角色运维人员的专属运维BI看板,辅助管理层洞察决策和优化改进。 资源全生命周期管理,提供资源定义
2。 图4 变更管理 表2 变更管理数据字典 指标名称 数据来源 指标定义 计算规则 统计周期 度量单位 变更导致现网事件 变更管理 统计由于变更原因导致的现网各个级别的事件数量 选择时间范围内,各级别事件单类型为变更操作问题的数量 天/月 个 变更等级 变更管理 统计各个等级的变更单的数量
事件管理 事件管理主要是对应用的所有事件进行管理,包含事件的受理、驳回、转单、处理到闭环整个生命周期管理。事件来源包含流转规则产生的事件、通过告警创建的事件及人工创建的事件。 事件管理同时支持配置SLA规则,若需配置请参考基础配置-SLA管理 事件流程 创建事件 处理事件 事件历史记录
告警管理 汇聚告警 原始告警 父主题: 故障管理
集成管理 集成配置支持简单、快速集成现有或第三方等监控系统;将业务下所有分散的监控系统告警进行统一收口及管理。不同的监控系统通过各自独立的集成接入密钥实现对接集成。 监控系统接入后,配置流转规则后可将告警信息转事件或告警。 当前支持集成CES、AOM、Prometheus和自建监控系统。
问题管理 问题管理主要是对应用的所有问题单进行管理,通过识别故障的实际和潜在原因、管理规避方案和已知错误,来降低故障再次发生的可能性和影响性。包含问题单的创建、受理、驳回、转单、处理到闭环整个生命周期管理。问题单来源主要有人工创建与北向接口创建。 问题管理同时支持配置SLA规则,若需配置请参考基础配置-SLA管理。
改进管理 改进管理主要是故障处理过程识别到一些改进事项可通过改进单进行跟踪闭环。改进来源包含事件/Warrroom/演练/PRR。 改进管理 父主题: 故障管理
原始告警 登录COC。 左侧菜单栏选择“故障管理 > 告警管理”,选择“原始告警”页签,查看原始告警列表,页面默认显示一个月的告警信息。 单击击告警列表前可以查看告警其他信息。 图1 原始告警 父主题: 告警管理
在左侧菜单栏单击“故障管理 > 告警管理”,可以查看汇聚告警或原始告警列表信息。 在汇聚告警搜索框中输入告警单号、集成告警名称,“回车”进行搜索。 汇聚告警包含当前告警和历史告警。 图1 告警列表 处理告警 告警转事件 清除告警 历史告警 父主题: 告警管理
事件管理 创建事件单 受理事件单 提交事件单解决方案 验证事件处理结果 查询事件单详情 事件相关枚举信息 父主题: 故障管理
应用管理 应用管理,即为管理应用与云资源的关系,并为后续资源的监控、自动化运维等,提供统一、及时的资源环境管理服务。 创建应用 修改应用 删除应用 编辑应用拓扑 创建组件 修改组件 删除组件 创建分组 修改分组 删除分组 手动关联资源 智能关联资源 转移资源 解除关联资源 执行UniAgent操作