检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
立标准化的事件流程,实现规范性处理。 解决方案 端到端事件流程:明确标准化事件处理流程,通过WarRoom实现多运维兵种协同作战,通过响应预案提升事件处理效率。 图1 标准化故障管理 COC通过设置流转规则,将原始告警清洗为事件单或告警单,帮助用户进行统一的告警管理。当原始告警命
排班管理 资源管理与运维 资源管理 应用管理 补丁扫描与修复 自动化运维 脚本管理 作业模板与执行 定时运维 故障管理 配置和应用流转规则 标准化事件管理流程 集成告警 WarRoom机制 可用性分析 混沌演练 02 入门 以快捷执行作业及快捷混沌演练为例,帮助您快速了解COC在典型场景下的操作方法。
默认展示全部区域的资源,您可以自定义筛选指定区域查看该区域下的资源。 图2 区域筛选 鼠标移动到云服务图标(云服务图标右上角红底数字代表告警数量)悬停,可以快速查看紧急/重要告警数量,以及资源实例的区域分布。 图3 鼠标悬停查看资源 单击云服务图标,可以查询对应资源类型的全部资源信息。 图4 查询资源信息 单击“查
SLO管理”,进入“SLO管理”页面。 图1 SLO列表 单击搜索框,弹出搜索条件列表中选择对应的搜索条件,输入对应的值,按下“回车”键即可搜索数据。搜索框后的图标依次支持:刷新列表数据、设置列表展示字段。 图2 筛选SLO 单击列表中的,查看详情。 图3 SLO详情 单击右上角“创建SLO”,选择对应的应用与SLO目标值创建SLO。
依赖导致的变更风险。 实施保障:按预定方案执行变更,变更步骤标准化、可观测,变更异常及时介入处理,实现变更实施全过程可控、可视、可管。 确定性故障管理 统一事件中心:提供事件发现、事件处理、恢复验证及持续改进的全流程标准化机制。 承载Warroom和故障回溯能力:现网事件智能启动
集成管理 支持用户自主接入告警数据 功能介绍 支持租户将自开发的监控系统按照标准化集成至COC,集成后告警会按照标准格式上报至COC告警中心 URI POST /v1/event/huawei/custom/{integration_key} 表1 路径参数 参数 是否必选 参数类型
改进事项的类型 改进责任人 改进事项的责任人 改进验收人 改进事项的验收人 期望完成时间 改进事项的期望完成时间 问题现象 问题现象 改进闭环标准 改进事项闭环的标准 单击”添加会议纪要”,可以添加PRR评审会议的纪要材料 填写完成后,单击”确认”,完成评审纪要录入。 图11 评审纪要录入完成
改进事项所属的应用 改进类型 改进事项的类型 改进责任人 改进事项的责任人 期望完成时间 改进事项的期望完成时间 问题现象 问题现象 改进闭环标准 改进事项闭环的标准 进入演练报告页面,单击“故障记录”,查看故障记录。 图7 故障记录 父主题: 混沌演练
、故障恢复流程卡点等),及早发现系统可用性的问题进行解决,持续提升应用韧性,建立运维信心。对于无法避免的场景(硬件故障、服务器异常下电、网络设备单板故障等)通过提前制定快速恢复应急预案进行应对。 COC混沌演练为用户提供一站式的自动化演练能力,覆盖从风险识别、应急预案管理、故障注
待办中心”页面,进入待办中心的待处理列表。 图3 查看待办中心列表 单击搜索框,弹出搜索条件列表;选择对应的搜索条件,输入对应的值,单击回车按钮即可搜索数据。 搜索框后的图标依次支持:刷新列表数据,设置列表展示字段。 图4 添加筛选条件 选择“全部待办”、“待处理的待办”、“我处理的待办”、“我创建的待办”对应的页签,展示对应的待办列表。
记录列表界面。 图1 查询SLA记录 单击搜索框,弹出搜索条件列表中选择对应的搜索条件,输入对应的值,单击“回车”即可搜索数据。搜索框后的图标依次支持:刷新列表数据、设置列表展示字段。 单击列表数据的“SLA”列对应的SLA模板,查看对应的SLA模板。 单击列表数据的“工单ID”
收等全生命周期管理,构筑资源管理驾驶舱。 变更风控&作业可信,融合华为SRE安全生产最佳实践的变更管控模型,助力客户作业可信和稳定可靠。 标准化故障管理,加持WarRoom作战驾驶舱,实现故障高效协同和快速恢复。 智能化混沌演练,全旅程混沌工程解决方案,颠覆传统被动运维模式,推动客户向主动运维变革。
OS诊断插件(holmes-agent)是否支持 (Y:支持;N:不支持) X86 Huawei Cloud EulerOS Huawei Cloud EulerOS 2.0 标准版 64位(40GB) Y CentOS CentOS7.9 Y CentOS 8.0 Y CentOS 8.2 64bit Y CentOS7
AI加持风险评估:通过高危命令智能拦截算法,AI加持消减作业风险。 图3 变更风控&作业可信 标准化故障管理 标准化故障管理流程,加持WarRoom驾驶舱,实现故障高效协同和快速恢复。 标准化流程:华为云标准故障处理流程服务化,通过WarRoom实现运维、研发等多兵种协同作战,响应预案提升故障处理效率。
成功率取值范围0~100,支持精确到小数点后一位。 是否关机:勾选“立即关机”,工单开始执行时会自动将未关机的实例关机。 设置“镜像”。 公共镜像:常见的标准操作系统镜像,所有用户可见。包含操作系统以及预装的公共应用。请根据您的实际情况自助配置应用环境或相关软件。 私有镜像:用户基于云主机或者外
华为云秉承“将公司对网络和业务安全性保障的责任置于公司的商业利益之上”。针对层出不穷的云安全挑战和无孔不入的云安全威胁与攻击,华为云在遵从法律法规业界标准的基础上,以安全生态圈为护城河,依托华为独有的软硬件优势,构建面向不同区域和行业的完善云服务安全保障体系。 安全性是华为云与您的共同责任,如图1所示。
自定义SLA列表。 图1 SLA列表 单击搜索框,弹出搜索条件列表中选择对应的搜索条件,输入对应的值,单击“回车”即可搜索数据。搜索框后的图标依次支持:刷新列表数据、设置列表展示字段。 图2 筛选SLA规则 单击列表中的“SLA名称”,跳转到“SLA详情”页面。 图3 查看SLA详情
入“中断记录”页面。 图1 中断记录 单击搜索框,弹出搜索条件列表中选择对应的搜索条件,输入对应的值,单击“回车”即可搜索数据。搜索框后的图标依次支持:刷新列表数据、设置列表展示字段。 单击“添加中断记录”,右边弹出添加中断记录弹框,选择对应的数值,添加中断记录。 图2 添加中断记录
选择“公共SLA”页签,进入公共SLA列表界面。 图1 查看SLA列表 单击搜索框,弹出搜索条件列表中选择对应的搜索条件,输入对应的值,单击“回车”即可搜索数据。搜索框后的图标依次支持:刷新列表数据、设置列表展示字段。 图2 检索公共SLA模板 单击列表中的“SLA名称”,跳转到“SLA详情”页面。 图3 查看公共SLA详情
改进事项所属的应用 改进类型 改进事项的类型 改进责任人 改进事项的责任人 期望完成时间 改进事项的期望完成时间 问题现象 问题现象 改进闭环标准 改进事项闭环的标准