单击“确定”。 完成改进单转发。 验证改进单验证 登录云运维中心。 在左侧导航栏选择“故障管理 > 改进管理”。 在“待处理的”页签,选择需要验证的改进单,单击改进单标题。 单击右上方“验证”。 设置“结论验证”。 表3 结论验证参数说明 参数 说明 改进验证 可选项“通过”、“驳回”。
填写集成系统的简称和全称,单击“确认集成”。 集成自建监控系统告警。 告警管理数据,当前支持POST方式集成,具体参考自建监控系统上报告警。 验证集成是否成功。 在左侧导航栏选择“故障管理 > 集成管理”,在“已集成”中查看到应用运维管理监控源状态为“已接收报警”则说明已集成成功。
获取服务器密码对列表 ecs:serverKeypairs:list 重装、切换操作系统,查询密码对列表 批量关闭云服务器 ecs:cloudServers:stop 资源运维中批量关闭云服务器 批量重启云服务器 ecs:cloudServers:reboot 资源运维中批量重启云服务器
rRoom状态,便于记录故障恢复的时间节点,同时了解故障当前的进展。WarRoom状态包含启动WarRoom、故障定界和恢复、故障已恢复和关闭。 WarRoom状态 登录云运维中心。 在左侧导航栏选择“故障管理 > WarRoom”。 可以查看WarRoom列表信息。 单击需要查看的WarRoom标题。
倒换。 网络:通过对主机或集群注入网络故障,验证服务的容灾能力,如链路层网络丢包、网络时延、闪断等。 容灾:通过对主机或集群注入网络故障,验证服务的容灾能力,如链路层网络丢包、网络时延、闪断等。 容器:通过对主机或集群注入网络故障,验证服务的容灾能力,如链路层网络丢包、网络时延、闪断等。
自定义故障 操作场景 创建故障模式,可以针对潜在的故障进行日常演练,验证故障恢复措施和故障影响是否符合预期,为更好地应对各种挑战做好准备。 注意事项 由于自定义故障完全由您编写的脚本决定,所以在使用脚本对弹性云服务器 (ECS)进行攻击时,可能会导致资源使用率飙高、网络发生故障等异常现象,从而存在将弹性云服务器
使用应用诊断检查故障恢复情况和应用状态,故障恢复后需在修改故障信息填写故障基本信息。 关闭WarRoom:确认故障已闭环,需要关闭WarRoom。 注意:填写修改故障信息中所有必填的故障信息才可以关闭WarRoom。 另外: 故障处理过程中如果需要增加相关成员并拉入群组,请参考与会成员操作。
选择需要查看的事件审批,单击操作列“查看详情”。 查看审批配置详情。 开启/关闭事件审批 登录云运维中心。 在左侧导航栏选择“基础配置 > 流程管理”。 单击“事件流程 > 事件审批”。 选择需要开启/关闭的事件审批,单击是否开启列开关。 调整事件审批的开启/关闭状态,关闭后会取消当前事件审批。 新建事件审批 审批
故障复盘 操作场景 事件验证通过后,会根据故障复盘规则自动生成故障报告,在故障报告基础上对本次故障进行复盘,避免故障再次发生。故障复盘信息包含有故障现象、故障影响、故障处理过程、根因分析、解决方案,同类故障、改进措施等15种以上分析项。 系统默认P1/P2/P3/P4级别的事件和
事件管理 创建事件单 受理事件单 提交事件单解决方案 验证事件处理结果 查询事件单详情 事件相关枚举信息 父主题: 故障管理
问题管理 概述 创建问题 驳回问题 重新提交问题 撤销问题 转发问题 受理问题 升降级 挂起问题 问题定位出方案 问题待现网实施 验证问题 问题处理记录 父主题: 故障管理
执行公共脚本 操作场景 公共脚本是云运维中心提供的预定义脚本,用户对公共脚本具有只读和执行权限,具备一些常见的功能,如清理磁盘、重置密码、启动或关闭操作系统等。 注意事项 在执行脚本时需要确认是否有目标机所属组件资源权限。 执行公共脚本 登录云运维中心。 在左侧导航栏选择“资源运维 >
实施保障:按预定方案执行变更,变更步骤标准化、可观测,变更异常及时介入处理,实现变更实施全过程可控、可视、可管。 确定性故障管理 统一事件中心:提供事件发现、事件处理、恢复验证及持续改进的全流程标准化机制。 承载Warroom和故障回溯能力:现网事件智能启动Warroom,缩短故障处理非必要耗时,指挥中心实时观测
事件管理 概述 创建事件 驳回事件 重新开启事件 转发事件 受理事件 升降级 添加备注 启动WarRoom 处理事件 验证事件 事件创建改进单 故障复盘 应用诊断 事件历史记录 父主题: 故障管理
管理员的系统权限“COC FullAccess”。 创建用户并加入用户组 在IAM控制台创建用户,并将其加入1中创建的用户组。 用户登录并验证权限 登录云运维中心COC后,在左侧导航栏选择“任务管理 > 待办中心”,单击右上角“ 创建待办”,尝试创建待办任务,如果无法创建待办任务(假设当前权限仅包含COC
户。详细的退订规则请参见云服务退订规则概览。 如果您已开启“自动续费”功能,为避免继续产生费用,请在自动续费扣款日(默认为到期前7日)之前关闭自动续费。 按需计费资源 暂不涉及 父主题: 计费说明
包括租户委托首次同步租户RMS资源、查询租户的资源信息等 自动化运维 包括自定义脚本的创建、修改、删除、查询等 事件管理 包括事件的创建、处理、验证及查询 集成管理 主要为用户上报自监控系统的告警至COC 补丁管理 包括补丁管理合规性报告查询相关接口
在“日常运维”模块单击“脚本管理”。 在“自定义脚本”页签,单击“审批配置”。 配置“审批配置”。 表1 审批配置参数说明 参数 说明 入库人工审核 默认关闭。关闭时无需配置其他参数,开启后影响创建自定义脚本参数配置。 开启后在后续创建脚本中,若选择了审批配置中勾选的风险等级,将会强制开启入库人工审核。
在“日常运维”模块单击“作业管理”。 在“自定义作业”页签,单击“审批配置”。 配置“审批配置”。 表1 审批配置参数说明 参数 说明 入库人工审核 默认关闭。关闭时无需配置其他参数,开启后影响创建自定义作业参数配置。 开启后在后续创建作业中,若选择了审批配置中勾选的风险等级,将会强制开启入库人工审核。
问密钥(AK/SK)认证方式进行认证鉴权,即使用Access Key ID(AK)/Secret Access Key(SK)加密的方法来验证某个请求发送者身份。关于访问密钥的详细介绍及获取方式,请参见访问密钥(AK/SK)。 访问控制 COC支持通过IAM权限控制进行访问控制。
您即将访问非华为云网站,请注意账号财产安全