检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
WarRoom启动后,可以添加新的受影响的应用,本节介绍如何新增WarRoom中的影响应用。 操作步骤 登录COC。 左侧菜单栏选择“故障管理 > WarRoom”,可以查看WarRoom列表信息。 单击WarRoom列表中WarRoom名称,进入对应的“WarRoom详情”页面。 在“故障影响”模块,单击“新
成功率取值范围0~100,可以精确到小数点后一位。 单击“提交”。 图2 重启展示操作页 在“确认执行”弹框中,单击“确定”。 图3 确认执行 查看执行结果。 图4 查看结果 执行结果为“异常”时,可以通过点击“重试”或“批次重试”尝试重新执行失败的任务或批次。也可以点击“取消”或“批次取消”,跳过异常的任务或批次。
字段说明: 执行账号:即租户账号名,可以通过我的凭证页面查看。 图7 查看账号名 执行区域:执行的目标对象所在的区域 委托名称:IAM中委托对象的名称 图8 获取委托名称 项目ID:IAM中的项目概念,执行的目标对象所在的项目的ID 图9 查看项目 图10 获取项目ID 填写执行基本信息,
作业,完成后单击“提交”;应急预案为文本预案,根据对应的步骤执行后,单击“提交”。 图4 执行应急预案页面 处理事件过程可查看事件关联的原始告警。 图5 查看事件关联告警信息 事件处理完后,可单击“事件处理”,填写事件处理结果。 填写事件处理信息后,单击“提交”。 图6 事件处理详情
强制重启会导致云服务器中未保存的数据丢失,请谨慎操作。 单击“提交”。 图2 重启展示操作页 在“确认执行”弹框中,单击“确定”。 图3 确认执行 查看执行结果。 图4 查看结果 执行结果为“异常”时,可以通过点击“重试”或“批次重试”尝试重新执行失败的任务或批次。也可以点击“取消”或“批次取消”,跳过异常的任务或批次。
在左侧菜单栏选择“韧性中心 > 混沌演练”页面,可以查看演练任务列表。 图19 演练任务列表 找到需要查看的演练任务,单击“操作”列“演练记录”,进入演练记录列表。在演练记录列表操作列可以单击“创建报告”,或在操作列单击“进度查看”,进入演练记录详情页,在右侧单击“创建演练报告”。
成功率取值范围0~100,可以精确到小数点后一位。 单击“提交”。 图2 重启展示操作页 在“确认执行”弹框中,单击“确定”。 图3 确认执行 查看执行结果。 图4 查看结果 执行结果为“异常”时,可以通过点击“重试”或“批次重试”尝试重新执行失败的任务或批次。也可以点击“取消”或“批次取消”,跳过异常的任务或批次。
成功率取值范围0~100,可以精确到小数点后一位。 单击“提交”。 图2 关机展示操作页 在“确认执行”弹框中,单击“确定”。 图3 确认执行 查看执行结果。 图4 查看结果 执行结果为“异常”时,可以通过点击“重试”或“批次重试”尝试重新执行失败的任务或批次。也可以点击“取消”或“批次取消”,跳过异常的任务或批次。
成功率取值范围0~100,可以精确到小数点后一位。 单击“提交”。 图2 关机展示操作页 在“确认执行”弹框中,单击“确定”。 图3 确认执行 查看执行结果。 图4 查看结果 执行结果为“异常”时,可以通过点击“重试”或“批次重试”尝试重新执行失败的任务或批次。也可以点击“取消”或“批次取消”,跳过异常的任务或批次。
成功率取值范围0~100,可以精确到小数点后一位。 单击“提交”。 图2 关机展示操作页 在“确认执行”弹框中,单击“确定”。 图3 确认执行 查看执行结果。 图4 查看结果 执行结果为“异常”时,可以通过点击“重试”或“批次重试”尝试重新执行失败的任务或批次。也可以点击“取消”或“批次取消”,跳过异常的任务或批次。
如果资源无法在资源管理页面中查询到,如何处理? 在资源管理页面中进行同步资源。具体操作详见同步资源。 父主题: 资源管理常见问题
SLO(服务等级目标,Service Level Object),SLO管理目前对接Warroom、故障、告警等功能,自动化地完成SLO的计算,为SLO看板大屏提供数据。 查看SLO SLO指标配置 SLO中断记录 父主题: 基础配置
汇聚告警 登录COC。 在左侧菜单栏单击“故障管理 > 告警管理”,可以查看汇聚告警或原始告警列表信息。 在汇聚告警搜索框中输入告警单号、集成告警名称,“回车”进行搜索。 汇聚告警包含当前告警和历史告警。 图1 告警列表 处理告警 告警转事件 清除告警 历史告警 父主题: 告警管理
图1 问题级别 单击操作列“编辑”修改问题级别和描述。,若某个级别不需要开启可将列表中是否开启的开关关闭。 修改完后可在问题管理页面中查看最新的问题级别。 父主题: 问题流程
操作步骤 登录COC。 在左侧菜单栏中选择“资源运维”,单击“自动化运维” ,单击“补丁管理”,进入“补丁管理”页面。 选择“补丁扫描”页签,查看合规性报告列表。 图1 合规性报告列表 单击“创建扫描任务”。 图2 创建扫描任务 单击“添加实例”。 图3 选择实例 选择需要进行扫描的ECS/CCE/BMS实例。
理。SLO总体达成情况可查看年度和月度的总体SLO情况,评估整体的服务水平趋势。应用维度SLO支持按照时间和应用维度查看SLO情况,评估每个应用的服务水平。ErrorBuget根据应用的SLO情况计算出错误成本,用以指导变更或其他高风险操作。指标详情可查看表5。 图8 SLO看板
运维事务中心 提供用户查询、跟踪运维待办事项的能力。 操作场景 通过Cloud Operations Center查询、跟踪运维待办事项。 操作步骤 登录COC。 进入COC“总览”后,左上角可以查询到待处理事件、待处理告警、我的待办的统计数量。 图1 运维事务跟踪 单击“待处理
时间段,您需要在N个时间段内分别设置每个角色对应的责任人。 责任人可以选择多个。 排班创建好后,在“排班”页面,选择排班场景和时间段,可以查看排班中的人员。 应用排班+固定班次场景 使用场景:适用不同应用,排班人员是全天固定的。 前置条件:“应用排班”您需要先在应用管理中创建您的应用。
图1 资源帐号管理流程 按照资源帐号管理流程完成相关配置后,方可从帐号管理页面获取到主机密码。 密钥管理 帐号基线 改密策略 改密任务 查看帐号密码 父主题: 自动化运维
若不使用系统预置的问题类型,可将是否开启列表中开关关闭。若需要新增问题类型,单击“新增问题类型”,添加问题类型信息。添加后可在问题管理>创建问题页面中问题类型查看最新的枚举值。 图2 问题类型 父主题: 问题流程