检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
OS诊断插件仅支持部分操作系统,详情请见下表: 表1 OS诊断插件支持的操作系统 机器架构 操作系统(OS)类型 OS诊断插件(holmes-agent)是否支持 (Y:支持;N:不支持) X86 Huawei Cloud EulerOS Huawei Cloud EulerOS
步骤二:应急预案 选择要注入故障的目标机器所属应用 登录COC。 在左侧菜单栏选择“韧性中心 > 应急预案”页面,选择“自定义预案”页签,单击“创建应急预案”。 图4 应急预案页面 填写应急预案基本信息。
安装探针步骤会在目标机器上部署一个探针,该探针将会运行在系统中用于接收攻击、查询和清除等步骤的武器命令。在演练结束或终止操作后,清理环境步骤将停止其在系统中的所有操作并移除。
先填写攻击任务名称,攻击目标来源选择选择弹性云服务器 (ECS),在下方列表里选择对应的机器,单击“下一步”。 图1 选择攻击目标为弹性云服务器 (ECS) 攻击场景选择“自定义故障 > 自定义脚本”。
告警转事件 操作场景 当汇聚告警生成后,用户可以通过云运维中心将指定汇聚告警转为事件。转为事件后会生成相应的事件单,在关联事件单号列显示生成的实际单号。点击事件单号查看事件单详情,可以对事件单进行受理、驳回、转单、处理等操作。 注意事项 只有责任人可以将当前告警转为事件。 操作步骤
创建事件 操作场景 云运维中心提供了多种方式生成事件来记录故障。如果汇聚告警工单转事件和原始告警触发自动生成事件两种被动生成事件的方式不满足您的业务需求,您还可以通过手动创建事件功能来记录。 前提条件 需要先在应用管理中创建您的应用。 注意事项 确认事件单的内容,并如实填写事件等级
查询实例详情 操作场景 生成的云产品实例,可以在服务目录下查看详情,包括实例的基本信息、生成实例的日志事件和资源详情。 前提条件 确保您登录的账号拥有终端用户的权限,终端用户权限账号需加入COCServiceCatalogEndUserFullAccessPolicy策略。 查询实例详情
启动产品 操作场景 启动产品会根据产品模板内容生成相应的云产品资源。启动产品前需要管理员配置产品组合和产品,并对终端用户授权。 注意事项 生成云产品资源可能会产生相应的费用,具体根据各个云产品的实际情况计费。 前提条件 确保您登录的账号拥有终端用户的权限,终端用户权限账号需加入COCServiceCatalogEndUserFullAccessPolicy
演练报告有哪些内容? 演练报告包括演练过程的基本信息、服务恢复能力评分和复盘改进措施,并且能够生成复盘改进工单,确保演练中发现的问题能够落实改进。 父主题: 韧性中心常见问题
脚本工单 操作场景 执行脚本后会生成一条脚本工单记录,记录脚本执行的结果。若您需要跟踪和记录脚本的执行对象及执行结果,可通过脚本工单功能查看。 操作步骤 登录COC。 在左侧导航栏选择“任务管理 > 执行记录”页面,选择“脚本工单”页签。 图1 选择脚本工单 选择一个状态为“异常”
概述 服务目录功能基于RFS(资源编排服务)提供的资源编排能力,一方面设置符合需求云服务资源组合的产品,快速根据产品生成对应的云资源;另一方面实现帮助用户快速部署云资源,协助用户对资源的合规性进行管理。 计费说明 产品组合和产品构成了一个或多个云产品的启动模板,启动产品后生成的云产品实例
创建新版本 操作场景 产品创建后,默认生成一个基础产品版本。如果管理员需要更新产品的模板内容,可以创建产品的新版本。 前提条件 确保您登录的账号拥有管理员的权限,管理员权限账号需加入COCServiceCatalogAdminFullAccessPolicy策略。 创建新版本 登录云运维中心
删除实例 操作场景 启动产品生成实例后,如果需要删除,请按如下操作进行。 前提条件 确保您登录的账号拥有终端用户的权限,终端用户权限账号需加入COCServiceCatalogEndUserFullAccessPolicy策略。 删除实例 登录云运维中心。 在左侧导航栏选择“资源管理
处理告警 操作场景 当汇聚告警生成后,用户可以通过云运维中心快速处理,执行响应方案,支持作业、脚本两种方式。 注意事项 只有责任人可以处理当前告警。 处理告警 登录云运维中心。 在左侧导航栏选择“故障管理 >告警管理”。 单击“汇聚告警 > 当前告警”。 选择需要处理的告警,单击操作列
资源操作工单 前提条件 用户使用ECS操作、RDS操作、BMS操作、FlexusL操作等,系统生成对应的工单。 操作场景 在“资源运维 > 资源批量操作”中执行批量操作任务后,若您需要跟踪和记录任务的执行对象及执行结果,可以在“任务管理 > 执行记录 > 资源操作工单”页面查看。
SLO中断记录 操作场景 用户可以通过此页面查看、添加和修正SLO中断记录。 支持添加SLI指标、WarRoom、告警单、事件单和其他,共5类来源的SLO中断记录。其中告警单和事件单,若有SLA记录,且产生业务中断的,则会自动生成中断记录,规则示例可参考告警单SLO中断记录;其余3
SLA记录 操作场景 若客户账号下有启用状态的SLA规则,且有对应的工单触发SLA规则,则会在SLA记录页面生成一条记录,用户可以在此页面查看SLA记录详情,例如工单ID,SLA状态,SLA规则(公共SLA或者用户创建的自定义SLA)等。 查看SLA记录 登录COC。 在左侧菜单栏选择
排班场景管理 使用场景 排班创建后,排班场景和排班角色有变化,可在排场场景管理中增删改查。 创建排班场景操作步骤 登录COC。 在左侧导航栏选择“基础配置 > 排班管理”页面,单击“场景管理”,进入“场景管理”页面。 图1 场景管理 单击“创建排班场景”,创建排班场景。 图2 排班场景列表
概述 告警管理功能提供告警数据的收集、纳管和处理。 本功能支持集成多个现有或第三方等监控系统(比如CES、AOM、Prometheus),并将业务下分散的告警信息进行统一收集,生成原始告警。用户可以在集成管理处启用或禁用已有告警源,或者接入第三方监控系统。 本功能还支持汇聚告警的管理
创建流转规则 操作场景 用户通过流转规则可以实现事件、告警等规则的自定义配置。通过配置流转规则,将原始告警转成汇聚告警或事件。 前提条件 配置流转规则前,您需要确保集成管理配置流转规则的监控源已成功接入集成。 创建规则 登录云运维中心。 在左侧导航栏选择“故障管理 > 流转规则”。