检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
通过接单来创建演练任务,演练任务关联故障模式和区域。 注意事项 演练规划所属的企业项目无需指定,和其关联的故障模式的企业项目保持一致。 操作步骤 登录COC。 在左侧菜单栏选择“韧性中心 > 混沌演练”页面,选择“演练规划”页签。 图1 演练规划页面 单击“创建演练规划”,选择故障模式,执行人,区域和计划演练时间
脚本工单 操作场景 执行脚本后会生成一条脚本工单记录,记录脚本执行的结果。若您需要跟踪和记录脚本的执行对象及执行结果,可通过脚本工单功能查看。 操作步骤 登录COC。 在左侧导航栏选择“任务管理 > 执行记录”页面,选择“脚本工单”页签。 图1 选择脚本工单 选择一个状态为“异常”的脚本
事件审批 操作场景 系统提供的事件暂停和事件降级默认流程,支持用户自定义事件暂停和降级审批流程,流程修改后可在事件处理页面发起申请和审批。 操作步骤 登录COC。 在左侧导航栏选择“基础配置 > 流程管理”页面,单击页面事件流程>事件审批,可配置事件降级和事件暂停的审批流程。系统默认事件降级无需审批,无事件暂停能力
资源运维 对象存储服务 资源运维中,支持对弹性云服务器进行文件上传和分发,如需使用文件传输能力,需要在对象存储服务中购买存储桶。 执行公共脚本 华为云Flexus云服务 资源运维中,可以对Flexus应用服务器L实例进行批量操作、脚本执行、作业执行、定时任务等运维操作。混沌演练中,支持对
通知方式:添加“删除前通知”或“未修改通知”时需要设置,在下拉列表选择通知方式。按照通知人员预留的信息进行通知,设置通知人员信息详细操作请参考编辑用户信息操作步骤。 通知用户:添加“删除前通知”或“未修改通知”时需要设置,在下拉列表选择通知用户。配置用户详细操作请参考人员管理。 修改的通知时间若是相对时间,则需要注意以下事项:
组件名称 根据命名规则,自定义组件的名称。 测试组件 分组名称 根据命名规则,自定义分组的名称。 测试分组 云厂商 请选择目标实例所在云厂商。 华为云 资源关联方式 请选择资源关联方式。 手动关联:用户在对应分组下,手动将对应资源数据关联至分组内进行管理。 智能关联:用户通过企业项目和标
创建排班 使用场景 事件、变更等场景需获取排班中的人员作为责任人,可通过创建排班场景及角色进行人员管理。 操作步骤 登录COC。 在左侧导航栏选择“基础配置 > 排班管理”页面,单击右上角的“创建排班”。 图1 排班管理页面 进入“创建排班”页面,可以填写排班场景信息,并添加排班
前提条件 1、需要先在应用管理中创建您的应用。 2、需要在排班管理创建变更审批人的排班。 注意事项 确认变更单内容,按实际变更需求申请变更单。 操作步骤 登录COC。 在左侧菜单栏选择“变更管理 > 变更中心”,进入“变更中心”页面,单击“创建变更单”。 图1 创建变更单 填写变更单基本信息和变更配置。
通知方式:添加“删除前通知”或“未修改通知”时需要设置,在下拉列表选择通知方式。按照通知人员预留的信息进行通知,设置通知人员信息详细操作请参考编辑用户信息操作步骤。 通知用户:添加“删除前通知”或“未修改通知”时需要设置,在下拉列表选择通知用户。配置用户详细操作请参考人员管理。 删除前通知和未修改通知规则。
等字段建立故障模式,并将该故障模式应用于日常的混沌演练。 注意事项 确认故障模式所属的企业项目、所属应用、事件级别、场景分类是否正确。 操作步骤 登录COC。 在左侧菜单栏选择“韧性中心 > 混沌演练”页面,选择“ 故障模式”页签,单击“创建故障模式”。 图1 故障模式页面 参考表1
批量ECS资源切换镜像报错如何处理? 工单执行报错"code":"Ecs.0021","message":"Failed to check Cinder quotas because the number of Gigabytes exceeded the upper limit
单击“确定”。 若需要添加新的攻击任务,请参考后续步骤。 表2 添加新的攻击任务参数说明 参数 说明 示例 云厂商 请选择云厂商类型。 华为云 攻击目标来源 请选择目标实例的来源。 云容器引擎 (CCE)支持通过选择实例、指定pod、指定数量方式选择攻击目标。 弹性云服务器(ECS)
结束时间); (4)变更单必须点击【变更开始】 开启工单提权后,北向接口无法使用。例如执行脚本开启工单提权,北向调用脚本接口无法使用。 操作步骤 登录COC。 在左侧菜单栏选择“变更管理 > 变更管控”页面,启用工单授权默认关闭,若需启用工单授权点击开启即可。 开启后列表显示CO
补丁操作出现lsb_release not found异常如何处理? 1.请确认ECS实例上有是否有lsb_release命令包,若没有,则安装相应命令包。 2.若ECS实例上有lsb_release命令包,则确认使用的UniAgent版本是否高于1.1.0版本,若高于1.1.0则降UniAgent版本为1
发,按照风险分析、应急预案、演练执行、复盘改进4个维度,提供端到端混沌演练能力; 沉淀故障模式:首创基于容错视角的故障场景分析方法,沉淀华为云SRE多年的故障模式库,内置300个+典型故障模式。 图1 全旅程混沌工程 风险分析:分析应用架构,找出风险点。 应急预案:针对风险点,制定应急预案。
执行公共作业 操作场景 公共作业是云运维中心提供的预定义作业,用户对公共作业具有只读和执行权限,作业管理提供基础的公共作业列表,支持在目标资源执行公共作业。 注意事项 在执行公共作业前需要确认是否拥有目标实例的资源权限。 执行公共作业 登录云运维中心。 在左侧导航栏选择“资源管理
执行自定义作业 操作场景 自定义作业配置完成后,若需要执行自定义作业,请按如下操作进行。 注意事项 在执行作业前需要确认是否拥有目标实例的资源权限。 执行自定义作业 登录云运维中心。 在左侧导航栏选择“资源管理 > 自动化运维”。 在“日常运维”模块单击“作业管理”。 在“自定义
生成事件的流程是什么? 生成事件有三种方式:手动创建事件、告警转事件和通过流转规则自动生成事件,具体介绍如下。 手动创建事件 在故障管理>事件管理创建事件单,具体操作详见创建事件单。 告警转事件 在故障管理>事件管理创建事件单,具体操作详见告警转事件。 流转规则自动生成事件 流转规则自动生成事件,需要做以下步骤:
跨账号管理 概述 云运维中心服务具备安全可靠的跨账号数据汇聚和资源运维能力,如果您的账号由组织管理,您可以在云运维中心对组织内所有成员账号进行统一的资源管理、自动化运维以及运维态势感知,而无需逐个登录到成员账号。 通过COC对组织成员账号进行跨账号管理需要执行以下操作(以A账号管理B账号为例):
查看审计日志 支持审计的COC操作 通过云审计服务,您可以记录与云运维中心服务相关的操作事件,便于日后的查询、审计和回溯。支持审计的关键操作如表1所示。 表1 支持审计的关键操作列表 操作名称 资源类型 事件名称 创建warroom WarRoom createWarRoom 创建起会规则