检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
作业工单 提供用户查看、操作作业工单的能力。 前提条件 用户下发了执行作业的任务,系统生成对应的作业工单。 操作场景 通过Cloud Operations Center查看作业工单。 操作步骤 登录COC。 在左侧导航栏选择“任务管理 > 执行记录”页面,选择“作业工单”页签。可对作业工单进行“克隆操作”和“
演练规划 操作场景 创建演练规划时您可以指定执行人和计划演练时间,执行人通过接单来创建演练任务,演练任务关联故障模式和区域。 注意事项 演练规划所属的企业项目无需指定,和其关联的故障模式的企业项目保持一致 操作步骤 登录COC。 在左侧菜单栏选择“韧性中心 > 混沌演练”页面,选择“风险管理
资源运维 资源运维概述 批量ECS操作 批量RDS操作 批量FlexusL操作 批量BMS操作
Key):私有访问密钥。与访问密钥ID结合使用,对请求进行加密签名,可标识发送方,并防止请求被修改。 使用AK/SK认证时,您可以基于签名算法使用AK/SK对请求进行签名,也可以使用专门的签名SDK对请求进行签名。详细的签名方法和SDK使用方法请参见API签名指南。 签名SDK只提供签名功能
自动分批:用户选择的待执行机器,会根据默认规则,自动分成多批次。 手动分批:用户可以根据自身需要,手动创建若干批次,然后手动将机器分配到各批次中。 不分批:用户所有待执行的机器会全部在同一批次。 图7 选择分批策略 设置熔断策略。 熔断阈值:用户可以设置执行的成功率,当执行失败的机器数量到达根据成功率计算
帐号管理 账号管理为用户提供针对华为云ECS、RDS、中间件等资源实例的人机帐号密码集中管理能力。多种帐号进行统一收口,避免多资源帐号密码易遗忘、多人知晓密码信息易泄漏等风险,用户可通过帐号管理来获取主机密码 图1 资源帐号管理流程 按照资源帐号管理流程完成相关配置后,方可从帐号管理页面获取到主机密码。
成功率取值范围0~100,可以精确到小数点后一位。 选择需要切换的镜像。 图2 可切换的镜像页面 在“确认执行”弹框中,单击“确定”。 图3 确定执行 查看执行结果。 执行结果为“异常”时,可以通过点击“重试”或“批次重试”尝试重新执行失败的任务或批次。也可以点击“取消”或“批次取消”,跳过异常的任务或批次。
自动分批:用户选择的待执行机器,会根据默认规则,自动分成多批次。 手动分批:用户可以根据自身需要,手动创建若干批次,然后手动将机器分配到各批次中。 不分批:用户所有待执行的机器会全部在同一批次。 输入“熔断策略”。 用户可以设置执行的成功率,当执行失败的机器数量到达根据成功率计算出的失败数量,工单状态会变为异常,并停止执行。
跨账号资源 前置条件 在Cloud Operations Center进行跨账号资源的操作之前,用户需要满足一些前置条件。 用户已经开通组织(Organizations)或已经加入到一个组织中,可到组织的服务页面查看。 图1 组织服务 用户所在组织将COC设置为可信服务,可到组织页面的可信服务查看。
同步资源 提供用户同步资源的能力,资源数据支持页面的条件过滤及字段显示控制。 资源:用户可以在云平台上使用的一种实体。例如:弹性云服务器(ECS)实例、云硬盘(EVS)磁盘、虚拟私有云(VPC)实例等。 同步资源操作:需要当前用户具有rms:resources:list权限。该权
诉求。云运维中心的混沌演练功能支持用户配置演练模板、攻击模板,基于模板对物理机、虚拟机或CCE容器等进行故障演练。支持故障模式管理功能。您可以通过该功能对目标实例进行故障演练。 本章节介绍如何通过云运维中心操作一台弹性云服务器ECS进行CPU使用率加压的故障演练。 操作流程 操作步骤
标实例,单击“提交”。 图6 选择目标实例 选择“分批策略”: 自动分批:用户选择的待执行机器,会根据默认规则,分成多批。 手动分批:用户可以根据自身需要,将待执行的机器,分成若干批,控制机器所在的批次。 不分批:用户所有待执行的机器会全部在同一批次。 图7 选择分批策略 单击“
则进行信息匹配,解析出需要通知的人员、内容和发送通知的渠道,进行发送通知信息,实现了自动通知的功能。 事件和变更的通知模板为系统内置的,您可以根据您的场景选择通知模板。 创建通知 创建通知规则,事件单、问题单和变更单触发对应场景后会自动发送通知。 登录COC。 在左侧导航栏选择“基础配置
Array of strings 企业项目ID,当前只支持1个 最小长度:0 最大长度:255 数组长度:0 - 1 current_cloud_service 是 Array of strings 归属应用ID,当前只支持1个 最小长度:0 最大长度:255 数组长度:0 - 1
海量运维对象、复杂系统非线性等挑战。业务的停机都会给公司带来巨大的经济损失和声誉影响。 在运维过程中引入混沌工程,通过定期进行演练的方式,可以在现网问题发生前识别系统的薄弱点(软件Bug、方案设计不足之处、故障恢复流程卡点等),及早发现系统可用性的问题进行解决,持续提升应用韧性,
跨账号管理 概述 云运维中心服务具备安全可靠的跨账号数据汇聚和资源运维能力,如果您的账号由组织管理,您可以在云运维中心对组织内所有成员账号进行统一的资源管理、自动化运维以及运维态势感知,而无需逐个登录到成员账号。 通过COC对组织成员账号进行跨账号管理需要执行以下操作(以A账号管理B账号为例):
排班场景概述 排班管理中可以设置多种排班,一个排班场景即是一种排班的集合。创建排班场景时,您需要选择对应的排班方式,排班维度。根据您的选择,后续设置排班的方式也会有所区别。 场景角色概述 场景角色是设置排班时的最小单位,一个排班场景中可以创建多个排班角色,在设置排班时可以对每个角色设置不同的值班人。
“纪要录入”页签,可以查看待录入纪要的评审。 图7 PRR待录入纪要的评审 单击 “录入”,进入“PRR评审详情”页面,单击”录入评审结论”,可以进行评审纪要的录入。 图8 PRR详情-录入评审纪要 录入评审纪要。 图9 录入评审纪要 对于需要改进的检查项,可以添加改进事项,单击
作业管理 作业是操作步骤(原子动作)的集合,一个作业可以包含一个或多个操作,例如重启ECS、执行脚本等。 作业管理提供对公共作业、自定义作业的创建、修改、克隆、删除等管理的能力以及在目标实例上执行作业的能力。通过作业管理,用户可以在目标实例执行定义好的特定操作步骤。 执行公共作业 创建自定义作业
完成配置 步骤五:演练报告 演练结束后可以创建演练报告 登录COC。 在左侧菜单栏选择“韧性中心 > 混沌演练”页面,可以查看演练任务列表。 图19 演练任务列表 找到需要查看的演练任务,单击“操作”列“演练记录”,进入演练记录列表。在演练记录列表操作列可以单击“创建报告”,或在操作列单