检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
随着传统IT基础设施运维向云服务运维方式的转变,传统的运维手段面临服务间调用复杂、应用迭代速度快、海量运维对象、复杂系统非线性等挑战。业务的停机都会给公司带来巨大的经济损失和声誉影响。 在运维过程中引入混沌工程,通过定期进行演练的方式,可以在现网问题发生前识别系统的薄弱点(软件Bug、方案设计
手动关联资源 提供用户在对应分组下来关联资源的能力,将对应资源数据关联至某一应用的分组内进行管理。 操作场景 通过Cloud Operations Center关联资源到应用下的指定分组中。 操作步骤 登录COC。 在左侧菜单栏选择“资源管理 > 应用资源管理”,进入“应用资源管
对应API接口:自定义策略实际调用的API接口。 授权项:自定义策略中支持的Action,在自定义策略中的Action中写入授权项,可以实现授权项对应的权限功能。 依赖的授权项:部分Action存在对其他Action的依赖,需要将依赖的Action同时写入授权项,才能实现对应的权限功能。 IAM
强制结束:单击“强制结束”,将结束本次作业的所有执行任务。 结束所有批次:单击“结束所有批次”,将结束当前步骤所有批次的执行任务。 取消:单击“取消”,将结束单台实例的执行任务。 编辑标签:可按照标签管理中的步骤,对作业工单的标签进行编辑。 图3 操作作业工单 单击“输入”页签,查询当前选中作业的基本信息以及自定义原子任务的脚本内容。
单击“+添加实例”,选择待执行实例的区域,根据实例名称、UniAgent状态等条件筛选并选中目标实例,单击“提交”。 图6 选择目标实例 选择“分批策略”: 自动分批:用户选择的待执行机器,会根据默认规则,分成多批。 手动分批:用户可以根据自身需要,将待执行的机器,分成若干批,控制机器所在的批次。 不分
执行公共脚本 提供用户执行服务提供的公共脚本的能力。 公共脚本说明:COC提供的预定义脚本,用户对公共脚本具有只读和执行权限,具备一些常见的功能,如清理磁盘。 操作场景 通过Cloud Operations Center执行服务提供的公共脚本。 注意事项 在执行脚本时需要确认是否有目标机所属组件资源权限。
终端节点 终端节点即调用API的请求地址,不同服务不同区域的终端节点不同,您可以从地区和终端节点中查询服务的终端节点。 父主题: 使用前必读
Warroom是什么? 为快速恢复业务的运作机制,支撑运维、研发、运营联合作战,保障业务快速恢复而组建的会议。已受理的事件可以启动Warroom,具体参考启动WarRoom。 Warroom使用指导,请参考WarRoom管理。 父主题: 故障管理常见问题
选择一个状态为“异常”的脚本工单,单击对应的“脚本名称”,进入“脚本工单详情”页面。 图2 选择异常的脚本工单 单击“强制结束”,结束异常脚本工单。 图3 操作异常的脚本工单 选择一个状态为“执行中”的脚本工单,单击对应的“脚本名称”,进入“脚本工单详情”页面。 图4 选择执行中的脚本工单
在人员管理页面管理当前租户下的用户,人员管理中的用户从 IAM 同步,人员管理页面的数据作为云运维中心的用户基础数据,供创建待办、定时运维、通知管理、事件中心等多个功能模块使用。 人员管理页面可以手动选择需要的用户进行编辑、删除、请求订阅。 对已添加的用户在编辑时,若填写了手机号
快速配置中心 COC快速配置中心面向华为云全局云服务提供场景化的集中配置入口,通过最佳实践的极简配置实现多区域、多账号、定时的自动化操作,为后续运维降低操作门槛。 操作场景 通过快速配置中心进行不同场景资源的快捷配置。 云运维中心配置 登录COC。 进入COC“总览”后,可以看到快速配置中心。
查看资源详情 提供用户查看资源详情的操作。 操作场景 通过Cloud Operations Center查看已关联应用的资源详情。 操作步骤 登录COC。 在左侧菜单栏选择“资源管理 > 应用资源管理”,进入“应用资源管理”页面,选择“应用管理”页签,在“弹性云服务器ECS”模块
填写脚本基本信息,确认脚本风险等级,并选择脚本归属的企业项目。 图2 填写信息 填写脚本内容,可选择脚本类型为shell脚本、python脚本或者bat脚本,并对脚本内容进行高危命令校验。 脚本内容首行自动添加的解释器,例如#!/usr/bin/python需要用户的机器让有python的软链接,若缺乏软链接
单击“创建演练规划”,选择故障模式,执行人,区域和计划演练时间 ,单击“确认”,即可完成演练规划的创建。 图2 创建演练规划 演练规划指定的执行人在演练规划列表操作项里单击“接单”,进入创建演练任务页面,演练任务关联选择的故障模式和区域。并且可以对后续的演练任务进度进行跟踪。 图3 通过演练规划接单进入创建演练任务页面
等待API结果 该原子动作可以用来等待目标对象达到预期的状态。如通过执行API原子动作调用ECS的StartServer接口后,再通过等待API结果原子动作调用ECS的ShowServer接口,直到接口响应中的状态变为ACTIVE,即状态为运行中,才判定ECS实例已经启动成功。 操作步骤
资源操作工单列表 状态:已暂停、创建中、执行中、已取消、成功、异常 单击“ID”列对应的“资源操作工单ID”,可查询到对应工单详情。 当工单的状态是暂停状态时,单击“继续”,可以让工单继续。 当工单的状态为执行中时,单击“暂停”,可以让工单暂停。 当工单状态为非完成状态时,单击“强制结束”,可以让工单停止。
获取项目ID 操作场景 在调用接口的时候,部分URL中需要填入项目ID,所以需要获取到项目ID。有如下两种获取方式: 调用API获取项目ID 从控制台获取项目ID 调用API获取项目ID 项目ID可以通过调用查询指定条件下的项目列表API获取。 获取项目ID的接口为“GET https:
概述 流转规则将所有接收的集成原始告警进行去重操作,支持每个流转规则配置事件时默认分配对象&通知策略,从而实现更准确的通知。 父主题: 流转规则
手动分批:用户可以根据自身需要,手动创建若干批次,然后手动将机器分配到各批次中。 不分批:用户所有待执行的机器会全部在同一批次。 输入“熔断策略”。 用户可以设置执行的成功率,当执行失败的机器数量到达根据成功率计算出的失败数量,工单状态会变为异常,并停止执行。 成功率取值范围0~100,可以精确到小数点后一位。
手动分批:用户可以根据自身需要,手动创建若干批次,然后手动将机器分配到各批次中。 不分批:用户所有待执行的机器会全部在同一批次。 输入“熔断策略”。 用户可以设置执行的成功率,当执行失败的机器数量到达根据成功率计算出的失败数量,工单状态会变为异常,并停止执行。 成功率取值范围0~100,可以精确到小数点后一位。