检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
操作场景 创建问题单后,问题责任人需受理、定位并提交问题解决方案。 受理问题 驳回问题 问题定位出方案中 问题待现网实施 升降级 挂起问题 待验证 父主题: 问题管理
预案管理、故障注入到复盘改进的端到端演练流程。承载华为云SRE在混沌演练上多年的最佳实践,使客户能对云上应用主动地进行风险识别、消减和风险验证,持续提升云应用的韧性。 镜像与武器版本支持声明 COC混沌演练新增了裸金属服务器(BMS)和Flexus应用服务器L实例(HCSS)两种
包括租户委托首次同步租户RMS资源、查询租户的资源信息等 自动化运维 包括自定义脚本的创建、修改、删除、查询等 事件管理 包括事件的创建、处理、验证及查询 集成管理 主要为用户上报自监控系统的告警至COC 补丁管理 包括补丁管理合规性报告查询相关接口
管理员的系统权限“COC FullAccess”。 创建用户并加入用户组 在IAM控制台创建用户,并将其加入1中创建的用户组。 用户登录并验证权限 登录云运维中心COC后,在左侧导航栏选择“任务管理 > 待办中心”,单击右上角“ 创建待办”,尝试创建待办任务,如果无法创建待办任务(假设当前权限仅包含COC
流程管理”页面,单击页面问题流程>问题级别。 图1 问题级别 单击操作列“编辑”修改问题级别和描述。,若某个级别不需要开启可将列表中是否开启的开关关闭。 修改完后可在问题管理页面中查看最新的问题级别。 父主题: 问题流程
流程管理”页面,单击页面事件流程>事件级别。 图1 事件级别 单击操作列“编辑”修改事件级别和描述。,若某个级别不需要开启可将列表中是否开启的开关关闭。 修改完后可在事件管理页面中查看最新的事件级别。 图2 编辑事件级别和描述 父主题: 事件流程
流程管理”页面,单击页面事件流程>事件类别,当前页面显示的为系统预置的事件类别,不支持编辑和删除。 图1 事件类别 若不使用系统预置的事件类别,可将是否开启列表中开关关闭。若需要新增事件类别,单击“新增事件类别”,添加事件类别信息。添加后可在事件管理>创建事件单页面中事件类别查看最新的枚举值。 图2 新建事件类别
流程管理”页面,单击页面变更<br>场景,当前页面显示的为系统预置的问题类型,不支持编辑和删除。 图1 变更场景 若不使用系统预置的变更场景,可将是否开启列表中开关关闭。若需要新增变更场景,单击“新增变更场景”,添加变更场景信息。添加后可在变更管理>变更中心创建变更页面中填写变更类型查看最新的枚举值。 图2
的变更单后,系统会获取变更结果;若部分区域不涉及变更,可点击操作列的“不涉及变更”。 填写完变更信息后,单击右下角的“实施完成”,会走到待验证阶段。 图1 问题关联变更单 父主题: 处理问题
在左侧菜单栏选择“故障管理 > 问题管理”,进入“待我处理”的问题列表页面。 点击问题单名称进入问题详情页面,单击右上角“驳回”,创单人可对问题单重编辑后提交或撤回关闭。 图1 问题单驳回 父主题: 处理问题
问密钥(AK/SK)认证方式进行认证鉴权,即使用Access Key ID(AK)/Secret Access Key(SK)加密的方法来验证某个请求发送者身份。关于访问密钥的详细介绍及获取方式,请参见访问密钥(AK/SK)。 访问控制 COC支持通过IAM权限控制进行访问控制。
网实施”,待现网实施页面需要关联变更单,变更单有回填结果,才能流转至下个步骤。 无需变更的问题或需要变更的问题已有变更结果,问题状态为“待验证”,创建人确认问题是否解决或未解决,未解决可进行驳回。 图1 问题管理操作流程 父主题: 问题管理
流程管理”页面,单击页面事件流程>问题类型,当前页面显示的为系统预置的问题类型,不支持编辑和删除。 图1 问题类型 若不使用系统预置的问题类型,可将是否开启列表中开关关闭。若需要新增问题类型,单击“新增问题类型”,添加问题类型信息。添加后可在问题管理>创建问题页面中问题类型查看最新的枚举值。 图2 问题类型
running_num Long 进行中warroom总数 最小值:0 最大值:9223372036854775807 closed_num Long 已关闭warroom总数 最小值:0 最大值:9223372036854775807 total_num Long warroom总数 最小值:0
从控制台获取项目ID 调用API获取项目ID 项目ID可以通过调用查询指定条件下的项目列表API获取。 获取项目ID的接口为“GET https://{Endpoint}/v3/projects”,其中{Endpoint}为IAM的终端节点,可以从地区和终端节点获取。接口的认证鉴权请参见认证鉴权。
启动云服务器的权限。 √ √ x x coc:instance:reboot 重启云服务器的权限。 √ √ x x coc:instance:stop 关闭云服务器的权限。 √ √ x x coc:instance:reinstallOS 重装弹性云服务器操作系统的权限。 √ √ x x coc:instance:changeOS
coc:instance:start 授予启动云服务器的权限。 coc:instance:reboot 授予重启云服务器的权限。 coc:instance:stop 授予关闭云服务器的权限。 coc:instance:startRDSInstance 授予启用RDS实例的权限。 coc:instance:stopRDSInstance
缺省值:0 最小长度:0 最大长度:256 error_msg String 请求响应描述 最小长度:0 最大长度:256 请求示例 https://coc.myhuaweicloud.com/v1/event/huawei/custom/{integration_key} {
String 错误码 最小长度:8 最大长度:36 error_msg String 错误描述 最小长度:2 最大长度:512 请求示例 https://coc.myhuawei.com/v1/job/scripts/{script_uuid} { "execute_param"
String 错误码 最小长度:8 最大长度:36 error_msg String 错误描述 最小长度:2 最大长度:512 请求示例 https://coc.myhuaweicloud.com/v1/job/scripts/SC2023110211155901a700000 {