检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
演练报告有哪些内容? 演练报告包括演练过程的基本信息、服务恢复能力评分和复盘改进措施,并且能够生成复盘改进工单,确保演练中发现的问题能够落实改进。 父主题: 韧性中心常见问题
获取项目ID的接口为“GET https://{Endpoint}/v3/projects”,其中{Endpoint}为IAM的终端节点,可以从地区和终端节点获取。接口的认证鉴权请参见认证鉴权。 响应示例如下,其中projects下的“id”即为项目ID。 { "projects":
常规变更&紧急变更的区别? 概念上的区别 常规变更(指非紧急、能通过正常程序化的申请、评估、批准、排序、计划、测试、实施和回顾的变更)。 紧急变更(为了处理生产环境不可用或机器不可用、紧急满足业务需求而提出的计划外变更,无法满足计划性要求,或者来不及走正常流程进行评估审批的变更)。
Endpoint 指定承载REST服务端点的服务器域名或IP,不同服务不同区域的Endpoint不同,您可以从地区和终端节点获取。 例如IAM服务在“华北-北京四”区域的Endpoint为“iam.cn-north-4.myhuaweicloud.com”。 resource-path 资源
alarm_id id alarmName 告警名称 alarm_name metadata中的event_name alarmLevel 告警级别,取值有:紧急、重要、次要、提示 AlarmLevel event_severity time 告警发生时间 time starts_at nameSpace
生成事件的流程是什么? 生成事件有三种方式:手动创建事件、告警转事件和通过流转规则自动生成事件,具体介绍如下。 手动创建事件 在故障管理>事件管理创建事件单,具体操作详见创建事件单。 告警转事件 在故障管理>事件管理创建事件单,具体操作详见告警转事件。 流转规则自动生成事件 流转规则自动生成事件,需要做以下步骤:
基于策略对云服务进行操作。 根据授权的精细程度,分为角色和策略。角色以服务为粒度,是IAM最初提供的一种根据用户的工作职能定义权限的粗粒度授权机制。策略以API接口为粒度进行权限拆分,授权更加精细,可以精确到某个操作、资源和条件,能够满足企业对权限最小化的安全管控要求。 COC系统策略说明请参考COC权限管理。
COC混沌演练目前已支持弹性云服务器(ECS)、裸金属服务器(BMS)和Flexus应用服务器L实例(FlexusL)三种探针类武器的攻击对象,并提供了相应的资源类武器和网络类武器供用户演练使用。其中,探针类武器包括体验类、主机资源、主机进程、主机网络模块中的武器。通过集成武器模块和功能,用户可以更准确地模拟真实环境
创建脚本 功能介绍 创建作业脚本:自定义脚本 脚本有标签属性,表示是高危脚本。创建时候不需要对脚本进行是否是高危的二次校验。 进行租户隔离;北向接口创建的脚本,审批人字段不填写,默认不需要审批 约束条件: 脚本名称:同一租户下,脚本名称不能重复,最大字符64个字符,支持中文+字母+数字+下划线。
String 原始告警URL 最小长度:0 最大长度:255 alarmStatus 否 String 告警状态。一般取值为alarm(告警中)和ok(已恢复) 最小长度:0 最大长度:255 枚举值: alarm ok alarmSource 是 String 告警源 最小长度:1 最大长度:255
韧性中心常见问题 混沌演练是什么? 支持哪些攻击场景? 故障模式是什么? 演练规划主要做什么? 故障模式和演练任务的关系? 演练报告有哪些内容?
脚本入参:脚本入参在录入自定义脚本时已预置好参数名称与参数默认值。脚本执行时,脚本入参值支持“手动输入”和“参数仓库”两种方式。“手动输入”方式需要用自行填写参数值;“参数仓库”方式,需要从参数中心选择预置好的参数值,请注意选择参数所在区域、参数名称和参数联动模式。 图1 手动输入脚本参数 图2 参数仓库选择脚本参数
执行公共脚本 操作场景 公共脚本是云运维中心提供的预定义脚本,用户对公共脚本具有只读和执行权限,具备一些常见的功能,如清理磁盘、重置密码、启动或关闭操作系统等。 注意事项 在执行脚本时需要确认是否有目标机所属组件资源权限。 执行公共脚本 登录云运维中心。 在左侧导航栏选择“资源管理
myhuaweicloud.com/v3/auth/projects Content-Type: application/json X-Auth-Token: ABCDEFJ.... 您还可以通过这个视频教程了解如何使用Token认证:https://bbs.huaweicloud.com/videos/101333。
通知管理主要是提供变更、事件、问题等消息通知模板,满足不同阶段和场景的通知诉求。同时支持按需订阅通知,防止信息多,无法获取重要信息。 当产生事件单、问题单、告警单或有变更单时,通知规则会根据事件/问题/告警/变更信息和配置的通知规则进行信息匹配,解析出需要通知的人员、内容和发送通知的方式,进行消息通知,实现了自动通知的功能。
最大长度:36 error_msg String 错误描述 最小长度:2 最大长度:512 请求示例 https://coc.myhuawei.com/v1/job/scripts/{script_uuid} { "execute_param" : { "timeout" :
问题流程 使用场景 实际业务中问题级别、类型、降级和挂起和系统默认的枚举值或流程有差异,可对问题级别、问题分类进行修改,对问题降级和问题挂起的审批配置进行自定义。 问题级别 问题类型 问题审批 父主题: 流程管理
error_msg String 错误描述 最小长度:2 最大长度:512 请求示例 https://coc.myhuaweicloud.com/v1/job/scripts/SC2023110211155901a700000 { "type" : "SHELL", "content"
排班场景管理 使用场景 排班创建后,排班场景和排班角色有变化,可在排场场景管理中增删改查。 创建排班场景操作步骤 登录COC。 在左侧导航栏选择“基础配置 > 排班管理”页面,单击“场景管理”,进入“场景管理”页面。 图1 场景管理 单击“创建排班场景”,创建排班场景。 图2 排班场景列表
故障模式是指应用在运行过程中可能出现的特定类型的问题或失效状态。构建丰富的故障模式库,制定相应的预防和恢复措施,有助于设计更加高可用的应用系统。通过识别潜在的故障,可以针对该故障进行日常演练,验证故障恢复措施和故障影响是否符合预期,为更好地应对各种挑战做好准备。您可以对应用可能发生的故障点进行分