检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
故障模式和演练任务的关系? 故障模式是对云应用进行评估,识别风险,是混沌演练的前提,演练任务将不同的攻击场景组合起来,使用故障注入来模拟对应的故障模式。 父主题: 韧性中心常见问题
生成SLO中断记录需要先设置对应的SLA规则、SLO规则,并且该告警存在对应的SLA记录。 输入备注,单击“确定”,清除告警。 备注可以包含中文字符、英文字母、数字及特殊字符组成,长度不超过100个字符。 父主题: 告警管理
登录云运维中心。 在左侧导航栏选择“韧性中心 > 应用韧性评估”。 单击操作列”查看报告”,查看最新的评估报告详情。 1. 评估报告详情中,给出了识别到的风险项,并给出优化建议。 2. 若您认为部分风险项可以不进行优化,则可在查看评估报告详情中,点击“忽略风险“按钮,将其忽略。 父主题:
托。委托包含的权限可见表1以及表2。 图1 开通COC 表1 ServiceAgencyForCOC包含的权限 权限 权限描述 项目[所属区域] 使用场景 IAM ReadOnlyAccess 统一身份认证服务的只读权限 全局服务 [全局] 人员管理中读取IAM账户下的人员信息 RMS
您可以指定执行人来创建演练规划,执行人通过接单来创建演练任务,演练任务关联故障模式和区域。 登录COC。 在左侧菜单栏选择“韧性中心 > 混沌演练”页面,选择“风险管理 > 演练规划”页签。 图6 演练规划页面 单击“创建演练规划”,选择故障模式,执行人,区域和计划演练时间 ,单击“确认”,即可完成演练规划的创建。
故障模式是指应用在运行过程中可能出现的特定类型的问题或失效状态。构建丰富的故障模式库,制定相应的预防和恢复措施,有助于设计更加高可用的应用系统。通过识别潜在的故障,可以针对该故障进行日常演练,验证故障恢复措施和故障影响是否符合预期,为更好地应对各种挑战做好准备。 操作场景 您可以对应用可能
单击“账号改密 > 改密任务”,进入“改密任务”页面。 设置“定期改密区域”。 单击“选择区域”,勾选需要配置的区域至右选框后,单击“确定”。 配置好后可单击操作列“查看任务详情”,查看配置区域的改密任务。 不需要的区域可单击操作列“删除”。 父主题: 账号管理
案进行应对。 COC混沌演练为用户提供一站式的自动化演练能力,覆盖从风险识别、应急预案管理、故障注入到复盘改进的端到端演练流程。承载华为云SRE在混沌演练上多年的最佳实践,使客户能对云上应用主动地进行风险识别、消减和风险验证,持续提升云应用的韧性。 镜像与武器版本支持声明 COC
约束与限制 云运维中心COC为全局服务,但在部分特殊区域(专属区域、HCSO等)暂不支持,如您有相关需求,请联系COC侧沟通处理。 在使用云运维中心COC时,您需注意以下使用限制,详见表1。 表1 云运维中心使用限制 功能模块 对象 使用限制 公共 补丁/脚本/作业/ECS操作 单个操作任务最多支持选择200台实例。
评估。详情如表1所示。 3. 当前应用韧性评估中,只支持对部分区域内的云服务资源进行评估,若存在其他区域的云服务资源,则会评估失败。详情如表1所示。 表1 应用韧性评估支持的云服务和支持区域 云服务 资源类型 支持区域 弹性云服务器 ECS 云服务器(ecs.cloudservers)
单击上方“点击此处”或“定时运维” ,进入“配置定时任务”页面。 图1 点击此处 填入自动化执行参数,单击“确认配置”。 选择区域后,补丁自动化操作将定时执行该区域中所有Agent正常运行且操作系统为Linux的ECS实例,请自行判断影响范围。 图2 定时任务参数 创建定时任务成功后,
改进管理 改进管理主要是故障处理过程识别到一些改进事项可通过改进单进行跟踪闭环。改进来源包含事件/Warrroom/演练/PRR。 改进管理 父主题: 故障管理
参数仓库已选参数和已选主机实例不能跨Region? 安全生产规则,参数仓库已选参数和已选主机实例不允许跨Region操作,选择实例和参数仓库选择的区域需要一致。 图1 参数仓库 图2 选择实例 父主题: 参数管理常见问题
标签的值可以包含任意语种字母、数字、空格和_ . : / = + - @特殊字符,但首尾不能含有空格,限制长度最长255个字符。 设置“区域”、“目标实例模式”和“作业步骤”。 区域:请选择目标实例所在区域。 目标实例模式:请选择作业步骤和目标实例的执行方式。 所有步骤一致:所有步骤在所有目标实例执行。 每个步
补丁管理当前仅支持能够访问公网的机器,可通过绑定EIP或NAT网关的方式实现,请在功能使用前确认。 在执行补丁管理操作之前,请确认执行机器所在的区域为现支持的区域,操作系统为现补丁管理支持操作系统,机器上具备补丁管理依赖的二方包并且功能无损,否则可能会导致执行失败。 补丁管理现支持操作系统以及版本号表1。
单击“IDC离线资源”。 设置“导入IDC离线资源”。 导入类型:可选项为“物理机”、“虚拟机”、“中间件设备”,只可选择其中一项。 区域:从下拉列表中选择区域。 上传文件:上传Excel表格形式的资源信息。 单击“下载模板”。 下载表格模板录入信息。 单击“添加文件”。 添加录入信息后的表格。
终端节点 终端节点即调用API的请求地址,不同服务不同区域的终端节点不同,您可以从地区和终端节点中查询服务的终端节点。 父主题: 使用前必读
问题管理 问题管理主要是对应用的所有问题单进行管理,通过识别故障的实际和潜在原因、管理规避方案和已知错误,来降低故障再次发生的可能性和影响性。包含问题单的创建、受理、驳回、转单、处理到闭环整个生命周期管理。问题单来源主要有人工创建与北向接口创建。 问题管理同时支持配置SLA规则,若需配置请参考基础配置-SLA管理。
参数说明 参数名称 参数说明 待办名称 必选参数。 只能由中文字符、英文字母、数字及“_”、“-”、“.”组成,长度不超过255字符。 以中文字符、英文字母、数字开头 不能以“.”结尾 待办描述 必选参数。 可输入中文字符、英文字母、数字及特殊字符,长度不超过1000字符 类型 必选参数。
告警管理”,选择“汇聚告警 > 当前告警”页签,查看集成告警列表信息。 在集成告警列表中勾选告警单,单击“转事件”或“批量转事件”。 相同区域的告警才能批量转事件。 输入事件相关信息,单击“确定” 图1 告警转事件 事件的参数说明,参考创建事件。 父主题: 告警管理