检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
混沌演练是什么? 混沌演练是通过主动在系统中模拟软件或硬件故障,并根据系统在各种压力下的表现行为确定优化策略的一种系统韧性保障手段。一个完整的混沌演练包括前期的故障模式分析,中期的故障注入和后期的复盘改进。 父主题: 韧性中心常见问题
常规变更&紧急变更的区别? 概念上的区别 常规变更(指非紧急、能通过正常程序化的申请、评估、批准、排序、计划、测试、实施和回顾的变更)。 紧急变更(为了处理生产环境不可用或机器不可用、紧急满足业务需求而提出的计划外变更,无法满足计划性要求,或者来不及走正常流程进行评估审批的变更)。
创建变更单 操作场景 通过Cloud Operations Center 创建一个变更单。 前提条件 1、需要先在应用管理中创建您的应用 2、需要在排班管理创建变更审批人的排班 注意事项 确认变更单内容,按实际变更需求申请变更单。 操作步骤 登录COC。 在左侧菜单栏选择“变更管理
性故障场景无法自动恢复。存在多种级别的告警,处理告警缺乏规范性流程且处理效率较低。需要建立标准化的事件流程,实现规范性处理。 解决方案 端到端事件流程:明确标准化事件处理流程,通过WarRoom实现多运维兵种协同作战,通过响应预案提升事件处理效率。 图1 标准化故障管理 COC通
创建应用 提供用户创建应用的能力,便于按业务逻辑单元进行资源管理。 操作场景 通过Cloud Operations Center创建应用。 注意事项 同一个应用下不能同时存在子应用和组件。 操作步骤 登录COC。 在左侧菜单栏选择“资源管理 > 应用资源管理”,进入“应用资源管理
执行UniAgent操作 提供用户给对应机器资源执行UniAgent的安装、重装、升级和卸载操作。 操作场景 通过Cloud Operations Center给对应机器资源执行UniAgent的安装、重装、升级、卸载和状态同步操作。 注意事项 当前只有弹性云服务器(ECS)的实例支持UniAgent的操作。
执行UniAgent操作 提供用户给对应机器资源执行UniAgent的安装、重装、升级和卸载操作。 操作场景 通过Cloud Operations Center给对应机器资源执行UniAgent的安装、重装、升级、卸载和状态同步操作。 注意事项 当前只有弹性云服务器(ECS)的实例支持UniAgent的操作。
创建组件 提供用户创建组件的能力,便于按业务逻辑单元进行资源管理。 操作场景 通过Cloud Operations Center创建组件。 操作步骤 登录COC。 在左侧菜单栏选择“资源管理 > 应用资源管理”,进入“应用资源管理”页面,选择“应用管理”页签,选择需要创建组件的应用,单击“+”。
修改组件 提供用户修改组件的能力,便于按业务逻辑单元进行资源管理。 操作场景 通过Cloud Operations Center修改组件信息。 操作步骤 登录COC。 在左侧菜单栏选择“资源管理 > 应用资源管理”,进入“应用资源管理”页面,选择“应用管理”页签,选择需要修改的组件,单击。
修改应用 提供用户修改应用的能力,便于按业务逻辑单元进行资源管理。 操作场景 通过Cloud Operations Center修改应用。 操作步骤 登录COC。 在左侧菜单栏选择“资源管理 > 应用资源管理”,进入“应用资源管理”页面,选择“应用管理”页签,选择需要修改的应用,单击。
编辑IDC离线资源 提供用户编辑IDC离线资源的能力。 操作场景 通过Cloud Operations Center编辑线下IDC离线资源。 操作步骤 登录COC。 在左侧菜单栏选择“资源管理 > 应用资源管理”,进入“资源管理”页面,选择“IDC”页签,单击“操作”列中的“编辑”。
创建事件单 功能介绍 创建事件单 URI POST /v1/external/incident/create 请求参数 表1 请求Body参数 参数 是否必选 参数类型 描述 region 否 Array of strings 区域Code,如果自动拉起WarRoom则为必填,现在只支持1个
修改分组 提供用户修改分组的能力,便于按业务逻辑单元进行资源管理。 操作场景 通过Cloud Operations Center修改分组。 操作步骤 登录COC。 在左侧菜单栏选择“资源管理 > 应用资源管理”,进入“应用资源管理”页面,选择“应用管理”页签,,选择分组,单击。 图1
智能化混沌演练 全旅程混沌工程解决方案,快速评估应用潜在韧性风险,持续看护应用架构。 端到端混沌工程方案:从客户实际业务场景出发,按照风险分析、应急预案、演练执行、演练复盘4个维度,提供端到端混沌演练能力。 故障模式库:首创基于容错视角的故障场景分析方法,沉淀华为云SRE多年的故障模式库,用户开箱即用。
创建分组 提供用户创建分组的能力,便于按业务逻辑单元进行资源管理。 操作场景 通过Cloud Operations Center创建分组。 操作步骤 登录COC。 在左侧菜单栏选择“资源管理 > 应用资源管理”,进入“应用资源管理”页面,选择“应用管理”页签,展开应用,选择组件,单击“+”。
20210227 CentOS 7.6 64bit for Tenant 20210525 UniAgent客户端 当CPU使用率大于10%或者内存大于200M时,UniAgent客户端将自动重启。 UniAgent安装 单次最多可安装100台UniAgent主机。 应用管理 应用 租户创建的应用层级≤5层。
过提前制定快速恢复应急预案进行应对。 COC混沌演练为用户提供一站式的自动化演练能力,覆盖从风险识别、应急预案管理、故障注入到复盘改进的端到端演练流程。承载华为云SRE在混沌演练上多年的最佳实践,使客户能对云上应用主动地进行风险识别、消减和风险验证,持续提升云应用的韧性。 镜像与武器版本支持声明
流时无重大稳定性风险。 解决方案 混沌演练驱动主动运维:从客户实际业务场景出发,按照风险分析、应急预案、演练执行、复盘改进4个维度,提供端到端混沌演练能力; 沉淀故障模式:首创基于容错视角的故障场景分析方法,沉淀华为云SRE多年的故障模式库,内置300个+典型故障模式。 图1 全旅程混沌工程