检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
PRR评审 概述 PRR模板管理 PRR评审管理 父主题: 韧性中心
待办中心 概述 待办中心用于记录和跟踪日常待办事务,并提供提醒功能。 在COC待办中心,您可以创建待办任务给指定人员处理,设置截止时间,填写待办任务的推荐方案,创建待办后可通过短信、邮件等方式通知责任人。 除了上述功能外,创建待办任务时还支持设置标签和添加附件。 待办任务创建成功
变更中心 创建变更单 审批变更单 实施及闭环变更单 父主题: 变更管理
为用户或用户组授予云运维中心只读权限的系统策略“COC ReadOnlyPolicy”,云运维中心服务管理员权限的系统策略”COC FullAccessPolicy”,或将策略附加至用户或用户组。 用户登录并验证权限 使用已授权的用户登录控制台,验证权限: 登录云运维中心COC后,在左侧导航栏选择“任务管理
概述 PRR: Production Readiness Review 生产就绪程度评估基线。 从SLI/SLO、可冗余、可容灾、可过载控制、可故障管理、可变更能力、可运维、安全生产等维度,对服务可用性及运维能力提出基线要求,在服务产品开发前端构筑能力,进行相关需求规划、设计和开
概述 云运维中心的韧性中心提供了应急预案功能,允许用户为系统可能发生的故障建立对应的应急预案。这样,在故障发生后,用户可以参考这些预案进行紧急恢复。创建应急预案的流程包括登录 云运维中心,选择“韧性中心>应急预案”页面,并进行应急预案的自定义创建,包括填写基本信息、选择处理方式(如“脚本”或“作业”)
快速配置中心 操作场景 COC快速配置中心面向华为云全局云服务提供场景化的集中配置入口,通过最佳实践的极简配置实现多区域、多账号、定时的自动化操作,为后续运维降低操作门槛。 您可以在快速配置中心完成云运维中心配置和云服务配置: 云运维中心配置:涵盖资源应用管理、自动化运维、故障管
您可以通过定时运维功能对目标实例定时自动执行脚本或作业,提高运维自动化率。 操作路径:资源运维->自动化运维->定时运维->创建定时任务。 创建定时任务 登录云运维中心。 在左侧导航栏选择“资源管理 > 自动化运维”。 在“日常运维”模块单击“定时运维”。 单击“创建定时任务”。 设置“基本信息”。
在IAM控制台创建用户组,并授予云运维中心只读的系统权限“COC ReadOnlyAccess”,云运维中心服务管理员的系统权限“COC FullAccess”。 创建用户并加入用户组 在IAM控制台创建用户,并将其加入1中创建的用户组。 用户登录并验证权限 登录云运维中心COC后,在左侧导航栏选择“任务管理
COC混沌演练为用户提供一站式的自动化演练能力,覆盖从风险识别、应急预案管理、故障注入到复盘改进的端到端演练流程。承载华为云SRE在混沌演练上多年的最佳实践,使客户能对云上应用主动地进行风险识别、消减和风险验证,持续提升云应用的韧性。 镜像与武器版本支持声明 COC混沌演练目前已支持弹性云服务器(ECS)、裸金
应用韧性评估 概述 配置任务 开始评估 评估报告 导出报告 父主题: 韧性中心
演练规划 操作场景 创建演练规划时您可以指定执行人和计划演练时间,执行人通过接单来创建演练任务,演练任务关联故障模式和区域。 注意事项 演练规划所属的企业项目无需指定,和其关联的故障模式的企业项目保持一致。 操作步骤 登录COC。 在左侧菜单栏选择“韧性中心 > 混沌演练”页面,选择“演练规划”页签。
韧性中心常见问题 混沌演练是什么? 支持哪些攻击场景? 故障模式是什么? 演练规划主要做什么? 故障模式和演练任务的关系? 演练报告有哪些内容?
演练报告 操作场景 演练报告包含创建、编辑、改进事项以及故障记录的查看,以便用户全面地记录和管理演练活动及其结果。 创建演练报告 演练结束后可以创建演练报告 登录COC。 在左侧菜单栏选择“韧性中心 > 混沌演练”页面,选择“演练任务”页签,查看演练任务列表。 图1 演练任务列表
若需要添加已有任务,单击“选择已有”,勾选已有任务,单击“确定”。 若需要添加新的攻击任务,请参考后续步骤。 表2 添加新的攻击任务参数说明 参数 说明 示例 云厂商 请选择云厂商类型。 华为云 攻击目标来源 请选择目标实例的来源。 云容器引擎 (CCE)支持通过选择实例、指定pod、指定数量方式选择攻击目标。 弹性云服务器(ECS)
故障模式 操作场景 故障模式是指应用在运行过程中可能出现的特定类型的问题或失效状态。构建丰富的故障模式库,制定相应的预防和恢复措施,有助于设计更加高可用的应用系统。通过识别潜在的故障,可以针对该故障进行日常演练,验证故障恢复措施和故障影响是否符合预期,为更好地应对各种挑战做好准备
概述 应用韧性评估用于衡量应用在面对各种干扰和压力(如硬件故障、网络波动、流量峰值、安全攻击等)时,能够维持正常功能和性能的评估方式。韧性的概念不仅仅局限于恢复能力,还包括预防问题、快速检测问题以及有效应对问题的能力。 COC应用韧性评估基于华为最佳实践经验,定义了300+的评估
公共预案 操作场景 您可以对公共预案进行克隆,从而创建自定义的应急预案,在故障发生后可以参考应急预案进行故障紧急恢复。 查看公共预案详情 登录COC。 在左侧菜单栏选择“韧性中心 > 应急预案”页面,选择“公共预案”页签。 单击公共预案表格第一列“应急预案”名称,查看应急预案。 图1
PRR模板管理 操作场景 PRR模板管理支持用户创建、编辑、删除以及查看 PRR模板。 用户可以通过PRR模板管理进行模板的制定、评审等操作。 创建PRR模板 登录COC。 在左侧菜单栏选择“韧性中心 > PRR评审”页面,单击“PRR模板管理”,进入“PRR模板管理”页面。 图1
提示自动删除最老的评估报告,需要用户确认后,才能开启新的评估。 开始评估 登录云运维中心。 在左侧导航栏选择“韧性中心 > 应用韧性评估”。 单击操作列“评估”。 开始应用韧性评估。 重新评估 登录云运维中心。 在左侧导航栏选择“韧性中心 > 应用韧性评估”。 单击操作列“重新评估”。