检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
问题审批 1.问题降级和挂起审批流程配置生效后创建的事件单流程才会生效,配置流程之前不会生效。 2.问题单在已受理后可进行升降级和挂起操作。 3.问题单闭环之前需要将升降级和挂起的电子流闭环 4.问题单升级无需审批 查看问题审批 登录云运维中心。 在左侧导航栏选择“基础配置 > 流程管理”。
看、更新WarRoom状态,便于记录故障恢复的时间节点,同时了解故障当前的进展。WarRoom状态包含启动WarRoom、故障定界和恢复、故障已恢复和关闭。 WarRoom状态 登录云运维中心。 在左侧导航栏选择“故障管理 > WarRoom”。 可以查看WarRoom列表信息。
查看容量详情 操作场景 云运维中心支持查看应用、子应用、组件或分组下已关联的资源容量详情,按照资源类型展示资源核心数据和排名。 查看容量详情 登录云运维中心。 在左侧导航栏选择“资源管理 > 应用资源管理”。 单击左上方“应用管理”。 在左侧应用栏,选择需要查看的应用、子应用、组件或分组,单击右侧“容量”。
排班场景管理 操作场景 排班创建后,排班场景和排班角色有变化,可在排场场景管理中增删改查。 创建排班场景 登录云运维中心。 在左侧导航栏选择“基础配置 > 排班管理”。 单击右上方“场景管理”。 单击右上方“创建排班场景”。 设置“创建排班场景”。 表1 创建排班场景参数说明 参数
演练报告有哪些内容? 演练报告包括演练过程的基本信息、服务恢复能力评分和复盘改进措施,并且能够生成复盘改进工单,确保演练中发现的问题能够落实改进。 父主题: 韧性中心常见问题
添加排班人员 前提条件 设置排班人员前,您需要在人员管理中完善您的人员列表,并且需要创建完成排班场景和对应的排班角色。 操作场景 不同排班方式和排班维度添加排班人员会有所不同,具体介绍如下。 排班类型 固定班次 轮班(周一 -- 周日) 全局排班 全局排班+固定班次场景添加排班人员
应用之间的关系,管理范围包含华为云、友商云(当前支持阿里云、AWS)核心资源和IDC离线资源,为混沌演练、变更管控、账号管理等功能提供统一可靠的资源分组信息。 应用的结构类型根据复杂程度分为轻量级应用和大型应用。 轻量级应用:层级少,架构简单。 轻量级应用的结构类型:应用 > 组件
查看审计日志 支持审计的COC操作 通过云审计服务,您可以记录与云运维中心服务相关的操作事件,便于日后的查询、审计和回溯。支持审计的关键操作如表1所示。 表1 支持审计的关键操作列表 操作名称 资源类型 事件名称 创建warroom WarRoom createWarRoom 创建起会规则
您可以通过演练规划对故障模式进行排期,创建演练规划可以指定执行人和计划演练时间,执行人通过接单来创建演练任务,演练任务关联故障模式和区域。 注意事项 演练规划所属的企业项目无需指定,和其关联的故障模式的企业项目保持一致。 创建演练规划 登录云运维中心。 在左侧导航栏选择“韧性中心 > 混沌演练”。
自动化预案:可以通过脚本和作业进行故障恢复的预案。 文档预案:需要通过人工按步骤执行恢复动作进行故障恢复的预案。 处理方式:可选项“脚本”、“作业”,文档预案还可以选择“不涉及”。 脚本:在下拉列表选择选择脚本,支持自定义脚本和公共脚本。 作业:在下拉列表选择选择作业,支持自定义作业和公共作业。
处理待办 操作场景 待办任务创建成功后,责任人可以在待办中心受理和闭环待办任务。 注意事项 用户只能处理责任人或创建人为自己的待办。 受理待办 登录云运维中心。 在左侧导航栏选择“任务管理 > 待办中心”。 单击左上方“待处理的”。 选择待受理的待办,单击待办名称。 单击右上方“受理”。
人员管理 操作场景 人员管理统计了当前华为云账号下的用户和基础信息,通过人员管理功能您可以对用户信息进行修改,比如修改联系方式和设置通知方式等,具体操作如下。 添加人员 登录云运维中心。 在左侧导航栏选择“基础配置 > 人员管理”。 单击右上方“同步人员”。 修改人员信息 登录云运维中心。
自定义脚本参数值需要满足如下规则: 参数值长度为1-1024位。 可以包含大写字母、小写字母、数字以及特殊字符(_-/.*?:",=+@\[{]})和空格。 禁止出现连续‘.’。 父主题: 自动化运维常见问题
COC服务提供了3级可靠性架构,通过AZ内(Availability Zone,可用区)实例容灾、多AZ容灾、数据定期备份技术方案,保障服务的持久性和可靠性。 表1 COC服务可靠性架构 可靠性方案 简要说明 AZ内实例容灾 单AZ内,COC实例通过多实例方式实现实例容灾,快速剔除故障节点,保障COC实例持续提供服务。
故障模式是指应用在运行过程中可能出现的特定类型的问题或失效状态。构建丰富的故障模式库,制定相应的预防和恢复措施,有助于设计更加高可用的应用系统。通过识别潜在的故障,可以针对该故障进行日常演练,验证故障恢复措施和故障影响是否符合预期,为更好地应对各种挑战做好准备。您可以对应用可能发生的故障点进行分
终端节点 终端节点即调用API的请求地址,不同服务不同区域的终端节点不同,您可以从地区和终端节点中查询服务的终端节点。 父主题: 使用前必读
公共预案 操作场景 公共预案是云运维中心提供的预定义预案,用户对公共预案具有只读和使用权限,应急预案提供基础的公共预案列表。公共预案可以通过克隆,从而创建自定义预案。 查看公共预案详情 登录云运维中心。 在左侧菜单栏选择“韧性中心 > 应急预案”。 单击左上方“公共预案”。 选择需要查看的公共预案,单击应急预案名称。
故障模式是什么? 故障模式是对云应用面临的潜在风险进行分析和评估的结果,混沌演练平台预置华为云多年积累的故障模式数据,使用FT-FMEA故障分析法帮助您分析云应用存在的潜在风险。 父主题: 韧性中心常见问题
SLO指标配置 操作场景 用户可以通过此页面进行SLO指标的添加、修改、删除、查看操作。 指标分为请求型SLI指标和实例型SLI指标,配置完成可以在后续SLO中断记录中手动添加。 添加SLO指标 登录云运维中心。 在左侧导航栏选择“基础配置 > SLO管理”。 选择需要配置的SLO指标,单击操作列“指标配置”。
WarRoom的故障信息,主要是为了记录该故障的发生时间、恢复时间,故障带来的影响及故障原因,便于后续回溯防止故障再次发生。 在WarRoom启动、故障定界和恢复、故障已恢复过程都可以修改故障信息。 修改故障信息 登录云运维中心。 在左侧导航栏选择“故障管理 > WarRoom”。 单击需要修改的WarRoom标题。