故障模式是什么? 故障模式是对云应用面临的潜在风险进行分析和评估的结果,混沌演练平台预置华为云多年积累的故障模式数据,使用FT-FMEA故障分析法帮助您分析云应用存在的潜在风险。 父主题: 韧性中心常见问题
补丁基线支持用户自定义配置。用户可通过所设置的补丁基线对实例的补丁进行扫描,修复不符合基线的补丁。 补丁基线拥有弹性云服务器(ECS)、云容器引擎(CCE)和裸金属服务器(BMS)三种使用场景,用户可以根据具体使用场景,创建合适的补丁基线。 云运维中心提供了各操作系统的公共补丁基线作为初始ECS和BMS场景默认
补丁工单日志中出现all mirrors were tried异常如何处理? 一般由网络原因引发,确认机器网络是否能和机器上所配置的补丁源联通,或机器网络是否出现异常。 父主题: 补丁管理常见问题
终端节点 终端节点即调用API的请求地址,不同服务不同区域的终端节点不同,您可以从地区和终端节点中查询服务的终端节点。 父主题: 使用前必读
手机号:用户使用的手机号码 邮箱:用户使用的邮箱号码 企业微信:用户企业微信群聊机器人的webhook地址 钉钉:用户钉钉群聊机器人的webhook地址 钉钉密钥:用户在钉钉群组中添加自定义机器人时,选择“加签”校验生成的签名密钥 飞书:用户飞书群聊自定义机器人的webhook地址
云运维中心支持查看应用、子应用、组件或分组下已关联的资源容量详情,按照资源类型展示资源核心数据和排名。 查看容量详情 登录云运维中心。 在左侧导航栏选择“资源管理 > 应用资源管理”。 单击左上方“应用管理”。 在左侧应用栏,选择需要查看的应用、子应用、组件或分组,单击右侧“容量”。 图1
华为云:负责云服务自身的安全,提供安全的云。华为云的安全责任在于保障其所提供的 IaaS、PaaS 和 SaaS 类云服务自身的安全,涵盖华为云数据中心的物理环境设施和运行其上的基础服务、平台服务、应用服务等。这不仅包括华为云基础设施和各项云服务技术的安全功能和性能本身,也包括运维运营安全,以及更广义的安全合规遵从。
您可以通过演练规划对故障模式进行排期,创建演练规划可以指定执行人和计划演练时间,执行人通过接单来创建演练任务,演练任务关联故障模式和区域。 注意事项 演练规划所属的企业项目无需指定,和其关联的故障模式的企业项目保持一致。 创建演练规划 登录云运维中心。 在左侧导航栏选择“韧性中心 > 混沌演练”。 单击“演练规划”。
模拟节点间网络不通,支持故障紧急终止;请勿填写演练系统和UniAgent服务器的IP地址,否则可能导致演练失败;如需要中断已建立的长连接,中断方向请选择全方向 网卡down 模拟网卡down的情况,因各主机网络配置不同,网卡down后有可能启动网卡失败,请做好恢复网络的应急预案,不支持故障紧急终止 篡改DNS域名解析
韧性中心优化 全生命周期风险管理:覆盖部署态和运行态两部分的风险治理,贯穿应用和资源全生命周期,将华为云多年沉淀的动态清零风险管理经验使能用户。 使能主动运维:通过性能压测、应急演练/混沌工程、韧性评估等主动运维手段提升客户关键业务的质量和韧性。 丰富的故障演练武器:沉淀华为云实践经验,内
完成影响应用新增。单击受影响应用可以查看该应用的告警、事件和变更信息。 执行预案 登录云运维中心。 在左侧导航栏选择“故障管理 > WarRoom”。 单击需要修改的WarRoom标题。 选择需要处理的应用,单击“执行预案”。 若选择应急预案,在下拉列表选择相应的应急预案,单击“执行”。 若没有合适的应急预案需要创建,请参考创建应急预案。
区域可用来区分同一个应用在不同区域的排班。若您的业务和区域无关,您可以忽略区域。 选择需要配置的应用,单击操作列“修改”。 选择排班用户,支持多选。 单击“确定”。 完成排班人员添加。排班添加完成后,在“排班”页面,可以查看排班中的人员。 应用排班+轮班场景 使用场景:适用不同应用按照轮班的班次进行排班。
手动分批:用户可以根据自身需要,手动创建若干批次,然后手动将机器分配到各批次中。 不分批:用户所有待执行的机器会全部在同一批次。 熔断策略: 设置执行的成功率,当执行失败的机器数量到达根据成功率计算出的失败数量,工单状态会变为异常,并停止执行。 成功率取值范围0~100,支持精确到小数点后一位。 单击“确定”并再次“确定”。
额外费用,具体以对应云服务的收费为准,由提供该功能的服务结算。 计费模式 COC的多云纳管和优化、故障管理、变更管理、运维BI、故障演练提供包年/包月计费模式;COC的场景化作业(执行自定义/公共作业、定时执行作业等)提供按需计费模式,以满足不同场景下的用户需求,场景化作业按需价
公共预案是云运维中心提供的预定义预案,用户对公共预案具有只读和使用权限,应急预案提供基础的公共预案列表。公共预案可以通过克隆,从而创建自定义预案。 查看公共预案详情 登录云运维中心。 在左侧菜单栏选择“韧性中心 > 应急预案”。 单击左上方“公共预案”。 选择需要查看的公共预案,单击应急预案名称。
修改故障信息 操作场景 WarRoom的故障信息,主要是为了记录该故障的发生时间、恢复时间,故障带来的影响及故障原因,便于后续回溯防止故障再次发生。 在WarRoom启动、故障定界和恢复、故障已恢复过程都可以修改故障信息。 修改故障信息 登录云运维中心。 在左侧导航栏选择“故障管理
COC服务提供了3级可靠性架构,通过AZ内(Availability Zone,可用区)实例容灾、多AZ容灾、数据定期备份技术方案,保障服务的持久性和可靠性。 表1 COC服务可靠性架构 可靠性方案 简要说明 AZ内实例容灾 单AZ内,COC实例通过多实例方式实现实例容灾,快速剔除故障节点,保障COC实例持续提供服务。
混沌演练是什么? 混沌演练是通过主动在系统中模拟软件或硬件故障,并根据系统在各种压力下的表现行为确定优化策略的一种系统韧性保障手段。一个完整的混沌演练包括前期的故障模式分析,中期的故障注入和后期的复盘改进。 父主题: 韧性中心常见问题
操作场景 待办任务创建成功后,责任人可以在待办中心受理和闭环待办任务。 注意事项 用户只能处理责任人或创建人为自己的待办。 受理待办 登录云运维中心。 在左侧导航栏选择“任务管理 > 待办中心”。 单击左上方“待处理的”。 选择待受理的待办,单击待办名称。 单击右上方“受理”。 完成待办受理。
查看历史告警 操作场景 历史告警显示的是被清除的汇聚告警。当汇聚告警被清除后,您可以在历史告警页签中继续查看汇聚告警的相关信息和处理记录。 注意事项 告警数据留存期为31天,逾期将自动清除。 查看历史告警 登录云运维中心。 在左侧导航栏选择“故障管理 >告警管理”。 单击“汇聚告警
您即将访问非华为云网站,请注意账号财产安全