检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
故障模式是什么? 故障模式是对云应用面临的潜在风险进行分析和评估的结果,混沌演练平台预置华为云多年积累的故障模式数据,使用FT-FMEA故障分析法帮助您分析云应用存在的潜在风险。 父主题: 韧性中心常见问题
改进事项字段说明 字段名称 说明 改进名称 改进事项的名称 所属应用 改进事项所属的应用 改进类型 改进事项的类型 改进责任人 改进事项的责任人 期望完成时间 改进事项的期望完成时间 问题现象 问题现象 改进闭环标准 改进事项闭环的标准 进入演练报告页面,单击“故障记录”,查看故障记录。
机器无法选择? 请确认机器状态是否正确,资源状态为运行中且UniAgent状态为运行中。 UniAgent安装可参考安装UniAgent。 父主题: 补丁管理常见问题
概述 问题管理是在使用软件产品过程中,发现产品功能缺陷、性能差等问题,记录和解决应用中存在的根本原因问题。其主要目标是降低产品/服务现网故障数量,并提高服务的整体质量促进产品或应用质量的不断完善,防止问题的再次发生。问题管理包含问题单的创建、受理、驳回、转单、处理到闭环整个生命周
韧性中心优化 全生命周期风险管理:覆盖部署态和运行态两部分的风险治理,贯穿应用和资源全生命周期,将华为云多年沉淀的动态清零风险管理经验使能用户。 使能主动运维:通过性能压测、应急演练/混沌工程、韧性评估等主动运维手段提升客户关键业务的质量和韧性。 丰富的故障演练武器:沉淀华为云实践经验,内
选择异常的脚本工单 单击“强制结束”,结束异常脚本工单。 图3 操作异常的脚本工单 选择一个状态为“执行中”的脚本工单,单击对应的“脚本名称”,进入“脚本工单详情”页面。 图4 选择执行中的脚本工单 单击“暂停”或“强制结束”,即可暂停执行或结束脚本工单。 图5 操作执行中的脚本工单
限制长度1-1000个字符。 影响客户 请填写受影响的客户。 限制长度1-1000个字符。 影响应用 请填写应用的影响描述。 支持添加和删除影响应用。 设置“处理过程”。 表2 处理过程参数说明 参数 说明 处理过程 请填写处理过程的时间和过程描述。 支持添加和删除处理过程。 设置“根因分析”。 表3
查询实例详情 操作场景 生成的云产品实例,可以在服务目录下查看详情,包括实例的基本信息、生成实例的日志事件和资源详情。 前提条件 确保您登录的账号拥有终端用户的权限,终端用户权限账号需加入COCServiceCatalogEndUserFullAccessPolicy策略。 查询实例详情
手动分批:用户可以根据自身需要,手动创建若干批次,然后手动将机器分配到各批次中。 不分批:用户所有待执行的机器会全部在同一批次。 熔断策略: 设置执行的成功率,当执行失败的机器数量到达根据成功率计算出的失败数量,工单状态会变为异常,并停止执行。 成功率取值范围0~100,支持精确到小数点后一位。 单击“提交”并“确定”。
自动批准选择“批准指定日期之前发布的补丁”时必填。 合规性级别 未指定 重大 高 中 低 提示 符合该补丁基线的补丁在合规性报告中展示的等级。 包括非安全更新 - 不勾选“包括非安全更新”,在补丁修复时不会进行有漏洞的补丁升级。 补丁例外 - 已批准的补丁以及已拒绝补丁支持以下格式: 完整的软件包名称,格式为:example-1
修改故障信息 操作场景 WarRoom的故障信息,主要是为了记录该故障的发生时间、恢复时间,故障带来的影响及故障原因,便于后续回溯防止故障再次发生。 在WarRoom启动、故障定界和恢复、故障已恢复过程都可以修改故障信息。 修改故障信息 登录云运维中心。 在左侧导航栏选择“故障管理
COC服务提供了3级可靠性架构,通过AZ内(Availability Zone,可用区)实例容灾、多AZ容灾、数据定期备份技术方案,保障服务的持久性和可靠性。 表1 COC服务可靠性架构 可靠性方案 简要说明 AZ内实例容灾 单AZ内,COC实例通过多实例方式实现实例容灾,快速剔除故障节点,保障COC实例持续提供服务。
概述 流转规则可将接收的原始告警进行去重操作,通过配置触发规则和触发条件,将原始告警转成汇聚告警或事件。每个流转规则配置时支持分配给排班或者多个责任人,从而实现更准确的通知,同时转事件支持故障自愈。 父主题: 流转规则
限制长度1-1000个字符。 单击“确定”。 完成通告更新。最新的通告显示在“进展通告”中。 单击“发布”。 设置“发布通告”。 表2 发布通告参数说明 参数 说明 通报主题 自定义通报主题。 通报对象 可选项“排班”、“个人”。 排班:按照已配置的排班场景和角色在下拉列表选择。 单击“创建排班”可以配置排班,详细操作请参考排班管理。
查看历史告警 操作场景 历史告警显示的是被清除的汇聚告警。当汇聚告警被清除后,您可以在历史告警页签中继续查看汇聚告警的相关信息和处理记录。 注意事项 告警数据留存期为31天,逾期将自动清除。 查看历史告警 登录云运维中心。 在左侧导航栏选择“故障管理 >告警管理”。 单击“汇聚告警
删除产品组合 操作场景 您可以删除已不再使用的产品组合。需要注意的是,在删除产品组合之前,您需要先移除产品组合中的所有产品。 前提条件 确保您登录的账号拥有管理员的权限,管理员权限账号需加入COCServiceCatalogAdminFullAccessPolicy策略。 删除产品组合
任人受理问题并进行后续处理,完成问题的闭环。 受理问题 登录云运维中心。 在左侧导航栏选择“故障管理 > 问题管理”。 在“待我处理”页签,选择需要处理的问题单,单击问题单标题。 单击右上方“受理”。 完成问题单受理,问题单状态为“定位出方案中”。 父主题: 问题管理
1、当前coc生成的变更管控策略默认仅提供绑定在用户组的功能,请勿将策略用作其他用途; 2、您可以通过coc界面action的编辑按钮来控制相应功能是否开启管控,注意所有操作请在coc完成,切勿直接操作策略。 3、工单提权开启后,策略绑定了用户后,若需要关闭工单提权,需先将用户组中的策略解绑后才能关闭。
eOS 资源运维中批量切换云服务器的操作系统 重装弹性云服务器操作系统 ecs:cloudServers:rebuild 资源运维中批量重装云服务器的操作系统 获取云服务器信息 ecs:servers:get 资源运维中执行批量操作时获取云服务信息 列出组织中的账号 organi
批次index 最小值:1 最大值:20 execute_uuid 是 String 脚本工单的执行Id,取自executeJobScript和ListJobScriptOrders返回体中 最小长度:1 最大长度:26 表2 Query参数 参数 是否必选 参数类型 描述 status