检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
故障模式是指应用在运行过程中可能出现的特定类型的问题或失效状态。构建丰富的故障模式库,制定相应的预防和恢复措施,有助于设计更加高可用的应用系统。通过识别潜在的故障,可以针对该故障进行日常演练,验证故障恢复措施和故障影响是否符合预期,为更好地应对各种挑战做好准备。您可以对应用可能发生的故障点进行分析,
问题单创建后,问题责任人分析问题实际情况,若属实则问题责任人受理问题并进行后续处理,完成问题的闭环。 受理问题 登录云运维中心。 在左侧导航栏选择“故障管理 > 问题管理”。 在“待我处理”页签,选择需要处理的问题单,单击问题单标题。 单击右上方“受理”。 完成问题单受理,问题单状态为“定位出方案中”。
事件创建后,事件责任人分析事件实际情况,若属实则事件责任人受理事件并进行后续处理,完成事件的闭环。 受理事件 登录云运维中心。 在左侧导航栏选择“故障管理 > 事件管理”。 在“待处理的”页签,选择需要处理的事件单,单击事件标题。 单击右上方“受理”。 完成事件受理,事件状态变更为“已受理”。
查询实例详情 操作场景 生成的云产品实例,可以在服务目录下查看详情,包括实例的基本信息、生成实例的日志事件和资源详情。 前提条件 确保您登录的账号拥有终端用户的权限,终端用户权限账号需加入COCServiceCatalogEndUserFullAccessPolicy策略。 查询实例详情
资源列表默认展示资源的部分属性,如果您需要查看应用层级下某个资源的资源详情,可按如下操作查看。 查看资源详情 登录云运维中心。 在左侧导航栏选择“资源管理 > 应用资源管理”。 单击左上方“应用管理”。 在左侧应用栏,选择应用,选择目标实例,单击实例名称。 图1 查看详情 单击下方的“查看资源详情”。
修改组件 操作场景 组件创建后,若想对组件的名称进行修改,请按如下操作进行。 修改组件 登录云运维中心。 在左侧导航栏选择“资源管理 > 应用资源管理”。 单击左上方“应用管理”。 在左侧应用栏,展开应用,选择需要修改的组件,单击。 设置“修改组件”。 表1 修改组件参数说明 参数
在左侧导航栏选择“资源管理 > 应用资源管理”。 单击左上方“应用管理”。 在左侧应用栏,选择需要创建组件的应用,单击。 设置“创建组件”。 表1 创建组件参数说明 参数 说明 示例 组件名称 根据命名规则,自定义组件的名称。 测试组件 单击“确认”。 完成组件创建。 父主题: 应用管理
删除组件 登录云运维中心。 在左侧导航栏选择“资源管理 > 应用资源管理”。 单击左上方“应用管理”。 在左侧应用栏,展开应用,选择需要删除的组件,单击。 单击“确定”。 完成组件删除。 父主题: 应用管理
手动分批:用户可以根据自身需要,手动创建若干批次,然后手动将机器分配到各批次中。 不分批:用户所有待执行的机器会全部在同一批次。 熔断策略: 设置执行的成功率,当执行失败的机器数量到达根据成功率计算出的失败数量,工单状态会变为异常,并停止执行。 成功率取值范围0~100,支持精确到小数点后一位。 单击“提交”并“确定”。
可选参数,可选项“企业微信”、“钉钉”、“飞书”。 选择的与会方式会自动选择相应的通知方式。 请先在移动应用管理中配置应用,人员管理中配置应用对应邮箱。 通知方式 可选参数,可选项“短信”、“电话”。 支持多选,“企业微信”、“钉钉”、“飞书”三种通知方式由选择的与会方式自动关联。 配置用户信息请参考人员管理。
于记录故障恢复的时间节点,同时了解故障当前的进展。WarRoom状态包含启动WarRoom、故障定界和恢复、故障已恢复和关闭。 WarRoom状态 登录云运维中心。 在左侧导航栏选择“故障管理 > WarRoom”。 可以查看WarRoom列表信息。 单击需要查看的WarRoom标题。
删除产品 操作场景 您可以删除已不再使用的产品。需要注意的是,如果产品已经绑定到产品组合,您需要先在产品组合移除产品。 前提条件 确保您登录的账号拥有管理员的权限,管理员权限账号需加入COCServiceCatalogAdminFullAccessPolicy策略。 删除产品 登录云运维中心。
驳回问题 操作场景 若创建人提交的问题属于非问题或其他原因可驳回问题单,驳回后创建人可重新编辑提交或撤销问题,重新提交后需问题处理人继续定位解决。 驳回问题 登录云运维中心。 在左侧导航栏选择“故障管理 > 问题管理”。 在“待我处理”页签,选择需要处理的问题单,单击问题单标题。 单击右上方“驳回”。
删除产品组合 操作场景 您可以删除已不再使用的产品组合。需要注意的是,在删除产品组合之前,您需要先移除产品组合中的所有产品。 前提条件 确保您登录的账号拥有管理员的权限,管理员权限账号需加入COCServiceCatalogAdminFullAccessPolicy策略。 删除产品组合
可选参数。选择排班角色,其中的排班人员在启动WarRoom时会被自动加入到第三方移动应用群组。 配置排班详细操作请参考排班管理,移动应用需要配置详细操作请参考移动应用管理。 单击“确定”。 完成起会规则创建。起会规则命中逻辑:根据事件启动warroom的区域、应用、事件级别,匹配起会规则的区域、应用
事件来源为“告警”的事件可以在事件详情中查看关联的原始告警。 执行响应预案 登录云运维中心。 在左侧导航栏选择“故障管理 > 事件管理”。 在“待处理的”页签,选择需要处理的事件单,单击事件标题。 根据执行的响应预案。 若选择应急预案,在下拉列表选择相应的应急预案,单击“执行响应预案”。
授权产品组合 操作场景 产品组合配置完成后,需要对终端用户授予访问产品组合下所绑定产品的权限,终端用户才可以对产品进行操作。 前提条件 确保您登录的账号拥有管理员的权限,管理员权限账号需加入COCServiceCatalogAdminFullAccessPolicy策略。 授权产品组合
源请手动创建扫描或修复任务。 补丁自动化任务可周期性扫描区域下所有ECS资源的补丁合规情况,并根据扫描结果创建待办事项。 补丁自动化任务将定时执行选择区域中所有Agent正常运行且操作系统为Linux的ECS实例。 创建补丁自动化任务 登录云运维中心。 在左侧导航栏选择“资源管理
您可以在定时运维页面查看定时任务的执行历史记录,历史记录呈现脚本工单/作业工单,支持跳转查看每一个工单详情。 查看定时任务执行记录 登录云运维中心。 在左侧导航栏选择“资源管理 > 自动化运维”。 在“日常运维”模块单击“定时运维”。 选择需要查看的任务,单击操作列“更多 > 历史记录”。
资源列表默认展示资源的部分属性,如果您需要查看某个资源的资源详情,可按如下操作查看。 注意事项 暂不支持查看阿里云资源详情。 IDC离线资源仅支持查看虚拟机资源详情。 查看资源详情 登录云运维中心。 在左侧导航栏选择“资源管理 > 应用资源管理”。 选择需要查看资源所在的云厂商。 默认选择“华为云”。