检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
资源管理常见问题 首次安装UniAgent如何操作? 如果资源无法在资源管理页面中查询到,如何处理? 无法找到应用管理层级说明页面?
Warroom是什么? 为快速恢复业务的运作机制,支撑运维、研发、运营联合作战,保障业务快速恢复而组建的会议。已受理的事件可以启动Warroom,具体参考启动WarRoom。 Warroom使用指导,请参考WarRoom管理。 父主题: 故障管理常见问题
批量RDS操作 批量开启 批量停止 批量重启 父主题: 资源批量操作
批量FlexusL操作 批量开机 批量关机 批量重启 批量重装操作系统 批量切换操作系统 父主题: 资源批量操作
路径参数 参数 是否必选 参数类型 描述 execute_uuid 是 String 脚本工单的执行Id,取自executeJobScript和ListJobScriptOrders返回体中 最小长度:1 最大长度:26 请求参数 表2 请求Body参数 参数 是否必选 参数类型 描述
任人,改进项完成后需验收人验收通过才能闭环。 前提条件 需要通过事件、Warrroom、混沌演练、PRR评审创建改进单。 处理改进单 登录云运维中心。 在左侧导航栏选择“故障管理 > 改进管理”。 在“待处理的”页签,选择需要处理的改进单,单击改进单标题。 单击右上方“处理”。 设置“改进处理”。
需要先在应用管理中创建您的应用。 创建问题 登录云运维中心。 在左侧导航栏选择“故障管理 > 问题管理”。 单击右上方“创建问题单”。 设置“创建问题单”。 表1 创建问题单参数说明 参数 说明 问题标题 自定义问题的标题。 问题描述 对问题进行描述,具体描述问题现象和对现网的影响。 上传附件 单击“添加文件”上传问题相关附件。
应用管理 概述 创建应用 修改应用 删除应用 应用拓扑 创建组件 修改组件 删除组件 创建分组 修改分组 删除分组 手动关联资源 智能关联资源 转移资源 解除关联资源 查看资源详情 查看容量详情 父主题: 资源管理
该步骤介绍自定义监控系统接入步骤 登录云运维中心。 在左侧导航栏选择“故障管理 > 集成管理”。 在集成管理页面中选择“Other Monitoring Systems 自定义集成”,单击“接入集成”。 页面展示详细的集成接入步骤。 填写集成系统的简称和全称,单击“确认集成”。 集成自建监控系统告警。
批量BMS操作 批量开机 批量关机 批量重启 批量重装操作系统 父主题: 资源批量操作
执行账号委托:执行账号(组织中的成员租户)信任COC服务和管理员的委托,必须是IAM 5.0版本的信任委托。委托用于支持管理员切换到执行账号身份进行作业工单创建以及跨账号实际目的操作,以跨账号创建CES告警规则为例,跨账号实际目的操作有三个:创建SMN主题、SMN主题添加订阅和创建CES告警规则,所以实际创
操作场景 问题单处理完成后,需要问题创建人验证问题是否已解决,若未解决可不通过,问题处理人重新定位处理,已解决可直接闭环。 验证问题 登录云运维中心。 在左侧导航栏选择“故障管理 > 问题管理”。 在“待我处理”页签,选择需要处理的问题单,单击问题单标题。 单击右上方“验证”。 设置“验证”。
、应用、事件级别匹配到对应的规则,将规则中相关的人员拉入群组,关注故障恢复的人员在第一时间可以接收到故障,并响应故障。 新增起会规则 登录云运维中心。 在左侧导航栏选择“故障管理 > WarRoom”。 单击“起会规则”。 单击右上方“创建起会规则”。 设置“创建起会规则”。 表1
受理问题 操作场景 问题单创建后,问题责任人分析问题实际情况,若属实则问题责任人受理问题并进行后续处理,完成问题的闭环。 受理问题 登录云运维中心。 在左侧导航栏选择“故障管理 > 问题管理”。 在“待我处理”页签,选择需要处理的问题单,单击问题单标题。 单击右上方“受理”。 完
复盘改进的端到端演练流程。承载华为云SRE在混沌演练上多年的最佳实践,使客户能对云上应用主动地进行风险识别、消减和风险验证,持续提升云应用的韧性。 镜像与武器版本支持声明 COC混沌演练目前已支持弹性云服务器(ECS)、裸金属服务器(BMS)和Flexus应用服务器L实例(Fle
概述 排班管理为云运维中心提供了统一的、多维度、多形式、可自定义的人员管理模式。您可以在排班管理对排班场景进行管理,并将“人员管理”中的人员添加到排班中完成排班的设置。 在需要设置排班人员、获取排班人员时,您直接前往排班管理页面进行配置、查询。 已创建的排班可直接在流转规则、事件
符。 从故障发生到故障恢复所需时间称为业务中断时间。云运维中心支持将清除告警填写的业务中断时间自动计入对应应用的SLO中断记录。具体操作步骤如下: 创建SLA规则,设置触发类型:告警管理,选择级别和应用,需要包含汇聚告警级别和应用。 创建SLO规则,选择应用,需要包含汇聚告警应用。
通过流转规则可以将一条或多条原始告警汇聚成单条汇聚告警,一条原始告警可以触发多个流转规则。 注意事项 页面默认显示31天的告警信息,过期的告警将自动清除。 操作步骤 登录云运维中心。 在左侧导航栏选择“故障管理 >告警管理”。 在“原始告警”页签,单击告警名称。 查看原始告警详情。 父主题: 告警管理
加入群组后,可以设置管理员、恢复责任人、恢复成员。 与会成员默认管理员为创建WarRoom设置的WarRoom管理员。 添加与会成员 登录云运维中心。 在左侧导航栏选择“故障管理 > WarRoom”。 单击需要修改的WarRoom标题。 单击右侧“邀请”。 设置“邀请”。 表1
若创建人提交的问题属于非问题或其他原因可驳回问题单,驳回后创建人可重新编辑提交或撤销问题,重新提交后需问题处理人继续定位解决。 驳回问题 登录云运维中心。 在左侧导航栏选择“故障管理 > 问题管理”。 在“待我处理”页签,选择需要处理的问题单,单击问题单标题。 单击右上方“驳回”。 填写驳回原因,单击“确定”。