检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
产品咨询 云运维中心权限如何配置? 如何通过企业项目进行权限控制
资源管理常见问题 首次安装UniAgent如何操作? 如果资源无法在资源管理页面中查询到,如何处理? 无法找到应用管理层级说明页面?
补丁修复后合规性报告仍然为不合规如何处理? 单击修复后生成的合规性报告摘要 图1 合规性报告摘要 查看不合规的补丁状态,根据状态不同查看不同解决方案 表1 不同合规性状态的解决方案 不合规状态 解决方案 失败 查看生成此合规性报告的补丁工单日志,根据失败的日志解决此问题 已安装待重启
补丁管理常见问题 补丁基线不生效? 补丁基线中安装规则基线与自定义基线的区别? 补丁工单日志中出现all mirrors were tried异常如何处理? 机器无法选择? 补丁修复后合规性报告仍然为不合规如何处理? 补丁操作出现lsb_release not found异常如何处理?
故障管理常见问题 生成事件的流程是什么? 怎么能收到事件单通知? Warroom是什么?
怎么能收到事件单通知? 登录COC。 在人员管理中完成消息通知订阅,具体参考人员管理。 在通知管理中配置通知规则,具体参考通知管理。 父主题: 故障管理常见问题
韧性中心常见问题 混沌演练是什么? 支持哪些攻击场景? 故障模式是什么? 演练规划主要做什么? 故障模式和演练任务的关系? 演练报告有哪些内容?
批量操作常见问题 批量ECS资源切换镜像报错如何处理? 父主题: 资源运维常见问题
批量RDS操作 批量RDS操作为用户提供了管理RDS实例的能力,支持进行批量开启、停止、重启等操作。 批量开启 批量停止 批量重启 父主题: 资源运维
批量FlexusL操作 FlexusL操作为用户提供了管理Flexus L实例的能力,支持进行批量开机、关机、重启、重装操作、切换操作。 批量开机 批量关机 批量重启 批量重装操作系统 批量切换操作系统 父主题: 资源运维
事件管理 事件管理主要是对应用的所有事件进行管理,包含事件的受理、驳回、转单、处理到闭环整个生命周期管理。事件来源包含流转规则产生的事件、通过告警创建的事件及人工创建的事件。 事件管理同时支持配置SLA规则,若需配置请参考基础配置-SLA管理 事件流程 创建事件 处理事件 事件历史记录
添加备注 操作步骤 登录COC。 在左侧菜单栏选择“故障管理 > 事件管理”,选择“待处理的”页签,单击事件标题进入“事件详情”页面。 图1 进入事件详情 单击页面右上角“...”中的“添加备注”。 图2 添加备注 填写备注信息后,单击“提交”。 图3 填写备注信息 父主题: 处理事件
告警管理 汇聚告警 原始告警 父主题: 故障管理
汇聚告警 登录COC。 在左侧菜单栏单击“故障管理 > 告警管理”,可以查看汇聚告警或原始告警列表信息。 在汇聚告警搜索框中输入告警单号、集成告警名称,“回车”进行搜索。 汇聚告警包含当前告警和历史告警。 图1 告警列表 处理告警 告警转事件 清除告警 历史告警 父主题: 告警管理
修改起会规则 操作步骤 登录COC。 左侧菜单栏选择“故障管理 > WarRoom”,选择“起会规则”页签,进入“起会规则”列表。 图1 起会规则列表 在“起会规则”列表,选择需要修改的起会规则,单击“编辑” 修改起会规则。输入规则名称,选择区域,应用,事件级别,加入群组信息,完成后,单击“确定”修改起会规则。
流转规则 概述 流转规则 父主题: 故障管理
集成管理 集成配置支持简单、快速集成现有或第三方等监控系统;将业务下所有分散的监控系统告警进行统一收口及管理。不同的监控系统通过各自独立的集成接入密钥实现对接集成。 监控系统接入后,配置流转规则后可将告警信息转事件或告警。 当前支持集成CES、AOM、Prometheus和自建监控系统。
问题管理 问题管理主要是对应用的所有问题单进行管理,通过识别故障的实际和潜在原因、管理规避方案和已知错误,来降低故障再次发生的可能性和影响性。包含问题单的创建、受理、驳回、转单、处理到闭环整个生命周期管理。问题单来源主要有人工创建与北向接口创建。 问题管理同时支持配置SLA规则,若需配置请参考基础配置-SLA管理。
诊断工具 OS诊断 父主题: 故障管理
OS诊断 登录COC。 在左侧菜单栏单击“故障管理 > 诊断工具”,在“OS诊断”模块单击“立即诊断”,进入“创建OS诊断”页面。 图1 OS诊断入口 在“创建OS诊断”页面,单击“添加实例”。实例需提前安装UniAgent,且镜像和规格满足OS诊断要求。 图2 选择实例 在“创