检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
怎么能收到事件单通知? 登录COC。 在人员管理中完成消息通知订阅,具体参考人员管理。 在通知管理中配置通知规则,具体参考通知管理。 父主题: 故障管理常见问题
故障管理常见问题 生成事件的流程是什么? 怎么能收到事件单通知? Warroom是什么?
提交事件单解决方案 功能介绍 HandleCocIncident 处理事件单 URI POST /v1/external/incident/handle 备注:受理,提交解决方案,验证等操作URI一致。 请求参数 表1 请求Body参数 参数 是否必选 参数类型 描述 incident_num
查看不合规的补丁状态,根据状态不同查看不同解决方案 表1 不同合规性状态的解决方案 不合规状态 解决方案 失败 查看生成此合规性报告的补丁工单日志,根据失败的日志解决此问题 已安装待重启 补丁已安装修复,待机器重启后生效,机器重启后扫描即可解决不合规问题 已拒绝 在补丁基线中拒绝了此
驳回问题 操作场景 若创建人提交的问题属于非问题或其他原因可驳回问题单,驳回后创建人可重新编辑提交或撤销问题,重新提交后需问题处理人继续定位解决。 驳回问题 登录云运维中心。 在左侧导航栏选择“故障管理 > 问题管理”。 在“待我处理”页签,选择需要处理的问题单,单击问题单标题。 单击右上方“驳回”。
操作场景 问题单定位方案如果判断需要进行现网变更,问题单会走到待现网实施阶段。此时需要在问题区域实施变更,变更完成后问题单才算解决。 前提条件 问题定位出解决方案详情页面,“是否需要变更”填写“需要变更”,问题单会走到待现网实施阶段。 现网实施 登录云运维中心。 在左侧导航栏选择“故障管理
若是否需要现网变更参数选择“需要”,参数为必填。 根因分类 在下拉列表选择问题根因分类。 根因分析 请输入问题的根因分析。 限制长度1-1000个字符。 解决方案 请输入问题的解决方案。 限制长度1-1000个字符。 是否需要现网变更 可选项“需要”、“不需要”。 需要:工单走到待现网实施阶段,需要关联变更单。
受理事件单 功能介绍 受理事件 URI POST /v1/external/incident/handle 备注:受理,提交解决方案,验证等操作URI一致。 请求参数 表1 请求Body参数 参数 是否必选 参数类型 描述 incident_num 是 String 事件单号,示
验证问题 操作场景 问题单处理完成后,需要问题创建人验证问题是否已解决,若未解决可不通过,问题处理人重新定位处理,已解决可直接闭环。 验证问题 登录云运维中心。 在左侧导航栏选择“故障管理 > 问题管理”。 在“待我处理”页签,选择需要处理的问题单,单击问题单标题。 单击右上方“验证”。
洞,导致业务受损。云上无统一的OS合规性管理和自闭环工具,合规性问题修复困难或求助华为侧协助解决。希望能够自动化的完成OS补丁的扫描,并且及时修复补丁漏洞,保证主机的OS补丁合规性。 解决方案 治理:提供OS合规性自动化定时巡检能力,打造开箱即用体验,同时保留客户自定义能力,及时发现OS合规性问题并输出合规性报告;
设置“监控告警”。 表4 监控告警参数说明 参数 说明 是否优先于客户发现 可选项“是”、“否”。 告警单号 支持添加和删除告警。 设置“解决方案”。 表5 解决方案参数说明 参数 说明 短期方案(故障如何恢复) 请填写故障的短期方案。 单击“添加文件”上传短期方案相关附件。 支持最多上传
验证事件处理结果 功能介绍 验证事件单 URI POST /v1/external/incident/handle 备注:受理,提交解决方案,验证等操作URI一致 请求参数 表1 请求Body参数 参数 是否必选 参数类型 描述 incident_num 是 String 事件单号
审计与日志 审计 云审计服务(Cloud Trace Service,CTS),是华为云安全解决方案中专业的日志审计服务,提供对各种云资源操作记录的收集、存储和查询功能,可用于支撑安全分析、合规审计、资源跟踪和问题定位等常见应用场景。 用户开通云审计服务并创建和配置追踪器后,CT
单击事件标题。 单击右上方“验证关闭”。 设置“验证关闭”信息。 表1 验证关闭参数说明 参数 说明 验证结论 可选项“已解决”、“未解决”。 选择“未解决”将会驳回事件,事件流程重新变为“待处理”。 说明 请填写事件相关说明。 单击“确定”。 完成事件验证的处理。 父主题: 事件管理
始评估。 若评估状态为其他状态,详细操作请参考重新评估。 注意事项 一个应用当前支持最多评估30次,若评估达到上限,再次”重新评估”时,会提示自动删除最老的评估报告,需要用户确认后,才能开启新的评估。 开始评估 登录云运维中心。 在左侧导航栏选择“韧性中心 > 应用韧性评估”。 单击操作列“评估”。
当触发类型为事件单,级别有 P1 P2 P3 P4 P5 当触发类型为告警单,级别有 紧急 重要 次要 提示 当触发类型为待办任务,级别有 紧急 重要 次要 提示 当触发类型为问题单,级别有 致命 严重 一般 提示 选择应用 可以选择 部分应用 全部应用 单击SLA规则表格里的“编辑”,弹出SLA规则弹窗。
在运维过程中引入混沌工程,通过定期进行演练的方式,可以在现网问题发生前识别系统的薄弱点(软件Bug、方案设计不足之处、故障恢复流程卡点等),及早发现系统可用性的问题进行解决,持续提升应用韧性,建立运维信心。对于无法避免的场景(硬件故障、服务器异常下电、网络设备单板故障等)通过提前制定快速恢复应急预案进行应对。
更单,变更单有回填结果,才能流转至下个步骤。 无需变更的问题或需要变更的问题已有变更结果,问题状态为“待验证”,创建人确认问题是否解决或未解决,未解决可进行驳回。 图1 问题管理操作流程 父主题: 问题管理
业管理,用户可以在目标实例执行定义好的特定操作步骤。作业管理支持最多100个版本。 公共作业 公共作业是由云运维中心提供几种常见运维场景的解决方案,作业详情所有用户可见,公共作业不支持用户的增加、修改和删除。 自定义作业 自定义作业是由用户自定义创建并管理,作业包含自定义脚本、A
ITSM、ITOM、专家服务相互协同,形成合力。 无需多平台间跳转,站内闭环,夯实一站式体验。 一体化解决方案 化零为整,原子化运维能力实现有机融合。 沉淀华为云运维专家经验,提供场景化运维解决方案。 安全生产、运维大脑、故障管理等优秀实践使能客户极简运维。 一朵云使用体验 构筑全场景资