检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
审批人无法接收通知? 审批人没有在人员管理配置任何消息通知渠道。 消息渠道配置请参考:如何使用人员管理。 父主题: 自动化运维常见问题
验证事件处理结果 功能介绍 验证事件单 URI POST /v1/external/incident/handle 备注:受理,提交解决方案,验证等操作URI一致 请求参数 表1 请求Body参数 参数 是否必选 参数类型 描述 incident_num 是 String 事件单号
验证事件 操作场景 事件单处理完成后,通过故障是否恢复或达到预计效果,在验证关闭事件中填写验证结果,选择未解决可以驳回事件,驳回后需事件处理人重新定位并处理该故障。 验证事件 登录云运维中心。 在左侧导航栏选择“故障管理 > 事件管理”。 在“待处理的”页签,选择需要处理的事件单,单击事件标题。
考自建监控系统上报告警。 验证集成是否成功。 在左侧导航栏选择“故障管理 > 集成管理”,在“已集成”中查看到应用运维管理监控源状态为“已接收报警”则说明已集成成功。 自定义集成最多只能接入5个监控系统,若对接错误,禁用后删除即可。 启用、禁用集成 登录云运维中心。 在左侧导航栏选择“故障管理
管理。 集成监控系统,自动上报告警信息,具体参考集成管理。 配置流转规则,根据流转规则生成事件,具体参考配置流转规则。 若事件生成后,想要接收到事件的通知信息,可配置自动通知能力,具体参考通知管理。 父主题: 故障管理常见问题
通知管理有部分功能不在前端进行展示,此处对其进行补充。 通知去重 当事件/变更单一次触发多个通知生效,并且多条通知订阅的人或者其他条件相同时,通知模块会对接收消息的人进行去重;接收人在同一场景下仅收到一条通知短信,而非多条相同信息。 通知模板解释 事件通知模板:不同模板对应不同场景,在事件单进入某个场景下或
快捷混沌演练 操作场景 云运维中心(Cloud Operations Center,简称COC)为用户提供安全、高效的一站式智能运维平台,满足客户集中运维诉求。云运维中心的混沌演练功能支持用户配置演练模板、攻击模板,基于模板对物理机、虚拟机或CCE容器等进行故障演练。支持故障模式
飞书:填写保存后,飞书无需创建订阅即可使用。 备注: 当前版本中支持的消息通知方式为:短信、企业微信、语音、钉钉、飞书、邮箱,但“企业微信”、“钉钉”、“飞书”、“语音”消息通知处于公测阶段,需要申请公测权限才可以使用,申请步骤请见“人员管理”页面消息提示栏。 用户填写企业微
故障模式是什么? 故障模式是对云应用面临的潜在风险进行分析和评估的结果,混沌演练平台预置华为云多年积累的故障模式数据,使用FT-FMEA故障分析法帮助您分析云应用存在的潜在风险。 父主题: 韧性中心常见问题
在“待处理的”页签,选择需要转发的改进单,单击改进单标题。 单击右上方“转发”。 设置“转发”。 表2 转发参数说明 参数 说明 所属应用 在下拉列表选择改进单涉及的应用。 接收责任人 在下拉列表选择目标责任用户。 单击“确定”。 完成改进单转发。 验证改进单验证 登录云运维中心。 在左侧导航栏选择“故障管理 > 改进管理”。
自动化运维常见问题 审批人无法接收通知? 自定义脚本参数输入值无效? 实例无法选择? 如何在不重启实例的情况下重置密码? 父主题: 资源运维常见问题
操作场景 起会规则是在启动WarRoom时,根据区域、应用、事件级别匹配到对应的规则,将规则中相关的人员拉入群组,关注故障恢复的人员在第一时间可以接收到故障,并响应故障。 新增起会规则 登录云运维中心。 在左侧导航栏选择“故障管理 > WarRoom”。 单击“起会规则”。 单击右上方“创建起会规则”。
概述 流转规则可将接收的原始告警进行去重操作,通过配置触发规则和触发条件,将原始告警转成汇聚告警或事件。每个流转规则配置时支持分配给排班或者多个责任人,从而实现更准确的通知,同时转事件支持故障自愈。 父主题: 流转规则
标签管理 操作场景 标签管理服务(Tag Management Service,TMS)用于用户在云平台通过统一的标签管理各种资源。TMS服务与各服务共同实现标签管理能力,TMS提供全局标签管理能力,各服务维护自身标签管理 。当您的云资源较多时,可以通过标签管理服务管理账户下的云资源。
标签管理 操作场景 标签管理服务(Tag Management Service,TMS)用于用户在云平台通过统一的标签管理各种自定义作业。TMS服务与各服务共同实现标签管理能力,TMS提供全局标签管理能力,各服务维护自身标签管理 。当您的自定义作业较多时,可以通过标签管理服务管理账户下的自定义作业。
验证问题 操作场景 问题单处理完成后,需要问题创建人验证问题是否已解决,若未解决可不通过,问题处理人重新定位处理,已解决可直接闭环。 验证问题 登录云运维中心。 在左侧导航栏选择“故障管理 > 问题管理”。 在“待我处理”页签,选择需要处理的问题单,单击问题单标题。 单击右上方“验证”。
审项,提升应用高可用能力。 访问方式 云服务平台提供了Web化的服务管理平台,即管理控制台和基于HTTPS请求的API(Application Programming Interface)管理方式。 API方式 如果用户需要将云服务平台上的云运维中心集成到第三方系统,用于二次开发
生成原始告警。用户可以在集成管理处启用或禁用已有告警源,或者接入第三方监控系统。 本功能还支持汇聚告警的管理。通过设置流转规则,用户可以将接收到的符合指定规则的多条原始告警汇聚成单条告警,称为汇聚告警。 对于汇聚告警,用户可以转事件单处理,或者对其执行脚本和作业,并自动通知相应责
故障管理中,支持接入应用性能管理服务产生的告警,并在云运维中心中进行流转处理 接入应用性能管理告警 消息通知服务 云运维中心中的故障管理、资源运维等场景中,支持发送短信、邮件、语音、企业微信、钉钉等通知。如需使用需要先开通消息通知服务。 通知管理 云数据库RDS 资源运维中,可以对RDS进行批量操作。混沌演练中,支持对RDS进行演练任务执行。
同步资源 操作场景 当资源数据未正常展示时,通过同步资源进行手动更新资源数据,保证数据实时可靠。 资源:用户可以在云平台上使用的一种实体。例如:弹性云服务器(ECS)实例、云硬盘(EVS)磁盘、虚拟私有云(VPC)实例等。 同步资源操作:需要当前用户具有rms:resources