检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
该步骤主要自定义监控系统接入步骤 登录COC。 在左侧导航栏选择“故障管理 > 集成管理”,进入“集成管理”配置页面 在集成管理页面有待集成中选择“Other Monitoring Systems 自定义集成”,单击“接入集成”会跳转至集成接入步骤页面,可填写集成监控系统的简称和全称,
批量重装操作系统 操作场景 云运维中心提供了统一操作BMS实例的功能。通过批量BMS重装操作系统功能,您可以对BMS实例执行单独或批量重装操作系统的操作。 注意事项 如果存在运行中的实例,需要勾选“立即关机”。 如果不存在运行中的实例,则可直接提交执行。 批量重装操作系统 登录云运维中心。
批量重装操作系统 操作场景 云运维中心提供了统一操作ECS实例的功能。通过批量ECS重装操作系统功能,您可以对ECS实例执行单独或批量重装操作系统的操作。 注意事项 如果存在运行中的实例,需要勾选“立即关机”。 如果不存在未关机的实例,则可直接提交执行。 批量重装操作系统 登录云运维中心。
如果不存在运行中的实例,则可直接提交执行。 批量切换操作系统 登录云运维中心。 在左侧导航栏选择“资源管理 > 资源批量操作”,进入“资源批量操作”页面。 资源类型选择“Flexus应用服务器L实例”,单击“重装操作系统”,进入“重装操作系统”页面。 单击“添加实例”,设置“选择实例”。 表1 选择实例参数说明 参数
标签管理 操作场景 标签管理服务(Tag Management Service,TMS)用于用户在云平台通过统一的标签管理各种资源。TMS服务与各服务共同实现标签管理能力,TMS提供全局标签管理能力,各服务维护自身标签管理 。当您的云资源较多时,可以通过标签管理服务管理账户下的云资源。
如果不存在运行中的实例,则可直接提交执行。 批量重装操作系统 登录云运维中心。 在左侧导航栏选择“资源管理 > 资源批量操作”,进入“资源批量操作”页面。 资源类型选择“Flexus应用服务器L实例”,单击“重装操作系统”,进入“重装操作系统”页面。 单击“添加实例”,设置“选择实例”。 表1 选择实例参数说明 参数
批量切换操作系统 操作场景 云运维中心提供了统一操作ECS实例的功能。通过批量ECS切换操作系统功能,您可以对ECS实例执行单独或批量切换操作系统的操作。 注意事项 如果存在运行中的实例,需要勾选“立即关机”。 如果不存在运行中的实例,则可直接提交执行。 批量切换操作系统 登录云运维中心。
标签管理 操作场景 标签管理服务(Tag Management Service,TMS)用于用户在云平台通过统一的标签管理各种自定义作业。TMS服务与各服务共同实现标签管理能力,TMS提供全局标签管理能力,各服务维护自身标签管理 。当您的自定义作业较多时,可以通过标签管理服务管理账户下的自定义作业。
告警管理概述 告警管理功能提供告警数据的收集、纳管和处理。 本功能支持集成多个现有或第三方等监控系统(比如CES、AOM、Prometheus),并将业务下分散的告警信息进行统一收集,生成原始告警。用户可以在集成管理处启用或禁用已有告警源,或者接入第三方监控系统。 本功能还支持汇
集成管理 支持用户自主接入告警数据 功能介绍 支持租户将自开发的监控系统按照标准化集成至COC,集成后告警会按照标准格式上报至COC告警中心 URI POST /v1/event/huawei/custom/{integration_key} 表1 路径参数 参数 是否必选 参数类型
通知管理 操作场景 通知管理为用户创建通知规则,通知规则包含事件通知、问题通知、变更通知和告警通知。 当产生事件单、问题单、告警单或有变更单时,通知规则会根据事件/问题/告警/变更信息和配置的通知规则进行信息匹配,解析出需要通知的人员、内容和发送通知的方式,进行消息通知,实现了自动通知的功能。
集成管理 集成配置支持简单、快速集成现有或第三方等监控系统;将业务下所有分散的监控系统告警进行统一收口及管理。不同的监控系统通过各自独立的集成接入密钥实现对接集成。 监控系统接入后,配置流转规则后可将告警信息转事件或告警。 集成管理 父主题: 故障管理
如表2所示,包括了COC的所有系统权限。基于角色授权场景的系统策略与基于策略授权场景的并不互通。 表2 COC系统权限 系统角色/策略名称 描述 类别 依赖关系 COC ReadOnlyAccess 云运维中心服务只读权限 系统策略 无 COC FullAccess 云运维中心服务管理员权限 系统策略 无
人员管理概述 人员管理为云运维中心提供了统一的人员数据管理。您可以在人员管理页面管理当前华为云账号下的用户,人员管理中的用户从 统一身份认证服务(IAM) 同步,人员管理页面的数据作为云运维中心的用户基础数据,供创建待办、定时运维、通知管理、事件中心等多个功能模块使用。 人员管理页
在“日常运维”模块单击“账号管理”,进入“账号管理”页面。 单击右上方“密钥管理”,进入“密钥管理”页面。 根据是否已绑定密钥。 若首次使用密钥管理,未绑定过密钥,单击“绑定密钥”,右侧弹出“绑定密钥”窗口。 若已绑定密钥,单击“更新”,右侧弹出“更新密钥”窗口。 选择需要绑定的密钥。单击“确定”。 若当前
在左侧菜单栏选择“故障管理 > 改进管理”,选择“待处理的”页签,选择待验证状态的改进单,单击改进标题进入“改进单详情”页面。 图3 改进单列表 单击右上角的“验证”,填写验证结论。 图4 改进单验证 改进单历史记录 登录COC。 在左侧菜单栏选择“故障管理 > 改进管理”,选择“待处理
问题管理 问题管理主要是对应用的所有问题单进行管理,通过识别故障的实际和潜在原因、管理规避方案和已知错误,来降低故障再次发生的可能性和影响性。包含问题单的创建、受理、驳回、转单、处理到闭环整个生命周期管理。问题单来源主要有人工创建与北向接口创建。 问题管理同时支持配置SLA规则,若需配置请参考基础配置-SLA管理。
事件管理 事件管理主要是对应用的所有事件进行管理,包含事件的受理、驳回、转单、处理到闭环整个生命周期管理。事件来源包含流转规则产生的事件、通过告警创建的事件及人工创建的事件。 事件管理同时支持配置SLA规则,若需配置请参考基础配置-SLA管理。 事件流程 创建事件 处理事件 事件历史记录
告警管理 告警管理概述 查看告警 处理告警 告警转事件 清除告警 历史告警 原始告警 父主题: 故障管理
改进管理 改进管理主要是故障处理过程识别到一些改进事项可通过改进单进行跟踪闭环。改进来源包含事件/Warrroom/演练/PRR。 改进管理 父主题: 故障管理