检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
流转规则 概述 流转规则 父主题: 故障管理
集成管理 集成配置支持简单、快速集成现有或第三方等监控系统;将业务下所有分散的监控系统告警进行统一收口及管理。不同的监控系统通过各自独立的集成接入密钥实现对接集成。 监控系统接入后,配置流转规则后可将告警信息转事件或告警。 当前支持集成CES、AOM、Prometheus和自建监控系统。
问题管理 问题管理主要是对应用的所有问题单进行管理,通过识别故障的实际和潜在原因、管理规避方案和已知错误,来降低故障再次发生的可能性和影响性。包含问题单的创建、受理、驳回、转单、处理到闭环整个生命周期管理。问题单来源主要有人工创建与北向接口创建。 问题管理同时支持配置SLA规则,若需配置请参考基础配置-SLA管理。
诊断工具 OS诊断 父主题: 故障管理
混沌演练 概述 故障模式 演练规划 演练任务 自定义故障 演练报告 父主题: 韧性中心
排班管理 排班管理概述 排班场景管理 父主题: 基础配置
SLA管理 SLA(服务等级协议,Service Level Agreement),SLA管理为客户提供了工单时效管理,当工单触发某一个规则时,及时通知客户跟进和处理,并记录工单SLA触发详情。 自定义SLA 公共SLA SLA记录 父主题: 基础配置
多云配置 创建账号 编辑账号 删除账号 导入IDC离线资源 编辑IDC离线资源 删除IDC离线资源 父主题: 应用资源管理
原始告警 登录COC。 左侧菜单栏选择“故障管理 > 告警管理”,选择“原始告警”页签,查看原始告警列表,页面默认显示一个月的告警信息。 单击击告警列表前可以查看告警其他信息。 图1 原始告警 父主题: 告警管理
事件流程 支持事件级别、事件类别、事件降级和事件暂停的审批配置 事件级别 事件类别 事件审批 父主题: 流程管理
资源运维 资源运维概述 批量ECS操作 批量RDS操作 批量FlexusL操作 批量BMS操作
待办中心 概述 待办中心主要实现功能:客户华为云主账号(租户主SRE)直接创建任务给下属的某些IAM账号(租户子SRE)去处理(如一个公司下有不同部门,每个部门分别有一个IAM账号)。 新增待办 登录COC。 在左侧导航栏选择“任务管理 > 待办中心”页面,进入待办中心列表界面。
COC混沌演练新增了裸金属服务器(BMS)和Flexus应用服务器L实例(HCSS)两种攻击对象,并提供了相应的资源类武器和网络类武器供用户演练使用。通过集成武器模块和功能,用户可以更准确地模拟真实环境故障,及早发现系统可用性等问题,持续提升应用韧性。 以下是BMS、HCSS各镜像版本与支持的探针类武器声明:
应用监控 提供用户自定义添加应用,查看应用监控信息的能力。 操作场景 通过Cloud Operations Center查看应用运维管理中仪表盘信息。 操作步骤 登录COC。 进入COC“总览”后,可以查看应用监控信息。 单击“ 自定义看板”设置需要监控的应用。 图1 应用监控信息
员管理页面管理当前租户下的用户,人员管理中的用户从 IAM 同步,人员管理页面的数据作为云运维中心的用户基础数据,供创建待办、定时运维、通知管理、事件中心等多个功能模块使用。 人员管理页面可以手动选择需要的用户进行编辑、删除、请求订阅。 对已添加的用户在编辑时,若填写了手机号、邮
资源总览 提供用户查看所购买资源(包含弹性云服务器、弹性公网IP、云数据库等)的能力。 操作场景 通过Cloud Operations Center查看资源(包含弹性云服务器、弹性公网IP、云数据库等)。 操作步骤 登录COC。 进入COC“总览”后,可以查看对应的资源信息。 图1
资源管理 同步资源 执行UniAgent操作 查看资源详情 查看资源拓扑 父主题: 应用资源管理
脚本管理 提供用户自定义脚本的创建、修改、删除以及在目标虚拟机上执行自定义脚本、公共脚本的能力。通过该功能,用户可以通过自定义脚本或公共脚本在目标实例上执行操作。 创建自定义脚本 管理自定义脚本 执行自定义脚本 执行公共脚本 父主题: 自动化运维
处理问题 操作场景 创建问题单后,问题责任人需受理、定位并提交问题解决方案。 受理问题 驳回问题 问题定位出方案中 问题待现网实施 升降级 挂起问题 待验证 父主题: 问题管理
排班管理概述 排班管理为云运维中心提供了统一的、多维度、多形式、可自定义的人员管理模式。您可以在排班管理对排班场景进行管理,并将“人员管理”中的人员添加到排班中完成排班的设置。 在需要设置排班人员、获取排班人员时,您直接前往排班管理页面进行配置、查询。 已创建的排班可直接在流转规