检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
混沌演练是什么? 混沌演练是通过主动在系统中模拟软件或硬件故障,并根据系统在各种压力下的表现行为确定优化策略的一种系统韧性保障手段。一个完整的混沌演练包括前期的故障模式分析,中期的故障注入和后期的复盘改进。 父主题: 韧性中心常见问题
全链路故障诊断 操作场景 当事件创建后,您可以通过全链路故障诊断,快速定位故障根因。我们面向客户应用提供应用层、组件层、资源层的关系拓扑,实现基于资源和应用告警的异常染色,并提供资源核心指标查看与实例诊断能力。 前提条件 已完成在CMDB的应用创建和资源关联,并完成应用拓扑编辑。
登录COC。 在左侧导航栏选择“基础配置 > 流程管理”页面,单击页面事件流程>事件类别,当前页面显示的为系统预置的事件类别,不支持编辑和删除。 图1 事件类别 若不使用系统预置的事件类别,可将是否开启列表中开关关闭。若需要新增事件类别,单击“新增事件类别”,添加事件类别信息。添
总览 为用户提供资源健康度、资源监控信息、安全概览、运维态势感知、系统公告等相关信息,呈现基于资源一站式的信息概览,同时您可通过总览页面右上角“自定义设置”灵活配置页面楼层的展示和排序。 运维概览 快速配置中心 资源看板 资源监控 优化顾问 安全评分 运维态势感知
处理事件 驳回事件 驳回后重新提交事件 转发事件 受理事件 升降级 添加备注 启动WarRoom 处理事件 验证事件 事件创建改进单 全链路故障诊断 父主题: 事件管理
公共SLA 操作场景 公共SLA由系统为客户预置,开箱即用,默认为禁用状态,用户可根据需要启用/禁用。 查询公共SLA 登录COC。 在左侧菜单栏选择“基础配置 > SLA管理”,进入“SLA管理”页面。 选择“公共SLA”页签,进入公共SLA列表界面。 图1 查看SLA列表 单
集成管理 支持用户自主接入告警数据 功能介绍 支持租户将自开发的监控系统按照标准化集成至COC,集成后告警会按照标准格式上报至COC告警中心 URI POST /v1/event/huawei/custom/{integration_key} 表1 路径参数 参数 是否必选 参数类型
集成管理 集成配置支持简单、快速集成现有或第三方等监控系统;将业务下所有分散的监控系统告警进行统一收口及管理。不同的监控系统通过各自独立的集成接入密钥实现对接集成。 监控系统接入后,配置流转规则后可将告警信息转事件或告警。 集成管理 父主题: 故障管理
批量重装操作系统 操作场景 云运维中心提供了统一操作BMS实例的功能。通过批量BMS重装操作系统功能,您可以对BMS实例执行单独或批量重装操作系统的操作。 注意事项 如果存在运行中的实例,需要勾选“立即关机”。 如果不存在运行中的实例,则可直接提交执行。 批量重装操作系统 登录云运维中心。
事件审批 登录COC。 在左侧导航栏选择“基础配置 > 流程管理”页面,单击页面事件流程>事件审批,可配置事件降级和事件暂停的审批流程。系统默认事件降级无需审批,无事件暂停能力 图1 事件审批 单击“新建事件审批”配置事件降级或事件暂停的流程,选择事件流程、事件级别和审批配置。 图2
查看账号基线 √ √ 创建账号基线 x √ 策略授权系统权限 COC服务支持基于策略授权的授权模型。如表4 COC系统策略所示,包括了COC基于策略授权中的所有系统策略。策略授权的系统策略与角色授权的系统策略并不互通。 表4 COC系统策略 系统策略名称 描述 策略类别 COCReadOnlyPolicy
批量FlexusL操作 批量开机 批量关机 批量重启 批量重装操作系统 批量切换操作系统 父主题: 资源批量操作
OS诊断目标实例UniAgent状态需要为运行中,UniAgent相关操作请参考配置UniAgent。 OS诊断插件仅支持部分操作系统,详情请见下表: 表1 OS诊断插件支持的操作系统 机器架构 操作系统(OS)类型 OS诊断插件(holmes-agent)是否支持 (Y:支持;N:不支持) X86 Huawei
若出现实例不可选,请排查以下三种情况: 该实例UniAgent状态是否正常。 是否为Cloud Operations Center补丁管理支持操作系统。 该实例是否处于关机状态。 创建扫描任务 登录云运维中心。 在左侧导航栏选择“资源管理 > 自动化运维”,进入“自动化运维”页面。 在“
能力,TMS提供全局标签管理能力,各服务维护自身标签管理 。当您的云资源较多时,可以通过标签管理服务管理账户下的云资源。 建议您先在TMS系统中设置预定义标签。 标签由“键”和“值”组成,每个标签中的一个“键”只能对应一个“值”。 每个实例最多支持10个标签配额。 编辑标签 登录云运维中心。
MS提供全局标签管理能力,各服务维护自身标签管理 。当您的自定义作业较多时,可以通过标签管理服务管理账户下的自定义作业。 建议您先在TMS系统中设置预定义标签。 标签由“键”和“值”组成,每个标签中的一个“键”只能对应一个“值”。 每个实例最多支持10个标签配额。 编辑标签 登录云运维中心。
根据命名规则,自定义基线的名称。 基线类型 组件基线 参数不支持修改,账号基线的类型。 基线账号 账号类型 Linux 参数不支持修改,账号的操作系统类型。 仅支持Linux操作系统。 账号名称 root 请填写账号名称。 账号名称是资源的主机账号,后续账号改密等功能依赖填写的账号名称。 账号分级 只读账号
批量ECS操作 批量开机 批量关机 批量重启 批量重装操作系统 批量切换操作系统 父主题: 资源批量操作
64bit 对于Linux x86_64服务器,支持上表中所有的操作系统及版本。 对于Linux ARM服务器,当前CentOS操作系统支持7.4/7.5/7.6版本,EulerOS操作系统支持2.0版本,Ubuntu操作系统支持18.04版本。 安装UniAgent 登录云运维中心。 在左侧导航栏选择“资源管理
必填,最大长度 128 字符 Private IP 内网IP 必填 Pm Model 设备类型 必填,最大长度 64 字符 Manufacturer 设备厂家 必填,最大长度 64 字符 OS Type 操作系统(LINUX、WINDOWS) 必填 Description 描述 非必填,最大长度