检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
派操作,支持多监控源纵向抑制、横向收敛,进行多维降噪;支持每个流转规则配置事件时默认分配对象和通知策略,而实现更准确的通知。 Global 集成管理 集成配置支持简单、快速集成现有或第三方等监控系统;将业务下所有分散的监控系统告警进行统一收口及管理。不同的监控系统通过各自独立的集成接入密钥实现对接集成。
总览页面中提供用户查看到账号下的安全监控信息。从安全评分、安全监控、安全趋势三个维度呈现安全概览,并支持自定义看板。 查看安全概览 云监控 总览页面中支持资源监控总览,以及资源告警详情的查看。故障管理中,支持接入云监控服务产生的告警,并在云运维中心中进行流转处理。混沌演练中,支持在演练过程中查看云监控的指标数据。如需正常使用需先开通云监控服务。
资源信息等 自动化运维 包括自定义脚本的创建、修改、删除、查询等 事件管理 包括事件的创建、处理、验证及查询 集成管理 主要为用户上报自监控系统的告警至COC 补丁管理 包括补丁管理合规性报告查询相关接口
单击“添加文件”上传根因分析件相关附件。 支持最多上传10个文件,支持文件类型:jpg、png、docx、txt、pdf,上传文件不能超过10MB。 设置“监控告警”。 表4 监控告警参数说明 参数 说明 是否优先于客户发现 可选项“是”、“否”。 告警单号 支持添加和删除告警。 设置“解决方案”。 表5 解决方案参数说明
流转规则自动生成事件,需要做以下步骤: 登录COC。 同步人员,具体参考人员管理。 设置排班,并给排班中添加排班人员,具体参考排班管理。 集成监控系统,自动上报告警信息,具体参考集成管理。 配置流转规则,根据流转规则生成事件,具体参考配置流转规则。 若事件生成后,想要接收到事件的通知信
按钮进行配置。 图3 选择场景前往配置 云服务配置 快速配置中心目前已支持云监控服务(CES)跨区域配置告警规则。 登录云运维中心。 进入COC“总览”后,单击“快速配置中心 > 云服务配置 > 云监控服务 CES”可以进入CES告警配置页面。 图4 COC快速配置CES告警规则
公共SLA 操作场景 公共SLA由系统为客户预置,开箱即用,默认为禁用状态,用户可根据需要启用/禁用。 查询公共SLA 登录COC。 在左侧菜单栏选择“基础配置 > SLA管理”,进入“SLA管理”页面。 选择“公共SLA”页签,进入公共SLA列表界面。 图1 查看SLA列表 单
图5 新增流转规则 根据页面提示,输入规则名称、应用名称等基本信息。 在触发规则部分,选择触发类型,触发规则的数据源下拉选择监控源,并根据相应的监控源的字段的键,配置相应的条件及满足条件的值。 图6 触发规则 可在流转规则中配置对应事件或告警的响应预案,可选择已有的脚本和作业作为预案。
混沌演练是什么? 混沌演练是通过主动在系统中模拟软件或硬件故障,并根据系统在各种压力下的表现行为确定优化策略的一种系统韧性保障手段。一个完整的混沌演练包括前期的故障模式分析,中期的故障注入和后期的复盘改进。 父主题: 韧性中心常见问题
用户能够实现操作系统补丁合规性扫描,操作系统补丁合规性修复功能。 补丁管理当前仅支持能够访问公网的机器,可通过绑定EIP或NAT网关的方式实现,请在功能使用前确认。 在执行补丁管理操作之前,请确认执行机器所在的区域为现支持的区域,操作系统为现补丁管理支持操作系统,机器上具备补丁
inc_type_p_shelter_issues 机房问题 shelter issues inc_type_p_monitoring_issues 监控问题 monitoring issues inc_type_p_consulting_issues 业务咨询类 consulting issues
代速度快、海量运维对象、复杂系统非线性等挑战。业务的停机都会给公司带来巨大的经济损失和声誉影响。 在运维过程中引入混沌工程,通过定期进行演练的方式,可以在现网问题发生前识别系统的薄弱点(软件Bug、方案设计不足之处、故障恢复流程卡点等),及早发现系统可用性的问题进行解决,持续提升
BMS等多种资源进行批量操作,具体操作包含批量开机、批量关机、批量重启、重装操作系统以及切换操作系统等场景。 支持场景 表1 资源运维支持的资源和场景 资源类型 批量开机 批量关机 批量重启 批量重装操作系统 批量切换操作系统 执行命令 弹性云服务器 ECS √ √ √ √ √ √ 云数据库
t。 OS诊断插件仅支持部分操作系统,详情请见下表: 表1 OS诊断插件支持的操作系统 机器架构 操作系统(OS)类型 OS诊断插件(holmes-agent)是否支持 (Y:支持;N:不支持) X86 Huawei Cloud EulerOS Huawei Cloud EulerOS
改进管理 统计改进单的闭环情况 闭环率=已完成改进单数量/改进单总量*100% 天/月 百分比 监控告警 监控告警将告警信息以直观的图表形式展示,使运维人员快速掌握服务的整体状况,监控告警中含告警分析、告警成本、告警质量三个模块,体现告警管理核心指标。告警分析中提供告警总量、告警
变更管理中系统默认的变更场景字段和实际业务使用过程中有差异,支持修改变更场景枚举值。 操作步骤 登录COC。 在左侧导航栏选择“基础配置 > 流程管理”页面,单击页面变更<br>场景,当前页面显示的为系统预置的问题类型,不支持编辑和删除。 图1 变更场景 若不使用系统预置的变更场
自定义预案 操作场景 您可以对系统可能发生的故障创建自定义的应急预案,在故障发生后可以参考应急预案进行故障紧急恢复。 创建应急预案 登录COC。 在左侧菜单栏选择“韧性中心 > 应急预案”页面,选择“自定义预案”页签。 图1 自定义预案页面 单击右上角“创建应急预案”,填写应急预案基本信息。
64bit 对于Linux x86_64服务器,支持上表中所有的操作系统及版本。 对于Linux ARM服务器,当前CentOS操作系统支持7.4/7.5/7.6版本,EulerOS操作系统支持2.0版本,Ubuntu操作系统支持18.04版本。 安装UniAgent 登录云运维中心。
步骤一:同步资源 获取当前用户所属的所有Region下资源数据并同步至云运维中心。 步骤二:创建应用 管理应用与云资源的关系,并为后续资源的监控、自动化运维等,提供统一、及时的资源环境管理服务。 步骤三:创建演练任务 针对资源预设演练方案,支持多攻击任务自由编排的故障注入组合。 步骤四:启动演练
事件类别 操作场景 系统提供的事件类别名称和业务流程定义的事件类别不符合,支持用户自定义事件类别,修改后可在创建事件页面查看最新的事件类别。 操作步骤 登录COC。 在左侧导航栏选择“基础配置 > 流程管理”页面,单击页面事件流程>事件类别,当前页面显示的为系统预置的事件类别,不支持编辑和删除。