检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
通过grafana查看AOM中的指标数据 前提条件 已购买弹性云服务器ECS。 已购买弹性公网IP,并绑定到购买的弹性云服务器ECS上,具体操作请参见《弹性公网IP快速入门》。 操作步骤 安装并启动Grafana,具体操作请参见Grafana官方文档。
资源监控 操作场景 您可以在资源监控快速查看账号下购买资源(例如弹性云服务器、对象存储、云数据库等)的监控指标信息,如ECS的CPU使用率、磁盘读/写带宽,对象存储的存储对象总数、TPS等。 资源监控 登录云运维中心。 进入COC“总览”后,可以查看CES监控的指标信息。 图1 CES监控信息
使用Grafana查看AOM中的监控指标 安装配置Grafana 配置Grafana数据源 配置仪表盘查看指标数据 父主题: ModelArts Standard资源监控
接入Prometheus/Grafana 安装配置CES Exporter 将监控数据导出到自建Prometheus/Grafana 父主题: 接入中心
接入Prometheus/Grafana 将实时监控数据接入自建Prometheus
全局排班+轮班(周一 -- 周日)”),单击“添加人员”添加排班人员。 图2 全局轮班场景添加排班人员 填写添加信息后,单击“确定”。 图3 添加人员 开始时间:选择日期,重新排班策略将从该日期的00:00分开始 结束时间:选择日期,重新排班策略将从该日期的23:59分结束 班次:选择每天需要排班的班次
示资源之间的关系。为您更加直观地展示资源之间的相互关系,便于资源的使用、监控和管理。 注意事项 支持查看华为云资源的拓扑关系。 支持查看弹性云服务器(ECS)、MapReduce服务 (MRS)、裸金属服务器 (BMS)、云容器引擎 (CCE)的拓扑关系。 查看资源拓扑 登录云运维中心。
资源看板 操作场景 您可以在资源看板快速查看账号下购买的资源(例如弹性云服务器、弹性公网IP、云数据库等),以及资源当前的告警信息(在云监控服务CES配置后产生)。 资源看板 登录云运维中心。 进入COC“总览”后,可以查看对应的资源信息。 图1 资源信息 默认展示全部区域的资源
添加备注 操作步骤 登录COC。 在左侧菜单栏选择“故障管理 > 事件管理”,选择“待处理的”页签,单击事件标题进入“事件详情”页面。 图1 进入事件详情 单击页面右上角“...”中的“添加备注”。 图2 添加备注 填写备注信息后,单击“提交”。 图3 填写备注信息 父主题: 处理事件
集成管理 本文介绍如何集成监控源。 操作场景 每个监控源的集成配置都有独立的集成接入步骤,需要单独接入,各监控源的详细步骤可查看集成接入中各监控集成说明。 操作步骤 该步骤主要介绍华为云监控系统、开源监控系统的接入步骤 登录COC。 在左侧导航栏选择“故障管理 > 集成管理”,进入“集成管理”配置页面。
选择应用下的分组 从下拉列表中选择应用、组件和分组。 测试应用/测试组件/测试分组 资源类型 从下拉列表中选择云厂商、资源类型。 华为云/弹性云服务器ECS/云服务器 资源列表 请选择需要关联的资源。 - 单击“确定”,关联至该分组下。 父主题: 应用管理
告警管理功能提供告警数据的收集、纳管和处理。 本功能支持集成多个现有或第三方等监控系统(比如CES、AOM、Prometheus),并将业务下分散的告警信息进行统一收集,生成原始告警。用户可以在集成管理处启用或禁用已有告警源,或者接入第三方监控系统。 本功能还支持汇聚告警的管理。通过设置流转规则,用户
应用拓扑以图形的形式呈现,其中节点表示应用层次结构和资源,连线表示之间的关系。为您更加直观地展示应用层次结构和资源之间的相互关系,便于资源的使用、监控和管理。 注意事项 编辑拓扑仅支持编辑组件之间的连线关系。 编辑拓扑不影响应用和组件的层级和功能。 查看和编辑拓扑 登录云运维中心。 在左侧导航栏选择“资源管理
安全评分 操作场景 通过云运维中心查看安全云脑 SecMaster的安全监控信息,安全评分维度包含合规检查、漏洞、威胁告警等。 安全概览 登录云运维中心。 进入COC“总览”后,可以查看安全云脑的安全评分。 图1 安全评分 单击“前往处理”,可跳转至安全云脑。 图2 跳转安全云脑
总览页面中提供用户查看到账号下的安全监控信息。从安全评分、安全监控、安全趋势三个维度呈现安全概览,并支持自定义看板。 查看安全概览 云监控 总览页面中支持资源监控总览,以及资源告警详情的查看。故障管理中,支持接入云监控服务产生的告警,并在云运维中心中进行流转处理。混沌演练中,支持在演练过程中查看云监控的指标数据。如需正常使用需先开通云监控服务。
Center创建一个攻击场景为自定义故障的演练任务。 注意事项 由于自定义故障完全由您编写的脚本决定,所以在使用脚本对弹性云服务器 (ECS)进行攻击时,可能会导致资源使用率飙高、网络发生故障等异常现象,从而存在将弹性云服务器 (ECS)上已安装的UniAgent状态变成离线/异常的风险,请悉知。 创建自定义故障 通过Cloud
概述 云运维中心支持对弹性云服务器 ECS、云数据库 RDS、Flexus应用服务器L实例、裸金属服务器 BMS等多种资源进行批量操作,具体操作包含批量开机、批量关机、批量重启、重装操作系统以及切换操作系统等场景。 支持场景 表1 资源运维支持的资源和场景 资源类型 批量开机 批量关机
集成管理 支持用户自主接入告警数据 功能介绍 支持租户将自开发的监控系统按照标准化集成至COC,集成后告警会按照标准格式上报至COC告警中心 URI POST /v1/event/huawei/custom/{integration_key} 表1 路径参数 参数 是否必选 参数类型
描,修复不符合基线的补丁。 补丁基线拥有弹性云服务器ECS、云容器引擎CCE和裸金属服务器BMS三种使用场景,用户可以根据具体使用场景,创建合适的补丁基线。 云运维中心提供了各操作系统的公共补丁基线作为初始弹性云服务器ECS和裸金属服务器BMS场景默认补丁基线,如需使用云容器引擎CCE场景下补丁基线功能请手动创建。
力。 Global 补丁管理 补丁管理提供了用户能够管理ECS实例上补丁的能力。通过补丁管理能力,用户能够实现OS补丁合规性扫描,OS补丁合规性修复功能。 Global 批量ECS操作 批量ECS操作为用户提供了管理ECS实例的能力,支持进行批量开机、关机、重启、切换操作系统、重装操作系统等操作。
运维中心的作业管理功能可以为用户提供自定义作业的操作以及在目标虚拟机上执行作业的能力。您可以通过该功能对目标实例(目前支持弹性云服务器ECS和裸金属服务器BMS)执行操作。 本章节介绍如何通过云运维中心操作一台ECS执行重启作业。 操作流程 操作步骤 说明 准备工作 注册华为账号并实名认证,开通云运维中心。
或重复的自动化任务。脚本管理可以对脚本进行高危检测,也支持Windows和Linux操作系统,当前脚本支持弹性云服务器 ECS、裸金属服务器 BMS、Flexus应用服务器L实例三种云资源。 自定义脚本 自定义脚本是由用户自定义创建并管理,脚本支持“Shell”、“Python”
从故障发生到故障恢复的预期时间 单击“添加一个新的攻击任务,还可创建5个攻击任务”,进入添加攻击新的攻击任务页面。 设置“添加新的攻击任务”,设置完成后单击“下一步”,进入选择攻击场景页面。 图5 “添加新的攻击任务”参数配置 表4 “添加新的攻击任务”参数说明 参数 示例 说明
恢复到正常状态的期望时间,该时间不会对演练任务产生影响。 3 单击“添加一个新的攻击任务”。 默认有1个攻击任务组,单击“添加新的任务组”可添加新的任务组。添加攻击任务后继续单击“添加一个新的攻击任务”,可添加新的攻击任务。 1.任务组间的任务为串行执行,任务组内的任务为并行执行。