检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
名称后,单击,选择“导入仪表盘”。 导入方法: 选择待导入的JSON格式仪表盘文件,上传或拖入“导入仪表盘”对话框的文本上传区域,然后单击“创建”。 在“新建仪表盘”对话框,依次设置仪表盘名称等信息,具体请参见表1。 设置完成,单击“创建”。 导出监控报告 选择待操作的仪表盘,在
> 告警行动规则 > 消息模板”。 在“消息模板”页面中单击“创建消息模板”。 输入模板名称。 输入模板描述。 选择消息头语言(目前仅支持中文简体和英文)。 自定义模板内容(创建消息模板时会自动填充默认字段)。 您最多可创建100个消息模板,如果消息模板数量已达上限100时,请删除不需要的消息模板。
简介 指标是对资源性能的数据描述或状态描述,指标由命名空间、维度、指标名称和单位组成。 指标命名空间 指标命名空间是对一组资源和对象产生的指标的抽象整合,不同命名空间中的指标彼此独立,因此来自不同应用程序的指标不会被错误地汇聚到相同的统计信息中。 系统指标的命名空间:命名空间是固定不变的,均以“PAAS
0,可直接跳过如下操作。 登录AOM华为云官网。 在AOM产品简介下方单击“AOM2.0控制台”,进入AOM 2.0服务页面。 在弹出的“通知”对话框中仔细阅读从AOM 1.0切换到AOM 2.0计费方式变化的说明。 单击“授权”,然后在“云服务授权”页面中仔细阅读授权声明后,勾选“我已阅读并同意授权声明”。
选择“仪表盘”后,还需要单击页面右上角“体验新版”,切换至新版仪表盘界面。 选择待操作的仪表盘,在对应“仪表盘”页面右上角单击。 在弹出的对话框中设置全屏模式在线时长。具体的参数说明请参见表1。 图1 设置在线时长 表1 在线时长参数说明 参数名称 说明 设置方式 在线时长的设置方式,包括以下两种:
新增标签 表1 新增标签参数表 参数名称 说明 标签名称 标签的名称。 支持输入2~64个字符,只能由大小写字母、数字、下划线、中划线、点和中文字符组成。 描述 标签的描述信息,最多可输入255个字符。 关联节点 标签要关联的节点。 区域:资源支持的区域,请从下拉列表中选择或输入关键字搜索后选择。
配置容器服务日志采集路径 AOM支持容器服务日志采集,并展现在AOM界面中,以供您检索。使用该功能前首先要配置日志采集路径,配置方法详见如下操作。 注意事项 ICAgent只采集*.log、*.trace和*.out类型的文本日志文件。 配置步骤 在CCE中添加日志策略 在CCE
安装机是远程安装方式下命令的执行机,必选项。 如果没有配置安装机,按如下步骤进行配置: 单击对应的下拉框,选择“设置安装机”。 图3 设置安装机 在弹出的对话框中,选择待配置为安装机的主机,并填写安装机名称。 完成后单击“确认”。 - 需安装UniAgent主机 需安装UniAgent主机的详细信息,必选项。
在左侧导航栏中,选择“UniAgent管理 > 虚机接入”。 在虚机接入中,选择待安装ICAgent的主机,单击“插件批量操作”。 图3 安装ICAgent 在弹出的对话框中,操作类型选择“安装”,选择插件为“ICAgent”,插件版本选择“5.12.163”,在“ak”、“sk”中输入4获取的AK/SK。
集群监控 集群监控的对象为通过CCE部署的集群。“集群监控”页面可实时监控集群的多项基础监控指标(例如集群状态、CPU使用率、内存使用率、节点运行状态等)和相关的告警、事件数据,通过这些指标和相关的告警信息,用户可实时了解集群的运行状况,及时处理潜在风险,保障集群稳定运行。 注意事项
采集管理 表1 采集管理基本概念 术语 说明 UniAgent 统一数据采集Agent,完成统一插件生命周期管理,并为AOM提供指令下发,如脚本下发和执行。它自身不提供数据采集能力,运维由不同的插件分工采集,插件按需安装、升级和卸载。后续逐步上线其它插件(如云监控和主机安全),统一规范管理。
用户自定义接入主机”。 在ICAgent列表中选中一个或多个待卸载ICAgent的服务器前的复选框,单击“卸载ICAgent”。在“卸载ICAgent”对话框中单击“确定”。 ICAgent开始卸载,卸载ICAgent预计需要1分钟左右,请耐心等待。待ICAgent的状态由“卸载中”变为“未安装”时,表示卸载成功。
以选择“云容器引擎CCE”卡片为例,云容器引擎CCE在购买后集群后默认已经安装ICAgent采集器。 选择云服务监控指标卡片: 在弹出的“云服务接入”对话框中选择需要监控的云服务。例如RDS或DCS服务。 单击“确定”完成接入。 接入完成后,系统自动跳转至“云服务监控”页面,即可查看已选择的云服务运行状态等信息。
查看事件 事件告诉您AOM自身或外部服务发生了某种变化,但不一定会引起业务异常,事件一般用来表达一些重要信息。您可根据需要对事件进行处理。用户可通过“事件”页面查看需要关注的事件,监控系统运行情况。 操作步骤 登录AOM 2.0控制台。 在左侧导航栏中选择“告警管理 > 告警列表”。
在左侧导航栏中选择“工作负载 ”,选择需要上报到AOM的工作负载类型。 在该工作负载对应的“操作”列中选择“更多 > 编辑YAML”。 在弹出的“编辑YAML”对话框中找到spec.template.metadata.annotations代码段。 图3 编辑yaml文件 在代码段中按照实际需要依次设
在资源列表中根据需要执行以下操作: 转移单个资源实例:单击对应资源实例“操作”列的“”。 转移多个资源实例:勾选对应资源实例前的复选框,单击页签底部的“”。 在“转移资源”对话框中设置转移的目标节点等信息,具体参数说明如表2所示。 表2 转移资源参数说明 参数 说明 选择节点 资源实例需要转移到的目标节点,请从下拉列表中选择。
创建阈值规则 通过阈值规则可对资源的指标设置阈值条件。当指标数据满足阈值条件时产生阈值告警,当没有指标数据上报时产生数据不足事件。 创建方式 阈值规则的创建方式分为两种:自定义阈值规则和使用模板创建阈值规则。一次创建后,只生成一条规则,无论是一个还是多个资源,均通过同一条规则进行
节点设置参数说明 参数类别 参数名称 说明 组件设置相关参数 组件名称 组件的名称。 支持输入2~64个字符,只能由大小写字母、数字、下划线、中划线、点和中文字符组成。 描述 组件的描述信息,最多可输入255个字符。 子应用设置相关参数 唯一标识 子应用的唯一标识。 支持输入2~64个字符,只能
默规则,告警管理系统根据标签属性进行告警管理和通知。 告警标签为key:value键值对格式,支持用户自定义。key 和value只能包含中文、字母、数字和下划线。 如果在创建告警规则时设置了告警标签,触发的告警会自动添加该标签为告警属性。 消息模板中通过$event.metadata
数据保护技术 AOM通过多种数据保护手段和特性,保障AOM的数据安全可靠。 表1 AOM的数据保护手段和特性 数据保护手段 简要说明 详细介绍 传输加密(HTTPS) AOM支持HTTPS传输协议,保证数据传输的安全性。 构造请求 数据冗余存储 指标、告警、配置等数据以多副本方式存储,保障数据可靠性。