云服务器内容精选

  • 功能特性 查看监控指标:在监控指标页面上,您可以查看基于近1小时、近3小时 、近12小时、近 24小时、近7天和近30天收集的原始数据的图表。您可以自定义选择要查看的监控指标,数据可实现自动刷新。 创建告警规则:用户对云服务的核心监控指标设置告警规则,当监控指标触发用户设置的告警条件时,支持以 邮箱、短信、HTTP、HTTPS等方式通知用户,让用户在第一时间得知云服务发生异常,迅速处理故障,避免因资源问题造成业务损失。 导出监控数据:云服务监控支持您在所选的区间和周期内最多同时导出10个监控项,导出的监控报告中包含用户名、Region名称、服务名称、实例名称、实例ID、指标名称、指标数据、时间、时间戳,查询和筛选更加方便。
  • Agent安装配置方式说明 安装Agent方式有如下几种,你可以根据你所使用的服务的操作系统类型、是否有多个服务器以及个人习惯选择任何一种或多种安装方式: 安装场景 支持的服务 参考章节 控制台界面安装/升级Agent E CS 在控制台界面安装/升级Agent 安装Agent(Linux) ECS、BMS 单台主机下安装Agent 安装Agent(Windows) ECS 安装Agent(Windows) 批量安装Agent(Linux) ECS 批量安装Agent 安装配置依赖: 安装Agent依赖DNS的配置和安全组配置,DNS错误或安全组规则不正确会导致Agent包下载失败。 如果安装过程出现失败的情况,可以参考如何配置DNS和安全组?尝试恢复服务器DNS配置。 安装Agent后,可以通过“修复插件配置”完成委托配置和文件配置。 当通过“修复插件配置”或其他原因无法完成Agent配置时,您还可以手工配置Agent。 支持安装Agent的操作系统请参见Agent支持的系统有哪些。 对于私有镜像,推荐您使用已安装Agent的ECS或BMS制作私有镜像,并使用该私有镜像创建ECS或BMS。 制作的私有镜像不支持跨Region使用,跨Region使用会导致没有监控数据。 注意:使用私有镜像安装使用Agent过程中出现任何问题, CES 将不对此提供技术支持。 父主题: 云监控 插件(Agent)
  • 云监控服务 自定义策略样例 示例1:授权用户拥有云监控服务修改告警规则的权限。 { "Version": "1.1", "Statement": [ { "Action": [ "ces:alarms:put" ], "Effect": "Allow" } ] }
  • 按自定义时间段查看监控指标 监控指标默认显示“近1小时”、“近3小时”、“近12小时”、“近24小时”、“近7天”的数据,如果您想要看近2小时或者某自定义时间段的指标时可以使用拖动选择自定义时间段功能。 按自定义时间段查看监控指标详情:单击监控视图详情右侧的第一个图标,如图3所示。拖动选择自定义时间段,系统自动展示所选时间段内的监控数据。 图3 自定义时间段 退出自定义时间段监控指标详情:单击监控视图详情右侧的第三个图标。
  • 选择监控对象查看监控指标 为了对比各资源的某项监控指标,您可以将多个资源的监控指标集中到一个监控制图中。但是当资源较多时,如只想对比其中的部分资源的指标数据,那么可以使用拖动选择监控对象功能。 选择监控对象:单击监控视图详情右侧的第二个图标,如图4所示。拖动选择需要显示在监控视图详情中的监控对象,系统自动显示您选择的监控对象数据,其他监控数据则会隐藏起来。 图4 选择监控对象 重置监控对象筛选:单击监控视图详情右侧的第三个图标。 在监控视图详情窗口下方,您还可以通过以下方法选择监控对象:单击某一个资源对象关闭该监控项的走势图,再次单击该监控对象即可开启显示该指标走势。
  • 告警通知 当告警触发后,我们需要定义通知的渠道和对象,快速的将告警信息通过配置的渠道通知到运维人员。 当前CES支持以下三种方式来完成通知的配置。 通知策略(推荐):产品最新上线能力,通过通知策略可以完成告警的分级通知、简易排班。 通知组:通过在云监控服务上配置的通知群组,可以快速通知到指定运维人员。 主体订阅:通过在 消息通知 服务( SMN )配置的主题,快速将该消息推送至消息主题。 通知配置模块如下图所示。 通知策略模块如下图所示。 监控最核心的职责是帮助用户发现问题,而问题的发现是依赖监控系统中对告警规则的配置,告警规则配置的覆盖率、准确率将直接影响监控系统的故障发现率。
  • 告警状态有哪些? 目前云监控服务支持五种告警状态: 告警中、已解决、数据不足、已触发、已失效。 告警中:监控指标数值达到告警配置阈值,资源正在告警中; 已解决:监控指标数值恢复至正常区间,资源的告警已解决; 数据不足:连续三个小时未有监控数据上报,通常是由于相应服务实例被删除或状态异常导致; 已触发:监控的资源触发了告警策略中配置的事件; 已失效:告警规则中监控的资源或告警策略有调整,原有的告警记录状态失效。 父主题: 告警
  • Agent各种状态说明及异常状态处理方法 插件有以下四种状态: 运行中:插件正常运行,监控数据上报正常。 未安装: Agent未安装,安装方法参考《云监控服务用户指南》中的“Agent安装说明”章节。 Agent已经安装,委托未配置,委托配置方法参考如何配置委托?。 Agent已经安装,网络配置异常,修复方法参考修改DNS与添加安全组。 已停止: Agent被手动停止,启动插件方法参考管理Agent。 故障:监控插件每1分钟发送1次心跳;当服务端3分钟收不到插件心跳时,“插件状态”显示为“故障”。 Agent 域名 无法解析,修复方法参考修改DNS与添加安全组(Linux)、修改DNS与添加安全组(Windows)。 账号欠费。 Agent进程故障,先尝试重启Agent,重启Agent方法参考管理Agent。如果重启后状态还是故障,可能Agent相关文件被破坏,请尝试重新安装Agent,安装方法参考Agent安装说明。 服务器内部时间和本地标准时间不一致。 使用的DNS非华为云DNS,请通过执行dig+目标域名获取到agent.ces.myhuaweicloud.com在华为云内网DNS下解析到的IP后再添加对应的hosts。华为云提供的内网 DNS地址 请参见华为云提供的内网DNS地址是多少?。 请将Agent升级为最新版本,详情请参考升级Agent。 父主题: 主机监控
  • 入门实践 当您了解了云监控服务的功能后,可以根据自身的业务需求使用云监控服务搭建业务的系统级监控。 本文介绍云监控服务常用最佳实践,帮助您更好的使用云监控服务。 表1 常用最佳实践 实践 描述 电商平台 电商平台最佳实践 电商业务对内存要求高、数据量大并且数据访问量大、要求快速的数据交换和处理,监控要求极其高。 主机监控功能可提供服务器的系统级、主动式、细颗粒度监控服务。 站点监控功能可对网站或ECS的弹性IP等进行持续拨测,监控业务入口的可用性及响应时间。 云服务监控功能在云服务监控页面实时查看云服务运行状态、各个指标的使用情况并对监控指标设置告警规则,精确掌握云服务的运行情况。 资源分组功能从业务视角查看资源使用情况、告警情况、健康情况,管理告警规则,可以极大的降低运维复杂度,提高运维效率。 视频直播 视频直播最佳实践 在互联网飞速发展的时代,视频直播服务需求量不断加大。华为云稳定的ECS、VPC、ELB,可为您的视频直播服务提供稳定的资源,以保障便捷接入、低延迟、高并发、高清流畅的视频直播服务,减少视频卡顿、模糊带来的用户体验差的问题。华为云云监控可提供对ECS、VPC、ELB等资源的监控,及时发现异常并通知用户处理。 众包平台 众包平台最佳实践 众包平台作为知识工作者共享平台,利用互联网来将工作分配出去,连接雇主和服务提供者。在华为云部署的众包平台的经典架构图中,BMS与ECS的运行状态对整体业务至关重要,CPU、内存、磁盘使用率等会直接影响整体业务状态,因此,需使用主机监控和事件监控随时监控ECS与BMS的运行状况。网站与各个基础接口的可用性、响应时间、丢包率等会直接影响用户使用的流畅程度,需使用站点监控随时监控各站点的运行情况。网络监控功能可随时监控各业务系统的网络状态。 事件监控 弹性云服务器事件 在各业务中,弹性云服务器作为核心基础,细微的性能变化,运行异常及自动恢复,都可能会引起云服务上的业务受到大幅震荡。因此需使用云监控的事件监控功能对服务器运行异常及自动恢复进行监控,订阅事件告警同步进行业务处理。 关系型数据库事件 关系型数据库是一种基于 云计算平台 的即开即用、稳定可靠、弹性伸缩、便捷管理的在线关系型数据库服务。在使用关系型数据库中,需持续关注数据库状态,可通过事件监控,对异常事件告警进行处理,保证业务稳定运行。 弹性公网IP事件 当您的弹性云服务器要访问Internet时,您可使用虚拟私有云创建的弹性公网IP绑定到弹性云服务器上,弹性云服务器即可连接公网。不同弹性公网IP还可以共享带宽,减少您的带宽成本。使用弹性公网IP时,可使用事件监控弹性公网IP的状态,可防止出现异常事件,导致丢包等情况影响用户业务,用户需要订阅事件告警同步进行业务处理。 告警通知 上报指定资源的监控指标 云监控服务提供了资源分组功能和告警功能。资源分组功能将资源进行有效分组。告警功能对云服务的核心监控指标设置告警规则,当监控指标触发用户设置的告警条件时,支持以邮箱、短信、HTTP、HTTPS等方式通知用户,让用户在第一时间得知云服务发生异常,迅速处理故障,避免因资源问题造成业务损失。 配置云服务器全部挂载点告警规则 配置云服务器全部挂载点磁盘使用率告警规则 云监控服务提供了配置云服务器全部挂载点告警规则的能力。磁盘使用率指标调整为挂载点维度,在新配置磁盘使用率告警规则时需要选择“云服务器挂载点”维度。
  • 日志数据类图表 日志数据类图表支持的图表类型:折线图、数字图、表格、柱状图、数字折线图、饼图、地图。 折线图:属于趋势类分析图表,一般用于表示一组数据在一个有序数据类别(多为连续时间间隔)上的变化情况,用于直观分析数据变化趋势。当需要监控一段时间内一个或多个资源的日志数据趋势时,请使用此类型图表。 如下图所示,在同一个图表中展示了CPU的使用率数据。 图7 折线图 表7 折线图图表配置说明 参数类别 参数名称 说明 标准配置 格式化 在下拉框选择“K,Mil,Bil”、“1000000”或“Byte,KB,MB”等格式,将Y轴按照指定格式进行显示。 单位 自定义配置Y轴的单位。 小数位数 开启后显示数字小数点后的位数。 小数点位数 设置显示数值小数点位数。 查询分析设置 X轴数据 支持数字或字符串数据。 Y轴数据 支持数字或字符串数据,可以选择多个数据。 维度列 请从下拉列表中选择,一般为有序数据类别。 趋势对比 当X轴为时间数据时,且不设置维度列时,可开启该按钮。 开启后,设置比较对象时间,时间小于等于24小时。设置完成后,将当前时间的数据与对象时间数据进行比较。 图例配置 隐藏图例 开启后,可以隐藏图例和对比值的显示。 图例位置 选择图表顶部或图表右边。 对比数值 选择显示最大值、最小值、平均值、求和值等,可勾选多个。 图形配置 连接方式 设置线图显示格式,可选择直线或曲线。 线宽 折线的线宽。 是否显示点 开启该功能后,显示折线的连接点。 上边距 坐标轴距离图表上边界距离。 下边距 坐标轴距离图表下边界距离。 左边距 坐标轴距离图表左边界距离。 右边距 坐标轴距离图表右边界距离。 Tooltip配置 排序方式 提示框配置,当Y轴数据选择多个时,可对其进行排序显示。 X轴 显示X轴 开启后,显示X轴数据。 X轴名称 设置X轴名称。 Y轴 显示Y轴 开启后,显示Y轴数据。 Y轴名称 设置Y轴名称。 Y轴位置 设置Y轴位置,左边或者右边。 数字图:用于突出显示单个数值。当需要实时监控某个指标的最新数值时,可使用此类型的图表。 图8 数字图 表8 数字图图表配置说明 类别 参数名称 说明 查询分析设置 数值列 支持数字或字符串数据。 同比数据 选择待对比的字段,在图表中显示该字段对应的值。 主体配置 格式化 将数据按照指定格式进行显示。 数值字号 显示值的字号,取值范围为12px~80px。 数值单位 显示值的单位 单位字号 显示值单位的字号,取值范围为12px~50px。 小数位数 开启后显示数字小数点后的位数。 小数点位数 设置显示数值小数点位数。 添加对比值 开启后,显示待对比字段对应的值。 对比值格式化 将待对比数据按照指定格式进行显示。 对比值字号 待对比值的字号,取值范围为12px~50px。 对比值单位 待对比值的单位。 对比值单位字号 显示待对比值单位的字号,取值范围为12px~50px。 描述 对显示的数值及对比值趋势的描述,显示在数值下方。 背景配置 背景色 图表的背景颜色,支持深色或浅色。 表格:能够系统、简洁、集中和对比性较强地表述内容,直观地表达分类的关系或对比量的准确程度,进而更加准确的展示该分类数据。 图9 表格 表9 表格图标配置说明 类别 参数名 说明 标准配置 格式化 将表格数据按照指定格式进行显示。 单位 自定义配置表格数据的单位。 小数位数 开启后显示数字小数点后的位数。 小数点位数 设置显示数值小数点位数。 查询分析设置 隐藏字段 选择目标字段,将该字段在表格中隐藏。 表格配置 每页显示 每页显示的数据条数。 显示总数 显示表格数据的总条目数。 列配置 对齐方式 表格数据的对齐方式,支持左对齐,右对齐以及居中。 开启搜索 开启后,即可对表格列数据进行搜索功能。 开启排序 开启后,即可对表格列数据进行排序功能。 字体大小 表格字体的大小,取值范围为12px~24px。 柱状图:使用垂直或水平的柱形平面显示类别之间的数值比较,用于描述分类数据,并统计每一个分类中的数量。您也可以绘制多个矩形对应同一个分类属性,分为分组和层叠两种模式,进而分析该分类数据在不同维度上的区别。 如下图所示,在同一个图表中展示了CPU内核占用率平均值数据。 图10 柱状图 表10 柱状图图表配置说明 参数类别 参数名称 说明 标准配置 格式化 将Y轴按照指定格式进行显示。 单位 自定义配置Y轴的单位。 小数位数 开启后显示数字小数点后的位数。 小数点位数 设置显示数值小数点位数。 柱配置 方向 选择基础柱状图或横向柱状图。 柱宽度 设置柱宽度。 是否显示值 开启后,显示各个条形体对应的数值。 值字体大小 设置各个条形体对应的数值字体大小。 是否堆叠 开启后,将堆叠显示Y轴数据。 查询分析设置 X轴数据 支持数字或字符串数据。 Y轴数据 支持数字或字符串数据,可以选择多个数据。 图例配置 隐藏图例 开启后,可以隐藏图例和对比值的显示。 图例位置 图例在图表中的位置,选择图表顶部或图表右边。 对比数值 选择显示最大值、最小值、平均值、求和值等,可勾选多个。 图形配置 上边距 坐标轴距离图表上边界距离。 下边距 坐标轴距离图表下边界距离。 左边距 坐标轴距离图表左边界距离。 右边距 坐标轴距离图表右边界距离。 Tooltip配置 排序方式 提示框配置,当Y轴数据选择多个时,可对其按照不排序、升序、降序进行排序显示。 X轴 显示X轴 开启后,显示X轴数据。 X轴名称 设置X轴名称。 Y轴 显示Y轴 开启后,显示Y轴数据。 Y轴名称 设置Y轴名称。 Y轴位置 设置Y轴位置,左边或者右边。 数字折线图:属于趋势类分析图表,一般用于表示一组数据在一个有序数据类别(多为连续时间间隔)上的变化情况,并直观的展示相关数据分析。当需要监控一段时间内一个或多个资源的日志数据趋势时,请使用此类型图表。 如下图所示,在同一个图表中展示了不同时段CPU使用率。 图11 数字折线图 表11 数字折线图图表配置说明 参数类别 参数名称 说明 查询分析设置 X轴数据 支持数字或字符串数据。 Y轴数据 支持数字或字符串数据,可以选择多个数据。 图表样式 连接方式 设置线图显示格式,可选择直线或曲线。 主体配置 数据格式 将数据按照指定格式进行显示。 数值字号 显示值的字号,取值范围为12px~80px。 数值单位 显示值的单位。 单位字号 显示值单位的字号,取值范围为12px~50px。 小数位数 开启后显示数字小数点后的位数。 小数点位数 设置显示数值小数点位数。 背景配置 背景色 图表的背景颜色,支持深色或浅色。 饼状图:用于表示不同分类的占比情况,通过弧度大小来对比各种分类。饼图通过将一个圆饼按照分类的占比划分成多个区块,整个圆饼代表数据的总量,每个区块表示该分类占总体的比例大小,所有区块的加和等于100%。 如下图所示,在同一个图表中展示了不同国家所在省份的日志用户数据。 图12 饼状图 表12 饼图图表配置说明 参数类别 参数名称 说明 标准配置 格式化 在下拉框选择K,Mil,Bil、1000000或Byte,KB,MB等格式,将Y轴按照指定格式进行显示。 单位 自定义配置单位。 小数位数 开启后显示数字小数点后的位数。 小数点位数 设置显示数值小数点位数。 饼图配置 饼图类型 包括饼图、环图和南丁格尔玫瑰图。 饼图 饼图是一种用于展示各部分组成在整体中所占百分比的图形。它通过将一个圆形划分为不同的扇区,每个扇区的面积(或弧长和圆心角)大小对应所表示的数据的比例,从而直观地展示出各部分与整体之间的关系。 环图 环图本质上是将饼图中心挖空,相比于饼图来说有如下优点: 在原有构成的基础上增加了总数显示,展示了更多的信息。 两个饼图直接进行比较是非常不直观的,两个环图间可以通过环状条长度进行简单的对比。 南丁格尔玫瑰图 南丁格尔玫瑰图本质上并不是环图,而是在极坐标系下画出来的柱状图,每一个分类数据被圆弧平分,使用圆弧的半径长短表示数据的大小,相比于饼图来说有如下优点: 饼图适用于不超过10条的分类数据,南丁格尔玫瑰图则适用于分类较多的场景(10-30条数据)。 由于半径和面积是成平方的关系,南丁格尔玫瑰图放大了各个分类数据之间值的差异,尤其适合对比大小相近的数值。 由于圆形有周期的特性,南丁格尔玫瑰图也适用于表示一个周期的时间概念,比如星期、月份。 是否显示刻度 开启后,显示饼图上的文本标签,可用于说明图形的一些数据信息,比如值,名称等。 刻度文本格式 可配置为分类、百分比、分类:百分比或分类:数值(百分比)。 标签位置 开启是否显示刻度后,可配置此参数,调整标签在图表中的位置。 查询分析设置 数据 分类数据对应的数值。 第一层数据 类目 分类数据。 展示数量 显示分类数据的个数。 排序方式 升序或降序。 其余归为其他 开启后,除了展示的数据,其余归为其他方式展示。 添加分层 单击添加分层,设置第二层数据,每层数据包括类目、展示数量、排序方式、其余归为其他。 图例配置 隐藏图例 开启后,可以隐藏图例和图例内容的显示。 图例内容 选择显示值和百分比,可勾选多个。 图例位置 图例在图表中的位置,选择图表顶部或图表右边。 图形配置 外半径 指定饼图外半径值。取值范围为40~100 。 内半径 指定饼图内半径值。取值范围为0~100。 上边距 坐标轴距离图表上边界距离。 下边距 坐标轴距离图表下边界距离。 左边距 坐标轴距离图表左边界距离。 右边距 坐标轴距离图表右边界距离。 地图:将日志数据以国、省、市级地图形式地理化呈现。使用地图可对不同国家、省、市的同一日志进行对比,如下图所示,在同一个图表中展示了不同省份的日志用户。 图13 地图 表13 地图图表配置说明 参数名称 说明 地图类型 请从下拉列表中选择,包括中国省级地图、世界地图。 省份 “地图类型”设置为“中国省级地图”,则需要设置省份信息。 国家 “地图类型”设置为“世界地图”,则需要设置国家信息。 数值列 位置信息对应的数据量。
  • 指标数据类图表 指标类图表支持选择的图表类型有:折线图、数字图、TopN、表格、柱状图、数字折线图。 折线图:属于趋势类分析图表,一般用于表示一组数据在一个有序数据类别(多为连续时间间隔)上的变化情况,用于直观分析数据变化趋势。当需要监控一段时间内一个或多个资源的指标数据趋势时,请使用此类型图表。 使用折线图可对不同资源的同一指标进行对比,如下图所示,在同一个图表中展示了不同主机的CPU使用率。 图1 折线图 表1 折线图图表配置说明 参数类别 参数名称 说明 图形配置 连接方式 设置线图显示格式,可选择直线或曲线。 是否显示区域 开启该功能后,使用折线图监控指标时,指标数据在图表中显示背景色。 上边距 坐标轴距离图表上边界距离。 下边距 坐标轴距离图表下边界距离。 左边距 坐标轴距离图表左边界距离。 右边距 坐标轴距离图表右边界距离。 X轴 显示X轴 开启该功能后,显示X轴。 X轴名称 设置X轴的名称。 Y轴 显示Y轴 开启该功能后,显示Y轴。 Y轴名称 设置Y轴的名称。 Y轴范围 自定义设置Y轴的最小值和最大值,确定Y轴数值区间。 数字图:用于突出显示单个数值。当需要实时监控某个指标的最新数值时,可使用此类型的图表。 如下图所示,可实时查看主机的CPU使用率。 图2 数字图 表2 数字图图表配置说明 参数名称 说明 显示微缩图标 开启该功能后,将按照一定的比例将图标缩小,并增加折线图。 TopN:统计单位为集群,统计对象为集群下的资源(这里的资源指主机、组件和实例)。资源TopN图表可视化地展示了集群中资源占用最高的N个资源,默认展示占用最高的前五个资源。 当资源数量很多时,您想快速了解资源占用最高的资源,可在仪表盘中添加TopN图表,您只需要选择资源类型和指标,例如主机的CPU使用率,那么 AOM 将自动将TopN的主机挑选出来以N个条形图的形式展示,如果不超过N个资源,则按照实际资源展示。 如下图所示,在同一个图表中展示了主机的CPU使用率Top5。 图3 TopN图 表3 TopN图表配置说明 参数类别 参数名称 说明 - 排序方式 设置数据的排序方式,默认为降序。 限制数量 设置TopN图表中显示的条形图数量,默认为5个。 展示维度 设置TopN图表中展示的指标维度。 柱宽 设置柱宽度,可选择auto、16、22、32、48、60,默认展示auto。 单位 设置展示数据的单位,默认单位为“%”。 显示X轴刻度 开启该功能后,显示X轴的刻度。 显示数值 开启该功能后,显示Y轴的数值。 显示Y轴线条 开启该功能后,显示Y轴的线条。 高级设置 左边距 坐标轴距离图标左边界距离。 右边距 坐标轴距离图标右边界距离。 上边距 坐标轴距离图标上边界距离。 下边距 坐标轴距离图标下边界距离。 表格:能够系统、简洁、集中和对比性较强地表述内容,直观地表达分类的关系或对比量的准确程度,进而更加准确的展示该分类数据。 如下表所示,在一个图表中展示了不同主机的CPU使用率。 图4 表格 表4 表格图表配置说明 参数名称 说明 字段名 展示字段参数名。 字段重命名 可重命名表头参数名称。 柱状图:使用垂直或水平的柱形平面显示类别之间的数值比较,用于描述分类数据,并统计每一个分类中的数量。您也可以绘制多个矩形对应同一个分类属性,分为分组和层叠两种模式,进而分析该分类数据在不同维度上的区别。 在同一个图表中展示了不同主机的CPU使用率。 图5 柱状图 表5 柱状图图表配置说明 参数类别 参数名称 说明 图形配置 上边距 坐标轴距离图表上边界距离。 下边距 坐标轴距离图表下边界距离。 左边距 坐标轴距离图表左边界距离。 右边距 坐标轴距离图表右边界距离。 X轴 显示X轴 开启该功能后,显示X轴。 X轴名称 设置X轴名称。 Y轴 显示Y轴 开启该功能后,显示Y轴。 Y轴名称 设置Y轴名称。 Y轴范围 自定义设置Y轴的最小值和最大值,确定Y轴数值区间。 数字折线图:属于趋势类分析图表,一般用于表示一组数据在一个有序数据类别(多为连续时间间隔)上的变化情况,并直观的展示相关数据分析。当需要监控一段时间内一个或多个资源的指标数据趋势时,请使用此类型图表。 如下图所示,在同一个图表中展示了不同时段CPU使用率。 图6 数字折线图 表6 数字折线图图表配置说明 参数类别 参数名称 说明 图表样式 连接方式 设置线图显示格式,可选择直线或曲线。 隐藏图例 开启该功能后,隐藏折线的图例。 显示X轴 开启该功能后,显示X轴。 显示Y轴 开启该功能后,显示Y轴。 是否显示点 开启该功能后,显示折线的连接点。
  • 约束与限制 只有组织管理员或委托管理员账号才可以创建多账号聚合Prometheus实例,并执行接入账号的操作。设置委托管理员相关操作请参见添加、查看和取消委托管理员。 以委托管理员登录,如果无法执行接入账号操作,请参考给 IAM 用户授权为委托管理员授予以下权限: organizations:trustedServices:list organizations:organizations:get organizations:delegatedAdministrators:list organizations:accounts:list organizations:delegatedServices:list AOM只支持接入组织单元OU下的成员账号,当OU和成员账号所属关系变化时,AOM不会自动同步OU和成员账号的关系信息。
  • 接入账号 登录AOM 2.0控制台。 在Prometheus实例列表中,单击多账号聚合类型的Prometheus实例名称,进入该实例的“账号接入”界面。 在“账号接入”界面可以管理成员账号、接入云服务、选择数据存储,并添加云服务支持的相关指标。 管理成员账号:AOM为企业用户提供多账号关系的管理能力,支持用户将多个华为云账号整合到创建的组织中,并可以集中管理组织下的所有账号。组织下有三种成员类型,分别为组织管理员、委托管理员和普通用户。普通用户无权限在AOM监控多账号指标。 需要监控某个成员账号的指标,则单击“成员账号”文本框,在弹出的搜索框中输入账号关键字,下面的账号树中自动显示相关的成员账号,根据需要勾选需要监控的成员账号即可。 需要停止监控某个成员账号的指标,则在“账号接入”界面的“成员账号”文本框中删除对应的成员账号。 接入云服务:从云服务下拉列表中选择需要监控的一个或多个云服务。 数据存储:组织内子账号指标数据接入Prometheus For聚合实例后,子账号保留数据。系统默认不选择。 添加云服务支持的相关指标:单击“新增指标”,依次为接入的云服务添加相关指标。 图1 账号接入界面
  • 约束与限制 当前仅华北-乌兰察布二零一、华北-北京一、华南-广州、西南-贵阳一、亚太-新加坡、中国-香港、华东-上海一、华东-上海二区域可以直接使用 APM 配置功能,华北-北京四区域需提前在“菜单开关”中开启应用监控和配置的开关,详细操作请参见菜单开关。 APM配置功能当前仅在华北-乌兰察布二零一、华北-北京一、华北-北京四、华南-广州、西南-贵阳一、亚太-新加坡、中国-香港、华东-上海一、华东-上海二区域开放。
  • 事件监控支持的事件说明 表1 文档数据库服务 事件来源 事件名称 事件ID 事件级别 事件说明 处理建议 事件影响 DDS 创建实例业务失败 DDSCreateInstanceFailed 重要 创建文档数据库实例失败产生的事件,一般是由于磁盘个数、配额不足,底层资源耗尽导致。 检查磁盘个数、配额大小是否满足需求,并考虑释放资源后重新创建实例。 无法创建数据库实例。 复制状态异常 DDSAbnormalReplicationStatus 重要 出现“复制状态异常”事件通常有两种情况: 主备之间复制时延太大(一般在写入大量数据或执行大事务的时候出现),在业务低峰期,备节点数据会逐渐追上主节点。 主备间的网络中断,导致主备复制异常。 提交工单。 不会导致原来实例的读写中断,客户的应用是无感知的。 复制状态异常已恢复 DDSReplicationStatusRecovered 重要 复制时延已回到正常范围内,或者主备之间的网络通信恢复。 不需要处理。 无 实例运行状态异常 DDSFaultyDBInstance 重要 由于灾难或者物理机故障导致实例故障时,会上报该事件,属于关键告警事件。 提交工单。 可能导致数据库服务不可用。 实例运行状态异常已恢复 DDSDBInstanceRecovered 重要 针对灾难性的故障,NoSQL有高可用工具会自动进行恢复或者手动恢复,执行完成后会上报该事件。 不需要处理。 无 节点运行状态异常 DDSFaultyDBNode 重要 由于灾难或者物理机故障导致数据库节点故障时,会上报该事件,属于关键告警事件。 检查数据库服务是否可以正常使用,并提交工单。 可能导致数据库服务不可用。 节点运行状态异常已恢复 DDSDBNodeRecovered 重要 针对灾难性的故障,NoSQL有高可用工具会自动进行恢复或者手动恢复,执行完成后会上报该事件。 不需要处理。 无 实例主备切换 DDSPrimaryStandbySwitched 重要 在手动触发的主备倒换或节点故障自动触发的故障倒换场景下,会上报该事件。 不需要处理。 无 数据盘空间不足 DDSRiskyDataDiskUsage 重要 数据盘空间不足,产生此告警。 请参见对应服务用户指南中“扩容磁盘”的内容,进行磁盘扩容。 实例被设为只读模式,数据无法写入。 数据盘空间已扩容并恢复可写 DDSDataDiskUsageRecovered 重要 数据盘空间已扩容并恢复可写,产生此事件。 无需处理。 无影响。 用户计划删除KMS密钥 DDSplanDeleteKmsKey 重要 一般由于用户计划删除kms的key导致。 计划删除kms的key后,及时恢复kms的key或者及时解密数据。 kms的key被删除后用户无法进行磁盘加密。 父主题: 事件监控