检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
监控数据中会出现跳点的情况 监控数据中可能会出现某段时间无监控数据情况,该现象非功能或者设计缺陷,云监控服务指标采集插件Agent采集时间以云服务器操作系统时间为准,当系统时间出现跳变时会造成"丢点"的假象(时间同步导致时间跳变),实际上采集点并未丢失。 父主题: 主机监控
选择“云服务监控”。 分别单击弹性公网IP和带宽与NAT网关所在行的“创建告警规则”。 这里以平时的SNAT连接数为10000为例,高峰期为平时的2-3倍,因此配置SNAT连接数为30000的告警规则。 出网带宽使用率建议配置为80%。 “告警通知”功能触发产生的告警消息由消息通知服务SMN发送,
进入“监控看板”,查看该监控看板下的所有监控视图。 用户可根据业务需求,拖动其中的监控视图,调整监控视图的顺序。 单击监控视图上方的“近1小时”、“近3小时”、“近12小时”、“近24小时”、“近7天”,可切换该监控看板下的所有视图的监控周期,其中“近1小时”以内的监控时长系统默认
查看主机监控的资源详情 操作步骤 登录管理控制台。 单击“服务列表 > 云监控服务”。 单击左侧导航栏的“主机监控 > 弹性云服务器”。 单击需要查看资源详情的监控名称,进入“操作系统监控”界面。 单击右上角“查看资源详情”,弹出“查看资源详情”窗口。 可查看该监控的实例名称、实例ID、资源分组情况。
监控图表中单位为字节和字节每秒的指标支持单位切换。单位切换时,当最大值小于10^(-5)时,会出现最大值和最小值同时为0的情况,并且监控图表数据全为0。 打开“自动刷新”开关,可每分钟自动刷新一次数据。 通过搜索框,您可以查找特定指标。 部分服务支持查看资源详情,您可以通过单击页面上方的“查看资源详情”按钮来查看被监控资源的详细信息。
单击“服务列表 > 云监控服务”。 选择“我的看板 > 自定义监控看板”,进入“我的看板”界面。 通过下拉框切换账号即可查看其他账号下的看板,如图1所示。 图1 切换账号 若账号下无看板,需使用对应的账号登录进行创建看板操作,请参考创建监控看板。 父主题: 监控看板(新版)
云监控服务”。 查看ECS或BMS的监控指标: 支持企业项目的服务,系统默认展示用户拥有权限的企业项目的主机资源列表。 查看ECS操作系统监控指标的方法:单击左侧导航栏的“主机监控 > 弹性云服务器”,再单击ECS实例所在行的“查看监控指标”,如图1所示。 图1 操作系统监控 查看ECS基
对象存储服务提供按需付费、包年包月两种计费方式。用户可以根据实际需求变更资源的资费方式。OBS开通时,默认按照按需付费(使用量按小时计费),同时也支持包年包月(资源包)的方式提前购买使用额度和时长。 由于云监控服务需要高频次的访问转储事件文件的OBS桶,因此必须选择标准存储类型的OBS桶,具体价格请参考产品价格说明。
管理Agent 管理Agent(Linux) 查看、启动、停止、更新和卸载Agent需使用root用户。 查看Agent版本 使用root账号,登录主机。 执行如下命令,确认使用Agent的版本。 if [[ -f /usr/local/uniagent/extension/in
当主机挂载磁盘数量较多时,Agent占用的CPU或内存可能较高。您可以根据实际观测主机的资源占用率,参考操作步骤配置Agent熔断机制中的第一阈值和第二阈值。 操作步骤 使用root账号,登录Agent不上报数据的ECS或BMS。 可选:执行以下命令,切换至Agent安装路径的bin下。 Windo
据盘的磁盘使用率。查看方法如下:在操作系统监控指标查看页面,选择“磁盘”页签,然后选择右侧的挂载点,如图1所示。 图1 在操作系统监控页面查看数据盘的磁盘使用率 父主题: 告警
快速了解云服务资源的运行情况。 告警统计 告警统计提供最近7日告警趋势图、当前不同等级告警条数统计。 单击不同告警等级的规则条数,可以跳转至告警规则页面,显示所有该告警等级的所有告警规则。 在告警规则页面,单击“查看资源详情”,根据资源ID到相应云服务控制台查找具体资源进行处理。
上报的指标被丢弃问题排查 问题现象 插件状态正常,查询指标出现断点的情况。 分析 可能的原因如下: Linux时间与实际时间差距较大,Agent采集的指标上报到服务端会认为是无效指标,导致上报的指标被丢弃。 修复方法(Linux) 使用root账号登录主机,确认当前主机ntp服务正常,然后执行以下命令:
计划删除kms的key后,及时恢复kms的key或者及时解密数据。 kms的key被删除后用户无法进行磁盘加密。 查询墓碑数过多 TooManyQueryTombstones 重要 查询墓碑数过多,可能会导致查询超时,影响查询性能。 使用合理的查询删除方式,避免大批次的范围查询 可能会导致查询超时,影响查询性能。
告警规则在何种情况下会触发“数据不足”? 当某一个告警规则监控的告警指标连续三个小时内未上报监控数据,此时告警规则的状态将变为“数据不足”。 特殊情况下,如果指标的上报周期大于三个小时,连续三个周期均未上报监控数据,则告警规则状态变为“数据不足”。 父主题: 告警
响应时间等。 单击站点名称所在行的“查看监控图表”。 进入“监控图表”页面。在此页面您可以根据需要查看该站点“近3小时”、“近12小时”和“近24小时”的监控原始数据曲线图。 图1 查看监控图表 当监控指标为可用性指标时,监控图表显示的为一小时内的平均值。 聚合周期大于1小时,可用性指标按照聚合周期进行显示。
总览由资源监控和站点监控两部分组成。通过查看监控概览,让用户实时了解各云服务的资源告警情况和站点响应情况。 资源监控 资源监控是以资源分组维度横向展示和各个服务资源维度纵向分布,将各个资源的实时告警情况进行展示,用户可按照不同维度对资源告警进行关注,方便高效管理您的资源。 下面将介绍资源监控如何查看和使用。
拓展标签支持情况 该插件对于已对接云监控的云服务均支持指标数据的导出。为提高云服务资源的识别度、可读性,插件对于以下服务支持导出资源属性label,如ECS实例会增加hostname、ip等label,同时支持将华为云标签转化为label,满足对资源自定义label的诉求,具体如下表所示。
资源数(告警中/已触发/资源总数) 组内所有正在告警的资源数/已触发告警的资源数/组内所有资源的数量。 资源类型数 组内资源类型的数量,例如组内有2台弹性云服务器 、1个云硬盘两种资源类型,则资源类型数为2。 归属企业项目 拥有资源分组权限的企业项目名称。 创建方式 创建资源分组的方式,有手动添加和智能添加两种。
查看监控大盘 操作步骤 登录管理控制台。 单击“服务列表 > 云监控服务”。 选择“我的看板 > 监控大盘”。 在“监控大盘”界面,单击操作列的“查看”。 可查看监控大盘的详细信息。 父主题: 监控大盘