检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
配置监控视图 随着云上服务的业务日趋增长,用户对云监控服务的使用也日渐成熟,监控视图已添加的监控指标已经无法满足当前的监控需求,用户需要对监控视图中的监控指标进行修改、替换等操作。本章节指导用户如何实现在拆线图和条形图中完成监控指标的增加、修改、删除等日常操作。 曲线图的操作步骤
主机监控 针对众包平台中使用的ECS和BMS,ECS作为业务的计算资源,数据库部署在BMS上。因此,BMS的磁盘速度会影响数据库操作速度,ECS的内存和CPU占用大小等会影响业务执行速度,为了监控更细颗粒度的监控指标,可以在弹性云服务器中安装配置Agent。 具体监控指标方面,可
返回版本号,表示使用新版本Agent。 返回“0”,表示未安装Agent。 问题分析 弹性云服务器或裸金属服务器安装Agent后仍然无操作系统监控数据时,一般考虑有如下几个原因: Agent进程运行状态异常 委托异常 网络问题 问题解决(Linux) 以root用户登录弹性云服务器或裸金属服务器。 执行如下命令,检查telescope进程是否存在:
加安全组中DNS地址配置正确,然后参考《云监控服务用户指南》中“手动配置Agent”章节检查配置是否正确。 账号欠费。 Agent进程故障,请参照管理Agent重启,如果无法重启则说明相关文件被误删,请重新安装Agent。 配置异常: ECS/BMS主机没有配置委托。 当前委托权限异常。
在“创建告警规则”界面,根据界面提示配置参数。 根据界面提示,配置告警规则名称。 图4 配置告警规则名称 选择监控对象,配置告警触发条件。 图5 配置告警规则 配置“分组”参数时,选择在操作步骤1-创建资源分组中创建的“开发组资源”。 根据界面提示,配置告警通知参数。 图6 配置告警通知 注意,配置“通知对
可用于支撑安全分析、合规审计、资源跟踪和问题定位等常见应用场景。 用户开通云审计服务并创建和配置追踪器后,CTS可记录CES的管理事件和数据事件用于审计。 CTS的详细介绍和开通配置方法,请参见CTS快速入门。 CES支持审计的操作事件请参见云审计服务支持的Cloud Eye操作列表。
所关注指标对应的服务名称。 取值样例:弹性云服务器 维度 所关注指标的维度名称。 取值样例:云服务器 监控对象 所关注指标对应的监控对象,数量上限为50个。 可支持一次勾选多个监控对象。 监控指标 所关注指标的名称。 取值样例:CPU使用率 单击“下一步:配置图例名称”。 图例名称是显示在
信息。 PING 对指定的URL进行Ping探测。 TCP 对指定的端口进行TCP服务器探测。 高级设置中支持配置TCP的请求内容。 UDP 对指定的端口进行UDP服务器探测。 高级设置中支持配置UDP的请求内容。 父主题: 站点监控
命名空间 维度 监控指标参考文档 计算 弹性云服务器 SYS.ECS Key:instance_id Value:云服务器ID 弹性云服务器的基础监控指标 弹性云服务器中操作系统监控 AGT.ECS Key:instance_id Value:云服务器ID Key:disk Value:磁盘
广域网质量监控主要用于发送模拟真实用户对远端服务器的访问,从而探测远端服务器的可用性、连通性等问题。 服务可用性监控 通过使用广域网功能配置定时HTTP(S)拨测任务,选择分布在全球的探测点对域名进行HTTP(S)拨测,并根据协议拨测结果状态码识别服务的可用性,通过配置监控告警条件,可在出现异常状
为什么配置了5分钟聚合指标告警规则,实际却无法触发告警? 问题现象 已经配置了CBR等服务的5分钟聚合指标告警规则,连续3次触发则告警。实际却无法触发告警。 问题分析 CBR服务每15分钟上报一条指标数据,切换cloudsense告警引擎的region,此类指标无法在连续的两个5分钟时间窗内达到阈值,
电商业务内存要求高、数据量大并且数据访问量大、要求快速的数据交换和处理,监控要求极其高。 ECS为核心服务,全面、立体的ECS监控系统对业务稳定起到了至关重要的作用。主机监控功能可提供服务器的系统级、主动式、细颗粒度监控服务。为业务的顺畅运行保驾护航。 网站为电商平台的入口,双1
Linux类型的机器目前安装Agent支持单台安装和批量安装。目前部分机器支持在CES页面直接一键安装,或者在购买ECS的页面直接支持开启监控安装Agent。 支持一键安装的机器可直接在页面单击安装按钮进行安装。 图2 一键安装 CES还支持批量在界面实现对已支持一键安装的机器进行批量安装,无需登录机器或者单台安
在“创建告警规则”界面,配置参数。 配置告警规则的基本信息。 表1 事件监控的告警规则基本信息配置说明 参数 参数说明 名称 系统会随机产生一个名称,用户也可以进行修改。 描述 告警规则描述(此参数非必填项)。 选择监控对象,配置告警内容参数。 图1 配置事件监控的告警内容 表2
vs、G5、Pi2、Pi1、P1系列的ECS,P、Pi、G、KP系列的BMS。 已安装lspci工具,未安装lspci工具的云服务器不支持采集GPU指标数据及上报事件。 安装lspci工具的方法如下 登录弹性云服务器。 更新镜像源,获取安装依赖。 wget http://mirrors
错误码 ces.0429 可能原因 原因1:API被流控。详见下方【案例一】 解决方法 若API被流控,需第一时间找运维人员配置新的流程策略。 案例一 API被流控 查看弹性云服务器ID为6f3c6f91-4b24-4e1b-b7d1-a94ac1cb011d的CPU使用率在2019-04-30
告警模板”,进入告警模板界面。 在“告警模板”界面,单击“创建自定义模板”。 在“创建自定义告警模板”界面,参考表1进行参数配置。 图1 创建自定义告警模板 表1 配置参数 参数 参数说明 名称 系统会随机产生一个模板名称,用户也可以进行修改。 取值样例:alarmTemplate-c6ft
在“创建告警规则”界面,根据界面提示配置参数。 监控对象为当前的ECS,无需配置。 选择监控指标,选择“自定义创建”,参照配置参数说明完成参数配置。 以CPU使用率为例,由于需要给服务器预留部分处理性能保障服务器正常运行,所以建议将CPU告警阈值设置为80%,连续三次超过阈值后开始报警。 配置完成后,单击“立即创建”,完成创建告警规则。
GPU驱动正常安装后,最多10分钟将在控制台看到采集到的GPU指标数据。 已安装lspci工具,未安装lspci工具的云服务器不支持采集GPU指标数据及上报事件。 安装lspci工具的方法,请参见安装lspci工具。 确保云服务器的安装目录都有读写权限,并且安装成功后的Telescope进程不会被其他软件关闭。
资源分组简介 资源分组支持用户从业务角度集中管理其业务涉及到的云服务器、云硬盘、弹性IP、带宽、数据库等资源。从而按业务来管理不同类型的资源、告警规则,可以迅速提升运维效率。 购买了多种云产品的用户,通过资源分组功能将同一业务相关的云服务器、云硬盘、弹性IP、带宽、数据库等资源添加到同一资源