检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
配置监控视图 随着云上服务的业务日趋增长,用户对云监控服务的使用也日渐成熟,监控视图已添加的监控指标已经无法满足当前的监控需求,用户需要对监控视图中的监控指标进行修改、替换等操作。本章节指导用户如何实现在拆线图和条形图中完成监控指标的增加、修改、删除等日常操作。 曲线图的操作步骤
败。 如果安装过程出现失败的情况,可以参考如何配置DNS和安全组?尝试恢复服务器DNS配置。 安装Agent后,可以通过“修复插件配置”完成委托配置和文件配置。 当通过“修复插件配置”或其他原因无法完成Agent配置时,您还可以手工配置Agent。 支持安装Agent的操作系统请参见Agent支持的系统有哪些。
Agent版本特性 CES Agent支持的镜像列表,参见 Agent支持的系统有哪些? CES Agent迭代版本已知版本特性如下: 2.7.2.1版本 基于2.7.2版本: 增加GPU指标。 增加NPU指标。 增加物理机硬件监控能力。详情说明参考BMS硬件监控插件说明。 2.7.2版本 增加自定义进程监控指标。
自定义看板配置方式 配置自定义看板
如果选择了配置云服务器全部挂载点的告警规则,后续该云服务器的新增挂载点会自动适配该告警规则。 对于用户之前已配置的包含挂载点磁盘使用率的告警规则,在用户修改告警规则时,会提示将该条告警规则拆分成不同维度的多条规则。建议在拆分时,选择将拆分后的挂载点规则,替换为全部挂载点。 图1 配置挂载点告警规则优化前后示意图
本章节指导用户为Windows系统的ECS主机添加域名解析并添加安全组,防止下载Agent安装包与采集监控数据时出现异常。 修改ECS的DNS配置有两种方式:Windows图形化界面和管理控制台。您可以根据自己的使用习惯选择其中一种方式进行配置。 添加DNS服务解析和配置安全组针对的是主网卡。 修改DNS(Windows图形化界面)
确认执行窗口对业务的影响。 实例等待执行规格变更操作。 实例计划重新部署等待执行 instance_redeploy_scheduled 重要 由于底层硬件、系统运维等影响,实例在计划时间重新部署到新主机,任务等待执行。 确认执行窗口对业务的影响。 实例等待执行重部署。 实例计划重启等待执行
Agent一键修复失败问题排查 问题现象 安装主机监控Agent后,单击“修复插件配置”后,插件状态仍然是“配置异常”。 约束与限制 当前章节的修复方式只支持新版本Agent,若Agent版本为老版本,建议先升级到新版本。 查看当前Agent版本的命令为: if [[ -f /usr/
企业项目的子用户在配置告警规则时,无法选择全部资源 配置告警规则可选择全部资源的功能只有主账号或配置了Tenant Administrator权限的子用户才有权使用。 如何为子账号设置Tenant Administrator权限,请参考创建用户组并授权。 父主题: 告警
选择监控对象,配置告警内容参数。 表2 主机监控告警内容配置说明 参数 参数说明 取值样例 告警类型 告警规则适用的告警类型,可选择指标或者事件告警。 指标 资源类型 配置告警规则监控的服务名称。 弹性云服务器 维度 用于指定告警规则对应指标的维度名称 云服务器 监控范围 告警规则适用的资源范围。
单击页面左侧的“事件监控”,在事件监控页面,单击相页面右上角的创建告警规则,根据界面提示配置参数。 事件名称分别配置因硬件故障触发重启、因硬件故障重启已完成,具体参数说明请参见创建告警规则。 配置完成后,单击“立即创建”,完成创建告警规则。 告警通知”功能触发产生的告警消息由消息
本章节指导用户为Linux系统的ECS或BMS添加域名解析并添加安全组,防止下载Agent安装包与采集监控数据时出现异常。本章节以ECS为例介绍如何修改DNS和添加安全组,BMS操作步骤类似。 修改ECS的DNS配置有两种方式:命令行和管理控制台。您可以根据自己的使用习惯选择其中一种方式进行配置。 添加
已配置DNS和安全组,配置方法参考如何配置DNS和安全组?。 已配置委托,配置方法参考如何配置委托?。 确保操作步骤中的安装目录都有读写权限,并且安装成功后的Telescope进程不会被其他软件关闭。 确保已下载Agent安装脚本,获取脚本的方式如下: 表1 获取Linux镜像的Agent安装脚本
已配置DNS和安全组,配置方法参考如何配置DNS和安全组?。 已配置委托,配置方法参考如何配置委托?。 确保操作步骤中的安装目录都有读写权限,并且安装成功后的Telescope进程不会被其他软件关闭。 登录方式为账号密码:已收集需要安装Agent的所有主机的IP地址和root用户密码,按照iplist.tx
已配置DNS和安全组,配置方法参考如何配置DNS和安全组?。 已配置委托,配置方法参考如何配置委托?。 使用具有administrator权限的账户安装,例如administrator用户,并且确保安装成功后的Telescope进程不会被其他软件关闭。 已获取Agent安装包,格式为exe/zip,安装包获取方式如下。
为什么配置了5分钟聚合指标告警规则,实际却无法触发告警? 问题现象 已经配置了CBR等服务的5分钟聚合指标告警规则,连续3次触发则告警。实际却无法触发告警。 问题分析 CBR服务每15分钟上报一条指标数据,切换cloudsense告警引擎的region,此类指标无法在连续的两个5分钟时间窗内达到阈值,
到阈值时就告警了,并不是磁盘A的读写指标同时达到阈值时才告警。 云产品的与告警规则,当前是按实例层级计算告警的,只要该实例下所有配置的指标都触发了阈值,就会产生告警,如要配置具体资源的与告警,建议告警规则的资源层级选择子维度。 父主题: 告警
Files\telescope\log\ces.log 使用的DNS非华为云DNS,请通过执行dig+目标域名获取到agent.ces.myhuaweicloud.com在华为云内网DNS下解析到的IP后再添加对应的hosts。华为云提供的内网DNS地址请参见华为云提供的内网DNS地址是多少?。 父主题:
选择待查看的云服务资源所在行“永久数据存储”列下的指定的OBS桶名称,页面跳转到OBS管理控制台中对应OBS桶的对象管理界面。 或单击页面左侧的“主机监控”,单击待查看的ECS所在行的“永久数据存储”列下的指定的OBS桶名称,页面跳转到OBS管理控制台中对应OBS桶的对象管理界面。
168.0.1为云服务器的网关,请根据实际情况修改配置。 问题是否解决? 解决:排查结束。 未解决:执行8。 执行如下命令,打开Agent的配置文件。 cat /usr/local/telescope/bin/conf_ces.json 获取Agent配置文件中的Endpoint。 图4