检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
添加监控数据 功能介绍 添加一条或多条自定义指标监控数据,解决系统监控指标不能满足具体业务需求的场景。 监控数据保留时间请参见《云监控服务用户指南》的“指标数据保留多长时间”章节。 调试 您可以在API Explorer中调试该接口,支持自动认证鉴权。API Explorer可以
如已有访问密钥,查看创建时下载保存的credentials.csv文件中,获取文件中记录的Key值即可; 如未创建,则通过“新增访问密钥”可创建新的访问密钥,妥善保存credentials.csv文件,并获取文件中记录的Key值。 须知: 为了安全考虑,建议该用户为IAM用户,并且权限仅为CES
企业微信、钉钉、飞书、语音通知协议公测”,填写您的联系方式(手机或邮箱),跟进工单处理进展,完成后单击“下一步”。 提交工单:单击下方“未解决,提交工单”,提交申请公测工单。 完成工单提交:等待系统回复,当出现华为云工程师系统角色提示您确认风险的回复后,输入“风险已知晓,继续开通”,等待系统回复,完成公测协议开通。
Agent误将ECS错误识别为BMS,进而影响指标的查询展示。lscpu命令正常返回值如图1所示。 图1 lscpu命令正常返回值 解决方式 使用root账号登录机器。 执行以下命令修改配置文件,并在{}中输入配置内容:"telescope.instance.namespace": "AGT.ECS"。
Agent状态切换或监控面板有断点该如何处理? Excel打开监控数据CSV文件乱码如何处理? 更多 智能客服 您好!我是有问必答知识渊博的的智能问答机器人,有问题欢迎随时求助哦! 社区求助 华为云社区是华为云用户的聚集地。这里有来自容器服务的技术牛人,为您解决技术难题。
基本概念 账号 用户注册时的账号,账号对其所拥有的资源及云服务具有完全的访问权限,可以重置用户密码、分配用户权限等。由于账号是付费主体,为了确保账号安全,建议您不要直接使用账号进行日常管理工作,而是创建用户并使用用户进行日常管理工作。 用户 由账号在IAM中创建的用户,是云服务的
已打开的最大文件描述符数 不涉及 avg_open_file_descriptors 已打开的平均文件描述符数 不涉及 sum_max_file_descriptors 最大允许的文件描述符数 不涉及 sum_open_file_descriptors 已打开的文件描述符数 不涉及
述安装GPU驱动。 安装GPU驱动需使用默认路径。 GPU驱动安装完后,需重启GPU加速型实例,否则可能导致采集GPU指标及上报GPU事件失败。 GPU驱动正常安装后,最多10分钟将在控制台看到采集到的GPU指标数据。 已安装lspci工具,未安装lspci工具的云服务器不支持采集GPU指标数据及上报事件。
包含盘的基本信息。(SN、型号、容量、协议类型、固件版本等),以及盘的SMART log中的各项指标(健康状态、温度、坏块计数、各类错误和失败计数等)。 使用smartctl -a <盘符>命令采集。 NVMe SSD 基本信息 包含NVMe盘的基本信息。(SN、型号、容量、固件版本等)
创建ECS实例后,登录ECS,修改Agent配置文件(/usr/local/telescope/bin/conf.json)中的InstanceId为对应ECS的ID,即可完成复制流程,如图5所示。 图5 修改Agent配置文件 父主题: 主机监控
suppress_duration 否 Integer 告警抑制时间,单位为秒,对应页面上创建告警规则时告警策略最后一个字段,该字段主要为解决告警频繁的问题,0代表不抑制,满足条件即告警;300代表满足告警触发条件后每5分钟告警一次; 最小值:0 最大值:86400 枚举值: 0
period}&filter={filter} ces:metricData:list √ × 添加一条或多条自定义指标监控数据,解决系统监控指标不能满足具体业务需求的场景。 POST /V1.0/{project_id}/metric-data ces:metricData:create
“故障”原因可能为: Agent域名无法解析,请先确认修改DNS与添加安全组中DNS地址配置正确,然后参考《云监控服务用户指南》中“手动配置Agent”章节检查配置是否正确。 账号欠费。 Agent进程故障,请参照管理Agent重启,如果无法重启则说明相关文件被误删,请重新安装Agent。
CES云监控的告警通知中,存在部分云服务的告警中未显示实例名称,主要原因有三种: 云服务未按CES的规范对接,导致无法查询到资源名称信息。 云服务未对接RMS,CES无法从RMS获取到资源的名称信息。 其他情况:资源已被删除、部分资源本身无名称信息。 当前告警通知中未上报资源名称的云服务如表1所示。
0 suppress_duration Integer 告警抑制时间,单位为秒,对应页面上创建告警规则时告警策略最后一个字段,该字段主要为解决告警频繁的问题,0代表不抑制,满足条件即告警;300代表满足告警触发条件后每5分钟告警一次; 最小值:0 最大值:86400 枚举值: 0
为“故障”。 Agent域名无法解析,请先确认修改DNS与添加安全组中DNS地址配置正确,然后参考《云监控服务用户指南》中“手动配置Agent”章节检查配置是否正确。 账号欠费。 Agent进程故障,请参照管理Agent重启,如果无法重启则说明相关文件被误删,请重新安装Agent。
e为notification时,notification_list列表不能为空。 说明:若alarm_action_enabled为true,对应的alarm_actions、ok_actions至少有一个不能为空。若alarm_actions、ok_actions同时存在时,n
“插件状态”显示为“故障”。 Agent域名无法解析,修复方法参考修改DNS与添加安全组。 账号欠费。 Agent进程故障,先尝试重启Agent,重启Agent方法参考管理Agent。如果重启后状态还是故障,可能Agent相关文件被破坏,请尝试重新安装Agent,安装方法参考Agent安装说明。
e为notification时,notification_list列表不能为空。 说明:若alarm_action_enabled为true,对应的alarm_actions、ok_actions至少有一个不能为空。若alarm_actions、ok_actions同时存在时,n
弹性云服务器策略,会自动同步到告警规则中,修改弹性云服务器-磁盘策略,则不会自动同步。 自定义创建 模板 当触发规则为关联模板时,需要选择导入的模板。 您可以选择系统预置的默认告警模板,或者选择自定义模板。 - 告警策略 当触发规则选择“自定义创建”时,需要设置触发告警规则的告警策略。