检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
0/{project_id}/alarms 参数说明 表1 参数说明 名称 是否必选 说明 project_id 是 项目ID。 获取方式请参见获取项目ID。 样例 POST https://{云监控的endpoint}/V1.0/{project_id}/alarms 请求消息
主机监控 如何配置DNS和安全组? 如何配置委托? CES Agent如何通过授权获取临时AK/SK? Agent支持的系统有哪些? Agent插件资源占用和熔断说明 主机监控Agent对主机的性能会有影响吗? Agent不同插件状态说明及处理方式 Agent支持的指标列表 支持GPU监控的环境约束
Authentication fails or the authentication information is not provided. 检查获取token的用户名或密码(或AK、SK)是否正确 404 ces.0016 请求的资源不存在 The requested resource
com/v1.0/agencies/cesagency/securitykey 当有数据返回时,表示获取AK/SK正常。排查结束。 调用失败或者回显如下时,请执行5。 图2 获取AK/SK失败 在管理控制台的统一身份认证服务页面,选择“委托”,查询“cesagency”委托,查看
riod}&filter={filter} 参数说明 表1 参数说明 名称 是否必选 说明 project_id 是 项目ID。 获取方式请参见获取项目ID。 表2 查询检索参数 名称 是否必选 参数类型 说明 namespace 是 String 服务的命名空间,各服务命名空间请参考支持监控的服务列表。
单独job - job_name: "prometheus-eps" metrics_path: '/eps-info' # 获取企业项目的URL路径 static_configs: - targets: ["192.168.0.xx:8087"]
已安装lspci工具,未安装lspci工具的云服务器不支持采集GPU指标数据及上报事件。 安装lspci工具的方法如下 登录弹性云服务器。 更新镜像源,获取安装依赖。 wget http://mirrors.myhuaweicloud.com/repo/mirrors_source.sh &&
老版本Agent:C:\Program Files\telescope\log\ces.log 使用的DNS非华为云DNS,请通过执行dig+目标域名获取到agent.ces.myhuaweicloud.com在华为云内网DNS下解析到的IP后再添加对应的hosts。华为云提供的内网DNS地
Agent,安装方法参考Agent安装说明。 服务器内部时间和本地标准时间不一致。 使用的DNS非华为云DNS,请通过执行dig+目标域名获取到agent.ces.myhuaweicloud.com在华为云内网DNS下解析到的IP后再添加对应的hosts。华为云提供的内网DNS地
notification_list 是 Array of strings 告警状态发生变化时,被通知对象的列表。topicUrn可从SMN获取,具体操作请参考查询Topic列表。当type为notification时,notification_list列表不能为空。 说明:若al
rce-groups/{group_id} 参数说明 表1 参数说明 名称 是否必选 说明 project_id 是 项目ID。 获取方式请参见获取项目ID。 group_id 是 资源分组ID。 status 否 资源健康状态,值可为health、unhealth、no_alarm_rule,health表示健康。
授权原因: CES Agent运行在弹性云服务器或裸金属服务器内,该Agent采集监控数据后需要上报到云监控服务,授权后CES Agent能够自动获取临时AK/SK,这样您就可以安全方便的使用云监控服务管理控制台或API查询Agent监控数据指标了。 安全:Agent使用的AK/SK仅具有CES
因为对资源的过度使用造成业务无法正常运行。 处理异常场景 云监控服务会根据您创建的告警规则,在监控数据达到告警策略时发送告警信息,让您及时获取异常通知,查询异常原因。 扩容场景 对CPU使用率、内存使用率、磁盘使用率等监控项创建告警规则后,可以让您方便的了解云服务现状,在业务量变
0/{project_id}/alarm-template 参数说明 表1 参数说明 名称 是否必选 说明 project_id 是 项目ID。 获取方式请参见获取项目ID。 样例 POST https://{云监控的endpoint}/V1.0/{project_id}/alarm-template
原因1:请求IAM获取Token中写的项目ID与调用批量查询监控数据接口接口使用的项目ID不同。 原因2:Token 过期。 原因3:Token内容复制过程少复制或多复制其他内容。 原因4:ak与sk不匹配。 定位思路 根据可能原因进行故障排查。 解决方法 原因1:请求IAM获取Token
企业项目是项目的升级版,针对企业不同项目间的资源进行分组和管理,是逻辑隔离。企业项目中可以包含多个区域的资源,且项目中的资源可以迁入迁出。 关于企业项目ID的获取及企业项目特性的详细信息,请参见《企业管理用户指南》。 父主题: 使用前必读
参见批量安装Agent,需要替换安装命令中,-t后的版本号为支持GPU采集的插件版本号。 安装lspci工具 登录弹性云服务器。 更新镜像源,获取安装依赖。 wget http://mirrors.myhuaweicloud.com/repo/mirrors_source.sh &&
arset=UTF-8 最小长度:1 最大长度:64 X-Auth-Token 是 String 用户Token。用户Token也就是调用获取用户Token接口的响应值,该接口是唯一不需要认证的接口。请求响应成功后在响应消息头中包含的“X-Subject-Token”的值即为Token值。
0/{project_id}/alarms 参数说明 表1 参数说明 名称 是否必选 说明 project_id 是 项目ID。 获取方式请参见获取项目ID。 表2 参数说明 名称 参数类型 说明 alarms Array of objects 告警规则列表。 详细参数请参见表3。
resources Array of ResourcesInListResp objects 资源列表,关联资源需要使用查询告警规则资源接口获取 数组长度:1 - 3000 type String 告警规则类型 enabled Boolean 告警开关 notification_enabled