检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
返回“0”,表示未安装Agent。 操作步骤(新版本Agent) 使用root账号,登录ECS。 修改bin目录下的配置文件conf.json。 执行以下命令,打开配置文件conf.json。 vi /usr/local/uniagent/extension/install/telescope/bin/conf
设置prometheus从exporter查询数据的间隔时间,prometheus配置文件中默认为15s,建议设置为1m scrape_timeout: 1m # 设置从exporter查询数据的超时时间,prometheus配置文件中默认为15s,建议设置为1m scrape_configs:
使用资源分组和告警功能上报指定资源的监控指标 场景描述 云监控服务提供了资源分组功能和告警功能。如何将您的资源进行有效分组,并按分组后的资源监控指标通过短信或邮箱告知告警信息呢? 本章节为您解答上述问题。 假设我们有4台云服务器,两台用于开发项目组(ECS-01和ECS-02),
yml" # 可选配置,指定日志配置文件路径,建议使用绝对路径。若未指定,程序将默认使用执行启动命令所在目录下的日志配置文件。 metrics_conf_path: "/root/metric.yml" # 可选配置,指定指标配置文件路径,建议使用绝对路径。若未指定,程序将默认使用执行启动命令所在目录下的指标配置文件。
选择“指定资源”时,在“监控对象”单击“选择指定资源”进行指定资源的选择。 全部资源 分组 当告警类型选择指标,且监控范围选择资源分组时需配置此参数。 - 监控对象 当告警类型选择指标,且监控范围选择指定资源时需配置此参数。 - 条件类型 针对弹性云服务器,您可以选择静态阈值和动态阈值。当前仅在华南-广州上线。
Files\uniagent\extension\install\telescope\bin\logs_config.xml 如果未找到1中的配置文件,则需要更改另外一个配置文件。 Linux: /usr/local/uniagent/extension/install/telescope/conf/logs
问题是否解决? 解决:排查结束。 未解决:执行8。 执行如下命令,打开Agent的配置文件。 cat /usr/local/telescope/bin/conf_ces.json 获取Agent配置文件中的Endpoint。 图4 查询Agent的Endpoint配置 执行如下命令,确认DNS解析是否正常。
Files\uniagent\extension\install\telescope\bin\logs_config.xml 如果未找到1中的配置文件,则需要更改另外一个配置文件。 Linux: /usr/local/uniagent/extension/install/telescope/conf/logs
Agent插件状态显示“故障”该如何处理? 操作系统监控插件每1分钟发送1次心跳;当服务端3分钟收不到插件心跳时,“插件状态”显示为“故障”。 “故障”原因可能为: Agent域名无法解析,请先确认修改DNS与添加安全组中DNS地址配置正确,然后参考《云监控服务用户指南》中“手动配置Agent”章节检查配置是否正确。
启停告警规则 功能介绍 启动或停止一条告警规则。 告警规则V1接口只支持配置单资源单策略规则,建议使用批量启停告警规则与前端功能配套使用。 调试 您可以在API Explorer中调试该接口,支持自动认证鉴权。API Explorer可以自动生成SDK代码示例,并提供SDK代码示例调试功能。
查询指标列表 功能介绍 查询系统当前可监控指标列表,可以指定指标命名空间、指标名称、维度、排序方式,起始记录和最大记录条数过滤查询结果。 云服务资源删除后,会保留3个小时的数据缓存,在3小时之内还能查到资源对应的监控指标,属于正常现象。 调试 您可以在API Explorer中调试该接口,支持自动认证鉴权。API
数。 修改告警规则时,告警类型、云产品、资源层级和监控范围的参数为默认值,不可修改,若监控范围是“全部资源”时,可单击“选择排除资源”排除指定资源。其它参数请参考5进行配置。 单击“立即修改”,完成告警规则的修改。 父主题: 告警规则
当显示如下内容时,表示telescope进程正常。 图1 查看telescope进程 进程正常:请执行4。 进程异常:请执行3。 如果进程异常,执行如下命令,启动Agent。 service uniagent restart 执行如下命令,确认云服务器委托已创建。 curl -ivk https://agent
问题是否解决? 解决:排查结束。 未解决:执行8。 执行如下命令,打开Agent的配置文件。 cat /usr/local/telescope/bin/conf_ces.json 获取Agent配置文件中的Endpoint。 图4 查询Agent的Endpoint配置 执行如下命令,确认DNS解析是否正常。
警规则中所包含策略也会跟随修改。 说明: 当“资源层级”选择“云产品”时,关联模板中指定云产品策略修改后,会自动同步,其他云产品策略修改后不会自动同步。 当“资源层级”选择“子维度”时,模板中指定维度的策略修改后,会自动同步,其他维度策略修改后不会自动同步。 例如:“资源层级”选
管理Agent 本章节指导如何在Linux平台、Windows平台查看、启动、停止、更新和卸载Agent。 前提条件 已成功安装Agent插件。 Linux平台 查看、启动、停止、更新和卸载Agent需使用root用户。 查看Agent版本 使用root账号,登录主机。 执行如下命令,确认使用Agent的版本。
× × × 函数 √ × × × × 云数据库 GaussDB GAUSSDB 云数据库 GaussDB实例 √ × × × × 云数据库 GaussDB(for MySQL) GaussDB(for MySQL) GaussDBforMySQL实例 √ √ √ √ √ 全域弹性公网IP和带宽
应用与数据集成平台的监控指标说明 数据库 关系型数据库 SYS.RDS 请参考右侧相关文档链接页面。 MySQL的监控指标说明 PostgreSQL的监控指标说明 SQL Server的监控指标说明 文档数据库 SYS.DDS Key:mongodb_node_id Value:文档数据库节点ID K
Roce网卡健康状态 NPU网卡不可用 NPU:Roce网卡配置文件/etc/hccn.conf不存在 HccnConfNotExisted 重要 Roce网卡配置文件"/etc/hccn.conf"不存在 请检查/etc/hccn.conf网卡配置文件 Roce网卡不可用 GPU:GPU基本组件异常
查询监控数据(ShowMetricData) 查询指定时间范围指定指标的指定粒度的监控数据。 添加监控数据(CreateMetricData) 添加一条或多条指标监控数据。 批量查询监控数据(BatchListMetricData) 批量查询指定时间范围内指定指标的指定粒度的监控数据,目前最多支持10指标的批量查询。