检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
返回“0”,表示未安装Agent。 操作步骤(新版本Agent) 操作步骤(老版本Agent) 使用root账号,登录ECS。 修改bin目录下的配置文件conf.json。 执行以下命令,打开配置文件conf.json。 vi /usr/local/uniagent/extension/install/telescope/bin/conf
设置prometheus从exporter查询数据的间隔时间,prometheus配置文件中默认为15s,建议设置为1m scrape_timeout: 1m # 设置从exporter查询数据的超时时间,prometheus配置文件中默认为15s,建议设置为1m scrape_configs:
除不需要监控的资源。 选择“指定资源”时,在“监控对象”单击“选择指定资源”进行指定资源的选择。 指定资源 分组 当告警类型选择指标,且监控范围选择资源分组时需配置此参数。 - 监控对象 当告警类型选择指标、站点、广域网质量或可用性,且监控范围选择指定资源时需配置此参数。 - 条件类型
加、修改、删除等日常操作。 操作步骤 登录管理控制台。 单击“服务列表 > 云监控服务”。 单击页面左侧的“监控看板 > Dashboards”,鼠标滑过需要修改的监控看板,在待配置的“监控视图”区域右上角单击“配置”图标,弹出“配置监控视图”页面。 在该页面,用户可以对监控视图
yml" # 可选配置,指定日志配置文件路径,建议使用绝对路径。若未指定,程序将默认使用执行启动命令所在目录下的日志配置文件。 metrics_conf_path: "/root/metric.yml" # 可选配置,指定指标配置文件路径,建议使用绝对路径。若未指定,程序将默认使用执行启动命令所在目录下的指标配置文件。
使用资源分组和告警功能上报指定资源的监控指标 场景描述 云监控服务提供了资源分组功能和告警功能。如何将您的资源进行有效分组,并按分组后的资源监控指标通过短信或邮箱告知告警信息呢? 本章节为您解答上述问题。 假设我们有4台云服务器,两台用于开发项目组(ECS-01和ECS-02),
查询指标列表 功能介绍 查询系统当前可监控指标列表,可以指定指标命名空间、指标名称、维度、排序方式,起始记录和最大记录条数过滤查询结果。 云服务资源删除后,会保留3个小时的数据缓存,在3小时之内还能查到资源对应的监控指标,属于正常现象。 调试 您可以在API Explorer中调试该接口,支持自动认证鉴权。API
Files\uniagent\extension\install\telescope\bin\logs_config.xml 如果未找到1中的配置文件,则需要更改另外一个配置文件。 Linux: /usr/local/uniagent/extension/install/telescope/conf/logs
启停告警规则 功能介绍 启动或停止一条告警规则。 告警规则V1接口只支持配置单资源单策略规则,建议使用批量启停告警规则与前端功能配套使用。 调试 您可以在API Explorer中调试该接口,支持自动认证鉴权。API Explorer可以自动生成SDK代码示例,并提供SDK代码示例调试功能。
创建事件监控的告警通知 操作场景 当您需要关注核心事件时,通过为指定的事件创建告警规则及告警通知,可以及时收到告警信息,进行异常处理或业务切换。本章节指导用户针对事件监控创建告警规则。 操作步骤 登录管理控制台。 单击“服务列表 > 云监控服务”。 单击页面左侧的“事件监控”。
数。 修改告警规则时,告警类型、云产品、资源层级和监控范围的参数为默认值,不可修改,若监控范围是“全部资源”时,可单击“选择排除资源”排除指定资源。其它参数请参考5进行配置。 单击“立即修改”,完成告警规则的修改。 父主题: 告警规则
问题是否解决? 解决:排查结束。 未解决:执行8。 执行如下命令,打开Agent的配置文件。 cat /usr/local/telescope/bin/conf_ces.json 获取Agent配置文件中的Endpoint。 图4 查询Agent的Endpoint配置 执行如下命令,确认DNS解析是否正常。
名”。 企业项目 企业项目是一种云资源管理方式,企业项目管理服务提供统一的云资源按项目管理,以及项目内的资源管理、成员管理。 启动日志记录 是否配置启动日志记录。 日志组 选择日志组。 日志组是云日志服务进行日志管理的基本单位,可以创建日志流以及设置日志存储时间。创建日志组请参见日志组。
管理Agent 本章节指导如何在Linux平台、Windows平台查看、启动、停止、更新和卸载Agent。 前提条件 已成功安装Agent插件。 Linux平台 Windows平台 查看、启动、停止、更新和卸载Agent需使用root用户。 查看Agent版本 使用root账号,登录主机。
× × × 函数 √ × × × × 云数据库 GaussDB GAUSSDB 云数据库 GaussDB实例 √ × × × × 云数据库 GaussDB(for MySQL) GaussDB(for MySQL) GaussDBforMySQL实例 √ √ √ √ √ 全域弹性公网IP和带宽
告警规则 展示该资源分组下的全部告警规则。并且可以在单个资源分组中对指定的告警规则进行创建、复制、启用、停用、删除、屏蔽等操作。 操作步骤 登录管理控制台。 在管理控制台左上角选择区域和项目。 单击“服务列表 > 云监控服务”。 单击页面左侧的“资源分组”,进入“资源分组”页面。
Agent不同插件状态说明及处理方式 Agent有以下五种状态: 未安装/未启动:指未在该ECS/BMS中安装Agent或手动停止了Agent。 运行中:Agent运行正常,可正常上报监控数据。 故障:监控插件每1分钟发送1次心跳;当服务端3分钟收不到插件心跳时,“插件状态”显示为“故障”。
Roce网卡健康状态 NPU网卡不可用 NPU:Roce网卡配置文件/etc/hccn.conf不存在 HccnConfNotExisted 重要 Roce网卡配置文件"/etc/hccn.conf"不存在 请检查/etc/hccn.conf网卡配置文件 Roce网卡不可用 GPU:GPU基本组件异常
路径为:/usr/local/uniagent/extension/install/telescope/bin 修改配置文件conf.json。 执行以下命令,打开配置文件conf.json。 vi conf.json 在conf.json文件中,添加如下四行参数,具体参数请参见表1。
查询监控数据(ShowMetricData) 查询指定时间范围指定指标的指定粒度的监控数据。 添加监控数据(CreateMetricData) 添加一条或多条指标监控数据。 批量查询监控数据(BatchListMetricData) 批量查询指定时间范围内指定指标的指定粒度的监控数据,目前最多支持10指标的批量查询。