检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
yml" # 可选配置,指定日志配置文件路径,建议使用绝对路径。若未指定,程序将默认使用执行启动命令所在目录下的日志配置文件。 metrics_conf_path: "/root/metric.yml" # 可选配置,指定指标配置文件路径,建议使用绝对路径。若未指定,程序将默认使用执行启动命令所在目录下的指标配置文件。
问题是否解决? 解决:排查结束。 未解决:执行8。 执行如下命令,打开telescope的配置文件。 cat /usr/local/telescope/bin/conf_ces.json 获取telescope配置文件中的Endpoint。 图4 查询telescope的Endpoint配置 执行如下命令,确认DNS解析是否正常。
查询指标列表 功能介绍 查询系统当前可监控指标列表,可以指定指标命名空间、指标名称、维度、排序方式,起始记录和最大记录条数过滤查询结果。 云服务资源删除后,会保留3个小时的数据缓存,在3小时之内还能查到资源对应的监控指标,属于正常现象。 调试 您可以在API Explorer中调试该接口,支持自动认证鉴权。API
设置prometheus从exporter查询数据的间隔时间,prometheus配置文件中默认为15s,建议设置为1m scrape_timeout: 1m # 设置从exporter查询数据的超时时间,prometheus配置文件中默认为15s,建议设置为1m scrape_configs:
选择“指定资源”时,在“监控对象”单击“选择指定资源”进行指定资源的选择。 全部资源 分组 当告警类型选择指标,且监控范围选择资源分组时需配置此参数。 - 监控对象 当告警类型选择指标,且监控范围选择指定资源时需配置此参数。 - 条件类型 针对弹性云服务器,您可以选择静态阈值和动态阈值。当前仅在华南-广州上线。
返回“0”,表示未安装Agent。 操作步骤(新版本Agent) 使用root账号,登录ECS。 修改bin目录下的配置文件conf.json。 执行以下命令,打开配置文件conf.json。 vi /usr/local/uniagent/extension/install/telescope/bin/conf
使用资源分组和告警功能上报指定资源的监控指标 场景描述 云监控服务提供了资源分组功能和告警功能。如何将您的资源进行有效分组,并按分组后的资源监控指标通过短信或邮箱告知告警信息呢? 本章节为您解答上述问题。 假设我们有4台云服务器,两台用于开发项目组(ECS-01和ECS-02),
查询监控数据(ShowMetricData) 查询指定时间范围指定指标的指定粒度的监控数据。 添加监控数据(CreateMetricData) 添加一条或多条指标监控数据。 批量查询监控数据(BatchListMetricData) 批量查询指定时间范围内指定指标的指定粒度的监控数据,目前最多支持10指标的批量查询。
当显示如下内容时,表示telescope进程正常。 图1 查看telescope进程 进程正常:请执行4。 进程异常:请执行3。 如果进程异常,执行如下命令,启动Agent。 service uniagent restart 执行如下命令,确认云服务器委托已创建。 curl -ivk https://agent
Files\uniagent\extension\install\telescope\bin\logs_config.xml 如果未找到1中的配置文件,则需要更改另外一个配置文件。 Linux: /usr/local/uniagent/extension/install/telescope/conf/logs
Agent插件状态显示“故障”该如何处理? 操作系统监控插件每1分钟发送1次心跳;当服务端3分钟收不到插件心跳时,“插件状态”显示为“故障”。 “故障”原因可能为: Agent域名无法解析,请先确认修改DNS与添加安全组中DNS地址配置正确,然后参考《云监控服务用户指南》中“手动配置Agent”章节检查配置是否正确。
Agent不同插件状态说明及处理方式 Agent有以下五种状态: 未安装/未启动:指未在该ECS/BMS中安装Agent或手动停止了Agent。 运行中:Agent运行正常,可正常上报监控数据。 故障:监控插件每1分钟发送1次心跳;当服务端3分钟收不到插件心跳时,“插件状态”显示为“故障”。
数。 修改告警规则时,告警类型、云产品、资源层级和监控范围的参数为默认值,不可修改,若监控范围是“全部资源”时,可单击“选择排除资源”排除指定资源。其它参数请参考5进行配置。 单击“立即修改”,完成告警规则的修改。 父主题: 告警规则
加、修改、删除等日常操作。 操作步骤 登录管理控制台。 单击“服务列表 > 云监控服务”。 单击页面左侧的“监控看板 > Dashboards”,鼠标滑过需要修改的监控看板,在待配置的“监控视图”区域右上角单击“配置”图标,弹出“配置监控视图”页面。 在该页面,用户可以对监控视图
当系统返回以下内容,则表示Agent为正常运行状态。 "Telescope process is running well." 启动Agent(新版本) 执行以下命令,启动Agent。 /usr/local/uniagent/extension/install/telescope/telescoped
排查业务是否出现异常写入和异常编码,导致写入大集合列。 会出现集合列查询失败。 表11 云数据库GaussDB(for MySQL) 事件来源 命名空间 事件名称 事件ID 事件级别 事件说明 处理建议 事件影响 GaussDB(for MySQL) SYS.GAUSSDB 实例增量备份业务失败 Tauru
告警规则 展示该资源分组下的全部告警规则。并且可以在单个资源分组中对指定的告警规则进行创建、复制、启用、停用、删除、屏蔽等操作。 操作步骤 登录管理控制台。 在管理控制台左上角选择区域和项目。 单击“服务列表 > 云监控服务”。 单击页面左侧的“资源分组”,进入“资源分组”页面。
路径为:/usr/local/uniagent/extension/install/telescope/bin 修改配置文件conf.json。 执行以下命令,打开配置文件conf.json。 vi conf.json 在conf.json文件中,添加如下四行参数,具体参数请参见表1。
配置事件监控的告警内容 表2 事件监控告警内容参数说明 参数 参数说明 告警类型 告警规则适用的告警类型,可选择指标或者事件告警。 默认值:事件 事件类型 用于指定事件类型,可选择系统事件或自定义事件。 事件来源 事件来源的云服务名称。 取值样例:弹性云服务器 对于自定义事件,事件来源配置为自定义事件时的event_source。
告警规则适用的告警类型,可选择指标或者事件告警。 指标 资源类型 配置告警规则监控的服务名称。 弹性云服务器 维度 用于指定告警规则对应指标的维度名称 云服务器 监控范围 告警规则适用的资源范围。 指定资源 监控对象 监控对象为当前选择的弹性云服务器,无需配置。 - 触发规则 根据需要可选择关联模板、导入已有模板或自定义创建。