检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
导出告警规则 √ × × × √ × 查看告警规则列表 √ √ √ √ √ √ 查看告警规则详情 √ √ √ √ √ √ 查看监控图表 √ √ √ √ √ √ 告警记录 查看告警记录 √ √ √ √ √ √ 告警模板 查看默认告警模板 √ √ √ √ √ √ 查看自定义告警模板 √ √ √ √
业务视角管理资源 使用资源分组,方便用户将云账户下各类资源按业务分类,从业务角度出发查询监控与告警信息。 日常巡检与故障快速定位 资源分组提供资源概览、不健康资源列表、告警规则、告警记录等功能。方便用户查看云资源使用情况,收到报警后迅速定位故障资源与故障原因。 功能概览 资源分组可以跨产品,真正从业务角度管理您的云上资源。
GPU驱动正常安装后,最多10分钟将在控制台看到采集到的GPU指标数据。 已安装lspci工具,未安装lspci工具的云服务器不支持采集GPU指标数据及上报事件。 安装lspci工具的方法,请参见安装lspci工具。 确保云服务器的安装目录都有读写权限,并且安装成功后的Telescope进程不会被其他软件关闭。
无论您使用的是ECS还是BMS,都可以使用主机监控来采集丰富的操作系统层面监控指标,也可以使用主机监控进行服务器资源使用情况监控和排查故障时的监控数据查询。 约束限制 主机监控仅针对于华为云公共镜像提供监控服务,如您是私有镜像,使用过程中出现任何问题,CES将不对此提供技术支持。 监控能力
的运行状况,并及时收到异常告警做出反应,保证业务顺畅运行。 您可以使用本文档提供的API对指标、告警规则、监控数据进行相关操作,如查询指标列表、查询告警规则列表、创建告警规则、删除告警规则等。支持的全部操作请参见API概览。 在调用云监控服务API之前,请确保已经充分了解云监控服
终端节点 终端节点(Endpoint)即调用API的请求地址,不同服务不同区域的终端节点不同,您可以从地区和终端节点中查询所有服务的终端节点。 父主题: 使用前必读
根据界面提示,配置归属企业项目。 图3 高级配置 表4 配置规则信息 参数 参数说明 归属企业项目 告警规则所属的企业项目。只有拥有该企业项目权限的用户才可以查看和管理该告警规则。创建企业项目请参考:创建企业项目。 标签 标签由键值对组成,用于标识云资源,可对云资源进行分类和搜索。建议在TMS中创建
单击资源分组列表中的其中一个分组名,进入分组资源概览界面。 图1 资源概览 在该页面中,可修改资源分组的名称,修改资源匹配规则,资源可进行移除操作和设置告警规则。 父主题: 查看资源分组
查看监控视图 监控视图添加完成后,您可以在我的看板页面查看该监控项的监控走势图。系统提供固定时长和自定义时长两种方式查看监控走势图。 操作步骤 登录管理控制台。 单击“服务列表 > 云监控服务”。 单击“我的看板 > 自定义监控看板”。 单击需要查看监控视图的看板名称,查看我的看板下的所有监控视图。
上报的指标被丢弃问题排查 问题现象 插件状态正常,查询指标出现断点的情况。 分析 可能的原因如下: Linux时间与实际时间差距较大,Agent采集的指标上报到服务端会认为是无效指标,导致上报的指标被丢弃。 修复方法(Linux) 使用root账号登录主机,确认当前主机ntp服务正常,然后执行以下命令:
Excel打开监控数据CSV文件乱码如何处理? 用户使用云监控服务可以将监控数据导出为csv文件,而使用Excel工具打开该文件时,可能出现中文乱码的情况。这是因为云监控服务导出的csv文件使用了UTF-8编码格式,而Excel是以ANSI格式打开的,没有做编码识别。针对此问题有以下解决方案:
通过搜索框,您可以查找特定指标。 部分服务支持查看资源详情,您可以通过单击页面上方的“查看资源详情”按钮来查看被监控资源的详细信息。 单击页面右上角的“设置监控指标”。 进入“设置监控指标”页面。 您可以选择要展示的指标名称,并且可以拖动选中指标对指标进行排序,方便您自定义需要查看的指标运行状况。
从控制台获取项目ID的步骤如下: 登录管理控制台。 鼠标悬停在右上角的用户名,选择下拉列表中的“我的凭证”。 在“API凭证”页面的项目列表中查看项目ID。 图1 查看项目ID 父主题: 公共参数
部分客户存在多云、多账号、多region资源协同管理的场景,希望能够将云上资源的监控数据实时导出到自建监控系统中统一管理,基于该场景云监控服务为您提供线下自动导出工具,根据配置实时获取云资源监控数据并持续导入本地Prometheus。 前提条件 请保证线下环境与云监控网络互通。 操作步骤 下载、安装并配置CES
项。 时间范围:可选择查询最近七天内任意时间段的操作事件。 在需要查看的记录左侧,单击展开该记录的详细信息,展开记录如图1所示。 图1 展开记录 在需要查看的记录右侧,单击“查看事件”,弹出一个窗口,如图2所示,显示了该操作事件结构的详细信息。 图2 查看事件的详细日志信息 父主题:
频率、可用探测点百分比、平均响应时间等。 单击站点名称所在行的“查看监控图表”。 进入“监控图表”页面。在此页面您可以根据需要查看该站点“近3小时”、“近12小时”和“近24小时”的监控原始数据曲线图。 图1 查看监控图表 当监控指标为可用性指标时,监控图表显示的为一小时内的平均值。
通过IAM服务获取到的Token有效期为24小时,需要使用同一个Token鉴权时,可以先将Token缓存,避免频繁调用。 操作步骤 Token认证,具体操作请参考认证鉴权。 查询可监控的指标列表。 发送“GET https://云监控的终端节点/V1.0/{project_id}/metrics”。 在Request
在您开启了云审计服务后,系统开始记录云监控资源的操作。云审计服务管理控制台保存最近7天的操作记录。如何在云审计服务管理控制台查看或导出最近7天的操作记录,请参见查看云监控服务日志。 父主题: 安全
新增删除资源分组。 新增查询所有资源分组。 新增查询事件监控列表。 新增查询某一事件监控详情。 2020-11-10 第四十次正式发布: 新增创建自定义告警模板。 新增删除自定义告警模板。 新增查询告警历史。 新增查询自定义告警模板列表。 新增更新自定义告警模板。 新增查询资源分组下的资源。
第二阈值(内存),默认值为734003200(700MB),单位为Byte。 aAgent的CPU使用率和内存使用率查询方法: Linux: top -p telescope的PID Windows: 在任务管理器中查看Agent进程详情。 { "cpu_first_pct_threshold": xx