检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
{ "metrics": [ { "namespace": "SYS.ECS", "dimensions": [ { "name": "
表3 metric字段数据结构说明 名称 是否必选 参数类型 说明 namespace 是 String 服务的命名空间,各服务命名空间请参考支持监控的服务列表。
否 String 告警规则状态, ok为正常,alarm为告警,invalid为已失效 最小长度:0 最大长度:64 正则匹配:^(ok|alarm|invalid)$ level 否 Integer 告警级别, 1为紧急,2为重要,3为次要,4为提示 最小值:1 最大值:4 namespace
表3 metric字段数据结构说明 名称 参数类型 说明 namespace String 查询服务的命名空间,各服务命名空间请参考支持监控的服务列表。 dimensions Array of objects 指标维度列表。 详细参数请参见表4。
云监控插件(Agent) Agent安装配置方式说明 Agent版本特性 修改DNS与添加安全组 Agent安装说明 手动配置Agent(可选) 升级Agent 管理Agent BMS硬件监控插件说明 安装GPU指标集成插件 安装云专线指标采集插件 父主题: 主机监控
授权范围: 仅为所在区域的内部账户“op_svc_ces”添加“CES AgentAccess”权限。
instance_id Value:云服务器ID Key:disk Value:磁盘 Key:mount_point Value:挂载点 Key:gpu Value:GPU Key:proc Value:进程 弹性云服务器操作系统监控的监控指标(安装Agent) 裸金属服务器 SERVICE.BMS
Value:数据节点 Key:dcs_cluster_proxy_node Value:Redis3.0 Proxy集群实例Proxy节点 Key:dcs_cluster_proxy2_node Value:Redis4.0/Redis5.0 Proxy集群实例Proxy节点 Key
参数 是否必选 参数类型 描述 offset 否 Integer 分页查询时查询的起始位置,表示从第几条数据开始,默认为0 最小值:0 最大值:10000 limit 否 Integer 查询结果条数的限制值,取值范围为[1,100],默认值为100 最小值:1 最大值:100 namespace
probe_point_success_count 可用探测点数量 该指标用于统计正常状态探测点的个数。 probe_point_success_rate 可用探测点百分比 该指标用于统计可用探测点的百分比。
/usr/local/telescope/telescoped restart 停止Agent(老版本) 登录ECS或BMS,执行以下命令,停止Agent。
namespace=SYS.ECS&metric_name=cpu_util&dim.0=instance_id,6f3c6f91-4b24-4e1b-b7d1-a94ac1cb011d&from=1556625600000&to=1556632800000&period=1200&
Agent安装需要有以下权限: 全局:Security Administrator Region:ECS CommonOperations或BMS CommonOperations以及CES Administrator或CES FullAccess权限 图2 Agent安装所需用户权限
执行以下命令修改配置文件,并在{}中输入配置内容:"telescope.instance.namespace": "AGT.ECS"。
Agent不同插件状态说明及处理方式 Agent支持的指标列表 支持GPU监控的环境约束 BMS硬件监控指标采集说明 什么是插件修复配置? 怎样让新购ECS实例中带有操作系统监控功能?
-9e46-cbd43a462362\"}", "group_id": "", "resource_id": "0bfa63ee-31f5-40a9-b992-50992c80c58a", "resource_name": "ndrv2-pod-ops
增强版 除提供基础版能力外,还将提供:GPU监控能力、NPU监控能力、BMS硬件故障监控能力。 版本号一般为四位,例如2.7.5.1。 注意: 增强版由于采集指标更多,可能会占用更多的主机资源,请合理选择插件版本。 父主题: 主机监控
在华为云部署的众包平台的经典架构图中,BMS与ECS的运行状态对整体业务至关重要,CPU、内存、磁盘使用率等会直接影响整体业务状态,因此,需使用主机监控和事件监控随时监控ECS与BMS的运行状况。
ces:dataShareJob:get", "ces:dataShareTask:delete", "ces:dataShareJob:action", "ces:dataShareTask:list", "ces:namespaces
Metric Metric由3部分组成:Namespace,Dimensions(optional),MetricName,单纯的MetricName不是一个指标,不能标识任何东西。