检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
安装GPU指标集成插件 通过在GPU加速型Linux实例上安装GPU监控插件,可以为用户提供系统级、主动式、细颗粒度的GPU监控,包含GPU指标收集和GPU系统事件上报。GPU支持监控的指标,参见GPU指标。 本章节介绍如何通过CES监控Agent安装脚本为GPU加速型实例安装新版GPU监控插件:
获取项目ID的接口为“GET https://{Endpoint}/v3/projects”,其中{Endpoint}为IAM的终端节点,可以从地区和终端节点获取。接口的认证鉴权请参见认证鉴权。 响应示例如下,其中projects下的“id”即为项目ID。 { "projects":
project_id 是 项目ID。 获取方式请参见获取项目ID。 表2 查询检索参数 名称 是否必选 参数类型 说明 namespace 是 String 服务的命名空间,各服务命名空间请参考支持监控的服务列表。 格式为service.item;service和item必须是字符串,必须
d执行频率;各服务的指标名称可查看:“服务指标名称”。 period 是 Integer 指标周期,单位是秒; 0是默认值,例如事件类告警该字段就用0即可; 1代表指标的原始周期,比如RDS监控指标原始周期是60s,表示该RDS指标按60s周期为一个数据点参与告警计算;如想了解各
事件告警模板DimensionName为空 metric_name 是 String 指标名称 period 是 Integer 告警条件判断周期,单位为秒 枚举值: 0 1 300 1200 3600 14400 86400 filter 是 String 数据聚合方式 正则匹配:^(aver
托方DMS实例中,以下简称“CES账号委托”。 委托方是指拥有DMS资源的账号,被委托方是指拥有待转储的指标数据的账号。 创建CES账号委托 操作步骤请参考IAM服务的创建委托。 按照创建委托的方法分别创建DMS资源查询委托和CES账号委托。在创建过程中,需要将“委托的账号“参数填写正确。如图1所示。
主机监控 如何配置DNS和安全组? 如何配置委托? CES Agent如何通过授权获取临时AK/SK? Agent支持的系统有哪些? Agent插件资源占用和熔断说明 主机监控Agent对主机的性能会有影响吗? Agent不同插件状态说明及处理方式 Agent支持的指标列表 支持GPU监控的环境约束
当云监控服务的Agent进程出现以下现象时,可能是因为Agent负载过高,状态不稳定导致: 管理控制台主机监控页面的“插件状态”参数在“运行中”和“故障”两个状态切换。 监控指标面板中存在断点。 约束与限制 当前章节的修复方式只支持新版本Agent,若Agent版本为老版本,建议先升级到新版本。
展示该资源分组下的全部告警规则。并且可以在单个资源分组中对指定的告警规则进行创建、复制、启用、停用、删除、屏蔽等操作。 操作步骤 登录管理控制台。 在管理控制台左上角选择区域和项目。 单击“服务列表 > 云监控服务”。 单击页面左侧的“资源分组”,进入“资源分组”页面。 单击资源分组列表中待查看的分组名称,进入该资源分组的“资源概览”界面。
每小时探测的总次数 * 100%。 packet_loss_rate 丢包率 丢包率是数据包丢失部分与所传数据包总数的比值。 http_code HTTP响应码 HTTP响应码代表服务端反馈的响应状态,即标准的HTTP状态码。是用3位数字表示网页服务器超文本传输协议响应的状态。如:2xx代表成功
查看告警记录详情 告警记录展示所有告警规则的状态变化,默认展示近7天的告警记录,通过选择时间可以展示近30天的告警记录,用户可以统一、方便地回溯和查看告警记录。当出现告警时,可以参考本章节查看具体云资源的告警记录详情。 操作步骤 登录管理控制台。 单击“服务列表 > 云监控服务”。 单击“告警
project_id 是 项目ID。 获取方式请参见获取项目ID。 以下列表为查询检索参数 名称 是否必选 参数类型 说明 namespace 是 String 查询服务的命名空间,各服务命名空间请参考支持监控的服务列表。 格式为service.item;service和item必须是字符串,
使用IAM子账号配置主机监控时,单击“一键配置”提示权限不足。 可能原因 子账号未配置IAM委托相关权限 解决方法 添加查询委托权限策略。 以主账户或子账号(拥有创建自定义策略和给其他子账号授权的权限)登录华为云管理控制台。 确认主账号已开启该区域插件权限,在云监控服务中单击“主机监控 - 弹性云服务器”,若页面上方
简介 电商业务内存要求高、数据量大并且数据访问量大、要求快速的数据交换和处理,监控要求极其高。 ECS为核心服务,全面、立体的ECS监控系统对业务稳定起到了至关重要的作用。主机监控功能可提供服务器的系统级、主动式、细颗粒度监控服务。为业务的顺畅运行保驾护航。 网站为电商平台的入口
除网卡、删除安全组等操作。因此,可以使用事件监控随时监控ECS、BMS的运行状态。 操作步骤 登录管理控制台。 在管理控制台左上角选择区域和项目。 单击“服务列表 > 云监控服务”。 单击页面左侧的“事件监控”,在事件列表页面,单击相应事件右侧的创建告警规则。 此处以删除虚拟机事
应用场景 对于有一定资源规模的组织或企业而言,资源数量大多会因为人工维护繁琐导致易出错,同时应用于不同生产环节的资源可能需要分组管理,例如用于测试和用于生产的资源相比,需要配置的监控与告警、通知渠道与接收用户也可能不一样。云监控支持根据实例名称、实例标签、企业项目进行分组管理告警规则、监
参数类型 描述 namespace 是 String 资源命名空间,例如弹性云服务器命名空间(格式为service.item;service和item必须是字符串,以字母开头,可包含0-9/a-z/A-Z/_;长度范围[3,32]。) dimensions 是 Array of Dimension
是否必选 参数类型 描述 project_id 是 String 项目id 最小长度:1 最大长度:64 正则匹配:^[a-z0-9]+$ 请求参数 表2 请求Header参数 参数 是否必选 参数类型 描述 Content-Type 是 String 发送的实体的MIME类型。默认使用application/json;
监控图表展示和告警功能。 日志监控 日志监控提供了针对日志内容的实时监控能力。通过云监控服务和云日志服务的结合,用户可以针对日志内容进行监控统计、设置告警规则等,降低用户监控日志的运维成本,简化用户使用监控日志的流程。 事件监控 事件监控提供了事件类型数据上报、查询和告警的功能。
事件监控简介 事件监控提供了事件类型数据上报、查询和告警的功能。方便您将业务中的各类重要事件或对云资源的操作事件收集到云监控服务,并在事件发生时进行告警。事件监控不依赖于Agent插件。 事件即云监控服务保存并监控的云服务资源的关键操作。您可以通过“事件”了解到谁在什么时间对系统