检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
Agent支持的系统有哪些?。 支持的GPU加速型规格:G6v、G6、P2s、P2v、P2vs、G5、Pi2、Pi1、P1。 暂不支持CCE纳管后的GPU加速型实例。 前提条件 已安装GPU驱动,未安装lspci工具的云服务器影响GPU掉卡事件的上报。 如果您的弹性云服务器未安
取值为alarm。 alarm_id 告警规则ID。 alarm_name 告警规则名称。 alarm_status 告警状态。 取值范围: ok:正常 alarm:告警 time 告警触发时间。 namespace 服务的命名空间。 格式为service.item;service
"name": "username", "password": "********", "domain": { "name": "domainname"
事件来源 命名空间 事件名称 事件ID 事件级别 事件说明 处理建议 事件影响 BMS SYS.BMS GPU SRAM存在 Uncorrectable ECC告警 SRAMUncorrectableEccError 重要 GPU卡SRAM出现Uncorrectable ECC Error硬件故障。
事件来源 命名空间 事件名称 事件ID 事件级别 事件说明 处理建议 事件影响 BMS SYS.BMS GPU SRAM存在 Uncorrectable ECC告警 SRAMUncorrectableEccError 重要 GPU卡SRAM出现Uncorrectable ECC Error硬件故障。
0/{project_id}/alarms/{alarm_id} 请求消息 请求参数 表2 参数说明 名称 是否必选 类型 说明 alarm_name 否 String 告警名称,只能包含0-9/a-z/A-Z/_/-或汉字。 alarm_description 否 String 告警描述,长度0-256。
agent_install.sh -t 2.7.2 -r cn-north-1 命令执行完成时,输出Telescope process starts successfully.则代表安装成功。 执行如下命令,清除安装脚本。 if [[ -f /usr/local/uniagent/extensio
Agent目前仅支持物理磁盘指标的采集,不支持通过网络文件系统协议挂载的磁盘。 CES Agent会默认屏蔽docker相关的挂载点。挂载点前缀如下: /var/lib/docker;/mnt/paas/kubernetes;/var/lib/mesos 指标 指标名称 指标说明 单位
入网带宽和出网带宽出现负值 老版本Agent在统计出入网带宽时,如若装有docker,当容器重启时无法统计虚拟网卡值,由于计算的是差值而导致出现负值的情况。 请参照管理Agent更新Agent。 父主题: 主机监控
在华为云部署的众包平台的经典架构图如图1所示,核心数据库采用BMS集群方式部署数据库集群,Web-Server与API-Server部署在ECS上,Web-Server主要提供网站的搜索、类目、店铺、交易等业务,API-Server为连接各业务与数据库的各个基础接口。BMS与ECS的运行状态对整体业务至关重
主机监控 针对众包平台中使用的ECS和BMS,ECS作为业务的计算资源,数据库部署在BMS上。因此,BMS的磁盘速度会影响数据库操作速度,ECS的内存和CPU占用大小等会影响业务执行速度,为了监控更细颗粒度的监控指标,可以在弹性云服务器中安装配置Agent。 具体监控指标方面,可
创建告警通知主题 查看告警记录 权限管理 如果您需要对您所拥有的云监控服务进行精细的权限管理,您可以使用统一身份认证服务(Identity and Access Management,简称IAM),通过IAM,您可以: 根据企业的业务组织,在您的华为云账号中,给企业中不同职能部门的员工创建IA
修改DNS与添加安全组(Linux) 操作场景 本章节指导用户为Linux系统的ECS或BMS添加域名解析并添加安全组,防止下载Agent安装包与采集监控数据时出现异常。本章节以ECS为例介绍如何修改DNS和添加安全组,BMS操作步骤类似。 修改ECS的DNS配置有两种方式:命令行和管理控制台。您
使用主机监控 主机监控分为基础监控、操作系统监控、进程监控。 基础监控:ECS/BMS自动上报的监控指标。 操作系统监控:通过在ECS或BMS中安装Agent插件,为用户提供服务器的系统级、主动式、细颗粒度监控服务。 进程监控:针对主机内活跃进程进行的监控,默认采集活跃进程消耗的
创建主机监控的告警通知 操作场景 本章节指导用户对ECS或BMS的监控指标创建告警规则。 操作步骤 登录管理控制台。 在管理控制台左上角选择区域和项目。 单击“服务列表 > 云监控服务”。 单击页面左侧的“主机监控”,进入主机监控页面。 单击ECS或BMS主机所在栏右侧的“更多”按钮,选择下拉出的“创建告警规则”。
基础监控:ECS自动上报的监控指标,数据采集频率为5分钟1次。可以监控CPU使用率等指标,详见云产品监控指标。BMS不支持基础监控,需要安装主机监控Agent插件。 操作系统监控:通过在ECS或BMS中安装Agent插件,为用户提供服务器的系统级、主动式、细颗粒度监控服务。数据采集频率为1分钟1
事件监控 在实际的业务的运行中,ECS、BMS可随时根据业务调整,进行删除、重启、关闭、删除网卡、删除安全组等操作。因此,可以使用事件监控随时监控ECS、BMS的运行状态。 操作步骤 登录管理控制台。 在管理控制台左上角选择区域和项目。 单击“服务列表 > 云监控服务”。 单击页
onsole页面查看您的云产品运行状态和相关指标数据,并对监控项创建告警规则。 主机监控 通过监控ECS或BMS的CPU使用率、内存使用率、磁盘等基础指标,确保ECS或BMS的正常使用,避免因为对资源的过度使用造成业务无法正常运行。 处理异常场景 云监控服务会根据您创建的告警规则
1000 表4 one_click_alarms 参数 参数类型 描述 one_click_alarm_id String 一键告警ID namespace String 指标命名空间 description String 一键告警描述,长度范围[0,256],该字段默认值为空字符串 enabled
统监控数据。 若“插件状态”为“运行中”,等待5分钟后仍没有操作系统监控数据,则需要排查ECS或BMS时间和管理控制台所在客户端时间是否一致。 Agent上报数据时取的是ECS或BMS的操作系统本地时间,管理控制台下发的请求时间范围是依赖用户客户端浏览器的时间,两者如果不匹配则可