检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
新版本)。 安装最新版本的Agent,安装命令参见Linux系统。 使用具有“管理员”权限的账号(例如,administrator)登录Windows弹性云服务器。 根据Agent安装路径判断当前Agent版本,方法参见Windows平台。 卸载当前版本的Agent,卸载命令参见卸载Agent。
是否必选 描述 name String 否 监控维度名称,例如弹性云服务器的维度为instance_id。各服务维度请参考支持监控的服务列表,可参考维度中key字段。 value String 否 维度取值,例如弹性云服务器的ID。 长度最短为1,最大为256。 表6 meta_data字段数据结构说明
2021-06-16 配置云服务器全部挂载点磁盘使用率告警规则上线。 2020-03-09 使用资源分组和告警功能最佳实践上线。 2019-03-06 事件监控最佳实践上线。 2019-01-22 云监控在众包平台中的应用上线。 2018-09-30 云监控在视频直播中的应用上线。 2018-07-30
原始采样数据实时上报,提供对云服务的实时监控,实时触发产生告警并通知用户。 监控可视化 云监控服务通过监控面板为用户提供丰富的图表展现形式,支持数据自动刷新以及指标对比查看,满足用户多场景下的监控数据可视化需求。 多种通知方式 通过在告警规则中开启消息通知,当云服务的状态变化触发告警规则设置的阈值时,系
资源数(告警中/已触发/资源总数) 组内所有正在告警的资源数/已触发告警的资源数/组内所有资源的数量。 资源类型数 组内资源类型的数量,例如组内有2台弹性云服务器 、1个云硬盘两种资源类型,则资源类型数为2。 归属企业项目 拥有资源分组权限的企业项目名称。 创建方式 创建资源分组的方式,有手动添加和智能添加两种。
4命令采集。 内存的设备信息 内存条的SN、厂商、PN、位宽、容量、频率等。 使用dmidecode -t 17命令采集。 CPU的设备信息 CPU的ID、名称、频率、架构、型号等。 使用dmidecode -t 4和lscpu命令采集。 内存的错误记录 内存的CE/UCE错误记
project_id 是 项目ID。 获取方式请参见获取项目ID。 template_id 是 需要删除的自定义告警模板ID。 样例 DELETE https://{云监控的endpoint}/V1.0/{project_id}/alarm-template/at1603252280799wLRyGLxnz
URN是主题的唯一资源标识,不可修改。新创建的主题将显示在主题列表中。 单击主题名称,可查看主题详情和主题订阅总数。 后续操作 创建完主题后,您就可以添加订阅了。完成创建和添加订阅后,后续的告警通知即可通过SMN服务发送到您配置的订阅终端。 “告警通知”功能触发产生的告警消息由消
安装说明。 服务器内部时间和本地标准时间不一致。 使用的DNS非华为云DNS,请通过执行dig+目标域名获取到agent.ces.myhuaweicloud.com在华为云内网DNS下解析到的IP后再添加对应的hosts。华为云提供的内网DNS地址请参见华为云提供的内网DNS地址是多少?。
Files\telescope\log\ces.log 使用的DNS非华为云DNS,请通过执行dig+目标域名获取到agent.ces.myhuaweicloud.com在华为云内网DNS下解析到的IP后再添加对应的hosts。华为云提供的内网DNS地址请参见华为云提供的内网DNS地址是多少?。 父主题:
Unauthorized 未提供认证信息,或认证信息错误。 403 Forbidden 请求页面被禁止访问。 408 Request Timeout 请求超出了服务器的等待时间。 429 Too Many Requests 当前请求过多。 500 Internal Server Error 请求未完成,服务异常。
是否必选 说明 project_id 是 项目ID。 获取方式请参见获取项目ID。 alarm_id 是 告警规则的ID。 样例 DELETE https://{云监控的endpoint}/V1.0/{project_id}/alarms/al1441967036681YkazZ0deN
资源分组 一套完整的电商平台会使用到ECS、CDN、AS、安全服务、RDS、OBS、VPC等服务,您可以创建资源分组,将电商业务的ECS、EIP、EVS等资源划分成一个分组,通过资源分组功能从业务视角查看资源使用情况、告警情况、健康情况,管理告警规则,可以极大的降低运维复杂度,提高运维效率。
average:聚合周期内指标数据的平均值。 max:聚合周期内指标数据的最大值。 min:聚合周期内指标数据的最小值。 sum:聚合周期内指标数据的求和值。 variance:聚合周期内指标数据的方差。 comparison_operator String 告警阈值的比较条件,可以是>、=、<、>=、<=。
"unit": "unknown" }] } 案例三 ECS实例未安装agent插件 在CES页面“主机监控”下的【弹性云服务器】中找到对应ECS的实例,在【插件状态】列点击,未安装,然后根据使用指南安装agent插件。 案例四 ECS实例安装的agent插件没有上报磁盘使用率指标数据 a
检查应用和数据库之间的连接是否重新建立了连接。 复制状态异常 即主备之间复制时延太大(一般在写入大量数据,或者执行大事务的时候会出现),在业务低峰期备机会逐渐追上主机。还有另一种可能是主备间的网络中断,导致主备复制异常。但不会导致原来单实例的读写中断,客户的应用是无感知的。 提交工单处理。
String 资源的监控指标名称,必须以字母开头,只能包含0-9/a-z/A-Z/_,字符长度最短为1,最大为64;如:弹性云服务器中的监控指标cpu_util,表示弹性服务器的CPU使用率;文档数据库中的指标mongo001_command_ps,表示command执行频率;各服务的指标名称可查看:“服务指标名称”。
云监控服务监控的资源类型。 取值样例:弹性云服务器。 维度 监控对象的范围。 各服务监控对象的维度值请参考监控指标说明页面的“监控指标”和“维度”表格中描述。 选择“所有维度”时,表示该服务的所有监控对象均会转储到分布式消息服务Kafka中。 选择“云服务器”时,表示仅该云服务器的监控指标会转储到分布式消息服务Kafka中。
单击页面左侧的“事件监控”,在事件列表页面,单击相应事件右侧的创建告警规则。 此处以删除虚拟机事件为例,可根据业务需要,针对重启虚拟机、关闭虚拟机、删除网卡等创建告警规则。 当ECS、BMS出现异常时,云监控会在第一时间通过消息通知服务实时告知资源异常,提醒您处理,以免因此造成业务损失。
是否必选 说明 project_id 是 项目ID。 获取方式请参见获取项目ID。 alarm_id 是 告警规则的ID。 样例 PUT https://{云监控的endpoint}/V1.0/{project_id}/alarms/al1441967036681YkazZ0deN/action