正在生成
详细信息:
检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
幅震荡,甚至出现宕机,引起巨大损失。 主机监控提供了包括基础监控和操作系统监控两种不同监控粒度层次的监控。基础监控为ECS自动上报的监控指标,操作系统监控通过在ECS中安装Agent插件,为用户提供服务器的系统级、主动式、细颗粒度监控服务。 应用场景 促销、秒杀、爆款等电商业务场
使用hinicadm mode -i <dev_id>命令采集。 HiNIC网卡核温 HiNIC网卡核温。 使用hinicadm temperature -i <dev_id>命令采集。 HiNIC网卡事件记录 HiNIC网卡心跳丢失计数、PCIE异常计数、芯片错误计数、芯片健康状态等。
电商业务内存要求高、数据量大并且数据访问量大、要求快速的数据交换和处理,监控要求极其高。 ECS为核心服务,全面、立体的ECS监控系统对业务稳定起到了至关重要的作用。主机监控功能可提供服务器的系统级、主动式、细颗粒度监控服务。为业务的顺畅运行保驾护航。 网站为电商平台的入口,双12、618等大型购物节会
您对云服务运行情况不同的监控需求。 操作步骤 登录管理控制台。 单击“服务列表 > 云监控服务”。 选择“我的看板”,单击“创建看板”。 系统弹出“创建看板”窗口。 配置参数。 名称:表示监控看板名称,该参数只能由中文、英文字母、数字、下划线、中划线组成,且长度不超过128。 归
支持GPU监控的环境约束 仅支持Linux操作系统,且仅部分Linux公共镜像版本支持GPU监控,详情见:Agent支持的系统有哪些? 支持的规格:G6v、G6、P2s、P2v、P2vs、G5、Pi2、Pi1、P1系列的ECS,P、Pi、G、KP系列的BMS。 已安装lspci工
事件即云监控保存并监控的云服务资源的关键操作。您可以通过“事件”了解到谁在什么时间对系统哪些资源做了什么操作,如删除虚拟机、重启虚拟机等。 事件监控默认开通,您可以在事件监控中查看系统事件和自定义事件的监控详情,目前支持的系统事件请参见事件监控支持的事件说明。 事件监控为您提供上报自定义事件的接
搭建业务的系统级监控。 本文介绍云监控服务常用最佳实践,帮助您更好的使用云监控服务。 表1 常用最佳实践 实践 描述 电商平台 电商平台最佳实践 电商业务对内存要求高、数据量大并且数据访问量大、要求快速的数据交换和处理,监控要求极其高。 主机监控功能可提供服务器的系统级、主动式、细颗粒度监控服务。
扩展应用系统对外的服务能力,通过消除单点故障提升应用系统的可用性,并且使用云监控的事件监控功能对服务器运行异常及自动恢复进行监控,订阅事件告警同步进行业务处理。 表1 ECS重点事件 事件名称 事件说明 处理步骤 因硬件故障触发重启 弹性云服务器所在的主机出现故障时,系统会自动将
解决方法 支持的最大查询时间:155天。 问题三 问题描述 调用不同region区域的接口,对应的域名是什么。 解决方法 请参考地区和终端节点。 接口调用过程中常见问题 问题一 问题描述 调用批量查询监控数据接口,响应状态码200,无指标数据返回。响应体样例如下: { "metrics":
Agent支持的系统有哪些? Agent插件资源占用和熔断说明 主机监控Agent对主机的性能会有影响吗? Agent不同插件状态说明及处理方式 Agent支持的指标列表 支持GPU监控的环境约束 BMS硬件监控指标采集说明 什么是插件修复配置? 怎样让新购ECS实例中带有操作系统监控功能?
监控插件实现硬件的故障风险检查时,仅会采集一些必要的系统指标用作巡检,详情见硬件监控指标采集说明。 仅支持部分Linux操作系统,详情见:Agent支持的系统有哪些?。 支持的规格:所有规格的BMS。 若实例使用自建的私有镜像作为操作系统,请确保其包含了如下软件:dmidecode、l
Agent版本特性 CES Agent支持的镜像列表,参见 Agent支持的系统有哪些? CES Agent迭代版本已知版本特性如下: 2.7.2.1版本 基于2.7.2版本: 增加GPU指标。 增加NPU指标。 增加物理机硬件监控能力。详情说明参考BMS硬件监控插件说明。 2.7
则和通知。 查看系统进程数 云监控服务在您安装插件后,会默认展示系统的进程数据。 查看系统进程数的操作步骤 登录管理控制台。 单击“服务列表 > 云监控服务”。 单击页面左侧的“主机监控”,进入“主机监控”页面。 单击资源所在行的“查看监控指标”,进入“操作系统监控”页面。 单击
提交工单:单击下方“未解决,提交工单”,提交申请公测工单。 完成工单提交:等待系统回复,当出现华为云工程师系统角色提示您确认风险的回复后,输入“风险已知晓,继续开通”,等待系统回复,完成公测协议开通。 企业微信群消息,钉钉群消息,飞书群消息有发送条数限制和接收方系统故障情况,可能会导致消息发送失败。出现上述原因时,SMN不保证消息成功送达。
事件即云监控服务保存并监控的云服务资源的关键操作。您可以通过“事件”了解到谁在什么时间对系统哪些资源做了什么操作,如删除虚拟机、重启虚拟机等。 事件监控默认开通,您可以在事件监控中查看系统事件和自定义事件的监控详情,目前支持的系统事件请参见事件监控支持的事件说明。 事件监控为您提供上报自定义事件的接
否 事件类型,值为EVENT.SYS或EVENT.CUSTOM。EVENT.SYS表示系统事件,EVENT.CUSTOM表示自定义事件。 event_name String 否 事件名称,值为系统产生的事件名称或用户自定义上报的事件名称。 from Integer 否 查询数据起始
有视图的监控周期,其中“近1小时”以内的监控时长系统默认显示原始指标数据,其他时长周期默认显示聚合指标数据。 您还可以进入监控大屏查看监控视图,请参考大屏查询模式使用技巧。 在监控视图右上角,单击,进入监控项详情页面。您可以选择系统提供的固定时长或自定义时间段来查看云服务的监控周期内的走势图。
在“通知模板”页签,单击“创建通知模板”,根据界面提示配置参数。 根据界面提示,配置告警通知模板的基本信息。 图1 基本信息 表1 基本信息 参数 参数说明 模板名称 系统会随机产生一个通知模板名称,用户也可以进行修改。 取值样例:noticeTemplate-d9wa 描述 告警通知模板描述(此参数非必填项)。
在监控视图右上角,单击,进入监控项详情页面。您可以选择系统提供的固定时长或自定义时间段来查看云服务的监控周期内的走势图。 在监控项详情页面,其中“近1小时”、“近3小时”、“近12小时”、“近24小时”以内的监控时长系统默认显示原始指标数据,“近7天”及以上的监控时长系统默认显示聚合指标数据。不同监控周
单击“创建可用性监控”。 根据界面提示,配置可用性监控的基本信息。 图1 填写基本信息 表1 配置基本信息 参数 参数说明 取值样例 名称 系统会随机产生一个名称,用户也可以进行修改。 availabilityMonitor-wi4t 探测协议 目前仅支持对HTTP(S)协议进行监控。