检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
gpuAnt1EccAlarm 重要 GPU卡出现ECC硬件故障。 如果业务受损停止,则重启业务恢复。 如果业务无法启动,建议尝试重启虚拟机恢复业务。 如果业务仍然无法恢复,请提交工单。 可能会造成业务中断,故障页隔离后业务可继续正常使用GPU。 GPU ECC内存页隔离失败告警 ecc
操作系统监控GPU页面显示无记录该如何处理? 在查看主机监控的监控指标时,如果出现操作系统监控GPU页面显示无记录的问题,请先确认您的机器是否支持GPU。若您的机器支持GPU且驱动运行正常,请参考以下操作步骤升级插件为增强版: 卸载当前基础版Agent: Linux平台:登录机器执行命令
云网络互访性能 云网络互访性能是一个全面展示华为云各个区域间和某个区域下的可用区之间的访问时延的界面,旨在帮助用户在搭建服务时选择合适的区域或者可用区,从而实现最佳的互访性能。注意区域间的时延在选择的两个区域之间有云连接的时候,代表是云连接通道的访问性能,如果没有则是走互联网通道
上报事件 功能介绍 事件监控为您提供上报自定义事件的接口,方便您将业务产生的异常事件或重要变更事件采集上报到云监控服务。 调试 您可以在API Explorer中调试该接口,支持自动认证鉴权。API Explorer可以自动生成SDK代码示例,并提供SDK代码示例调试功能。 URI
用户开通了云监控服务支持的云服务后,即可方便地在云监控Console页面查看您的云产品运行状态和相关指标数据,并对监控项创建告警规则。 主机监控 通过监控ECS或BMS的CPU使用率、内存使用率、磁盘等基础指标,确保ECS或BMS的正常使用,避免因为对资源的过度使用造成业务无法正常运行。 处理异常场景 云监控服务会根
欢迎使用云监控服务(Cloud Eye)。云监控为用户提供一个针对弹性云服务器、带宽等资源的立体化监控平台。使您全面了解云上的资源使用情况、业务的运行状况,并及时收到异常告警做出反应,保证业务顺畅运行。 您可以使用本文档提供的API对指标、告警规则、监控数据进行相关操作,如查询指标列表、查询告警
单击ECS实例所在行的名称或“操作”列的“查看监控指标”,可以查看操作系统监控指标、基础监控和进程监控。 图7 查看监控指标 图8 操作系统监控 进入指标详情页展示操作系统监控和基础监控,操作系统监控下展示的指标就是安装了Agent之后会展示出来的指标,如果操作系统监控为空,可以安装Agent成功之后再进行查看。
Agent安装配置方式说明 云监控通过在主机上安装插件,为您的主机提供服务器的系统级、主动式、细颗粒度监控服务。 安装Agent方式有如下几种,你可以根据你所使用的服务的操作系统类型、是否有多个服务器以及个人习惯选择任何一种或多种安装方式: 安装场景 支持的服务 参考章节 控制台界面安装/升级Agent
告警规则适用的告警类型,默认选择事件。 事件类型 用于指定事件类型,可选择系统事件或自定义事件。 事件来源 事件来源的云服务名称。 取值样例:弹性云服务器 对于自定义事件,事件来源配置为自定义事件时的event_source。 触发规则 选择配置告警策略的方式。当事件类型选择系统事件时,支持选择关联模板和自定义创建两
on主题,具体创建主题请参见创建主题。 告警规则创建完成后,当业务量飙升,监控指标触发设定的阈值时,系统会在第一时间通过消息通知服务的Notifiaction中的邮件或短信实时告知资源异常,提醒您处理,以免因此造成业务损失。 父主题: 云监控在众包平台中的应用
在监控视图右上角,单击,进入监控项详情页面。您可以选择系统提供的固定时长或自定义时间段来查看云服务的监控周期内的走势图。 在监控项详情页面,其中“近1小时”、“近3小时”、“近12小时”、“近24小时”以内的监控时长系统默认显示原始指标数据,“近7天”、“近30天”以内的监控时长系统默认显示聚合指标数据。 进
BMS实例缺失硬件监控插件会导致华为云无法第一时间感知实例的硬件故障,可能影响业务可用性时长,且故障需要用户主动联系技术支持处理。 当安装硬件监控插件后,硬件故障风险会以事件的方式主动通知到用户,需要用户及时授权对风险硬件的维修或更换。 监控插件实现硬件的故障风险检查时,仅会采集一些必要的系统指标用作巡检,详情见硬件监控指标采集说明。
当告警类型选择指标时,需配置告警规则监控的服务名称。 支持的云产品以及云产品对应的监控指标说明,请参见云产品监控指标。 弹性云服务器-云服务器 资源层级 当告警类型选择指标时,需选择告警规则的资源层级,可选择云产品或子维度,推荐选择云产品。 以弹性云服务器ECS为例:用户购买了云产品(ECS虚拟机),根据指标
修改、删除、启用、停用数据转储 当业务变化或者之前配置的数据转储配置不符合您的业务需求时,您可参考本章节修改、停用、启用或删除数据转储任务。 修改数据转储任务 登录管理控制台。 单击“服务列表 > 云监控服务”。 在左侧导航树中选择“数据转储”。 单击数据转储任务所在行“操作”列的“修改”,进入“修改转储任务”界面。
修改屏蔽规则 当业务变化或者当前配置的屏蔽规则不符合您的业务需求时,可参考本章节进行修改。 操作步骤 登录管理控制台。 单击“服务列表 > 云监控服务”。 单击“告警 > 告警屏蔽”,进入告警屏蔽界面。 在“告警屏蔽”界面,单击待修改屏蔽规则所在行“操作”列的“修改”。 在“修改
Agent安装成功后管理控制台没有操作系统监控数据或者显示数据滞后 安装配置Agent成功,需要等待2分钟,管理控制台上才会有操作系统监控数据。 若“插件状态”为“运行中”,等待5分钟后仍没有操作系统监控数据,则需要排查ECS或BMS时间和管理控制台所在客户端时间是否一致。 Ag
管理站点监控 操作场景 当业务变化或者当之前配置的站点监控规则不符合您的业务需求时,您可参考本章节修改、停用、启用或删除站点监控。 修改站点监控 登录管理控制台。 单击“服务列表 > 云监控服务 > 站点监控”。 单击监控站点所在行的“更多 > 修改站点监控”,或者则勾选多个监控站点,单击列表上方的“修改”。
事件监控 在实际的业务的运行中,ECS、BMS可随时根据业务调整,进行删除、重启、关闭、删除网卡、删除安全组等操作。因此,可以使用事件监控随时监控ECS、BMS的运行状态。 操作步骤 登录管理控制台。 在管理控制台左上角选择区域和项目。 单击“服务列表 > 云监控服务”。 单击页
情况。这是因为云监控服务导出的csv文件使用了UTF-8编码格式,而Excel是以ANSI格式打开的,没有做编码识别。针对此问题有以下解决方案: 使用记事本等文本编译器直接打开,或使用WPS打开; 打开csv文件时,对Excel进行如下设置: 新建Excel。 选择“数据 > 自文本”。
图1 配置弹性伸缩策略 告警规则与伸缩策略创建完成后,当业务量飙升,监控指标触发设定的阈值时,系统自动增加一个实例并在第一时间通过消息通知服务的Notifiaction中的电话和短信实时告知资源异常,提醒您处理,以免因此造成业务损失。 “告警通知”功能触发产生的告警消息由消息通知服