检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
以直观的看到资源的异常情况。 图1 云服务监控 单击“看板名称”列的云服务看板名称,即可进入资源详情页和概览页。 图2 云服务监控详情 资源详情: 资源详情页可以进行搜索、资源排序、告警个数查看等功能。 资源详情列表从名称或者查看监控指标入口,可以进入资源的指标详情页。 指标详情
用户可手动卸载Agent插件,卸载后云监控服务将不再主动采集主机的监控数据。如需再次使用,请参考操作步骤或操作步骤重新安装。 查看Agent状态(老版本) 以root用户登录ECS或BMS,执行以下命令,查看Agent状态。 service telescoped status 当系统返回以下内容,则表示Agent为正常运行状态。
提示配置参数,如图1所示。 图1 创建站点监控 配置完成后,单击“确定”,完成创建站点监控。 创建站点监控完成后,单击站点名称右侧的“ 创建告警规则”,为设置的站点配置告警规则。 在创建告警规则界面,按照界面提示配置参数,参数说明请参见配置参数。 建议针对可用性≤95%、响应时间
Agent插件状态显示“已停止”该如何处理? 查看Agent版本 使用root账号,登录ECS。 执行如下命令,确认使用Agent的版本。 if [[ -f /usr/local/uniagent/extension/install/telescope/bin/telescope
站点监控 针对大量的静态数据,如产品图片,产品视频等导致不同网络用户访问电商网站出现网页打开慢、网络延时高等问题。可以使用站点监控对网站或ECS的弹性IP等进行持续拨测,监控业务入口的可用性及响应时间。 操作步骤 登录管理控制台。 单击“服务列表 > 云监控服务”。 单击左侧导航栏的“站点监控”。
库服务。在使用关系型数据库中,需持续关注数据库状态,可通过事件监控,对异常事件告警进行处理,保证业务稳定运行。 表1 RDS重点事件 事件名称 事件说明 处理步骤 创建实例业务失败 创建实例失败产生的事件,一般是磁盘个数,配额大小都很小,底层资源耗尽导致。 检查磁盘个数、配额大小,释放资源后重新创建。
在“创建告警规则”界面,根据界面提示配置参数。 根据界面提示,配置告警规则基本信息。 表1 广域网质量监控告警规则基本信息配置说明 参数 参数说明 名称 系统会随机产生一个名称,用户也可以进行修改。 描述 告警规则描述(此参数非必填项)。 选择监控对象,配置告警内容参数。 图1 配置广域网质量监控的告警内容
t插件。 事件即云监控服务保存并监控的云服务资源的关键操作。您可以通过“事件”了解到谁在什么时间对系统哪些资源做了什么操作,如删除虚拟机、重启虚拟机等。 事件监控默认开通,您可以在事件监控中查看系统事件和自定义事件的监控详情,目前支持的系统事件请参见事件监控支持的事件说明。 事件
单击页面左侧的“事件监控”,在事件列表页面,单击相应事件右侧的创建告警规则。 此处以删除虚拟机事件为例,可根据业务需要,针对重启虚拟机、关闭虚拟机、删除网卡等创建告警规则。 当ECS、BMS出现异常时,云监控会在第一时间通过消息通知服务实时告知资源异常,提醒您处理,以免因此造成业务损失。
枚举类型:notification,autoscaling,groupwatch,ecsRecovery,contact,contactGroup,iecAction 枚举值: notification autoscaling groupwatch ecsRecovery contact contactGroup
在弹出的“创建站点监控”对话框中根据界面提示配置参数,如创建站点监控所示,参数说明如表1所示。 图1 创建站点监控 表1 配置参数 参数 参数说明 取值样例 名称 配置站点监控的名称。 siteMonitor-mfdp 探测协议 目前可针对四种协议进行监控:HTTP(S)、PING、TCP、UDP。 更多探测协议正在部署中。
dll系统进程状态支持模块得到进程总数。 Count 2.4.1 1分钟 GPU指标 指标分类 指标名称 指标说明 单位 支持版本 采集方式 GPU指标 gpu_status 虚拟机上GPU健康状态。该指标是一个综合指标,0代表健康,1代表亚健康,2代表故障。 - 2.4.5 Linux:
新架构Agent。 约束限制 不支持局点:华南-广州-友好用户环境、拉美-圣保罗一、拉美-墨西哥城一。 操作步骤 使用root账号,登录ECS。 执行如下命令,确认当前Agent的版本是新架构Uniagent还是老架构telescope。 if [[ -f /usr/local/
否 Boolean 指定企业项目下监控看板是否收藏,true:收藏,false:未收藏,填此参数时,enterprise_id必填 dashboard_name 否 String 监控看板名称 最小长度:1 最大长度:128 正则匹配:^([\u4E00-\u9FFF]|[a-z
观测主机的资源占用率,参考操作步骤配置Agent熔断机制中的第一阈值和第二阈值。 操作步骤 使用root账号,登录Agent不上报数据的ECS或BMS。 可选:执行以下命令,切换至Agent安装路径的bin下。 Windows系统下,路径为:“C:\Program Files\u
最小长度:1 最大长度:16384 表3 请求Body参数 参数 是否必选 参数类型 描述 template_name 是 String 告警模板的名称,以字母或汉字开头,可包含字母、数字、汉字、_、-,长度范围[1,128] template_type 否 Integer 自定义告警模板类型
Agent不同插件状态说明及处理方式 Agent有以下五种状态: 未安装/未启动:指未在该ECS/BMS中安装Agent或手动停止了Agent。 运行中:Agent运行正常,可正常上报监控数据。 故障:监控插件每1分钟发送1次心跳;当服务端3分钟收不到插件心跳时,“插件状态”显示为“故障”。
告警级别有哪些? 告警级别分为紧急,重要,次要,提示四种级别,其中告警规则的告警级别由用户设置,用户可根据自己业务及告警规则设置合理告警级别,四种级别简单说明如下: 紧急告警:告警规则对应资源发生紧急故障,影响业务视为紧急告警。 重要告警:告警规则对应资源存在影响业务的问题,此问
告警简介 告警功能提供对监控指标的告警功能,用户对云服务的核心监控指标设置告警规则,当监控指标触发用户设置的告警条件时,支持以邮箱、短信、HTTP、HTTPS等方式通知用户,让用户在第一时间得知云服务发生异常,迅速处理故障,避免因资源问题造成业务损失。 云监控服务使用消息通知服务
全部资源 配置告警规则可选择全部资源的功能只有主账号或配置了Tenant Administrator权限的子用户才有权使用。 如何为子账号设置Tenant Administrator权限,请参考创建用户组并授权。 父主题: 告警