检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
资源分组支持用户从业务角度集中管理其业务涉及到的弹性云服务器、云硬盘、弹性IP、带宽、数据库等资源。从而按业务来管理不同类型的资源、告警规则、告警记录,可以迅速提升运维效率。 资源分组支持企业项目,当选择了资源分组到某个企业项目时,只有拥有该企业项目权限的用户才可以查看和管理该资源分组。 父主题:
储保存。具体操作请参考数据转储。 如果某个资源实例被停用、关闭或者删除,相应的原始指标数据停止上报1小时后,实例相关的指标就被删除。停用或关闭的实例被重新启用后,指标会恢复上报,此时可查看该指标保留期内的历史数据。 父主题: 云服务监控
VMTools,云监控服务无法提供监控弹性云服务器的内存使用率、磁盘使用率、带内网络流入速率和带内网络流出速率四个指标。但可以监控带外网络流入速率和带外网络流出速率指标,这样导致CPU使用率指标的精确性可能会降低。 弹性云服务器支持的监控指标,请参见弹性云服务器支持的监控指标。 父主题: 主机监控
停用数据转储 在“数据转储”界面,单击数据转储任务所在行的“停用”,在弹出的“停用转储任务”界面,单击“确定”,可以停用数据转储任务。 启用数据转储 在“数据转储”界面,单击状态为“已关闭”的数据转储所在行的“启用”,在弹出的“启用转储任务”界面,单击“确定”,可以启用数据转储任务。
告警级别分为紧急,重要,次要,提示四种级别,其中告警规则的告警级别由用户设置,用户可根据自己业务及告警规则设置合理告警级别,四种级别简单说明如下: 紧急告警:告警规则对应资源发生紧急故障,影响业务视为紧急告警。 重要告警:告警规则对应资源存在影响业务的问题,此问题相对较严重,有可能会阻碍资源的正常使用。 次要告警:
登录管理控制台。 单击“服务列表 > 云监控服务”。 单击页面左侧的“主机监控”,进入主机监控页面。 此时页面上显示了当前云平台上的弹性云服务器列表。 单击ECS主机所在栏右侧的“更多 > 创建告警规则”。 弹出创建告警规则的窗口。 输入告警规则名称和描述。 按照如下所示配置参数。 触发规则:选择自定义创建。
资源占用 Agent占用的系统资源很小,CPU单核使用率最大不超过10%、内存最大不超过200M。一般情况下,CPU单核使用率<5%,内存<100M。 熔断 Agent的CPU单核利用率大于10%,或者内存使用超过200M,且连续发生三次。为了保障用户的资源,Agent会主动触发
4命令采集。 内存的设备信息 内存条的SN、厂商、PN、位宽、容量、频率等。 使用dmidecode -t 17命令采集。 CPU的设备信息 CPU的ID、名称、频率、架构、型号等。 使用dmidecode -t 4和lscpu命令采集。 内存的错误记录 内存的CE/UCE错误记
Linux 操作场景 本章节主要介绍如何将老架构的Agent升级到新架构Agent。 约束限制 不支持局点:华南-广州-友好用户环境、拉美-圣保罗一、拉美-墨西哥城一。 操作步骤 使用root账号,登录ECS。 执行如下命令,确认当前Agent的版本是新架构Uniagent还是老架构telescope。
云监控服务”。 选择“告警 > 告警模板”,进入告警模板界面。 单击“自定义告警模板”或“自定义事件模板”页签。 单击模板所在行的“修改”。 参考表1,修改已配置的参数。 图1 修改自定义告警模板 单击“立即修改”,完成模板修改。 父主题: 告警模板
告警通知是什么,分为几类? 告警通知是告警状态触发时所采取的行为,用户可以在创建、修改告警的时候设置通知,也可以关闭通知。 通知目前支持两种: 触发告警时给用户发送邮件或短信通知或通过HTTP、HTTPS形式发送消息至服务器。 触发弹性伸缩自动扩容和缩容。 父主题: 告警
告警规则在何种情况下会触发“数据不足”? 当某一个告警规则监控的告警指标连续三个小时内未上报监控数据,此时告警规则的状态将变为“数据不足”。 特殊情况下,如果指标的上报周期大于三个小时,连续三个周期均未上报监控数据,则告警规则状态变为“数据不足”。 父主题: 告警
监控维度,例如弹性云服务器的维度为instance_id。各服务监控指标对应的维度请参考支持监控的服务列表中对应服务的监控指标说明。 指标的维度,目前最大支持3个维度,维度编号从0开始;维度格式为dim.{i}=key,value。key的最大长度32,value的最大长度为256。 例如dim
原始采样数据实时上报,提供对云服务的实时监控,实时触发产生告警并通知用户。 监控可视化 云监控服务通过监控面板为用户提供丰富的图表展现形式,支持数据自动刷新以及指标对比查看,满足用户多场景下的监控数据可视化需求。 多种通知方式 通过在告警规则中开启消息通知,当云服务的状态变化触发告警规则设置的阈值时,系
小时、近3小时 、近12小时、近 24小时、近7天和近30天收集的原始数据的图表。您可以自定义选择要查看的监控指标,数据可实现自动刷新。 创建告警规则:用户对云服务的核心监控指标设置告警规则,当监控指标触发用户设置的告警条件时,支持以 邮箱、短信、HTTP、HTTPS等方式通知用
返回结果 状态码 请求发送以后,您会收到响应,其中包含状态码、响应消息头和消息体。 状态码是一组从1xx到5xx的数字代码,状态码表示了请求响应的状态,完整的状态码列表请参见状态码。 对于获取用户Token接口,如果调用后返回状态码为“201”,则表示请求成功。 响应消息头 对应
State Transfer)风格API,支持您通过HTTPS请求调用,调用方法请参见如何调用API。 同时云监控服务还提供多种编程语言的SDK供您使用,SDK的使用方法请参见https://console.huaweicloud.com/apiexplorer/#/sdkcenter/CES
Agent插件状态显示“已停止”该如何处理? 查看Agent版本 使用root账号,登录ECS。 执行如下命令,确认使用Agent的版本。 if [[ -f /usr/local/uniagent/extension/install/telescope/bin/telescope
将实时监控数据接入自建Prometheus 部分客户存在多云、多账号、多region资源协同管理的场景,希望能够将云上资源的监控数据实时导出到自建监控系统中统一管理,基于该场景云监控服务为您提供线下自动导出工具,根据配置实时获取云资源监控数据并持续导入本地Prometheus。 前提条件
指标ID,例如弹性云服务器的监控指标CPU使用率,对应的metric_name为cpu_util。各服务监控指标请参考支持监控的服务列表。 字符格式必须以字母开头,只能包含0-9/a-z/A-Z/_-,字符长度最短为1,最大为96。 dim 否 String 监控维度,例如弹性云服务器的维度为in