检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
主机监控 ECS是电商平台的基础支撑,因此ECS上细微的性能变化,都可能会引起电商业务的大幅震荡,甚至出现宕机,引起巨大损失。 主机监控提供了包括基础监控和操作系统监控两种不同监控粒度层次的监控。基础监控为ECS自动上报的监控指标,操作系统监控通过在ECS中安装Agent插件,为
指标ID,例如弹性云服务器的监控指标CPU使用率,对应的metric_name为cpu_util。各服务监控指标请参考支持监控的服务列表。 表5 dimensions字段数据结构说明 名称 是否必选 参数类型 说明 name 是 String 监控维度名称,例如弹性云服务器的维度为in
14.0.linux-amd64 ECS操作系统 Ubuntu 18.04 ECS私网IP 192.168.0.xx 对于需要导出监控数据的账号,要求具有IAM,CES,Config,EPS服务的读权限,另外获取哪些服务的监控数据就需要有哪些服务的读权限。 安装配置cloudeye-exporter
是 创建的资源分组选择一个或者多个资源。 详细参数说明请参见表3。 表3 resources字段数据结构说明 名称 参数类型 是否必选 说明 namespace String 是 资源命名空间,如弹性云服务器的资源命名空间为:SYS.ECS,各服务命名空间可查看支持监控的服务列表。
资源分组 一套完整的电商平台会使用到ECS、CDN、AS、安全服务、RDS、OBS、VPC等服务,您可以创建资源分组,将电商业务的ECS、EIP、EVS等资源划分成一个分组,通过资源分组功能从业务视角查看资源使用情况、告警情况、健康情况,管理告警规则,可以极大的降低运维复杂度,提高运维效率。
而可以更好的使用云监控服务。 监控指标 聚合 监控面板 主题 告警规则 告警模板 项目 企业项目 监控指标 监控指标是云监控服务的核心概念,通常是指云平台上某个资源的某个维度状态的量化值,如云服务器的CPU使用率、内存使用率等。监控指标是与时间有关的变量值,会随着时间的变化产生一
支持GPU监控的环境约束 仅支持Linux操作系统,且仅部分Linux公共镜像版本支持GPU监控,详情见:Agent支持的系统有哪些? 支持的规格:G6v、G6、P2s、P2v、P2vs、G5、Pi2、Pi1、P1系列的ECS,P、Pi、G、KP系列的BMS。 已安装lspci工
云产品监控指标。 进程监控:针对主机内活跃进程进行的监控,默认采集活跃进程消耗的CPU、内存,以及打开的文件数量等信息。 目前支持Linux操作系统和Windows操作系统。支持的系统请参见Agent支持的系统有哪些?。 ECS规格建议Linux使用“2vCPUs | 4GiB”、Windows使用“4vCPUs
String 主机类型,ECS弹性云服务器,BMS裸金属服务器 枚举值: ECS BMS intranet_ips Array of strings 内网ip列表 数组长度:0 - 10 elastic_ips Array of strings 弹性公网ip列表 数组长度:0 - 10
主机监控Agent对主机的性能会有影响吗? 主机监控Agent占用的系统资源很小,性能基本不会受到影响。 在弹性云服务器中安装Agent资源占用情况如下: CPU单核使用率最大不超过10%、内存最大不超过200M。一般情况下,CPU单核使用率<5%,内存<100M。 在裸金属服务器中安装Agent资源占用情况如下:
4命令采集。 内存的设备信息 内存条的SN、厂商、PN、位宽、容量、频率等。 使用dmidecode -t 17命令采集。 CPU的设备信息 CPU的ID、名称、频率、架构、型号等。 使用dmidecode -t 4和lscpu命令采集。 内存的错误记录 内存的CE/UCE错误记
Agent域名无法解析,请先确认修改DNS与添加安全组中DNS地址配置正确,然后参考《云监控服务用户指南》中“手动配置Agent”章节检查配置是否正确。 账号欠费。 Agent进程故障,请参照管理Agent重启,如果无法重启则说明相关文件被误删,请重新安装Agent。 配置异常: ECS/BMS主机没有配置委托。 当前委托权限异常。
云产品监控指标 全局级服务的监控数据默认保存在华北-北京四,如需要查询数据,请在华北-北京四查看。 分类 服务 命名空间 维度 监控指标参考文档 计算 弹性云服务器 SYS.ECS Key:instance_id Value:云服务器ID 弹性云服务器的基础监控指标 弹性云服务器中操作系统监控
告警类型 告警规则适用的告警类型,可选择指标或者事件告警。 指标 资源类型 配置告警规则监控的服务名称。 弹性云服务器 维度 用于指定告警规则对应指标的维度名称 云服务器 监控范围 告警规则适用的资源范围。 指定资源 监控对象 监控对象为当前选择的弹性云服务器,无需配置。 - 触发规则
ELB监控 在视频直播中,网络访问流量的突增可能会引起业务的动荡,因此绝大多数的视频直播平台都会使用ELB自动分发流量到多台云服务器。 那么,ELB的稳定可靠运行对视频直播业务的正常运行至关重要。云监控可以监控ELB的异常主机数和并发连接数,确保您的业务稳定可靠运行。 操作步骤 登录管理控制台。
事件时,需要选择导入的模板。 您可以选择系统预置的默认告警模板,或者选择自定义模板。 事件名称 用户操作资源的动作,如用户登录,用户登出,为一个瞬间的操作动作。 事件监控支持的操作事件请参见事件监控支持的事件说明。 取值样例:删除虚拟机 告警策略 触发告警的告警策略。 例如:监控周期为5分钟,累计达到3次。
事件监控最佳实践 弹性云服务器事件 关系型数据库事件 弹性公网IP事件 父主题: 场景化实践案例
主机监控配置监控及告警的全流程介绍 主机资源作为最重要的云上资源,如何做好对它的监控、告警,在实际的运维过程中尤为重要,本文主要介绍主机如何进行监控及配置告警。 应用场景 当用户购买了主机资源后,对于资源的运行状态需要进行必要的监控,以及对重点业务指标进行配置监控告警,能及时准确掌握主机资源的云上运行状态。
为防止资源滥用,平台限定了各服务资源的配额,对用户的资源数量和容量做了限制。如您最多可以创建多少台弹性云服务器、多少块云硬盘。 如果当前资源配额限制无法满足使用需要,您可以申请扩大配额。 怎样查看我的配额? 登录管理控制台。 单击管理控制台左上角的,选择区域和项目。 在页面右上角,选择“资源 > 我的配额”。
本章节主要介绍如何在主机监控页面为弹性云服务器一键安装/升级Agent插件,为用户提供更加便捷的安装方式,请根据需要选择合适的安装方式。支持Agent一键安装的系统请参考Agent支持的系统有哪些? 表1 适用场景 安装方式 适用场景 安装&升级插件 已支持一键安装的主机资源,可在界面直接点