检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
云服务监控 云服务监控简介 查看云服务监控看板 配置数据存储 查看云服务监控指标原始数据 父主题: 云资源监控
图1 导出告警规则 您要导出的数据中,包含指定资源的监控对象,您可以按需选择是否导出指定资源列表。 导出任务提交成功后,单击“任务中心”,在“告警数据导出”页签中的“告警规则导出”页面查看及下载。
应用场景 无论您使用的是ECS还是BMS,都可以使用主机监控来采集丰富的操作系统层面监控指标,也可以使用主机监控进行服务器资源使用情况监控和排查故障时的监控数据查询。
单击“导出”,选择“导出监控数据”,弹出“导出监控数据”界面。 图1 “导出监控数据”界面 默认弹出的为新版界面,若要返回旧版,则单击“返回旧版”,旧版界面如图2所示。旧版导出数据任务不会在“任务中心”展示,直接会在当前页面下载。
Value:弹性资源池 数据湖探索的监控指标说明 数据接入服务 SYS.DAYU Key:stream_id Value:实时数据接入 数据接入服务的监控指标说明 表格存储服务 SYS.CloudTable Key:cluster_id Value:CloudTable集群ID
在“自定义监控”页面,可以查看当前用户通过API请求上报至云监控服务的相关数据,包括自定义上报的服务,指标等。 当用户通过API添加监控数据后,云监控服务界面才会显示自定义监控数据。添加监控数据请参见添加监控数据。
主机监控 针对众包平台中使用的ECS和BMS,ECS作为业务的计算资源,数据库部署在BMS上。因此,BMS的磁盘速度会影响数据库操作速度,ECS的内存和CPU占用大小等会影响业务执行速度,为了监控更细颗粒度的监控指标,可以在弹性云服务器中安装配置Agent。
单击“导出监控数据”,可导出云服务监控数据,具体操作请参见如何导出监控数据。 单击实例所在行的“查看监控指标”,可查看资源实例和Http状态码详情。 单击实例所在行的“更多 > 创建告警规则”,可创建针对该实例的告警规则,具体参数说明可参考创建告警规则和通知。
项目 项目用于将OpenStack的资源(计算资源、存储资源和网络资源)进行分组和隔离。项目可以是一个部门或者一个项目组。一个账户中可以创建多个项目。
在华为云部署的众包平台的经典架构图如图1所示,核心数据库采用BMS集群方式部署数据库集群,Web-Server与API-Server部署在ECS上,Web-Server主要提供网站的搜索、类目、店铺、交易等业务,API-Server为连接各业务与数据库的各个基础接口。
操作步骤 使用root账号,登录Agent不上报数据的ECS或BMS。 可选:执行以下命令,切换至Agent安装路径的bin下。
GB 2.4.1 1分钟 disk_total (Agent)磁盘存储总量 该指标用于统计测量对象磁盘存储总量。 采集方式(Linux):执行df -h命令,查看Size列数据。 挂载点前缀路径长度不能超过64个字符,必须以字母开头,只能包含0-9/a-z/A-Z/-/./~。
可用区(AZ,Availability Zone) 一个可用区是一个或多个物理数据中心的集合,有独立的风火水电,AZ内逻辑上再将计算、网络、存储等资源划分成多个集群。一个Region中的多个AZ间通过高速光纤相连,以满足用户跨AZ构建高可用性系统的需求。
影响数据读写业务或主机无法启动 云存储连接异常 storageError 重要 裸金属服务器云硬盘连接异常。包括: SDI卡故障 远端存储故障 业务应用做成高可用。 主机恢复后,确认业务是否自动恢复。
影响数据读写业务或主机无法启动 云存储连接异常 storageError 重要 裸金属服务器云硬盘连接异常。包括: SDI卡故障 远端存储故障 业务应用做成高可用。 主机恢复后,确认业务是否自动恢复。
问题分析 CBR服务每15分钟上报一条指标数据,切换cloudsense告警引擎的region,此类指标无法在连续的两个5分钟时间窗内达到阈值, 因此无法触发告警。 父主题: 告警
云监控服务的Agent插件会使用HTTP请求上报数据,使用过程中会随机占用动态端口,范围取自/proc/sys/net/ipv4/ip_local_port_range。
Agent各种状态说明及异常状态处理方法 插件有以下四种状态: 运行中:插件正常运行,监控数据上报正常。 未安装: Agent未安装,安装方法参考《云监控服务用户指南》中的“Agent安装说明”章节。 Agent已经安装,委托未配置,委托配置方法参考如何配置委托?。
资源分组简介 资源分组支持用户从业务角度集中管理其业务涉及到的弹性云服务器、云硬盘、弹性IP、带宽、数据库等资源。从而按业务来管理不同类型的资源、告警规则、告警记录,可以迅速提升运维效率。
运行中:Agent运行正常,可正常上报监控数据。 故障:监控插件每1分钟发送1次心跳;当服务端3分钟收不到插件心跳时,“插件状态”显示为“故障”。