检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
云监控服务统计的弹性云服务器网络流量与云主机系统内工具检测不一致的问题 因为云监控服务与弹性云服务器系统内指标检测软件的采样周期不同。 云监控服务对弹性云服务器、云硬盘的采样周期是4分钟(云服务器类型为KVM的是5分钟),而系统内工具的采样周期一般为1秒,远远小于云监控服务的采样周期。
弹性云服务器事件 弹性云服务器是作为一种可随时获取、弹性可扩展的计算服务器。在各业务中,弹性云服务器作核心基础,细微的性能变化,运行异常及自动恢复,都可能会引起云服务上的业务受到大幅震荡。 因此需使用弹性负载均衡将访问流量根据转发策略分发到后端多台弹性云服务器,通过流量分发扩展应
此时页面上显示了当前云平台上的弹性云服务器列表。 单击ECS主机所在栏右侧的“更多 > 创建告警规则”。 弹出创建告警规则的窗口。 输入告警规则名称和描述。 按照如下所示配置参数。 触发规则:选择自定义创建。 指标名称:在下拉框中选择“CPU使用率”。 告警策略:平均值、监控周期5分
每秒流入弹性云服务器的网络流量。 在弹性云服务器中下载外部网络资源或从外部网络、服务器、客户端上传文件到弹性云服务器,都是网络流入。 单位:Byte/s 网络流出速率 每秒流出弹性云服务器的网络流量。 弹性云服务器对外提供访问或弹性云服务器作为FTP服务器供外部网络下载ECS上的资源时,都是网络流出。
为什么云服务器看不到内存使用率、磁盘使用率、带内网络流入速率和带内网络流出速率四个监控指标? 当前创建的Linux云服务器,均不支持内存使用率、磁盘使用率、带内网络流入速率和带内网络流出速率四个监控指标。但Windows云服务器是支持这四个指标的。 不同操作系统支持的基础监控指标
出现”复制状态异常“事件通常有两种情况: 1、主机与备机或只读实例之间复制时延太大(一般在写入大量数据或执行大事务的时候出现),在业务高峰期容易出现阻塞。 2、主机与备机或只读实例之间的网络中断,导致主机与备机或只读实例复制异常。 提交工单。 不会导致原来实例的读写中断,客户的应用是无感知的。 复制状态异常已恢复
如果选择了配置云服务器全部挂载点的告警规则,后续该云服务器的新增挂载点会自动适配该告警规则。 对于用户之前已配置的包含挂载点磁盘使用率的告警规则,在用户修改告警规则时,会提示将该条告警规则拆分成不同维度的多条规则。建议在拆分时,选择将拆分后的挂载点规则,替换为全部挂载点。 图1 配置挂载点告警规则优化前后示意图
成。 如果上述修复方案失效,请参考GPU驱动不可用中的处理方法进行故障恢复。 GPU功能异常 自动恢复:弹性云服务器所在的硬件出现故障时,系统会自动将弹性云服务器迁移至正常的物理机,该过程会导致云服务器重启。 表2 裸金属服务器 事件来源 命名空间 事件名称 事件ID 事件级别 事件说明
原始值:导出原始数据。 时间区间 选择导出数据的时间范围。 聚合值最多可导出前90天的数据 原始值导出的最大时间区间为最近48小时 聚合区间 当统计方式为“聚合值”时需配置此参数。 当选择“按时间区间”时,导出的数据为该时间段聚合后的值,当选择其他聚合区间时,导出的数据会分别按照周、天、小时聚合后导出。
资源分组支持用户从业务角度集中管理其业务涉及到的弹性云服务器、云硬盘、弹性IP、带宽、数据库等资源。从而按业务来管理不同类型的资源、告警规则、告警记录,可以迅速提升运维效率。 站点监控: 站点监控用于模拟真实用户对远端服务器的访问,从而探测远端服务器的可用性、连通性等问题。 日志监控: 日
支持监控的服务列表 分类 服务 命名空间 维度 监控指标参考文档 计算 弹性云服务器 SYS.ECS Key:instance_id Value:云服务器ID 弹性云服务器的基础监控指标 弹性云服务器中操作系统监控 AGT.ECS Key:instance_id Value:云服务器ID
主机监控 ECS是电商平台的基础支撑,因此ECS上细微的性能变化,都可能会引起电商业务的大幅震荡,甚至出现宕机,引起巨大损失。 主机监控提供了包括基础监控和操作系统监控两种不同监控粒度层次的监控。基础监控为ECS自动上报的监控指标,操作系统监控通过在ECS中安装Agent插件,为
可能会降低。 弹性云服务器支持的监控指标,请参见弹性云服务器支持的监控指标。 父主题: 主机监控
每小时探测的总次数 * 100%。 packet_loss_rate 丢包率 丢包率是数据包丢失部分与所传数据包总数的比值。 http_code HTTP响应码 HTTP响应码代表服务端反馈的响应状态,即标准的HTTP状态码。是用3位数字表示网页服务器超文本传输协议响应的状态。如:
据。 问题分析 弹性云服务器或裸金属服务器安装Agent后仍然无操作系统监控数据时,一般考虑有如下几个原因: Agent进程运行状态异常 委托异常 路由配置异常导致的获取临时AK/SK失败 网络问题 首先需要确认使用的Agent版本。 使用root账号,登录ECS。 执行如下命令,确认使用老版本Agent。
弹性公网IP事件 虚拟私有云为弹性云服务器构建隔离的、用户自主配置和管理的虚拟网络环境,提升用户云中资源的安全性,简化用户的网络部署。 当您的弹性云服务器要访问Internet时,您可使用虚拟私有云创建的弹性公网IP绑定到弹性云服务器上,弹性云服务器即可连接公网。不同弹性公网IP还可以共享带宽,减少您的带宽成本。
电商业务内存要求高、数据量大并且数据访问量大、要求快速的数据交换和处理,监控要求极其高。 ECS为核心服务,全面、立体的ECS监控系统对业务稳定起到了至关重要的作用。主机监控功能可提供服务器的系统级、主动式、细颗粒度监控服务。为业务的顺畅运行保驾护航。 网站为电商平台的入口,双12、618等大型购物节
云产品监控指标。 进程监控:针对主机内活跃进程进行的监控,默认采集活跃进程消耗的CPU、内存,以及打开的文件数量等信息。 目前支持Linux操作系统和Windows操作系统。支持的系统请参见Agent支持的系统有哪些?。 ECS规格建议Linux使用“2vCPUs | 4GiB”、Windows使用“4vCPUs
控服务,请参考支持监控的服务列表。 已对接云监控的服务,由于各个服务采集上报监控数据的频率各有不同,请耐心等待一段时间。 弹性云服务器或裸金属服务器关机超过1小时以上。 云硬盘没有挂载给弹性云服务器或裸金属服务器。 弹性负载均衡未绑定后端服务器或者后端服务器全部关机。 资源购买时间不足10分钟。
网络正常:排查结束。 网络无法访问:修改DNS配置或CES的终端节点。 各区域对应的云监控服务的Endpoint请参考“地区和终端节点”。 问题解决(Windows) 以administrator权限用户登录弹性云服务器或裸金属服务器。 进入任务管理器,查看telescope进程是否存在。