检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
暂不支持CCE纳管后的GPU加速型实例。 前提条件 已安装GPU驱动,未安装lspci工具的云服务器影响GPU掉卡事件的上报。 如果您的弹性云服务器未安装GPU驱动,请参见GPU驱动概述安装GPU驱动。 安装GPU驱动需使用默认路径。 GPU驱动安装完后,需重启GPU加速型实例,否则可能导致采集GPU指标及上报GPU事件失败。
式的Agent授权方法。在安装主机监控Agent前,仅需要一键式单击该区域的授权按钮或者在创建弹性云服务器页面勾选云监控Agent委托,则系统会自动对该区域下所有云服务器或裸金属服务器安装的Agent做临时AK/SK授权,并且以后在该区域新创建的资源都会自动获得此授权。本节针对本授权做以下说明:
式的Agent授权方法。在安装主机监控Agent前,仅需要一键式单击该区域的授权按钮或者在创建弹性云服务器页面勾选云监控Agent委托,则系统会自动对该区域下所有云服务器或裸金属服务器安装的Agent做临时AK/SK授权,并且以后在该区域新创建的资源都会自动获得此授权。本节针对本授权做以下说明:
主机监控 在视频直播中,弹性云服务器作为核心基础,细微的性能变化,可能会引起云服务上的业务受到大幅震荡。为了监控更细颗粒度的监控指标,可以在弹性云服务器中安装配置Agent。 本章节介绍如何对弹性云服务器的CPU使用率、内存使用率、磁盘使用率设置告警规则。并在弹性伸缩中配置弹性伸
修复TCP连接数过多时cpu冲高bug,默认ss-s轻量采集TCP指标。 修复系统进程数指标和文件句柄总数指标值不刷新bug。 优化网卡指标采集逻辑,完善网卡名称维度值规则规则校验 2.7.2.1版本 基于2.7.2版本: 增加GPU指标。 增加NPU指标。 增加物理机硬件监控能力。详情说明参考BMS硬件监控插件说明。
电商业务内存要求高、数据量大并且数据访问量大、要求快速的数据交换和处理,监控要求极其高。 ECS为核心服务,全面、立体的ECS监控系统对业务稳定起到了至关重要的作用。主机监控功能可提供服务器的系统级、主动式、细颗粒度监控服务。为业务的顺畅运行保驾护航。 网站为电商平台的入口,双1
命名空间 维度 监控指标参考文档 计算 弹性云服务器 SYS.ECS Key:instance_id Value:云服务器ID 弹性云服务器的基础监控指标 弹性云服务器中操作系统监控 AGT.ECS Key:instance_id Value:云服务器ID Key:disk Value:磁盘
据。 问题分析 弹性云服务器或裸金属服务器安装Agent后仍然无操作系统监控数据时,一般考虑有如下几个原因: Agent进程运行状态异常 委托异常 路由配置异常导致的获取临时AK/SK失败 网络问题 首先需要确认使用的Agent版本。 使用root账号,登录ECS。 执行如下命令,确认使用老版本Agent。
有多个服务器以及个人习惯选择任何一种或多种安装方式: 安装场景 支持的服务 参考章节 控制台界面安装/升级Agent ECS 在控制台界面安装/升级Agent 安装Agent(Linux) ECS、BMS 单台主机下安装Agent 安装Agent(Windows) ECS 安装Agent(Windows)
当前支持的监控类型:HTTP、HTTPS、PING、TCP、UDP。 应用场景 广域网质量监控主要用于发送模拟真实用户对远端服务器的访问,从而探测远端服务器的可用性、连通性等问题。 服务可用性监控 通过使用广域网功能配置定时HTTP(S)拨测任务,选择分布在全球的探测点对域名进行
返回“0”,表示未安装Agent。 问题分析 弹性云服务器或裸金属服务器安装Agent后仍然无操作系统监控数据时,一般考虑有如下几个原因: Agent进程运行状态异常 委托异常 网络问题 问题解决(Linux) 以root用户登录弹性云服务器或裸金属服务器。 执行如下命令,检查telescope进程是否存在:
目前大部分区域已上线一键式授予该区域插件权限功能,即自动修复插件配置。您可以单击“主机监控 - 弹性云服务器”页面上方的“一键配置”开启该区域插件权限。配置完成后此区域所有服务器均默认修复插件配置,后续不再显示“一键配置”按钮。若提示租户权限不足,请参考主机监控界面单击一键配置
站点监控简介 应用场景 站点监控用于模拟真实用户对远端服务器的访问,从而探测远端服务器的可用性、连通性等问题。 首期支持华北(廊坊)、华东(上海)、华南(广州)、西南(贵阳)、华南(深圳)五个探测点实时监控网站,后续探测点和能力不再演进,如有诉求请使用广域网质量监控,具体操作请参见广域网质量监控(公测)。
测试组下的两台弹性云服务器不需要获取其运行状态。 表1 云服务器列表和分组规划 云服务器名称 分组 是否需要安装Agent 所属部门 ECS-01 开发组资源 是 开发项目组 ECS-02 开发组资源 是 开发项目组 ECS-03 无需分组 否 测试项目组 ECS-04 无需分组
使用站点监控 应用场景 站点监控用于模拟真实用户对远端服务器的访问,从而探测远端服务器的可用性、连通性等问题。 站点监控可以探测域名、IP的可用性、访问响应时间、丢包率,并对监控结果告警。 创建站点监控 登录管理控制台。 单击“服务列表 > 云监控服务”。 单击页面左侧的“站点监控”,进入“站点监控”页面。
Agent进程故障,请参照管理Agent重启,如果无法重启则说明相关文件被误删,请重新安装Agent。 配置异常: ECS/BMS主机没有配置委托。 当前委托权限异常。 当前委托已失效。 默认网卡安全组规则配置错误或DNS配置错误。 已停止:Agent被手动停止,可参考管理Agent章节启动Agent。
送,可能产生少量费用,具体费用请参考产品价格说明。 弹性云服务器和裸金属服务器支持通过名称、ID和私有IP地址搜索,其他类型支持通过名称或ID搜索。 关联企业项目仅支持部分区域。 资源分组关联企业项目功能目前仅支持弹性云服务器、弹性IP、带宽、关系型数据库。关联企业项目后,资源分
监控视图关联的企业项目,只有有企业项目的权限,才有权查看此监控视图的监控数据。 资源类型 所关注指标对应的服务名称。 取值样例:弹性云服务器 维度 所关注指标的维度名称。 取值样例:云服务器 监控对象 所关注指标对应的监控对象,数量上限为50个。 可支持一次勾选多个监控对象。 监控指标 所关注指标的名称。
云监控服务支持哪些服务的企业项目维度的分权分域监控? 目前,云监控服务支持的企业项目维度的分权分域资源有:弹性云服务器、弹性伸缩、云硬盘、弹性IP、弹性负载均衡、云数据库、分布式缓存服务、文档数据库服务和分布式消息服务。 父主题: 云服务监控
collect_time 是 Long 数据收集时间 UNIX时间戳,单位毫秒。 说明: 因为客户端到服务器端有延时,因此插入数据的时间戳应该在[当前时间-3天+20秒,当前时间+10分钟-20秒]区间内,保证到达服务器时不会因为传输时延造成数据不能插入数据库。 value 是 Double 待添加的监控指标数据的值。