检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
安装GPU指标集成插件 操作场景 通过在GPU加速型Linux实例上安装GPU监控插件,可以为用户提供系统级、主动式、细颗粒度的GPU监控,包含GPU指标收集和GPU系统事件上报。GPU支持监控的指标,参见GPU指标。 本章节介绍如何通过CES监控Agent安装脚本为GPU加速型实例安装新版GPU监控插件:
简介 电商业务内存要求高、数据量大并且数据访问量大、要求快速的数据交换和处理,监控要求极其高。 ECS为核心服务,全面、立体的ECS监控系统对业务稳定起到了至关重要的作用。主机监控功能可提供服务器的系统级、主动式、细颗粒度监控服务。为业务的顺畅运行保驾护航。 网站为电商平台的入口
ECS是电商平台的基础支撑,因此ECS上细微的性能变化,都可能会引起电商业务的大幅震荡,甚至出现宕机,引起巨大损失。 主机监控提供了包括基础监控和操作系统监控两种不同监控粒度层次的监控。基础监控为ECS自动上报的监控指标,操作系统监控通过在ECS中安装Agent插件,为用户提供服务器的系统级、主动式、细颗粒度监控服务。
用户单行数据量过大,可能会导致查询超时,进而节点OOM异常退出等各种故障发生。 1. 对每列和每行的写入长度做限制,遵从规范,使得单行的的key和value长度和不超过阈值。 2. 排查业务是否出现异常写入和异常编码,导致写入大row。 过大的单行记录,随着数据量增长,集群稳定性会下降。 用户计划删除KMS密钥
用户单行数据量过大,可能会导致查询超时,进而节点OOM异常退出等各种故障发生。 1. 对每列和每行的写入长度做限制,遵从规范,使得单行的的key和value长度和不超过阈值。 2. 排查业务是否出现异常写入和异常编码,导致写入大row。 过大的单行记录,随着数据量增长,集群稳定性会下降。 用户计划删除KMS密钥
> 屏蔽告警”,在弹出的“创建告警屏蔽”界面,选择“屏蔽时间”后,单击“确定”,即可完成对告警规则的屏蔽。 屏蔽告警规则与停用告警规则的区别: 停用告警规则后,将不再计算指标是否达到阈值,不再触发告警。 屏蔽告警规则生效后,仅产生告警记录将不会接收到告警通知。 修改告警屏蔽 在
解决方法 参考查询监控数据接口文档:查询监控数据。 问题二 问题描述 调用不同region区域的接口,对应的域名是什么。 解决方法 参考文档:地区和终端节点。 常见4XX问题处理 HTTP状态码 429 错误码 ces.0429 可能原因 原因1:API被流控。详见下方【案例一】 解决方法
当云监控服务的Agent进程出现以下现象时,可能是因为Agent负载过高,状态不稳定导致: 管理控制台主机监控页面的“插件状态”参数在“运行中”和“故障”两个状态切换。 监控指标面板中存在断点。 约束与限制 当前章节的修复方式只支持新版本Agent,若Agent版本为老版本,建议先升级到新版本。
围。 解决方法 支持的最大查询时间:155天。 问题三 问题描述 调用不同region区域的接口,对应的域名是什么。 解决方法 请参考地区和终端节点。 接口调用过程中常见问题 问题一 问题描述 调用批量查询监控数据接口,响应状态码200,无指标数据返回。响应体样例如下: { "metrics":
云专线插件是用于检测云专线端到端的网络质量的插件,主要包含网络时延和丢包率两个指标。 云专线插件分为两种: dc-nqa-collector:用于监控自动化专线,探测远端子网的时延和丢包率。 history-dc-nqa-collector:用于监控手工专线,探测远端子网的时延和丢包率。 自动化专线,云专线资源包
-上海一、拉美-圣保罗一、中东-利雅得和华东-青岛区域开放。 前提条件 当前账号所在的组织需开通可信服务功能。详细请参见启用、禁用可信服务。 使用跨账号功能需要拥有组织的管理员或CES服务的委托管理员身份。如何创建委托管理员请参见添加、查看和取消委托管理员。 操作步骤 以组织的管
监控服务。 表1 常用最佳实践 实践 描述 电商平台 电商平台最佳实践 电商业务对内存要求高、数据量大并且数据访问量大、要求快速的数据交换和处理,监控要求极其高。 主机监控功能可提供服务器的系统级、主动式、细颗粒度监控服务。 站点监控功能可对网站或ECS的弹性IP等进行持续拨测,监控业务入口的可用性及响应时间。
维需求。 细颗粒度监控 安装Agent插件后,Agent相关监控指标为 1分钟上报 1 次。 进程监控 采集当前活跃进程占用的CPU、内存和打开文件数,让您了解弹性云服务器或裸金属服务器的资源使用情况。 使用主机监控 登录管理控制台。 单击“服务列表 > 云监控服务”。 单击页面
时存在Allow和Deny,则遵循Deny优先原则。 如果您给用户授予CES FullAccess的系统策略,但不希望用户拥有CES FullAccess中定义的删除告警规则权限,您可以创建一条拒绝删除告警规则的自定义策略,然后同时将CES FullAccess和拒绝策略授予用户
用率连续5分钟内连续5次达到90%时,系统自动增加一个实例以保证业务平稳运行。 创建告警规则 登录管理控制台。 在管理控制台左上角选择区域和项目。 单击“服务列表 > 云监控服务”。 单击页面左侧的“主机监控”,进入主机监控页面。 单击弹性云服务器所在栏右侧的“更多”按钮,选择“创建告警规则”。
Prometheus是用于展示大型测量数据的开源可视化工具,在工业监控、气象监控、家居自动化和过程管理等领域也有着较广泛的用户基础。将华为云Cloud Eye服务接入Prometheus后,您可以利用Prometheus更好地监控和分析来自Cloud Eye服务的数据。将服务接入Prometheus前,需要先安装配置CES
弹性公网IP事件 虚拟私有云为弹性云服务器构建隔离的、用户自主配置和管理的虚拟网络环境,提升用户云中资源的安全性,简化用户的网络部署。 当您的弹性云服务器要访问Internet时,您可使用虚拟私有云创建的弹性公网IP绑定到弹性云服务器上,弹性云服务器即可连接公网。不同弹性公网IP还可以共享带宽,减少您的带宽成本。
日志监控提供了针对日志内容的实时监控能力。通过云监控服务和云日志服务的结合,用户可以针对日志内容进行监控统计、设置告警规则等操作,降低用户监控日志的运维成本,简化用户使用监控日志的流程。 事件监控: 事件监控提供了事件类型数据上报、查询和告警的功能。方便您将业务中的各类重要事件或对云资源
在“配置数据存储”或“批量配置数据存储”页面,按照表1配置参数: 表1 配置数据存储参数 参数 说明 样例 OBS转储 是否配置OBS转储,可选择“转储”和“不转储”。 转储 新创建OBS桶 若已有OBS桶,可不用创建。 是 转储OBS桶 若没有OBS桶,输入需要创建的OBS桶名。 已有OBS桶时,选择已有的桶。
content must be specified." } 术语解释 术语 解释 Cloud Eye 云监控 内置指标 各个服务有自己内置支持的指标和维度,比如弹性云服务器(SYS.ECS)支持的指标有cpu_util等。 Metric Metric由3部分组成:Namespace,Dimensions(optional)