检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
本Region内:云服务器所在区域与当前AOM服务端在同一区域,默认云服务器与AOM服务端网络互通。 本Region内 服务器类型 云服务器类型有两种:ECS云服务器、其他服务器。此处选择ECS云服务器。 ECS云服务器:ECS云服务器管理下的主机。 ECS云服务器 选择安装模式 安装模式当前仅支持命令行安装。
使用Prometheus监控ECS主机的指标 弹性云服务器(Elastic Cloud Server,简称ECS)是由CPU、内存、操作系统、云硬盘组成的一种可随时获取、弹性可扩展的云服务器,ECS提供了丰富的网络和安全功能,如VPC、安全组、云防火墙等,帮助用户构建安全、可靠的云上环境。应用运维管理(Application
系统事件:指默认会接入AOM的事件,此时事件来源只能选择“CCE”、IoTDA和“ModelArts”服务。 自定义事件:指其他第三方服务接入AOM的事件,事件来源请从现有的服务列表中选择。 设置告警规则详情。 图1 设置告警规则详情 表2 告警规则填写说明 参数名称 填写说明 监控对象 服务事件的筛
AppNameRule objects 服务命名部分,数组中有多个对象时表示将每个对象抽取到的字符串拼接作为服务的名称。nameType取值cmdLine时args格式为["start","end"],表示抽取命令行中start、end之间的字符。nameType取值cmdLine
Unauthorized 在客户端提供认证信息后,返回该状态码,表明服务端指出客户端所提供的认证信息不正确或非法。 403 Forbidden 请求被拒绝访问。返回该状态码,表明请求能够到达服务端,且服务端能够理解用户请求,但是拒绝做更多的事情,因为该请求被设置为拒绝访问,建议直接修改该请求,不要重试该请求。
如何区分告警和事件? 告警和事件的相同点 在AOM中告警和事件都是指AOM自身,或AOS、ServiceStage、CCE等外部服务在某种状态发生变化后上报给AOM的信息。 告警和事件的区别 告警是AOM自身,或AOS、ServiceStage、CCE等外部服务在异常情况或在可能
通过ICAgent插件采集CCE集群指标。云容器引擎CCE在购买后集群和节点后默认已经安装ICAgent,自动将CCE集群指标上报到AOM,用户无需手动接入。 单击“云容器引擎 CCE (ICAgent)”卡片,可查看支持接入的CCE集群指标。上报到AOM的CCE集群指标,详细说明请参见基础指标-虚机指标。
如何区分告警和事件? 告警和事件的相同点 在AOM中告警和事件都是指AOM自身,或ServiceStage、CCE等外部服务在某种状态发生变化后上报给AOM的信息。 告警和事件的区别 告警是AOM自身,或ServiceStage、CCE等外部服务在异常情况或在可能导致异常情况下上
参数 是否必选 参数类型 描述 X-Auth-Token 是 String 从IAM服务获取的用户Token。获取方式请参见:获取Token。 Content-Type 是 String 消息体的类型(格式)。指定类型为“application/json”。 Enterprise-Project-Id
ICAgent会加密存储您的AK/SK,有效保护敏感信息。 容器监控 在CCE容器监控场景下,AOM的采集器(ICAgent)必须以特权容器的方式运行,请合理的评估特权容器的安全风险,谨慎识别您的容器业务场景。如:节点对外提供的业务属于逻辑多租的共享容器方式,建议采用开源Prom
分了解应用运维管理服务相关概念,详细信息请参见产品介绍。 终端节点 终端节点即调用API的请求地址,不同服务不同区域的终端节点不同,您可以从地区和终端节点中查询所有服务的终端节点。 基本概念 账号 用户注册华为云时的账号,账号对其所拥有的资源及云服务具有完全的访问权限,可以重置用
clusterId 是 String CCE集群ID。 hostIP 否 String 日志所在虚拟机IP。 nameSpace 否 String CCE容器集群的命名空间。 pathFile 否 String 日志文件名称。 podName 否 String 容器实例名称。 响应参数 状态码:
管理CCE集群的ICAgent插件 AOM支持对您已购买的CCE(云容器引擎)集群下的主机批量执行ICAgent插件安装、升级和卸载的操作,从而实现对CCE中ICAgent插件的统一管理。 前提条件 已购买CCE(云容器引擎)集群和节点,详细请参考购买Standard/Turbo集群和创建节点。
otal_bytes) 该指标用于统计测试对象出方向和入方向的网络流速之和。 ≥0 字节/秒(Byte/s) 表2 网络指标维度 维度 说明 clusterId 集群ID。 hostID 主机ID。 nameSpace 集群的命名空间。 netDevice 网卡名称。 nodeIP
管理CCE集群的ICAgent插件 AOM支持对您已购买的CCE(云容器引擎)集群下的主机批量执行ICAgent插件安装、升级和卸载的操作,从而实现对CCE中ICAgent插件的统一管理。 前提条件 已购买CCE(云容器引擎)集群和节点,详细请参考购买Standard/Turbo集群和创建节点。
true bearer_token: '{access_code}' 参数说明: region_name为指定承载REST服务端点的服务器域名或IP,不同服务不同区域的名称不同,您可以从地区和终端节点中获取。例如AOM服务在“华北-北京一”区域名称为“cn-north-1”。
指标数据按照所设置的统计方式进行聚合,包括:平均值、最小值、最大值、总计、样本个数。 样本个数表示指标数据点的计数。 统计周期 指标数据按照所设置的统计周期进行聚合。 统计周期与统计时段相关联,选择的时段不同,统计周期的显示也会相应变化。 统计时段 指标数据按照所设置的时间范围进行聚
} else { fmt.Println(err) } } 更多编程语言的SDK代码示例,请参见API Explorer的代码示例页签,可生成自动对应的SDK代码示例。 状态码 状态码 描述 200 OK 请求响应成功。 400 未找到Prometheus实例。
配置CCE集群监控采集指标规则 AOM支持通过新增ServiceMonitor或PodMonitor的方式为应用配置可观测监控 Prometheus 版的采集规则,来监控部署在CCE集群内的应用的业务数据。 前提条件 服务已接入CCE类型Prometheus 监控,并接入CCE集群,具体请参见Prometheus实例
该指标用于统计测量对象的NPU存储容量。仅支持CCE类型主机的NPU指标采集。 >0 兆字节(MB) aom_node_npu_memory_usage NPU存储使用率 该指标用于统计测量对象已使用的NPU存储占NPU存储容量的百分比。仅支持CCE类型主机的NPU指标采集。 0~100 百分比(%) aom_n