检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
图5 查看环境 在“环境概览”区域的应用树中,单击某个资源或云服务,右侧列表中展示对应资源或云服务信息。单击某个实例名称,可查看对应实例的指标、告警、日志等信息。 在“概览”页签,展示环境指标以及应用层和基础设施类信息。 在“性能”页签,查看该环境的性能信息。
创建事件类告警规则 通过事件类告警规则可对服务设置事件条件,当服务发生了某种变化,资源数据满足事件条件时产生事件类告警。 注意事项 当服务的资源数据满足事件条件时,如需使用邮件或短信等方式发送通知,请参考“创建告警行动规则”设置告警行动规则。
应用监控 工作负载监控 集群监控 主机监控 指标浏览 告警管理 AOM支持通过告警规则对应用、资源及业务设置告警条件,当AOM自身或外部服务存在异常或可能存在异常时,将告警信息通过邮件、短信、企业微信等方式发送给指定人员,帮助用户及时发现故障。 告警管理使用说明 父主题: 安全
管理日志接入LTS规则 AOM支持本章为您介绍如何管理日志接入LTS规则,支持添加、查看、删除日志接入LTS的规则。 前提条件 已创建需要映射的日志组和日志流。创建方法请参见:创建日志组和日志流,也可以在添加接入规则页面直接创建。 已有集群、命名空间和工作负载,详情请参见:CCE用户指南
virtualServiceName Istio虚拟服务名。 gpuID GPU ID。 npuName NPU名称。 npuID NPU ID。 进程指标 appName 服务名称。 clusterId 集群ID。 clusterName 集群名称。
云服务监控 AOM作为华为云服务可观测性分析统一入口,自身并不具有云监控服务功能,AOM 2.0控制台中“云服务监控”下的“弹性云服务器”、“裸金属服务器”、“云服务监控”、“资源分组”功能由云监控服务CES提供。
基础指标:Modelarts指标 介绍Modelarts通过Agent上报到AOM的指标。 表1 Modelarts通过Agent上报到AOM的指标 指标类别 指标 指标名称 指标含义 取值范围 单位 CPU ma_container_cpu_util CPU使用率 该指标用于统计测量对象的
表6 AlarmRuleTemplateSpecWithCloudService 参数 参数类型 描述 related_cloud_service String 关联的云服务。 related_cce_clusters Array of strings 关联的CCE集群。
您若仍有子用户云服务资源控制诉求,则您可自行进行自定义的子用户权限配置,从而达成子用户云服务资源展示控制效果。
创建AOM事件告警规则 通过事件告警规则可对服务设置事件条件,当服务发生了某种变化,资源数据满足事件条件时产生事件类告警。
***/apm_agent_install2.sh -o apm_agent_install.sh && bash apm_agent_install.sh -ak * -sk * -masteraddress https://**** -obsaddress https://javaagent
采集器部署 在弹性云服务器 ECS上手动部署ICAgent过程中,安装命令中会使用到您的AK/SK作为输入参数,安装前请您关闭系统的历史记录收集,以免泄露隐私。安装后ICAgent会加密存储您的AK/SK,有效保护敏感信息。
采集器部署 在弹性云服务器 ECS上手动部署ICAgent过程中,安装命令中会使用到您的AK/SK作为输入参数,安装前请您关闭系统的历史记录收集,以免泄露隐私。安装后ICAgent会加密存储您的AKSK,有效保护敏感信息。
服务指标及其维度 服务指标是由实例指标汇聚而来的,其指标维度与实例指标维度相同。 实例指标详见:实例指标及其维度。 父主题: 指标总览
告警源:触发告警或事件的服务名称。可以设置为AOM 、LTS、CCE等服务名称。例如设置为:告警源+等于+AOM。 标签:告警标识属性,由标签名和标签值构成,支持用户自定义。例如设置为:标签+aom_monitor_level+等于+infrastructure。
网络指标及其维度 表1 网络指标 指标名称 指标含义 取值范围 单位 下行Bps(aom_node_network_receive_bytes) 该指标用于统计测试对象的入方向网络流速。 ≥0 字节/秒(Byte/s) 下行Pps(aom_node_network_receive_packets
您若仍有子用户云服务资源控制诉求,则您可自行进行自定义的子用户权限配置,从而达成子用户云服务资源展示控制效果。
RDS,OBS,DMS,ELB,NAT,VPC,GaussDB DWS,LakeFormation,WAF,DRS,DDS,DC,CSS,EVS,CBR,APIG)以及ICAgent采集的CCE和ECS指标。
配置多账号聚合实现指标统一监控 多账号聚合Prometheus实例类型,提供对同一组织下多个成员账号的云服务指标监控。 前提条件 已在组织控制台界面启用AOM 可信服务,具体操作请参见启用、禁用可信服务。 同一组织下多个成员账号均已接入云服务指标。
假设您有1台服务器,每天自定义上报800百万条指标,则按照计费公式,分3个区间计费,费用计算如下: 0~150(百万条):0.7*150 150~600(百万条):0.5*450 600~1200(百万条):0.35*200 每天费用总计为:0.7*150+0.5*450+0.35