检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
平台 ModelArts、湖仓构建 LakeFormation、表格存储服务 CloudTable、MapReduce服务 MRS、数据仓库服务 GaussDB DWS、数据湖探索 DLI、云搜索服务 CSS、设备接入 IoTDA、智能边缘平台 IEF、Web应用防火墙 WAF、云堡垒机
AOM 2.0相关接口当前在华为云政务平台-乌兰察布、华北-乌兰察布-汽车一、中东-利雅得、华北-北京一、华北-北京四、华北-北京二、华北-乌兰察布一、华东-上海一、华东-上海二、华南-广州、西南-贵阳一、华南-广州-友好用户环境、中国-香港、亚太-曼谷、亚太-新加坡、亚太-雅加达
云日志服务LTS是华为云统一日志管理平台,提供日志搜索、结构化和可视化等功能。通过添加接入规则,可以将AOM中的CCE、CCI或自定义集群的日志映射至LTS,通过LTS查看和分析日志。映射不会产生额外的费用(除重复映射外)。
日志接入LTS概述 云日志服务LTS是华为云统一日志管理平台,提供日志搜索、结构化和可视化等功能。通过添加接入规则,可以将AOM中的CCE、CCI或自定义集群的日志映射至LTS,通过LTS查看和分析日志。映射不会产生额外的费用(除重复映射外)。
实践场景 某电商平台运维人员在监控指标时,想要通过标签维度管理云上各种资源并分发告警。 解决方案 AOM通过Prometheus监控功能,创建云服务类型Prometheus实例,并接入云服务与标签,支持在“指标浏览”界面查看已接入的云服务指标和标签并为这些指标设置告警规则。
使用流程 应用运维管理(Application Operations Management,以下简称AOM)是云上应用的一站式立体化运维管理平台,实时监控您的应用及相关云资源,分析应用健康状态,提供灵活的告警及丰富的数据可视化功能,帮助您及时发现故障,全面掌握应用、资源及业务的实时运行状况
应用场景 某电商平台运维人员在监控指标时,只能实时监控一个账号下的指标数据,无法同时监控其他账号。
认证证书 合规证书 华为云服务及平台通过了多项国内外权威机构(ISO/SOC/PCI等)的安全合规认证,用户可自行申请下载合规资质证书。 图1 合规证书下载 资源中心 华为云还提供以下资源来帮助用户满足合规性要求,具体请查看资源中心。
什么是应用运维管理 应用运维管理(Application Operations Management,简称AOM)是云上应用的一站式立体化运维管理平台,融合云监控、云日志、应用性能、真实用户体验、后台链接数据等多维度可观测性数据源,提供应用资源统一管理、一站式可观测性分析和自动化运维方案
巡检与问题定界 日常运维中,遇到异常难定位、日志难获取等问题,需要一个监控平台对资源、日志、应用性能进行全方位的监控。
≥0 千字节/秒(kB/s) 文件系统可用(aom_container_filesystem_available_capacity_megabytes) 该指标用于统计测量对象文件系统的可用大小。
认证证书 合规证书 华为云服务及平台通过了多项国内外权威机构(ISO/SOC/PCI等)的安全合规认证,用户可自行申请下载合规资质证书。 图1 合规证书下载 资源中心 华为云还提供以下资源来帮助用户满足合规性要求,具体请查看资源中心。
容器是否terminated kube_pod_container_status_terminated_reason terminated容器的reason kube_pod_container_status_waiting 容器是否waiting kube_pod_container_status_waiting_reason
≥0 无 ai_cpu_rate ai_cpu_rate AI cpu占用率 昇腾AI加速卡的AI CPU使用率,由用户调用edgecore接口上报。
可观测大屏监控 运维可观测大屏是基于华为云Astro低代码平台开发的面向不同场景、角色的运维监控大屏,基于现网质量、服务韧性、评估优化等N大主题域,通过运维数据建模、可视化等数据分析能力,提供企业级运维沙盘。
命令失败数 统计当前实例/资源空间下命令失败数 ≥0 次 流控数据 iotda_flowcontrol_north_failedCount API调用流控失败数 统计当前实例下调用API流控失败次数 ≥0 次 iotda_flowcontrol_south_failedCount
0~100 百分比(%) ma_container_cpu_used_core CPU内核占用量 该指标用于统计测量对象已经使用的CPU核个数 ≥0 核(Core) ma_container_cpu_limit_core CPU内核总量 该指标用于统计测量对象申请的CPU核总量。
平台 ModelArts、湖仓构建 LakeFormation、表格存储服务 CloudTable、MapReduce服务 MRS、数据仓库服务 GaussDB DWS、数据湖探索 DLI、云搜索服务 CSS、设备接入 IoTDA、智能边缘平台 IEF、Web应用防火墙 WAF、云堡垒机
Site domain name suffix :站点域名后缀,例如“myhuaweicloud.com”。 project_id :项目的ID。 父主题: Prometheus监控
图7 全采样设置 智能采样:采用智能算法采样,采样策略请参考智能采样算法.。 全局采样:针对所有调用链设置全局采样率。默认值(%):100。取值范围(%):0~100。 自定义采样:参考下表按照用户的需求,自定义采样率。