检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
开通智能洞察 AOM智能洞察引擎持续监控您的应用和资源,通过历史数据和问题特征发现问题,并针对每个问题会给出相应的根因分析和建议。 功能介绍 事件巡检:提供基于应用性能管理APM平台的应用监控服务,通过应用服务和流量Top N接口的平均RT、错误率等关键指标看护服务质量,自动检测指标异常。
智能洞察(BETA) 开通智能洞察 通过AOM查看事件巡检数据 通过AOM查看事件根因分析结果 通过AOM查看故障传播链
API概览 应用运维管理服务API为开发者、合作伙伴提供告警、监控、prometheus监控、日志、Prometheus实例、配置管理、应用资源管理、自动化运维的开放接口,帮助您快速、低成本地实现应用运维。AOM 2.0相关接口当前在华为云政务平台-乌兰察布、华北-乌兰察布-汽车
搜索应用时,系统提示“AOM.11007006: get policy list failed.” 问题描述 在应用资源管理的“首页”界面进行资源检索时,系统提示“AOM.11007006: get policy list failed.” 可能原因 当前用户账号已欠费或者被冻结,导致没有应用资源管理的操作权限。
是否必选 参数类型 描述 install_version 否 String 指定安装的ICAgent版本。 domain_ak 否 String IAM账号AK,选填。 domain_sk 否 String IAM账号SK,选填。 响应参数 状态码: 200 表6 响应Body参数 参数
管理工具市场 工具市场会按照查看场景分类展现各功能的工具卡片,目前支持以下类型: 通用场景:管理脚本、管理文件。 云服务场景:启动ECS实例、关闭ECS实例、重启RDS实例、修改ECS非管理员密码、重启CCE工作负载。 软件部署:暂时为空。 日常巡检:暂时为空。 故障处理:清理磁盘空间。
trace | grep httpsend | grep MONITOR 若回显信息中包含“failed”字样,则说明ICAgent无法成功上报指标 => 执行3。 若回显信息中无“failed”字样,则说明ICAgent可成功上报指标 => 执行 4。 查询端口连通性。 执行以下命令,获取ACCESS的IP地址。
Debugging诊断概述 Debugging诊断可协助用户分析线程状况,获取方法及对象实时参数。方便开发人员从实时的远程应用程序中获取调试信息,而无需重新启动应用程序,也不会阻止它并导致服务停机。 约束与限制 为了应用运行稳定,强烈建议您按照要求升级JDK版本,在低版本的JDK
跟踪编号。主要用于开发人员快速搜索日志,定位问题。当返回的状态码为2xx时,trace_id为空;当返回4xx的状态码时,trace_id不为空。 请求示例 修改名称为“testaom”、告警等级为“3”、指标名称为“cpuCoreLimit”且所属命名空间为“PAAS.CONTAINER”的阈值规则
String 跟踪编号。主要用于开发人员快速搜索日志,定位问题。当返回的状态码为2xx时,trace_id为空;当返回4xx的状态码时,trace_id不为空。 请求示例 添加一条名称为“testaom”、告警等级为“3”、所属命名空间为“PAAS.CONTAINER”且以“average”形式计算的阈值规则。
s:字段增加以下字段来实现指定要采集的容器名称。 kubernetes.AOM.log.stdout: '["container_name0", "container_name1"]' 规则如下: 如果没有kubernetes.AOM.log.stdout:字段,默认采集该pod
“可观测大屏”功能当前仅华南-广州区域受限白名单开放,如有需求可以通过提交工单,为您开放此功能。 操作流程 使用AstroCanvas自定义开发业务指标监控大屏的流程,如图1所示。 图1 开发业务指标监控大屏流程 步骤一:申请AstroCanvas免费试用并开通模板 注册华为账号,开通华为云,并申请免费试
UniAgent和ICAgent安装类常见问题 UniAgent安装机和目标机器网络不通,报错提示“[warn] ssh connect failed, 1.2.1.2:22”如何解决? 答:安装之前先在安装页面单击连接测试,选择网络能通的安装机。 UniAgent安装成功后,后续
可观测大屏监控 运维可观测大屏是基于华为云Astro低代码平台开发的面向不同场景、角色的运维监控大屏,基于现网质量、服务韧性、评估优化等N大主题域,通过运维数据建模、可视化等数据分析能力,提供企业级运维沙盘。满足您全场景、自动化、可量化、可观测的一体化监控解决方案,为业务健康和稳定保驾护航。
什么是应用运维管理 运维遇到挑战 随着容器技术的普及,越来越多的企业通过微服务框架开发应用,业务实现更多使用云上服务,运维也转向云上的运维服务。对于云上应用的运维也提出了新的挑战。 图1 运维现有问题 运维人员技能要求高,配置繁杂,同时需要维护多套系统。对于分布式追踪系统,学习和使用成本高,并且稳定性差。
public static void main(String[] args) { // The AK and SK used for authentication are hard-coded or stored in plaintext, which has great
配置预聚合规则提升指标查询效率 预聚合(Recording Rule)可以对落地的指标数据做二次开发。您可以配置预聚合规则将计算过程提前写入端,减少查询端资源占用。 应用场景 某些指标查询可能需要在查询端进行大量的计算,查询端压力过大,影响查询性能。通过配置预聚合规则对一些常用的
public static void main(String[] args) { // The AK and SK used for authentication are hard-coded or stored in plaintext, which has great
MySQL Exporter接入AOM实现指标监控 应用场景 MySQL Exporter专门为采集MySQL数据库监控指标而设计开发,通过Exporter上报核心的数据库指标,用于异常报警和监控大盘展示。目前,Exporter支持5.6版本或以上版本的MySQL。在MySQL低于5
接入Prometheus后,为什么会产生额外费用? CCE容器场景 通常情况下,用户购买CCE集群,部署工作负载之后,默认会采集cluster、Pod、Container、Node等基础指标-容器指标,基础指标的上报不产生费用。 产生计费的可能原因是: Prometheus实例内置的指标管理功能采集到自定义指标并上报指标到AOM。