检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
管理Prometheus实例指标数据 AOM支持查看CCE类型、ECS类型、云服务类型、通用实例、APM类型与default类型Prometheus实例的指标,以及新增指标和废弃指标。 前提条件 服务已接入可观测Prometheus 监控。具体操作,请参见:管理Prometheus实例。
部署APM Agent时,必须确保接入APM的机器与APM服务网络连通,Agent才能正常工作。 可使用Telnet命令测试目标机器与APM服务器网络是否连通。例如,以检查华北-北京四区域,且接入方式选择“增强型探针”的连通性为例,请登录应用所部署的机器,并输入命令telnet 100
兼容旧版仪表盘的图表配置。 新增告警规则 添加图表时,新增告警规则 单击页面中的“添加图表”或单击页面右上角的。 选择指标后,在指标列表右上方单击,可为当前添加的所有指标新增告警规则。具体操作请参见创建指标告警规则。 修改图表时,新增告警规则 选择待操作的仪表盘,将光标移至某一图表框右上角,单击,选择“编辑”。
没有消息通知服务的访问权限? 以IAM用户登录AOM,当创建或修改阈值规则、通知规则、静态阈值模板时,“选择主题”参数下提示:“抱歉,您没有消息通知服务的访问权限”,如下图所示。 问题分析 原因:该问题是由于您是以IAM用户登录AOM,但IAM用户没有消息通知服务的访问权限导致的。
原因:AK/SK配置不正确或30200、30201端口未连通。 影响:ICAgent无法正常使用。 解决办法 以root用户登录安装ICAgent的服务器。 执行以下命令,检查AK/SK配置是否正确。 cat /var/ICAgent/oss.icAgent.trace | grep proxyworkflow
原因:AK/SK配置不正确或30200、30201端口未连通。 影响:ICAgent无法正常使用。 解决方法 以root用户登录安装ICAgent的服务器。 执行以下命令,检查AK/SK配置是否正确。 cat /var/ICAgent/oss.icAgent.trace | grep proxyworkflow
入门实践 当您完成了安装ICAgent、配置服务发现规则等基本操作后,可以根据自身的业务需求使用应用运维管理提供的一系列常用实践。 表1 常用最佳实践 实践 描述 阈值告警最佳实践(新版) 告警作为AOM应用运维管理中一项基础功能,在日常运维中发挥着重要作用。AOM告警可以对接华
通过内置发现规则发现的是系统应用,通过自定义规则发现的是自定义应用。应用列表展示了每个应用的名称、运行状态、部署方式等信息。AOM支持从应用下钻到组件,再从组件下钻到实例,从实例下钻到进程。通过各层状态,您可完成对应用的立体监控。在AOM的应用发现界面配置应用发现规则,可自动发现
Exporter,并创建采集任务。详情请参考:安装UniAgent。 创建ECS类型Prometheus实例,采集任务通过关联ECS Prometheus实例,对采集数据进行标记分类。详情请参考:创建ECS Prometheus实例。 配置中间件及自定义插件接入AOM。详情请参考
用率等信息。 原因分析 8149端口未连通。 用户侧节点时间与所在时区当前时间不一致。 解决方法 以root用户登录安装ICAgent的服务器。 执行以下命令,检查ICAgent是否可成功上报指标。 cat /var/ICAgent/oss.icAgent.trace | grep
支持字段有name,create_time,update_time。 最小长度:1 最大长度:32 sort_order 是 String 排序规则(默认降序) 传入升序或降序,升序:ASC,降序:DESC。 最小长度:1 最大长度:32 enterprise_project_id 否
使用前必读 欢迎使用应用运维管理服务(Application Operations Management,简称AOM)。应用运维管理(Application Operations Management,简称AOM)是云上应用的一站式立体化运维管理平台,提供一站式可观测性分析和自动
用户侧使用虚拟网卡,想要获取到ICAgent状态信息需要修改下相关脚本规避。 解决方法 以root用户登录已安装ICAgent的CCE集群的某个主机服务器。 执行以下命令,查看正在使用的hostIP地址,如图1所示。 netstat -nap | grep establish -i 图1 查看hostIP地址
基础指标:IEF指标 介绍IEF服务上报到AOM的监控指标,包括指标的类别、名称、含义等信息。IEF服务的指标上报到AOM后,系统会根据指标映射规则将IEF指标转换后,呈现在AOM控制台的“指标浏览”界面。 表1 IEF服务监控指标 指标类别 分类 AOM呈现的指标 IEF上报的指标 指标名称
Prometheus实例 选择一个ECS Prometheus实例用于存储采集数据。 采集任务通过关联ECS Prometheus实例,对采集数据进行标记分类。若当前没有可选的Prometheus实例,可以单击“创建普罗实例”,在Prometheus实例界面创建ECS Prometheus实例。
指定时间:从周日到周一中选择一个或多个,默认全部选中。 执行规则 “执行策略”为“周期执行(Cron表达式)”才需要设置。 根据设置的Cron表达式执行操作,目前只支持从0分开始计时递增,最小时间间隔30分钟 。具体的规则和配置方式请单击页面“了解Cron表达式”。 配置任务通知,详细参数说明请参见表3。
查询事件类告警规则列表 新增一条事件类告警规则 更新事件类告警规则 删除事件类告警规则 查询事件告警信息 统计事件告警信息 上报事件或告警信息 获取告警发送结果 删除静默规则 新增静默规则 修改静默规则 获取静默规则列表 通过告警规则名称获取告警行动规则 新增告警行动规则 删除告警行动规则
查询时序数据 查询指标 查询监控数据 添加监控数据 添加或修改服务发现规则 删除服务发现规则 查询系统中已有服务发现规则 添加阈值规则 查询阈值规则列表 修改阈值规则 删除阈值规则 查询单条阈值规则 批量删除阈值规则 父主题: API
aom:muteRule:list √ √ 通过规则名称获取告警行动规则 GET /v2/{project_id}/alert/action-rules/{rule_name} aom:actionRule:get √ √ 新增告警行动规则 POST /v2/{project_id}/alert/action-rules
认证证书 合规证书 华为云服务及平台通过了多项国内外权威机构(ISO/SOC/PCI等)的安全合规认证,用户可自行申请下载合规资质证书。 图1 合规证书下载 资源中心 华为云还提供以下资源来帮助用户满足合规性要求,具体请查看资源中心。 图2 资源中心 销售许可证&软件著作权证书