检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
父主题: 应用资源管理(aom2.0接口)
addInhibitRule 修改抑制规则 inhibitRule updateInhibitRule 删除抑制规则 inhibitRule delInhibitRule 新增静默规则 muteRule addMuteRule 修改静默规则 muteRule updateMuteRule
查看告警 在已设的连续周期内,当某个资源的指标数据满足阈值条件时,产生一条阈值告警。 可在左侧导航栏中选择“告警管理 > 告警列表”,在“告警”页签下查看该告警,具体请参见“查看告警”。 查看事件 在已设的连续周期内,当某个资源没有指标数据上报时,会产生一条数据不足的事件。
隐私声明 由于AOM会将运维数据内容展示到AOM控制台,请您在使用过程中,注意您的隐私及敏感信息数据保护,不建议将隐私或敏感数据上传到AOM,必要时请加密保护。
隐私与敏感信息保护声明 由于AOM会将运维数据内容展示到AOM控制台,请您在使用过程中,注意您的隐私及敏感信息数据保护,不建议将隐私或敏感数据上传到AOM,必要时请加密保护。
方式一:通过AOM提供的接口上报自定义指标,接口详见添加监控数据和查询监控数据。 方式二:在CCE创建容器应用时,通过对接普罗米修斯上报自定义指标,详细内容请参见对接普罗米修斯(自定义监控)。
缺省值:“” 表9 NoDataCondition 参数 是否必选 参数类型 描述 no_data_timeframe 否 Integer 无数据周期的个数。 no_data_alert_state 否 String 数据不足时,阈值规则的状态。
父主题: 应用资源管理(aom2.0接口)
当服务的资源数据满足事件条件时产生事件类告警。当资源的指标数据满足阈值条件时产生阈值告警,当没有指标数据上报时产生数据不足事件。 告警规则分为阈值规则和事件类告警规则两种。通常情况下,通过阈值规则,实时监控环境中主机、组件等资源使用情况。
父主题: 采集管理
例如,设置事件名称为“数据卷扩容失败”,监控周期为“20分钟”,累计次数为“>=3”,频率为“每5分钟”,则表示20分钟内发生数据卷扩容失败事件的次数累计达到或超过3次,则每5分钟发送一次告警通知直到告警被清除。
什么是应用运维管理 应用运维管理(Application Operations Management,简称AOM)是云上应用的一站式立体化运维管理平台,融合云监控、云日志、应用性能、真实用户体验、后台链接数据等多维度可观测性数据源,提供应用资源统一管理、一站式可观测性分析和自动化运维方案
采集开关 为了减少内存、数据库、磁盘空间占用,您可以按需进行采集设置。 日志采集开关 前提条件:弹性云服务器上已安装ICAgent,详细操作请参见安装ICAgent。 登录AOM控制台,选择“配置管理 > 日志配置”,选择“采集开关”页签。 开启或者关闭日志采集开关。
升级AOM 手动升级 一键迁移
监控安全风险 AOM通过多种方式监控安全风险,保障数据安全可靠,具体请参见表1。
监控安全风险 AOM通过多种方式监控安全风险,保障数据安全可靠,具体请参见表1。
自定义发现规则 在左侧导航栏中选择“配置管理 > 应用发现”。 单击“添加自定义应用发现规则”,配置应用发现规则。 选择预探测主机。 自定义一个规则规则名称(例如,rule-test)。
左侧导航栏选择“资源管理 > 网络管理”,在Service页面获取Grafana服务的访问地址和端口,以及Prometheus服务的访问域名和端口。
表1 AOM的云服务监控与CES的云服务监控功能对比 功能 CES云监控 AOM 2.0云监控 跨账号统一监控 不支持 支持 自定义数据存储时长 不支持(默认可存储3个月)。 支持(最长367天)。 数据导出 支持导出近3个月聚合数据。 支持导出近48个小时原始数据。
如果进程的“CMD”列的值以“/sbin/”开头,则该类进程会被过滤掉,不会被AOM发现。 例如,上面信息中“PID”为“1148”的进程,因为其“CMD”列的值以“/sbin/”开头,所以该进程不会被AOM发现。