检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
基础指标:CSE指标 介绍CSE服务上报到AOM的监控指标,包括指标的类别、名称、含义等信息。 表1 CSE服务监控指标 指标类别 分类 指标 指标名称 指标含义 取值范围 单位 ServiceComb registry servicecomb_service_center_db_service_total
AOM告警规则状态为什么显示“数据不足”? AOM告警规则中,资源项有时会出现数据不足的情况,如下图所示。 图1 查看规则状态 可能的原因如下: 数据上报延迟过大(曲线图最新数据上报时间和当前时间的时间差大于一个周期,阈值上报周期设定中可选1分钟和5分钟),上报周期内获取不到数据会报数据不足。
卸载托管Prometheus实例 DELETE /v1/{project_id}/aom/prometheus aom:metric:delete √ √ 查询Prometheus实例 GET /v1/{project_id}/aom/prometheus aom:metric:list √ √ 新增Prometheus实例
字符长度小于64位,以小写字母(a-z)开头,只能包含0-9/a-z/-,不能以-结尾。 规则名称。 createTime 否 String - 创建时间(创建时不传,修改时传查询返回的createTime) enable 是 Boolean true、false 规则是否启用。 hostid 否 Array - 主机ID(暂不使用,传空即可)。
500实例,指标存储时长1年 1000实例,指标存储时长1年 秒级监控指标数量 首月免费10个 无 2000个 自定义指标 10个 100个 500个 查询指标数据API调用 50万次/月 100万次/月 500万次/月 事件和告警总条数 5万条/月,存储时长7天 10万条/月,存储时长30天
接入管理功能支持ICAgent采集、云服务、API接入、SDK接入等日志采集方式,采集日志后,日志数据可以在控制台界面以简单有序的方式展示、方便快捷的方式进行查询。 登录AOM 2.0控制台。 在左侧导航栏选择“接入 > 接入管理”。 登录LTS控制台。 在左侧导航栏选择“接入 > 接入管理”。 日志接入
Token:输入访问用户侧Prometheus实例的Token。 无认证:无需认证,即可访问用户侧Prometheus实例。 规则创建成功后,即可在规则列表中查看当前创建的数据订阅规则。 数据订阅格式说明 AOM格式的指标JSON格式代码片断 package metric type MetricDatas
在左侧树节点选中待操作的环境,单击。 关联资源 在左侧树节点选中待操作的环境,在右侧区域单击任一资源实例页签,在下方列表区域单击“关联资源”,具体操作请参见“关联资源”。 查看环境信息 在左侧树节点选中一个环境,在右侧区域单击“环境信息”页签。 父主题: 应用管理
--with-http_stub_status_module 参数重新配置configure文件,来编译一个Nginx。示例如下: ./configure \ ##在原基础上添加--with-http_stub_status_module参数进行编译。 --with-http_stub_status_module
应用场景 AOM应用广泛,下面介绍AOM的两个典型应用场景,以便您深入了解。 巡检与问题定界 日常运维中,遇到异常难定位、日志难获取等问题,需要一个监控平台对资源、日志、应用性能进行全方位的监控。 AOM深度对接应用服务,一站式收集基础设施、中间件和应用实例的运维数据,通过指标监
Prometheus For CCE实例可以上报多个CCE集群数据。 开源兼容 支持自定义多维数据模型、HTTP API模块、PromQL查询。 静态文件配置和动态发现机制发现监控对象,实现轻松迁移及接入。 数据规模无上限 凭借云存储能力,数据存储无上限,不再受限于本地容量。云端分布式存储保障数据可靠性。
将光标移至待操作的应用名称后,单击,选择“删除”。 搜索应用信息 在“应用管理”页面的左侧区域,可以按企业项目、应用、区域、标签、关键字等搜索并展示需要的应用。 查看应用信息 选中一个应用,在右侧区域单击“应用信息”页签。 父主题: 应用管理
≥0 兆字节(MB) aom_node_memory_free_megabytes freeMem 可用物理内存 该指标用于统计测量对象上的尚未被使用的物理内存。 ≥0 兆字节(MB) aom_node_memory_usage memUsedRate 物理内存使用率 该指标用
服务参数。 表4 AppRules 参数 是否必选 参数类型 描述 createTime 否 String 规则创建时间(创建时不传,修改时传查询返回的createTime)。 缺省值:1599098476654 enable 是 Boolean true、false 规则是否启用。
CCE实例并在Prometheus实例中一键接入容器监控。 针对虚机场景,虚机、虚机上的自建中间件等资源指标存储在Proomthous for ECS类型的实例中。 如果需要关联分析,需要先在AOM中创建Prometheus for CCE实例并在AOM的接入中心,安装node-exporter或自建中间件。
“转移”,在弹出的页面中,选择目标节点,可转移节点。 添加环境 将光标移至待操作的子节点名称后,单击,添加环境,具体操作请参见添加环境。 查看节点信息 选中一个子应用或组件,在右侧区域单击“子应用信息”或“组件信息”页签。 父主题: 应用管理
对于一个单条静态阈值规则,若其监控对象为某个主机,当主机的CPU使用率超限时,在告警界面产生阈值告警,可在左侧导航栏中选择“告警 > 告警列表”,在告警列表中查看该告警;当主机满足已设的通知策略时,就会发送邮件或短信。 图3 单条静态阈值规则
Web监控 AOM作为华为云服务可观测性分析统一入口,自身并不具有APM服务的功能,AOM 2.0控制台中Web监控相关功能由应用性能管理APM提供。用户可在AOM 2.0控制台界面操作,也可登录APM控制台界面操作。 Web监控功能当前仅在华东-上海一区域开放。 表1 功能说明
使用抑制规则,您可以抑制或阻止与某些特定告警相关的其他告警通知。例如:当严重级别的告警产生时,可以抑制与其相关的低级别的告警。或当节点故障发生时,抑制节点上的进程或者容器的所有其他告警。 注意事项 若在发送告警通知之前抑制条件对应的源告警已恢复正常,则抑制规则失效,抑制对象(被源告警抑制的告警)将正常发送告警通知。
基础指标:Flink指标 介绍通过Flink服务上报到AOM的指标的类别、名称、含义等信息。 表1 Flink服务监控指标 分类 指标 指标含义 单位 CPU flink_jobmanager_Status_JVM_CPU_Load JobManager中JVM的CPU负载。 无