检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
在使用AOM时,您需注意以下使用限制,详见表2。使用限制中部分内容属于配额,关于什么是配额以及怎样查看与修改配额,详见关于配额。 表2 资源使用限制 分类 对象 使用限制 仪表盘 仪表盘 1个区域中最多可创建50个仪表盘。 仪表盘中的图表 1个仪表盘中最多可添加20个图表。 仪表盘中图表可选资源、阈值规则、组件或主机的个数
已创建需要映射的日志组和日志流。创建方法请参见:创建日志组和日志流,也可以在添加日志接入页面直接创建。 已有集群、命名空间和工作负载,详情请参见:CCE用户指南。 约束与限制 如需使用“日志接入”功能,需提前在“菜单开关”中开启应用洞察的开关,详细操作请参见菜单开关。 当前AOM不支持上报Windows虚机日志。
除”。 删除单条或多条规则:勾选对应规则前的复选框,单击“批量删除”。 搜索分组规则 在右上角的搜索框中输入规则名称关键字,单击后显示匹配对象。 父主题: 告警降噪
查询事件类告警规则列表 功能介绍 查询事件类告警规则列表。(该接口为aom1.0界面接口,该接口即将下线,建议使用aom2.0接口查询指标类或者事件类告警规则列表接口)。 调用方法 请参见如何调用API。 URI GET /v2/{project_id}/event2alarm-rule
主机状态图表:实时监控主机的状态。 图4 主机状态图表 组件状态图表:实时监控组件的状态。 图5 组件状态图表 资源TopN图表 资源TopN图表的统计单位为集群,统计对象为集群下的资源(这里的资源指主机、组件和实例)。资源TopN图表可视化地展示了集群中资源占用最高的N个资源,支持资源Top5、Top15数
aom_node_status)&time=1630381536 响应示例 状态码: 200 OK 请求响应成功。 { "status" : "success", "data" : { "resultType" : "vector", "result" : [ {
Invalid param. 参数不合法 请检查对应的参数是否符合要求。 400 AOM.04007101 Invalid namespace. namespace参数不合法 请检查对应的参数是否符合要求。 400 AOM.04007102 Invalid inventory ID.
0&end=1630390380&step=15 响应示例 状态码: 200 OK 请求响应成功。 { "status" : "success", "data" : { "resultType" : "matrix", "result" : [ {
insufficient_data_actions Array of strings 数据不足通知列表。 metric_name String 时间序列名称。 namespace String 时间序列命名空间。 ok_actions Array of strings 正常状态通知列表。 period Integer
组件与基础设施关联分析设置 针对容器场景:容器资源、容器中间件等指标存储在Prometheus for CCE类型的实例中。 如果需要关联分析,需要先在AOM中创建Prometheus for CCE实例,并在Prometheus实例中一键接入容器监控。 针对虚机场景:虚机、虚机上的自建中间件等资源指标存储在Prometheus
insufficient_data_actions Array of strings 数据不足通知列表。 metric_name String 时间序列名称。 namespace String 时间序列命名空间。 ok_actions Array of strings 正常状态通知列表。 period Integer
什么是应用运维管理 运维遇到挑战 随着容器技术的普及,越来越多的企业通过微服务框架开发应用,业务实现更多使用云上服务,运维也转向云上的运维服务。对于云上应用的运维也提出了新的挑战。 图1 运维现有问题 运维人员技能要求高,配置繁杂,同时需要维护多套系统。对于分布式追踪系统,学习和使用成本高,并且稳定性差。
等均不会高亮显示),以便帮您快速定位出异常。 图1 日志文件详情 (可选)单击该实例“操作”列的“配置转储”,将该实例的日志一次性转储到OBS桶的同一个.log日志文件中。具体操作详见添加一次性转储。 父主题: 日志管理(旧版)
event_source 否 String 告警来源。 “RDS” “EVS” “CCE” “LTS” “AOM” monitor_objects 否 Array of Map<String,String> objects 监控对象列表。键值对形式,键值为: “event_type”:通知类型 “
新增一条事件类告警规则 功能介绍 新增一条事件类告警规则。 调用方法 请参见如何调用API。 URI POST /v2/{project_id}/event2alarm-rule 表1 路径参数 参数 是否必选 参数类型 描述 project_id 是 String 项目ID,可
更新事件类告警规则 功能介绍 更新事件类告警规则。 调用方法 请参见如何调用API。 URI PUT /v2/{project_id}/event2alarm-rule 表1 路径参数 参数 是否必选 参数类型 描述 project_id 是 String 项目ID,可以从控制台
基础指标:Flink指标 介绍通过Flink服务上报到AOM的指标的类别、名称、含义等信息。 表1 Flink服务监控指标 分类 指标 指标含义 单位 CPU flink_jobmanager_Status_JVM_CPU_Load JobManager中JVM的CPU负载。 无
基础指标:node-exporter指标 介绍通过中间件Exporter上报到AOM的node-exporter指标的类别、名称、含义等信息。 表1 CCE/自建K8s集群容器指标 Job名称 指标 指标含义 node-exporter node_filesystem_size_bytes 挂载的文件系统占用空间
"in_execution" : [ ], "not_performed" : [ ], "success" : [ ] }, "status" : "success" } ], "last_record_id_with_snapshot" : "xxxxxxx"
尾。 设置日志存储时间。存储时间默认为7天,可设置为1~30天内的时间节点。超出存储时间的日志将会被自动删除,您可以按需将日志数据转储至OBS桶中长期存储。 单击“确定”完成创建。 创建日志流 输入日志流名称。日志流名称只支持输入英文、数字、中文、中划线、下划线及小数点,且不能以小数点、下划线开头或以小数点结尾。