检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
账号欠费:客户欠费后,为防止相关资源不被停止或者释放,需要客户及时进行充值,详细说明请参见:欠费还款。 账号冻结或受限:云服务资源因欠费冻结或受限时,若处于保留期,用户可通过续费或充值来解冻该资源,恢复云服务正常使用,详细说明请参见:资源冻结。 父主题: 应用资源管理(日落)
架构下的问题定位和性能瓶颈等难题,为用户体验保驾护航。 AOM提供基础运维能力,APM是对AOM运维能力的补充。AOM界面集成了APM,可通过AOM界面统一运维;APM也有独立的控制台入口,可以单独使用APM。 图1 立体化运维解决方案 父主题: 其他常见问题
AOM告警规则状态为什么显示“数据不足”? 正常状态的工作负载,AOM界面显示异常是什么原因? 如何创建委托apm_admin_trust? 如何通过创建委托获取AK/SK? 日志费用说明 在控制台查看不到日志怎么办? 如何处理界面“ICAgent状态”为“离线”的问题? 安装了ICAgent,但是监控不到主机是什么原因?
y 和value只能包含中文、字母、数字和下划线。 如果在创建告警规则时设置了告警标签,触发的告警会自动添加该标签为告警属性。 消息模板中通过$event.metadata.key1变量获取告警标签信息,具体请参见消息模板变量说明。 如您的组织已经设定AOM服务的相关标签策略,则
Agent指标上报延迟,从而导致状态判断出现问题。 遇到工作负载状态显示不对的问题,需要排查节点的时间与当前时间相比是否过快或过慢,也可以通过在AOM页面查看NTP指标的偏移进行确认。 父主题: 常见使用问题
删除事件类告警规则 查询事件告警信息 统计事件告警信息 上报事件告警信息 获取告警发送结果 删除静默规则 新增静默规则 修改静默规则 获取静默规则列表 通过规则名称获取告警行动规则 新增告警行动规则 删除告警行动规则 修改告警行动规则 获取告警行动规则列表 查询指标类或者事件类告警规则列表 添加或修改指标类或事件类告警规则
单击“组件”列,某一个组件名称,进入该组件详情页,默认展示“接口调用”详细信息。 单击“调用链”,切换至调用链页签,页面展示该组件调用链详情。 图1 调用链 通过选择实例、URL等查询条件查询,也可在界面下方新增自定义查询条件来查看调用链详情。详情请参考查看调用链。 父主题: 监控组件性能指标
state_updated_timestamp String 状态更新时间戳。 state_value String 服务状态。 statistic String 统计方式。 threshold String 临界值。 type String 阈值规则类型。 unit String 阈值单元。 表6 Dimension
新增线程指标、修复“获取lvs磁盘分区指标失败”问题。 5.12.100 上报内存指标增加内存workingset使用量、内存workingset使用率 容器采集支持通过标签区分stderr.log和stdout.log 容器上报增加Pod_ip的tag **配置匹配当前目录文件 5.12.98 增加LTS
state_updated_timestamp String 状态更新时间戳。 state_value String 服务状态。 statistic String 统计方式。 threshold String 临界值。 type String 阈值规则类型。 unit String 阈值单元。 表7 Dimension
一个AZ是一个或多个物理数据中心的集合,有独立的风火水电,AZ内逻辑上再将计算、网络、存储等资源划分成多个集群。一个Region中的多个AZ间通过高速光纤相连,以满足用户跨AZ构建高可用性系统的需求。 项目 华为云的区域默认对应一个项目,这个项目由系统预置,用来隔离物理区域间的资源(
数据发现、数据展示到数据异常告警的全方位、可视化监控服务,实现从上到下、从前端到后端的全栈一体化监控。 关联分析 应用和资源层层自动关联,通过应用、组件、实例、主机和事务等多视角下钻分析指标、日志、告警数据,直击异常。 精准告警 构建指标告警、事件告警、日志告警的统一告警体系,提
在左侧导航栏选择“设置”,进入全局配置界面。 在左侧导航栏选择“日志设置”,单击“配额设置”页签。 登录LTS控制台。 在左侧导航栏选择“配置中心”。 配额设置 分词配置 通过配置分词可将日志内容按照分词符切分为多个单词,在日志搜索时可使用切分后的单词进行搜索。 登录AOM 2.0控制台。 在左侧导航栏选择“设置”,进入全局配置界面。
aggregate_type 否 String 聚合方式。 “by”:不分组 “avg” “max” “min” “sum” 枚举值: by avg max min sum metric_statistic_method 否 String 当配置方式为全量指标时可选择的指标运算方式。 “single”:单个指标进行运算
监控(磁盘)等多种数据信息卡片,下面分别介绍各卡片内容及操作: 基础设施监控卡片 图1 基础设施监控 此卡片主要展示基础设施的指标数据。可通过选择集群,呈现某一个集群或者所有集群中的信息。如图选择所有集群,即该基础设施监控卡片呈现所有集群的如下信息: 主机运行状态,CPU、物理内存的使用量。
钟。3600000:一小时。 枚举值: 60000 300000 900000 3600000 statistic 是 String 统计方式。 枚举值: maximum minimum average sum sampleCount threshold 是 String 超限值。
角“更新时间”的下拉框,选择展示执行记录的时间为“近1天”、“近7天”“近30天”或自定义时间段。 说明: 更新时间默认不展示在列表中,可通过单击列表右上角,勾选下拉框中的“更新时间”查看。 任务管理最多保存最近一年的执行记录。 自定义时间最大跨度为30天。 执行任务 对未执行的任务单击“操作”列的“去执行”。
钟。3600000:一小时。 枚举值: 60000 300000 900000 3600000 statistic 是 String 统计方式。 枚举值: maximum minimum average sum sampleCount threshold 是 String 超限值。
可能原因三:资源被删除或被停止 修复建议: 在ECS界面检查主机是否已被重启、关机或删除。 在CCE界面检查服务是否已被停止或删除。 通过应用发现功能发现的应用,当应用规则被停止或删除时,应用也会同时被停止或删除,请在AOM的应用发现界面检查应用发现规则是否已被停止或删除。 父主题:
获取静默规则列表 GET /v2/{project_id}/alert/mute-rules aom:muteRule:list √ √ 通过规则名称获取告警行动规则 GET /v2/{project_id}/alert/action-rules/{rule_name} aom:actionRule:get