检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
您可以进入AOM的容器监控页面,在工作负载的监控视图里查看服务在各个时间的状态值,0代表正常,非0代表异常。 父主题: 常见使用问题
影响:无法使用邮件、短信等通知功能。 解决办法 请联系IAM用户所属的账号管理员增加消息通知服务的访问权限,增加消息通知服务的访问权限操作如下: 使用IAM用户所属的账号登录统一身份认证服务后,为IAM用户增加消息通知服务的访问权限。详细操作请参见修改用户权限。 父主题: 常见使用问题
表项的展示/隐藏。 修改告警规则 单击“操作”列的。详细操作请参见“创建指标告警规则”和“创建事件告警规则”。 注意: 修改告警规则的相关配置,可能导致告警无法监控目标资源或者告警无法生效,请谨慎操作。 复制告警规则 单击“操作”列的。详细操作请参见“创建指标告警规则”和“创建事件告警规则”。
规则的匹配条件。串行条件和并行条件的最大数量限制为10。 数组长度:1 - 10 mute_config MuteConfig object 规则的生效时间配置 name String 规则名称。名称包含大小写字母、数字、特殊字符(_)、不能以下划线开头或结尾,最大长度为100。 最小长度:1 最大长度:100
场景分类 在场景分类页面自动化运维已定义了服务场景的类型,具体如下: 故障处理 日常巡检 软件部署 云服务场景 通用场景 父主题: 设置
"group" : "ecs_instance", "ecs_id_list" : "[\"xxx\"]", "ecs_instance_status" : null, "ecs_instance_tags" : null, "ecs_inst
进程监控”,在右侧区域选择“组件监控”页签,进入组件监控界面,查看组件列表。 组件列表中对组件名称、所属应用、部署方式、应用发现规则、使用率、操作等参数进行展示。 为了方便查看组件列表,可以在组件列表上方设置运行状态、所属应用、集群名称、部署方式、组件名称等过滤条件,实现组件列表过滤显示。 通过开启或关闭“隐藏系统
401 Unauthorized 在客户端提供认证信息后,返回该状态码,表明服务端指出客户端所提供的认证信息不正确或非法。 403 Forbidden 请求被拒绝访问。返回该状态码,表明请求能够到达服务端,且服务端能够理解用户请求,但是拒绝做更多的事情,因为该请求被设置为拒绝访问,建议直接修改该请求,不要重试该请求。
“max” “min” “sum” 枚举值: by avg max min sum metric_statistic_method String 当配置方式为全量指标时可选择的指标运算方式。 “single”:单个指标进行运算 “mix”:多个指标进行混合运算 枚举值: single mix
事件巡检 事件巡检服务会定时巡检已开通智能洞察的应用服务,基于应用历史数据的平均RT、错误率等关键指标看护服务质量,全局分析问题。 功能说明 事件巡检基于应用的历史数据,形成动态上界,以比对服务近期时间的数据是否有异常。 获取基础数据时间范围如下: 基于应用3小时内的历史数据,形
描述 type String 节点类型。 最小长度:1 最大长度:32 configuration Map<String,Object> 配置信息。 表8 Parameter 参数 参数类型 描述 param_name String 参数名称。 param_type String
规则的匹配条件。串行条件和并行条件的最大数量限制为10。 数组长度:1 - 10 mute_config 是 MuteConfig object 规则的生效时间配置 name 是 String 规则名称。名称包含大小写字母、数字、特殊字符(_)、不能以下划线开头或结尾,最大长度为100。 最小长度:1
规则的匹配条件。串行条件和并行条件的最大数量限制为10。 数组长度:1 - 10 mute_config 是 MuteConfig object 规则的生效时间配置 name 是 String 规则名称。名称包含大小写字母、数字、特殊字符(_)、不能以下划线开头或结尾,最大长度为100。 最小长度:1
ams/report/metricdata [ { "metric" : { "namespace" : "NOPAAS.ESC", "dimensions" : [ { "name" : "instance_id", "value"
Prometheus实例读写地址支持公网的局点 华为云用户应使用公网Remote Read地址和Remote Write地址访问AOM的Prometheus监控服务,内网地址仅供华为云内部云服务调用。 公网Remote Write地址仅部分局点支持,具体请参见表1。 表1 支持公网数据上报的说明 局点名称 Region名称
Stage、CCE等外部服务在某种状态发生变化后上报给AOM的信息。 告警和事件的区别 告警是AOM自身,或ServiceStage、CCE等外部服务在异常情况或在可能导致异常情况下上报的信息,并且您需采取相应措施清除故障,否则会由于AOM自身或外部服务的功能异常而引起业务的异常。
基础指标:IoTDA指标 介绍IoTDA服务上报到AOM的监控指标,包括指标的类别、名称、含义等信息。 表1 IoTDA服务监控指标 指标类别 指标 指标名称 指标含义 取值范围 单位 设备总数 iotda_device_status_onlineCount 在线设备数 统计租户在当前实例/资源空间下的在线的设备数量
故障传播链分析 故障传播链图谱基于服务的调用链和平均RT、错误率等分析关键指标数据,找出异常调用在调用链追踪链路trace中的传播关系,并展示服务及其关联服务的关键指标数据,可以更有效地定位根因。 功能入口 登录AOM 2.0控制台。 在菜单栏选择“监控中心”,进入“监控中心”界面。
能,降低您使用SDK的难度,推荐使用。 SDK列表 表1提供了AOM服务支持的SDK列表,您可以在GitHub仓库查看SDK更新历史、获取安装包以及查看指导文档。 表1 SDK列表 编程语言 Github地址 参考文档 Java huaweicloud-sdk-java-v3 Java
集群监控 集群监控的对象为通过CCE部署的集群。“集群监控”页面可实时监控集群的多项基础监控指标(例如集群状态、CPU使用率、内存使用率、节点运行状态等)和相关的告警、事件数据,通过这些指标和相关的告警信息,用户可实时了解集群的运行状况,及时处理潜在风险,保障集群稳定运行。 约束与限制