检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
mUsage指标为例,原始指标名称为memUsage,AOM页面查询时指标名称为aom_container_memory_usage)。 操作步骤 登录AOM 2.0控制台,选择“Prometheus监控 > 实例列表”。 在Prometheus实例列表中,单击支持数据多写功能的
验证DMS实例连通性。 您需要确保在安全组"入方向规则"中,放通9011端口,源地址为"198.19.128.0/20"的网络流量。设置安全组规则操作如下: 登录管理控制台。 在左侧导航栏,单击,选择“网络 > 虚拟私有云 VPC”。 在左侧导航栏单击“访问控制 > 安全组”,在使用DMS所在的安全组右侧,单击“配置规则”。
况。 AOM作为云上应用的一站式立体化运维管理平台,可以实现对云主机、存储、网络、WEB容器、docker、kubernetes等应用运行环境的深入监控并进行集中统一的可视化管理,能够有效预防问题的产生及快速帮助应用运维人员定位故障,降低运维成本。AOM并非传统监控,它通过应用的
evaluation_periods Integer 连续周期数 statistic String 统计方式 metric_operation String 指标操作符 metric_threshold Float 阈值条件 表6 actions字段数据结构说明 参数名称 参数类型 描述 type String
该功能对非洲-约翰内斯堡、拉美-墨西哥城一、拉美-墨西哥城二、拉美-圣保罗一和拉美-圣地亚哥区域生效。 告警作为AOM应用运维管理中一项基础功能,在日常运维中发挥着重要作用。AOM告警可以对接华为云租户虚机、组件等数十种指标,通过短信、邮件等多种方式通知客户当前系统存在的问题。 支持的指标
标识该委托代理的名称。 须知: 委托名称必须为apm_admin_trust。 - 委托类型 选择“云服务”。 云服务 云服务 请选择“应用运维管理 AOM”。 - 持续时间 选择“永久”。 永久 描述 可选参数,用于补充说明该委托代理的详细信息。 - 单击“下一步”,进入“授权”页面。
R_ADDRESS、APM_ACCESS_KEY(apm-ak)以及APM_SECRET_KEY(apm-sk)赋值。获取AK/SK的具体操作,请参见获取AK/SK,获取master.address,请参见接入地址。 如果javaagent配置文件和环境变量同时配置了AK、SK、master
客户端可以随时再次提交该请求而无需进行任何更改。 409 Conflict 服务器在完成请求时发生冲突。 返回该状态码,表明客户端尝试创建的资源已经存在,或者由于冲突请求的更新操作不能被完成。 410 Gone 客户端请求的资源已经不存在。 返回该状态码,表明请求的资源已被永久删除。 411 Length Required
以根据需要调整时间范围,查看近1小时、近6小时、近1天、近1周或自定义时间段的事件。 图2 事件统计视图 在事件统计图区域,还可以执行以下操作: 在图表左上角,查看设置的时间段内事件巡检检测到的异常事件总数。 将鼠标悬浮于柱状图上,查看对应时间点各类型的事件数量。 单击柱状图上方
ss_cpu_seconds_total等于utime和stime之和除以USER_HZ。即将程序滴答总数除以 Hz(每秒滴答数)得到就是操作系统运行该进程的总时间(以秒为单位)。 node_disk_read_bytes_total 读取成功的字节总数 node_disk_io
2(20%),可能有如下情况: 在整个时间间隔内,有20%的SM的Tensor Core以100%的利用率运行。 在整个时间间隔内,有100%的SM的Tensor Core以20%的利用率运行。 在整个时间间隔的1/5时间内,有100%的SM上的Tensor Core以100%利用率运行。
按SQL统计创建告警规则功能仅支持全部用户使用的局点有:华南-广州、华北-北京四、华北-乌兰察布二零一、华北-乌兰察布一、华东-上海一、华东-上海二、中国-香港、亚太-曼谷、亚太-新加坡,支持部分白名单用户使用的局点有:华北-北京一、西南-贵阳一、亚太-曼谷、华南-深圳、华北
是否必选 参数类型 取值范围 描述 conditions 是 参见表5 conditions最多5个,最少1个 匹配条件内容。一个规则可以有多个条件,多个条件之间的关系是“并且”,内部描述了多个详细匹配条件。一个条件可以描述一个metric的匹配方式。 actions 是 参见表6
本文档介绍如何为告警规则配置告警降噪功能,在发送告警通知前按告警降噪规则对告警进行处理,处理完成后再发送通知,避免产生告警风暴。 实践场景 某电商运维人员在定位分析应用、资源及业务的实时运行状况时,发现系统上报的告警数量过大,重复性告警过多,需要从众多告警中快速及时发现故障,全面掌握应用。
用户购买该服务资源后,CMDB可实时感知获取该资源信息,并展示在资源管理页面。 资源类型相关信息,详见表1。 表1 资源类型 资源类型 子类型 信息 操作 云服务器ECS - - 名称/ID、内网IP、弹性公网IP、主机名称、可用区、区域、企业项目、应用环境、UniAgent状态、资源状态、镜像名称、VPC名称。
String 包含“>”、“<”。 例如,“>”表示当metric大于metric_thresholdUpdate值时触发actions 指标操作符 metric_threshold 是 Float [0,2147483647] 阈值条件 举例说明告警策略中conditions各个参数含义:
机器导入IP。 agent_id String agent ID。 host_name String 主机名。 os_type String 操作系统。 agent_state String UniAgent状态。 project_id String 所属project ID。 version
应用场景 该功能主要用于用户可以在自建系统免密登录AOM的场景,但是登录华为云AOM控制台还是需要账号密码。 用户在外部系统中(例如公司内部运维或运营系统)快速集成AOM仪表盘详情页面。 无需管理众多华为子账户,方便将AOM仪表盘详情页面进行分享查看。 将AOM仪表盘详情页面嵌入用户自建系统
port 是 Integer 机器登录端口,默认22。 account 是 String 机器ssh账号。 os_type 是 String 机器操作系统类型。 vpc_id 否 String 机器所属VPC ID。 coc_cmdb_id 否 String 外来唯一标识,COC用。 表5