检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
资源、告警和事件等数据的立体运维服务。AOM从架构上主要分为数据采集接入层、传输存储层和业务计算层。 架构图 图1 AOM架构 采用三层架构 数据采集接入层 ICAgent采集数据 给主机安装ICAgent(插件式的数据采集器)并通过ICAgent上报相关的运维数据。 API接入数据
2(20%),可能有如下情况: 在整个时间间隔内,有20%的SM的Tensor Core以100%的利用率运行。 在整个时间间隔内,有100%的SM的Tensor Core以20%的利用率运行。 在整个时间间隔的1/5时间内,有100%的SM上的Tensor Core以100%利用率运行。 其他组合模式。
登录管理控制台的账号。 ${domain_name} 通知类型 创建通知规则时选择的类型:告警或事件 ${event_type} 事件级别 创建通知规则时选择告警或事件级别:紧急、重要、次要、提示 ${event_severity} 事件名称 触发通知规则的告警或事件的名称 $event
500小站节点NPU卡的健康状态,由用户调用edgecore接口上报。 ≥0 无 ai_cpu_rate ai_cpu_rate AI cpu占用率 昇腾AI加速卡的AI CPU使用率,由用户调用edgecore接口上报。 0~100 百分比(%) ai_core_rate ai_core_rate
read_recent: true 将复制的Remote Read Prometheus配置代码添加到对应用户自建Prometheus的prometheus.yml文件中。 重启用户自建的Prometheus服务。 即可在用户侧的自建Prometheus中查看AOM的Prometheus数据。 Remote
指定上报的事件或者告警产生的时间。仅支持CST毫秒级时间戳。 例如:2024-10-16 16:03:01需要通过工具转换成CST毫秒级时间戳:1729065781000 当action值为空时,即上报事件或告警时需要时指定该参数。 ends_at 否 Long 指定清除的事件或者
安装文件包提示没有OBS权限怎么办? 定时任务无法成功触发 编排好的作业,能否在执行时再选择执行机,填入脚本参数等内容? 使用cron表达式创建定时任务,提示参数错误 如何为执行方案配置审批? 执行清理磁盘任务时,提示 delete success:{},未成功删除已选择目录下的文件 编辑作业后,作业的执行方案未更新
告警抑制规则功能可以抑制或阻止与某些特定告警相关的其他告警通知。例如:当严重级别的告警产生时,可以抑制与其相关的低级别的告警;或当节点故障发生时,抑制节点上的进程或者容器的所有其他告警。 约束与限制 如果在发送告警通知之前抑制条件对应的源告警已恢复正常,则抑制规则失效,抑制对象(被源告警抑制的告警)将正常发送告警通知。
返回结果 状态码 请求发送以后,您会收到响应,包含状态码、响应消息头和消息体。 状态码是一组从1xx到5xx的数字代码,状态码表示了请求响应的状态,完整的状态码列表请参见状态码。 对于管理员创建IAM用户接口,如果调用后返回状态码为“201”,则表示请求成功。 响应消息头 对应请
URL在采集周期内的平均响应时间。 url错误率 URL的错误率。 mysql错误率 MySQL的错误率。 redis错误率 Redis的错误率。“redis错误率”指标列默认不展示,可单击右上角,通过选中或取消选中“redis错误率”指标项前的单选框,自定义该列的展示与隐藏。 httpclient错误率
环境类型 环境的类型。目前支持环境类型有四种:开发、测试、预发布和生产。 主机类型 主机的类型。目前支持的主机类型有:LINUX和WINDOWS。 环境名称 环境的名称。 支持输入2~64个字符,只能由大小写字母、数字、下划线、中划线、点和中文字符组成。 区域 环境的区域,请从下拉列表中选择。
Key)包含访问密钥ID(AK)和秘密访问密钥(SK)两部分,是您在华为云APM服务的长期身份凭证,JavaAgent携带密钥ID(AK)上报数据,华为云通过该AK识别访问用户的身份,通过SK对请求数据进行签名认证,用于确保上报请求的机密性、完整性和请求者身份的正确性。 登录AOM 2.0控制台。 在左侧导航栏选择“APM配置
通过Debugging诊断线程 线程分析支持显示该应用的所有线程和查看线程的堆栈信息。通过Debugging诊断线程,帮助用户快速定位耗时较高的线程。 约束与限制 由于线程分析获取方法以及对象的实时参数,因此线程的状态等相关信息可能会产生变化。 通过Debugging诊断线程 登录AOM
r”。 单击“新增PodMonitor”,在弹出的对话框中输入PodMonitor的相关参数信息,然后单击“确定”。 采集规则YAML配置样例如下,样例的指标采集的周期是30秒,所以等待大概30秒后才能在AOM的界面上查看到上报的指标: apiVersion: monitoring
起文件夹和管理的功能,子应用为全局概念,当前最多支持三层子应用,子应用格式为:sub1/sub2/sub3 选填 APM_ENV env 环境名称。一个组件由于部署不同的配置参数,会形成的多个环境。 选填 APM_ENV_TAG envTag 环境标签,是在环境上的一个属性,多个
通过设置模板中全局变量projectId、region、domainName和agencyName,将AOM系统监控数据呈现在大屏页面中。 获取全局变量的值。 将鼠标放在模板上,单击“播放”。 在跳转的页面中,获取projectId、region、domainName和agencyName的值。 例如,跳转页面的UR
行业竞争激烈,用户对服务的体验要求高,尤其是用户体验成为互联网企业的核心竞争力。如何能获取用户的真实体验感受,减少流失率,提升用户转化率成为企业的难题。 解决方案 AOM提供应用体验管理能力,实时分析应用事务从用户请求、服务器到数据库,再到服务器、用户请求的完整过程,实时感知用户对应用的满意度,
户提供通用云服务的Region;专属Region指只承载同一类业务或只面向特定租户提供业务服务的专用Region。 详情请参见区域和可用区。 可用区(AZ,Availability Zone) 一个AZ是一个或多个物理数据中心的集合,有独立的风火水电,AZ内逻辑上再将计算、网络、
输入过滤属性和对应的过滤值,指定过滤条件来选择实例。 支持设置多个过滤条件,搜索时多个过滤属性之间为“与”的关系。 该方式对未来新增的实例也生效。 标签 设置标签键和对应的标签值,指定一个或多个标签来选取实例。 选择多个标签时,按照“与”的关系搜索。 该方式对未来新增的实例也生效。 从CMDB中选择
CPU使用率(aom_container_cpu_usage) 该指标用于统计测量对象的CPU使用率。服务实际使用的与限制的CPU核数量比率。 0~100 百分比(%) 磁盘读取速率(aom_container_disk_read_kilobytes) 该指标用于统计每秒从磁盘读出的数据量。 ≥0