检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
2(20%),可能有如下情况: 在整个时间间隔内,有20%的SM的Tensor Core以100%的利用率运行。 在整个时间间隔内,有100%的SM的Tensor Core以20%的利用率运行。 在整个时间间隔的1/5时间内,有100%的SM上的Tensor Core以100%利用率运行。 其他组合模式。
中“全部实例”的“URL监控”信息。 图1 接口调用 在接口调用页签选择您想要查看的“实例名称”和“监控项”,可以查看该实例在对应采集器下的不同指标集下的应用监控数据。 您还可以根据需要执行以下操作: 设置时间范围,查看已设时间范围内的数据。您可以使用AOM预定义的时间标签,例如
您可以进入AOM的容器监控页面,在工作负载的监控视图里查看服务在各个时间的状态值,0代表正常,非0代表异常。 父主题: 常见使用问题
基础设施监控 通过helm部署pod后,AOM无法查找到工作负载
接入AOM 接入AOM总览 管理采集器底座UniAgent 业务层接入AOM 应用层接入AOM 中间件及自定义插件接入AOM 运行环境接入AOM 云服务接入AOM 开源监控系统接入AOM 管理日志接入
服务指标及其维度 服务指标是由实例指标汇聚而来的,其指标维度与实例指标维度相同。 实例指标详见:实例指标及其维度。 父主题: 指标总览
表明服务端能被请求访问到,但是不能理解用户的请求。 503 ServiceUnavailable 被请求的服务无效。 建议直接修改该请求,不要重试该请求。 错误码 表7 错误码 错误码 错误信息 处理措施 SVCSTG_AMS_4000101 Projectid is left blank. 请检查对应的参数是否符合要求。
接入AOM(新版) 接入AOM总览 管理采集器底座UniAgent 业务层接入AOM 组件层接入AOM 中间件接入AOM 运行环境接入AOM 云服务接入AOM API开源协议及其他组件接入AOM 管理指标接入和日志接入
在页面左上角选择需要统计的Prometheus实例。 在页面右上角设置该Prometheus实例上报的资源信息的统计条件。 设置时间范围。您可以使用AOM预定义的时间标签,例如近1小时、近6小时等,也可以自定义时间范围,最长可设置为30天。 建议将指标查询的时间范围设置为大于1小时。
UniAgent管理 下发批量安装UniAgent任务 下发批量升级UniAgent任务 查询UniAgent主机列表信息 父主题: API
通过事件类告警规则,简化告警通知,快速识别服务的某一类资源使用问题并及时解决。 系统支持创建的阈值规则和事件类告警规则总计不能超过1000条,即创建的告警规则数量不能超过1000条。如果系统中的告警规则数量已达到上限,请删除不需要的告警规则后重新创建。 父主题: 告警规则(新版)
查看组件调用链监控项 在企业微服务之间调用复杂的场景下,Agent会抽样一些请求,拦截对应请求及后续一系列的调用信息。本章节主要介绍如何查看某个组件的调用链情况。 查看组件调用链 登录AOM 2.0控制台。 在左侧导航栏选择“应用监控 > 组件列表”,进入组件列表页面。 在左侧“
表明服务端能被请求访问到,但是不能理解用户的请求。 503 ServiceUnavailable 被请求的服务无效。 建议直接修改该请求,不要重试该请求。 错误码 表6 错误码 错误码 错误信息 处理措施 SVCSTG_AMS_4000109 Invalid project ID. 请检查对应的参数是否符合要求。
废弃一个指标:选择一个指标,单击操作列的。 批量废弃指标:选中一个或多个指标前的复选框,在弹出框中选择“废弃”,可以废弃一个或多个指标。单次废弃指标最多支持废弃100个指标。 如何恢复已废弃的自定义指标? 当用户需要重新使用某些自定义指标时,可以通过该功能将原来废弃的自定义指标恢复使用,指标恢
及对象实时参数。方便开发人员从实时的远程应用程序中获取调试信息,而无需重新启动应用程序,也不会阻止它并导致服务停机。 约束与限制 为了应用运行稳定,强烈建议您按照要求升级JDK版本,在低版本的JDK上使用Debugging诊断功能,存在应用崩溃的风险。 Debugging诊断仅针对白名单用户开放。
UniAgent:UniAgent的全称是统一数据采集Agent,主要是作为云服务运维系统的底座,为AOM提供指令下发,如脚本下发和执行,用于插件集成(ICAgent、CES、telescope等)并维护其状态。UniAgent对外功能主要是为AOM服务提供中间件指标采集和自定义指标采集的能力。 Un
口,查询当前监控的时间序列名称的时间序列维度列表。取值范围:数组不能为空,同时数组中任何一个dimension对象name和value属性的值也不能为空。 metricName 是 String 指标名称。名称长度取值范围为1~255个字符。取值范围:AOM提供的基础指标,cpu
Integer topic中订阅者的状态。 0:主题已删除或主题下订阅列表为空。 1:主题下的订阅列表存在状态为“已订阅”的订阅信息。 2:主题下的订阅信息状态处于“未订阅”或“已取消”。 枚举值: 0 1 2 topic_urn String Topic的唯一的资源标识。 最小长度:1 最大长度:100
Integer topic中订阅者的状态。 0:主题已删除或主题下订阅列表为空。 1:主题下的订阅列表存在状态为“已订阅”的订阅信息。 2:主题下的订阅信息状态处于“未订阅”或“已取消”。 枚举值: 0 1 2 topic_urn String Topic的唯一的资源标识。 最小长度:1 最大长度:100
search 否 String 模糊查询匹配字段,可以为空。如果值不为空,可以模糊匹配metadata字段中的必选字段的值。 sort 否 sort object 返回列表的排序方式,可以为空。 metadata_relation 否 Array of RelationModel objects