检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
在线推理阶段:当用户单击事件卡片,进入到根因分析页面时,会触发根因分析模型的在线推理任务,在线推理任务会基于上一步离线训练完的调用链模型与事件发生期间的异常调用进行模式对比,分析事件根因,进行快速定位。 父主题: 智能洞察(BETA)
设置告警通知策略。告警通知策略有两种方式,请根据需要选择: 直接告警:满足告警条件,直接发送告警。 需要设置是否启用告警行动规则。启用后,系统根据关联SMN主题与消息模板来发送告警通知。如果现有的告警行动规则无法满足需要,可单击“新建告警行动规则”添加。设置告警行动规则的操作详见创建告警行动规则。 图3
“max” “min” “sum” 枚举值: by avg max min sum metric_statistic_method String 当配置方式为全量指标时可选择的指标运算方式。 “single”:单个指标进行运算 “mix”:多个指标进行混合运算 枚举值: single mix
规则的匹配条件。串行条件和并行条件的最大数量限制为10。 数组长度:1 - 10 mute_config 是 MuteConfig object 规则的生效时间配置 name 是 String 规则名称。名称包含大小写字母、数字、特殊字符(_)、不能以下划线开头或结尾,最大长度为100。 最小长度:1
规则的匹配条件。串行条件和并行条件的最大数量限制为10。 数组长度:1 - 10 mute_config 是 MuteConfig object 规则的生效时间配置 name 是 String 规则名称。名称包含大小写字母、数字、特殊字符(_)、不能以下划线开头或结尾,最大长度为100。 最小长度:1
≥0 核(Core) CPU使用率(aom_process_cpu_usage) 该指标用于统计测量对象的CPU使用率。服务实际使用的与申请的CPU核数量比率。 0~100 百分比(%) 句柄数(aom_process_handle_count) 该指标用于统计测量对象使用的句柄数。
方便用户分析资源使用情况。 前提条件 服务已接入可观测Prometheus 监控。具体操作,请参见:管理Prometheus实例。 约束与限制 “资源消耗”页面暂不支持查看实例类型为“Prometheus for 云服务”和“Prometheus for 多账号聚合”的实例上报的基础指标和自定义指标数量。
当前运维可观测大屏预置了基础版的业务指标监控大屏模板。业务指标监控大屏统一接入了业务告警、前端性能监控、集群以及云服务指标。通过对业务指标的实时监控,实现业务的实时观察。 约束与限制 如果需要在AOM控制台中使用AstroCanvas的功能,需要提前获取AstroCanvas的相关权限,详情请参见AstroCanvas权限管理。
固定时间:仅在指定的时间段执行屏蔽告警通知的操作。 周期时间:根据设置的时间周期循环执行屏蔽告警通知的操作。 时区/语言 告警通知被屏蔽的时区/语言,默认为用户首选项配置的时区/语言,可根据需要修改。 设置完成后,单击“立即创建”。 更多静默规则操作 静默规则创建完成后,您还可以执行表2中操作。 表2 相关操作
1。当开始时间与结束时间都设置为-1时,系统会将结束时间设置为当前时间UTC毫秒值,并按(endTimeInMillis - durationInMinutes * 60 * 1000)计算开始时间。如:-1.-1.60(表示最近60分钟) 约束与限制:单次请求中,查询时长与周期需要满足以下条件:
描述 type String 节点类型。 最小长度:1 最大长度:32 configuration Map<String,Object> 配置信息。 表8 Parameter 参数 参数类型 描述 param_name String 参数名称。 param_type String
≥0 核(Core) CPU使用率(aom_container_cpu_usage) 该指标用于统计测量对象的CPU使用率。服务实际使用的与限制的CPU核数量比率。 0~100 百分比(%) 磁盘读取速率(aom_container_disk_read_kilobytes) 该指标用于统计每秒从磁盘读出的数据量。
应用创建完成后,单击“继续创建应用树节点”。 图1 创建子应用 在左侧导航栏中选择“应用管理”,进入“应用管理”页面。在左侧树节点的应用名称后,单击。 图2 应用树 配置节点信息,设置子节点类型和名称等信息。 图3 添加节点 表1 节点设置参数说明 参数类别 参数名称 说明 组件设置相关参数 组件名称 组件的名称。
占比(Fraction) DCGM_FI_PROF_SM_OCCUPANCY SM Occupancy 表示在一个时间间隔内,驻留在SM上的线程束与该SM最大可驻留线程束的比例。 该值表示一个时间间隔内的所有SM的平均值。 占用率越高不代表GPU使用率越高。只有在GPU内存带宽受限的工作
为:主机列表->主机详情。详情页面包含了当前主机上所发现的所有实例,显卡,网卡,磁盘,文件系统等信息。 应用自动发现 您在主机上部署应用后,在主机上安装的ICAgent将自动收集应用信息,包括进程名称,组件名称,容器名称,Kubernetes pod名称等,自动发现的应用在界面上
1。当开始时间与结束时间都设置为-1时,系统会将结束时间设置为当前时间UTC毫秒值,并按(endTimeInMillis - durationInMinutes * 60 * 1000)计算开始时间。如:-1.-1.60(表示最近60分钟) 约束与限制:单次请求中,查询时长与周期需要满足以下条件:
1。当开始时间与结束时间都设置为-1时,系统会将结束时间设置为当前时间UTC毫秒值,并按(endTimeInMillis - durationInMinutes * 60 * 1000)计算开始时间。如:-1.-1.60(表示最近60分钟) 约束: 单次请求中,查询时长与周期需要满足以下条件:
“max” “min” “sum” 枚举值: by avg max min sum metric_statistic_method String 当配置方式为全量指标时可选择的指标运算方式。 “single”:单个指标进行运算 “mix”:多个指标进行混合运算 枚举值: single mix
"hint" : "", "id" : "xxxxxxxxxx", "param_group" : "ecs_instance", "param_name" : "xxxxx", "param_type" : "HOST"
英文字母、数字、下划线、中划线、点;应用唯一标识与显示名称至少填写其一 display_name 否 String 实体的显示名称;字符集长度2-64,仅支持字符集:中文字符、英文字母、数字、下划线、中划线、点;应用唯一标识与显示名称至少填写其一 请求参数 表2 请求Header参数