已找到以下 27 条记录
AI智能搜索
产品选择
应用运维管理 AOM
没有找到结果,请重新输入
产品选择
应用运维管理 AOM
在搜索结果页开启AI智能搜索
开启
产品选择
没有找到结果,请重新输入
  • 创建AOM指标告警规则 - 应用运维管理 AOM

    clusterName,表示将指标按集群名称分组,然后将分组后的指标按平均值运算并展示在当前图表中。 检测规则 指标告警的检测规则,由统计方式(平均值、最小值、最大值、总计、样本个数)、判断条件(≥、≤、>、<)和阈值组成。例如,检测规则设置为“平均值>10”,表示指标的平均值大于已设置的阈值10时,生成指标告警。

  • 创建AOM仪表盘 - 应用运维管理 AOM

    如果您是创建的是新版仪表盘,图表的配置参数说明请参见指标数据类图表。 统计方式 指标数据按照所设置的统计方式进行聚合,包括:平均值、最小值、最大值、总计、样本个数。 统计时段 指标数据按照所设置的时间范围进行聚合。设置时间范围的方式包括:近30分钟、近1小时、近6小时、近1天、近1周、自定义时间段。

  • 基础指标:CSE指标 - 应用运维管理 AOM

    ry_open envoy_cluster_ejections_overflow 驱逐达到最大驱逐阈值的次数 主机因请求异常率达到最大驱逐比例而被限制驱逐的次数。 ≥0 次 envoy_cluster_ejections_consecutive_5xx 连续5xx 驱逐次数 主机因连续返回5xx导致的驱逐次数。

  • 与其他服务的关系 - 应用运维管理 AOM

    云容器引擎服务(Cloud Container Engine,简称CCE)是提供高性能可扩展的容器服务,基于云服务器快速构建高可靠的容器集群,深度整合网络和存储能力,兼容Kubernetes及Docker容器生态。帮助您轻松创建和管理多样化的容器工作负载,并提供容器故障自愈,监控日志采集,自动弹性扩容等高效运维能力。

  • 与其他服务的关系 - 应用运维管理 AOM

    云容器引擎服务(Cloud Container Engine,简称CCE)是提供高性能可扩展的容器服务,基于云服务器快速构建高可靠的容器集群,深度整合网络和存储能力,兼容Kubernetes及Docker容器生态。帮助您轻松创建和管理多样化的容器工作负载,并提供容器故障自愈,监控日志采集,自动弹性扩容等高效运维能力。

  • 基础指标:Modelarts指标 - 应用运维管理 AOM

    DCGM_FI_PROF_SM_OCCUPANCY SM Occupancy 表示在一个时间间隔内,驻留在SM上的线程束与该SM最大可驻留线程束的比例。 该值表示一个时间间隔内的所有SM的平均值。 占用率越高不代表GPU使用率越高。只有在GPU内存带宽受限的工作负载(DCGM_FI_PR

  • 创建AOM仪表盘(新版) - 应用运维管理 AOM

    如果您是创建的是新版仪表盘,图表的配置参数说明请参见指标数据类图表。 统计方式 指标数据按照所设置的统计方式进行聚合,包括:平均值、最小值、最大值、总计、样本个数。 统计时段 指标数据按照所设置的时间范围进行聚合。设置时间范围的方式包括:近30分钟、近1小时、近6小时、近1天、近1周、自定义时间段。