检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
1个主机状态图表最多可添加10个主机。 1个组件状态图表最多可添加10个组件。 指标 指标数据 基础规格:指标数据在数据库中最多保存7天。 专业规格:指标数据在数据库中最多保存30天。 指标总量 单租户总指标量不超过40W 小规格总指标量不超过10W 指标项 资源(例如,集群、组件、主机等)被删除后,其关联的指标项在数据库中最多保存30天。
设置阈值规则。 设置规则的基本信息:在“规则名称”文本框中输入阈值规则名称,并根据需要填写规则的描述信息。 设置规则的详细信息。 设置“规则类型”为“阈值规则”。 选择监控对象。通过以下两种方式选择: 选择资源对象:单击“选择资源对象”,通过“按资源添加”或“按指标维度添加”方式在
该值表示一个时间间隔内的平均值,而不是瞬时值。 较高的值代表FP16 Cores有较高的利用率。 该值为 1 (100%) 表示在整个时间间隔内上每两个周期(Volta类型卡为例)执行一次FP16指令。 假设该值为0.2(20%),可能有如下情况: 在整个时间间隔内,有20%的SM的FP16 Core以100%的利用率运行。
应用概览”,展示应用维度的指标数据,详细指标说明请参见表1。如果“应用概览”展示的指标,不在表1中,可以参见指标概览。 图1 查看应用概览 表1 应用概览指标说明 类型 指标名称 说明 概览 url调用次数 URL的调用次数。 url平均响应时间 URL在采集周期内的平均响应时间。 url错误率 URL的错误率。
登录AOM控制台,在左侧导航栏中选择“告警 > 阈值规则”,单击右上角的“添加阈值”。 自定义阈值规则。 选择资源:在“阈值名称”文本框中输入阈值规则名称,选择资源类型,在资源树上选择待监控的资源,单击“下一步”。 资源树上最多可选择100个资源。 当选择多个资源时,创建操作完成后,会创建多个单条阈值规则
和最大,这5个GC暂停时间百分位数。然后prometheus Go客户端根据返回的GC暂停时间百分位数、以及NumGC和PauseTotal变量创建摘要类型指标。 node_load5 节点5分钟CPU负载 node_filefd_allocated 已分配的文件描述符 node_exporter_build_info