检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
概述 AOM提供告警规则设置功能。通过告警规则可对服务设置事件条件,对资源的指标设置阈值条件,或对资源的日志设置搜索分析、关键词统计以及SQL查询等条件。当服务的资源数据满足事件条件时产生事件类告警。当资源的指标数据满足阈值条件时产生阈值告警,当没有指标数据上报时产生数据不足事件。当
日志 查询日志 父主题: API
Prometheus实例 卸载托管Prometheus实例 查询Prometheus实例 新增Prometheus实例 创建Prometheus实例的预聚合规则 获取Prometheus实例调用凭证 父主题: API
VPCEP控制台,进入终端节点页面。 单击“购买终端节点”。 在购买终端节点页面,选择终端节点所在的区域,“服务类别”选择“云服务”,在“选择服务”下方查找并选择AOM的云服务,并且勾选“创建内网域名”,选择终端节点所在的虚拟私有云和子网,其他参数默认设置,更多操作请参考购买终端节点。 设置完
M委托或信任委托)对华为云资源的访问范围。目前IAM支持两类授权,一类是角色与策略授权,另一类为身份策略授权。 两者有如下的区别和关系: 表1 两类授权的区别 名称 核心关系 涉及的权限 授权方式 适用场景 角色与策略授权 用户-权限-授权范围 系统角色 系统策略 自定义策略 为主体授予角色或策略
据传输给业务计算层。 数据存储:运维数据经过AOM后端服务的处理,将数据写入到数据库中,其中Cassandra用来存储数据,Redis用来查询缓存,ETCD用来存储AOM的配置数据,ElasticSearch用来存储资源、日志、告警和事件。 业务计算层 AOM提供告警、日志、监控
Occupancy 表示在一个时间间隔内,驻留在SM上的线程束与该SM最大可驻留线程束的比例。 该值表示一个时间间隔内的所有SM的平均值。 占用率越高不代表GPU使用率越高。只有在GPU内存带宽受限的工作负载(DCGM_FI_PROF_DRAM_ACTIVE)情况下,更高的占用率表示更有效的GPU使用率。
在页面右侧的下拉列表框中选择“集群:xxx”或“其他:用户自定义接入主机”。 升级ICAgent。如果在步骤2中下拉列表框中选择的是“集群:xxx”,则单击“升级ICAgent”。可实现整个集群的升级操作,即在ICAgent列表下的所有主机一次性完成升级。如果在步骤2中下拉列表框中选择的
请参见如何调用API。 URI PUT /v1/components/{component_id} 表1 路径参数 参数 是否必选 参数类型 描述 component_id 是 String 组件id 请求参数 表2 请求Header参数 参数 是否必选 参数类型 描述 X-Auth-Token 是
版本统计表、设备型号统计表、地域统计表、上网方式统计表以及运营商统计表。 登录AOM 2.0控制台。 在左侧导航栏选择“App监控 > 终端设备”。 登录APM控制台。 在左侧导航栏选择“App监控 > 终端设备”。 终端设备 自定义上报 APM App监控支持用户自定义监控。 登录AOM
scale_out_k8s、scale_out_vm表示扩容。 scale_in_k8s、scale_in_vm表示缩容。 scale_set_k8s、scale_set_vm表示设置应用实例个数。 说明: 含有k8s的表示容器应用,含有vm的表示进程应用。 parameters 是 参见表6 - 包含扩缩容的实例数
ture。 XX+存在:表示告警的metedata字段中存在XX参数。例如设置为:告警源+存在,表示筛选出metedata字段中包含告警源信息的告警。 XX+正则+表达式:表示根据正则表达式匹配告警的XX参数的值。例如设置为:资源类型+正则+host*,表示筛选出metedata
公共响应消息头 响应的消息报头在大多数情况下含有下面报头: 表1 响应消息头 名称 描述 示例 Date HTTP协议标准报头。表示消息发送的时间,时间的描述格式由rfc822定义。 Mon,12 Nov 2007 15:55:01 GMT Server HTTP协议标准报头。包含了服务器用来处理请求的软件信息。
告警行动规则与SMN主题、消息模板关联的类型,请从下拉列表中选择。当前只支持“通知”类型。 主题 SMN主题,请从下拉列表中选择。 若没有合适的主题,请单击主题选择栏下方“创建主题”,在SMN界面创建。 消息模板 通知消息的模板,请从下拉列表中选择。 若没有合适的消息模板,请单击消息模板选
status) 该指标用于统计主机上磁盘的读写状态。 0、1 0表示读写 1表示只读 无 磁盘使用率(aom_node_disk_usage) 已使用的磁盘空间占总的磁盘空间容量百分比。 0~100 百分比(%) 表2 文件系统指标维度 维度 说明 clusterId 集群ID。
图1 创建抑制规则 表1 设置抑制规则 类别 参数名称 说明 - 规则名称 抑制规则的名称。名称只能由大小写字母、数字、下划线组成,且不能以下划线开头和结尾,最多不能超过100个字符。 描述 抑制规则的描述。最多不能超过1024个字符。 抑制规则 根源告警 根源告警表示产生抑制的某类特定告警。
/v2/{project_id}/alert/mute-rules 表1 路径参数 参数 是否必选 参数类型 描述 project_id 是 String 租户从IAM申请到的projectid,一般为32位字符串。 最小长度:32 最大长度:32 请求参数 表2 请求Header参数 参数 是否必选 参数类型
创建告警行动规则 表1 告警行动规则参数说明 参数名称 说明 行动规则名称 行动规则的名称,只能由数字、字母、下划线和中划线组成,且不能以下划线、中划线开头和结尾,长度为1到100个字符。 描述 行动规则的描述。 行动规则类型 告警行动规则与SMN主题、消息模板关联的类型,请从下拉列表中选择。当前只支持“通知”类型。
/v2/{project_id}/alert/action-rules 表1 路径参数 参数 是否必选 参数类型 描述 project_id 是 String 租户从IAM申请到的projectid,一般为32位字符串。 最小长度:32 最大长度:32 请求参数 表2 请求Header参数 参数 是否必选 参数类型
磁盘指标及其维度 表1 磁盘指标 指标名称 指标含义 取值范围 单位 磁盘读取速率(aom_node_disk_read_kilobytes) 该指标用于统计每秒从磁盘读出的数据量。 ≥0 千字节/秒(kB/s) 磁盘写入速率(aom_node_disk_write_kilobytes)