正在生成
详细信息:
检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
集数据。 说明: 当采集插件为中间件插件时,只能选择一个主机。 插件采集配参 Exporter地址:安装Exporter的主机IP地址和端口号。格式为IP:Port,例如:10.0.0.1:9100。 指标维度 Exporter名称:自定义exporter名称。 单击按钮,选择“
和可靠性。 表1 AOM服务可靠性架构 可靠性方案 简要说明 AZ内实例容灾 单AZ内,AOM实例通过多实例方式实现实例容灾,快速剔除故障节点,保障实例持续提供服务。 多AZ容灾 AOM支持跨AZ容灾,当一个AZ异常时,不影响其他AZ下的实例持续提供服务。 多集群容灾 AOM支持
GPU使用率。 0~1.0 占比(Fraction) DCGM_FI_PROF_PIPE_TENSOR_ACTIVE Tensor Activity 表示Tensor(HMMA/IMMA) Pipe处于Active状态的周期分数。 该值表示一个时间间隔内的平均值,而不是瞬时值。 较高的值表示Tensor
component_id String 组件Id create_time String 创建时间 creator String 创建者 description String 描述 env_id String 环境Id env_name String 环境名称 env_tags Array
&updateTimeEvent2alarmRuleBody, CreateTime: int64(1669276304343), Description: &descriptionEvent2alarmRuleBody, Name: "scl_test_event", UserId: "xxxxxxx"
在CCE容器监控场景下,AOM的采集器(ICAgent)必须以特权容器的方式运行,请合理的评估特权容器的安全风险,谨慎识别您的容器业务场景。如:节点对外提供的业务属于逻辑多租的共享容器方式,建议采用开源Prometheus等工具进行监控,避免使用AOM的采集器监控您的业务。
_id}/{cluster_id}/{namespace}/agents 响应示例 状态码: 200 OK 请求响应成功。 [ { "ip" : "10.**.**.13", "agentId" : "7b****93-7**1-4**e-8**b-3d****35**84"
OM 2.0控制台中“主机组管理”功能由云日志服务LTS提供。用户可在AOM 2.0控制台界面操作,也可登录LTS控制台界面操作。 需要先购买云日志服务的相关功能,才可以使用AOM 2.0控制台中“主机组管理”功能。 表1 功能说明 功能名称 功能说明 AOM 2.0控制台入口 LTS控制台入口
在CCE容器监控场景下,AOM的采集器(ICAgent)必须以特权容器的方式运行,请合理的评估特权容器的安全风险,谨慎识别您的容器业务场景。如:节点对外提供的业务属于逻辑多租的共享容器方式,建议采用开源Prometheus等工具进行监控,避免使用AOM的采集器监控您的业务。
&updateTimeEvent2alarmRuleBody, CreateTime: int64(1669276173427), Description: &descriptionEvent2alarmRuleBody, Name: "scl_test_event", UserId: "xxxx"
告警是否启用 alarmActions 否 Array - 告警动作 alarmAdvice 否 String - 告警建议 alarmDescription 否 String - 阈值规则描述 insufficientDataActions 否 Array - 数据不足动作 okActions
可以查看默认20分钟内该通信协议的趋势图。 单击列表中“url”列的url地址,可以查看对应url的调用详情。 选中某一个时间节点时,展示该时间节点下,错误次数、关闭连接数、流量、平均响应时间(ms)、调用次数以及创建连接数。 设置时间范围,查看已设时间范围内的数据。可通过如下两种方式设置时间范围:
"containerName", "nameSpace", "namespace", "netDevice", "nodeIP", "nodeName", "node_ip", "pailId", "pailName", "period_expr", "podID", "podName"
应用概览 应用概览页面,展示应用维度的指标数据,包含核心指标,url调用次数,url平均响应时间等。同时支持“购买特惠包”以及“接入应用”。 查看应用概览 登录AOM 2.0控制台。 在左侧导航栏选择“应用监控 > 应用概览”,展示应用维度的指标数据,详细指标说明请参见表1。 图1
告警规则。 单击“修改资源对象”可修改已选择的资源对象。 命令行输入:提供手动输入和系统自动填充两种输入方式。 手动输入:已知指标的名称、IP等相关信息,且对Prometheus格式较了解时,可直接手动输入相关的Prometheus格式命令行。 例如查询主机CPU使用率,可输入如
aomId,如果为空则不显示 app_id String 应用ID create_time String 创建时间 creator String 创建人 description String 描述 display_name String 应用名称 eps_id String 企业项目id modified_time
络能通的安装机。 ICAgent安装成功后,后续的心跳和注册都失败,代理机网络不通,如何解决? 答:在目标机器上执行“telnet 代理机ip”,检查代理机和目标机器间的网络连通性。 安装ICAgent时需要开放8149、8102、8923、30200、30201和80端口,安装完成后80端口是否可以关闭?
/{project_id}/alert/action-rules/{rule_name} {aom_endpoint}信息请通过地区和终端节点获取。 响应示例 { "create_time": 1665991889597, "notification_template": "aom
AOM使用流程 开通AOM(必选) 创建子账号并设置权限(可选) 购买云主机(必选) 安装ICAgent(必选) ICAgent是AOM的采集器,用于实时采集指标、日志和应用性能数据。 如果是通过CCE购买的云主机,购买后自动安装ICAgent。 配置应用发现规则(可选) 满足内置发
checkType为scope时checkMode填equals,checkContent格式为节点ID数组["hostId1”,”hostId2”],表示规则仅会在这些节点上生效(如果不指定节点范围,规则将下发到该项目所有的节点)。 规则发现部分,数组中有多个对象时表示需要同时满足所有条件的进程才会被匹配到。详见表4。