检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
tus_allocatable_cpu_cores指标监控了Kubernetes集群中每个节点的可分配CPU核心数,假设您的集群中包含3个节点,则采样点分布于3条不同的时间线上。若每个节点的采样周期为15s,则一分钟的时间范围内,上报的采样点数据的总条数为:3*(60/15)=12(条),如下图所示:
ICAgent的状态由“升级中”变为“运行”时,表示升级成功。 如果升级后,界面显示ICAgent状态异常或者其它升级失败场景,请直接登录节点使用安装命令重新安装ICAgent即可(覆盖式安装,无需卸载操作)。 告警规则升级 登录AOM 1.0控制台。 在左侧导航栏中选择“告警 >
和可靠性。 表1 AOM服务可靠性架构 可靠性方案 简要说明 AZ内实例容灾 单AZ内,AOM实例通过多实例方式实现实例容灾,快速剔除故障节点,保障实例持续提供服务。 多AZ容灾 AOM支持跨AZ容灾,当一个AZ异常时,不影响其他AZ下的实例持续提供服务。 多集群容灾 AOM支持
和可靠性。 表1 AOM服务可靠性架构 可靠性方案 简要说明 AZ内实例容灾 单AZ内,AOM实例通过多实例方式实现实例容灾,快速剔除故障节点,保障实例持续提供服务。 多AZ容灾 AOM支持跨AZ容灾,当一个AZ异常时,不影响其他AZ下的实例持续提供服务。 多集群容灾 AOM支持
应用管理 应用管理的使用说明 创建应用 添加节点 添加环境 关联资源 父主题: 应用资源管理
将Prometheus数据接入到AOM。具体的操作步骤如下: 创建Prometheus实例。 根据需要参考对应的创建操作,具体请参见: Prometheus实例 for ECS Prometheus实例 for CCE Prometheus 通用实例 将原生Prometheus的指标通过Remote Write地址上报到AOM服务端。具体请参见
可以查看默认20分钟内该通信协议的趋势图。 单击列表中“url”列的url地址,可以查看对应url的调用详情。 选中某一个时间节点时,展示该时间节点下,错误次数、关闭连接数、流量、平均响应时间(ms)、调用次数以及创建连接数。 设置时间范围,查看已设时间范围内的数据。可通过如下两种方式设置时间范围:
、资源以及请求条件等。基于策略的授权是一种更加灵活的授权方式,能够满足企业对权限最小化的安全管控要求。例如:针对ECS服务,管理员能够控制IAM用户仅能对某一类云服务器资源进行指定的管理操作。多数细粒度策略以API接口为粒度进行权限拆分,AOM支持的API授权项请参见策略和授权项说明。
工具市场会按照场景分类展现各功能的工具卡片,目前支持以下类型: 通用场景:脚本管理、文件管理。 云服务场景:启动ECS实例、关闭ECS实例、重启RDS实例、修改ECS非管理员密码、重启CCE工作负载。 软件部署:暂时为空。 日常巡检:暂时为空。 故障处理:清理磁盘空间。 卡片管理
parent_node String 父亲节点的名称。 最小长度:1 最大长度:64 category String 节点类型。 最小长度:1 最大长度:32 description String 节点描述。 最小长度:1 最大长度:1024 id String 节点id 最小长度:1 最大长度:64
Exporter已部署成功。有以下三种方法进行验证: 登录集群节点执行如下任意一种命令: curl http://{集群IP}:9114/metrics curl http://{集群任意节点私有IP}:30921/metrics 访问地址:http://{集群任意节点的公网IP}:30921/metrics。
新增应用 删除应用 查询应用详情 修改应用 新增组件 删除组件 查询组件详情 修改组件 创建环境 删除环境 查询环境详情 修改环境 查询绑定在节点上的资源列表 根据应用名称查询应用详情 根据环境名称查询环境详情 根据组件名称查询组件详情 新增子应用 删除子应用 修改子应用 父主题: API
参数 参数类型 描述 node_id String 流程节点ID。 最小长度:1 最大长度:64 begin_time Long 节点开始执行时间。 最小值:0 最大值:9999999999999 end_time Long 节点执行结束时间。 最小值:0 最大值:9999999999999
单击页面右上角“返回旧版”,进入“日志搜索”页签。 单击“日志文件”页签。 查看日志文件 日志路径 AOM支持虚机(这里的虚机指操作系统为Linux的弹性云服务器)日志采集,即采集您自定义的日志文件并展现在AOM界面中,以供您检索。使用该功能前首先要配置日志采集路径。 登录AOM 2.0控制台。
Exporter已部署成功。有以下三种方法进行验证: 登录集群节点执行如下任意一种命令: curl http://{集群IP}:9114/metrics curl http://{集群任意节点私有IP}:30921/metrics 访问地址:http://{集群任意节点的公网IP}:30921/metrics。
事件根因分析 事件根因分析服务提供异常事件快速根因定位分析的功能,根因分析基于事件巡检看护的服务历史数据,根据服务指标、调用链数据进行下钻分析,细粒度定位根因。 功能入口 登录AOM 2.0控制台。 左侧导航栏单击“智能洞察(BETA)”。 在页面右上角设置应用的时间范围。可通过如下两种方式设置时间范围:
X 120 x 25 EM(连接介质中断) 57 9 89 Y 121 y 26 SUB(替换) 58 : 90 Z 122 z 27 ESC(跳出) 59 ; 91 [ 123 { 28 FS(文件分割符) 60 < 92 / 124 | 29 GS(组群分隔符) 61 = 93
ORIGIN 虚拟机运行的时间 apm_JVMInfo_info_vmName_ORIGIN 虚拟机的名字 apm_JVMInfo_info_vmVendor_ORIGIN 虚拟机的供应商 apm_JVMInfo_info_vmVersion_ORIGIN 虚拟机的版本 单击“立
checkType为scope时checkMode填equals,checkContent格式为节点ID数组["hostId1”,”hostId2”],表示规则仅会在这些节点上生效(如果不指定节点范围,规则将下发到该项目所有的节点)。 规则发现部分,数组中有多个对象时表示需要同时满足所有条件的进程才会被匹配到。详见表4。
监控。 针对虚机场景:虚机、虚机上的自建中间件等资源指标存储在Prometheus for ECS类型的实例中。 如果需要关联分析,需要先在AOM中创建Prometheus for ECS实例,并在AOM的接入中心安装node-exporter或自建中间件。 配置完成后,单击“保存”。