检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
输入搜索条件或关键字,从CMDB服务中选取实例。当前节点类型支持两种选择方式,静态IP和动态节点。 静态IP:可选中指定CMDB应用下的ECS实例。 动态节点:选择CMDB应用中的节点,从而动态获取节点下的ECS实例。该方式对节点下未来新增的实例也生效。 如需设置审批配置、执行策略
tigrade node_temperature 节点温度 Atlas 500小站节点温度,由用户调用edgecore接口上报。 ≥0 摄氏度(℃) node_power node_power 节点功率 Atlas 500小站节点功率,由用户调用edgecore接口上报。 ≥0 瓦(W)
日志文件轮转速度过快,如1秒轮转一次。 系统安全设置或syslog自身原因导致无法转发日志。 容器运行时间过短,例如小于30s。 单节点总日志产生速度过快,超过了单节点网络发送带宽或日志采集速度,建议单节点总日志产生速度<5M/s。 日志丢弃 当单行日志长度超过1024字节时,此行会被丢弃。 日志重复 当采集
十种指标、告警与日志关联分析,快速锁定问题根源,保障业务顺畅运行。 AOM作为应用运维环境的多层次一站式运维监控平台,可以实现对云主机、 存储、网络、WEB容器、docker、kubernetes等应用运行环境的深入监控并进行集中统一的可视化管理,能够有效预防问题的产生及快速帮助
十种指标、告警与日志关联分析,快速锁定问题根源,保障业务顺畅运行。 AOM作为应用运维环境的多层次一站式运维监控平台,可以实现对云主机、 存储、网络、WEB容器、docker、kubernetes等应用运行环境的深入监控并进行集中统一的可视化管理,能够有效预防问题的产生及快速帮助
境。 资源解绑:关联资源后,当组件或环境信息变化,不需要资源时,可将资源从原应用节点解除绑定。 资源转移:关联资源后,当组件或环境信息变化,需要及时转移资源时,可将资源从原应用节点转移到目标应用的节点下。 父主题: 应用资源管理
ICAgent有两种安装方式,您可以按照您的场景进行选择。您需要注意的是,下述两种安装方式,都不适用于容器节点(通过ServiceStage、CCE创建的集群容器节点)。容器节点不需要手动安装ICAgent,只需要在创建集群或部署应用时进行操作。 安装方式见表2: 表2 安装方式 方式
日志文件轮转速度过快,如1秒轮转一次。 系统安全设置或syslog自身原因导致无法转发日志。 容器运行时间过短,例如小于30s。 单节点总日志产生速度过快,超过了单节点网络发送带宽或日志采集速度,建议单节点总日志产生速度<5M/s。 日志丢弃 当单行日志长度超过1024字节时,此行会被丢弃。 日志重复 当采集
到数据库中,其中Cassandra用来存储数据,Redis用来查询缓存,ETCD用来存储AOM的配置数据,ElasticSearch用来存储资源、日志、告警和事件。 业务计算层 AOM提供告警、日志、监控、指标等基础运维服务,同时也提供异常检测与分析等AI服务。
控。 事务洞察,支持自动发现事务性能问题,智能筛选,完成根因探究。 中间件监控,无需额外安装其他插件,即可在AOM界面监控关系型数据库、分布式缓存服务等中间件的运行状态及各种指标。 2018-8-15 支持创建通知规则,将告警信息以短信或邮件的方式发送给指定人员。 2018-8-5
百分比(%) NPU存储容量(aom_node_npu_memory_free_megabytes) 该指标用于统计测量对象的NPU存储容量。 >0 兆字节(MB) NPU存储使用率(aom_node_npu_memory_usage) 该指标用于统计测量对象已使用的NPU存储占NPU存储容量的百分比。
应用管理 应用管理的使用说明 创建应用 添加节点 添加环境 关联资源 父主题: 应用资源管理
为了方便查看,可以在主机列表上方设置运行状态、主机类型、主机名称、IP地址等过滤条件,实现主机列表过滤显示。 通过开启或关闭“隐藏控制节点”开关,自定义控制节点的展示与隐藏。系统默认隐藏控制节点。 单击“隐藏控制节点”后的,可同步主机信息。 在页面右上角设置主机信息的统计条件。 设置时间范围,查看已设时间范围内上报
输入搜索条件或关键字,从CMDB服务中选取实例。当前节点类型支持两种选择方式,静态IP和动态节点。 静态IP:可选中指定CMDB应用下的ECS实例。 动态节点:选择CMDB应用中的节点,从而动态获取节点下的ECS实例。该方式对节点下未来新增的实例也生效。 选择完成后单击“确定”。
ICAgent有两种安装方式,您可以按照您的场景进行选择。您需要注意的是,下述两种安装方式,都不适用于容器节点(通过ServiceStage、CCE创建的集群容器节点)。容器节点不需要手动安装ICAgent,只需要在创建集群或部署应用时进行操作。 安装方式见表1: 表1 安装方式 方式
是否必选 参数类型 描述 action 是 String 对当前节点的操作:失败重试,失败跳过,暂停继续。 restart可重新执行失败的节点,skip可跳过失败的节点进入下个节点的执行,continue可通过暂停节点进入下一个节点。 最小长度:1 最大长度:10 枚举值: restart
应用之间的依赖关系复杂,难以梳理。 调用链路长,排查和定位群体困难。 接口调用、数据库调用关系复杂,管理难度大。 解决方案 AOM提供大型分布式应用异常诊断能力,当应用出现崩溃或请求失败时,通过应用拓扑+调用链下钻能力分钟级完成问题定位。 基于应用拓扑自助发现,定位性能瓶颈。 真实
可以将维度理解为这些特征的类别。图1以集群指标为例,介绍了命名空间、维度和指标的关系。 图1 集群指标 AOM的基础版和按需版所对应的指标存储时长及计费方式不同,详见收费详情。 主机 AOM的每一台主机对应一台虚拟机或物理机。主机可以是您自己的虚拟机或物理机,也可以是您通过华为云
新增应用 删除应用 查询应用详情 修改应用 新增组件 删除组件 查询组件详情 修改组件 创建环境 删除环境 查询环境详情 修改环境 查询绑定在节点上的资源列表 根据应用名称查询应用详情 根据环境名称查询环境详情 根据组件名称查询组件详情 新增子应用 删除子应用 修改子应用 父主题: API
警满足筛选条件的次数达到设置的累计次数就会发送一次通知。 例如,设置事件名称为“数据卷扩容失败”,监控周期为“20分钟”,累计次数为“>=3”,频率为“每5分钟”,则表示20分钟内发生数据卷扩容失败事件的次数累计达到或超过3次,则每5分钟发送一次告警通知直到告警被清除。 如果在设