检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
手动升级 引导用户如何将AOM 1.0 的数据迁移至AOM 2.0 ,目前仅支持日志升级、采集器升级和告警规则升级功能。 功能介绍 日志升级 日志升级后,容器日志和虚机日志均接入AOM 2.0,历史虚机日志可登录AOM 1.0查看。 采集器升级 采集器升级后,进程发现能力增强,并且可自动适配指标浏览服务相关功能。
0数据至AOM 2.0 引导用户如何将AOM 1.0 的数据迁移至AOM 2.0 ,目前仅支持日志升级、采集器升级和告警规则升级功能。 功能介绍 日志升级 日志升级后,容器日志和虚机日志均接入AOM 2.0,历史虚机日志可登录AOM 1.0查看。 采集器升级 采集器升级后,进程发现能力
该方式对未来新增的实例也生效。 标签 设置标签键和对应的标签值,指定一个或多个标签来选取实例。 选择多个标签时,按照“与”的关系搜索。 该方式对未来新增的实例也生效。 从CMDB中选择 输入搜索条件或关键字,从CMDB服务中选取实例。当前节点类型支持两种选择方式,静态IP和动态节点。 静态IP:可选中指定CMDB应用下的ECS实例。
查看组件日志监控项 日志监控项可以搜索和查看日志,通过日志来分析和定位问题。 查看组件日志 登录AOM 2.0控制台。 在左侧导航栏选择“应用监控 > 组件列表”,进入组件列表页面。 在左侧“快速筛选”栏中,选择“区域”、“应用”以及“技术栈”。 单击“组件”列,某一个组件名称,进入该组件详情页,默认展示“接口调用”详细信息。
修改阈值规则 单击“操作”列的“修改阈值”。 删除阈值规则 删除一个阈值规则:单击“操作”列的“删除”。 删除一个或多个阈值规则:选中一个或多个阈值规则前的复选框,单击页面上方的“删除”。 搜索阈值规则 支持规则名称、描述和指标名称搜索,可在右上角的搜索框中输入关键字,单击后显示匹配对象。
方式二:通过设置开始时间和结束时间,自定义时间段,最长可设置为30天。 设置信息的刷新频率。单击,根据需要从下拉列表中选择,例如,手动刷新、1分钟等。 可根据需要选择是否在组件列表对组件执行如下操作: 增加别名 当组件名称比较复杂,不便于识别时,可为该组件增加一个便于识别的别名。 在
据多副本等技术方案,保障服务的持久性和可靠性。 表1 AOM服务可靠性架构 可靠性方案 简要说明 AZ内实例容灾 单AZ内,AOM实例通过多实例方式实现实例容灾,快速剔除故障节点,保障实例持续提供服务。 多AZ容灾 AOM支持跨AZ容灾,当一个AZ异常时,不影响其他AZ下的实例持续提供服务。
据多副本等技术方案,保障服务的持久性和可靠性。 表1 AOM服务可靠性架构 可靠性方案 简要说明 AZ内实例容灾 单AZ内,AOM实例通过多实例方式实现实例容灾,快速剔除故障节点,保障实例持续提供服务。 多AZ容灾 AOM支持跨AZ容灾,当一个AZ异常时,不影响其他AZ下的实例持续提供服务。
图4 删除映射 删除接入规则或删除映射日志流不可恢复,请您谨慎操作。 重复映射 如果将同一个工作负载或文件映射分别映射到日志流A和B中,最新日志将同时上报至流A和流B,AOM会出现流A和流B重复的日志,同时重复产生的日志会被计费,因此不建议重复配置。 图5 重复映射 父主题: 接入LTS
5表示未高效利用GPU,大于0.8是必要的。 假设一个GPU有N个SM: 一个核函数在整个时间间隔内使用N个线程块运行在所有的SM上,此时该值为1(100%)。 一个核函数在一个时间间隔内运行N/5个线程块,此时该值为0.2。 一个核函数使用N个线程块,在一个时间间隔内,仅运行了1/5个周期的时间,此时该值为0
配置应用发现规则 应用发现是指AOM通过配置的规则发现和收集您主机上部署的应用和关联的指标。从是否需要您来操作的角度区分应用发现方式,则有两种,自动发现和手动配置。本章节介绍手动配置操作。 自动发现 您的主机安装ICAgent后,ICAgent会根据内置发现规则发现主机上的应用,并呈现在“应用监控”界面。
配置AOM应用发现规则 应用发现是指AOM通过配置的规则发现和收集您主机上部署的应用、组件和关联的指标。从是否需要您来操作的角度区分应用发现方式,则有两种,自动发现和手动配置。本章节介绍手动配置操作。 自动发现 您的主机安装ICAgent后,ICAgent会根据内置发现规则说明发
实例类型:系统默认选择为“Prometheus for ECS”,不可修改。 选择 Prometheus 实例:在下拉列表中选择Prometheus 实例。 如果当前没有可选的Prometheus实例,可以单击“新建 Prometheus 实例”去创建一个ECS类型Prometheus实例。 选择主机组。
PU使用率的平均值和所有集群的内存使用率的平均值。 应用监控卡片 图2 应用监控 此卡片主要展示应用监控的指标数据。 应用、组件、容器和实例的运行状态。 选择一个应用,可呈现该应用的如下信息: 近30分钟网络流量数据的趋势图,趋势图每1分钟一个点,趋势图每一个点的值表示1分钟内所
单击“操作”列的“修改”。 删除事件类告警规则 删除一个事件类告警规则:单击“操作”列的“删除”。 删除一个或多个事件类告警规则:选中一个或多个事件类告警规则前的复选框,在规则列表上方单击“删除”。 迁移事件类告警规则 选中一个或多个事件类告警规则前的复选框,在规则列表上方单击“一键迁移至2
指标下拉框中展示全部指标数据,可按需选取指标。 计算方式: 多指标:按设置的多个指标数据和对应条件逐条计算后并以图表形式展示。 混合运算:将设置的多个指标数据和条件按照表达式计算后以图表形式展示。 指标:可根据需要在下拉列表中需要选择,支持英文展示和搜索指标; 同时支持直接在指标搜索框中输入指标名称,然后单击
在“规则名称”列单击统计规则名称,查看统计规则的详细信息。 修改统计规则 单击“操作”列的“编辑”。 删除统计规则 删除一个统计规则:单击“操作”列的“删除”。 删除一个或多个统计规则:选中一个或多个统计规则前的复选框,单击页面上方的“删除”。 说明: 删除统计规则后,您的日志桶、日志文件均不会被删除。
stub_status模块。 如果未输出任何结果,则可以使用 --with-http_stub_status_module 参数重新配置configure文件,来编译一个Nginx。示例如下: ./configure \ ##在原基础上添加--with-http_stub_status_module参数进行编译。
修改通知规则 单击“操作”列的。 开启/关闭通知规则 单击“操作”列的“开启”/“关闭”。 删除通知规则 删除一个通知规则:单击“操作”列的。 删除一个或多个通知规则:选中一个或多个通知规则前的复选框,单击页面上方的“删除”。 搜索通知规则 在右上角的搜索框中输入通知规则名称关键字,单击后显示匹配对象。
更多指标介绍可参见指标总览。 创建方式 阈值告警规则的创建方式分为两种:自定义阈值规则和使用模板创建阈值规则。一次创建后,只生成一条规则,无论是一个还是多个资源,均通过同一条规则进行监控。 使用静态阈值模板创建静态阈值规则前,您需先创建一个静态阈值模板。 推荐使用“自定义阈值规则”方式创建。 自定义阈值规则