检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
面切换为新版管理主机组页面。新版管理主机组功能在邀测中,支持华北-北京四局点,仅针对用户内测使用。该功能受限开放,如有需求可以通过提交工单,为您开放此功能。 如果需要在AOM控制台中使用LTS的功能,需要提前获取LTS的相关权限,详情请参见LTS权限管理。 父主题: 采集设置
在左侧导航栏中选择“日志分析 > 日志路径”。 使用日志分析(新版)功能的区域可以通过表2中描述的入口进入“日志路径”页面。 在虚机列表中单击虚机所在行“操作”列的,为单个虚机配置一条或多条日志采集路径。 您既可使用ICAgent自动识别的路径,也可手动配置。 使用ICAgent自动识别的路径 I
gpuMemUsage 显存使用率 该指标用于统计测量对象已使用的显存占显存容量的百分比。 0~100 百分比(%) gpuMemUsed gpuMemUsed 显存使用量 该指标用于统计测量对象已使用的显存。 ≥0 兆字节(MB) gpuUtil gpuUtil GPU使用率 该指标用于统计测量对象显卡使用率。
2.0控制台界面操作,也可登录APM控制台界面操作。 当前仅华东-上海一区域可以直接使用APM配置功能,其余区域需提前在“菜单开关”中开启应用监控和配置的开关,详细操作请参见菜单开关,才可以使用AOM 2.0控制台中应用性能管理的相关功能。 表1 功能说明 功能名称 功能说明 AOM
该指标用于统计测量对象已使用的显存。 ≥0 兆字节(MB) GPU使用率(aom_cluster_gpu_usage) 该指标用于统计测量对象的GPU使用率。 0~100 百分比(%) 物理内存使用率(aom_cluster_memory_usage) 该指标用于统计测量对象已使用内存占申请物理内存总量的百分比。
创建日志组和日志流。 已使用新版结构化功能。结构化配置请参见:日志结构化配置。 已创建相关日志流的图表。创建方法请参见:日志可视化。 注意事项 按搜索分析创建告警规则功能目前在邀测中,暂不支持申请开通。 按SQL统计创建告警规则功能仅支持全部用户使用的局点有:华南-广州、华北-
创建抑制规则 使用抑制规则,您可以抑制或阻止与某些特定告警相关的其他告警通知。例如:当严重级别的告警产生时,可以抑制与其相关的低级别的告警。或当节点故障发生时,抑制节点上的进程或者容器的所有其他告警。 注意事项 若在发送告警通知之前抑制条件对应的源告警已恢复正常,则抑制规则失效,
按需版分为按量后付费和预付费套餐包(其中预付费套餐包又分为专业版套餐包和企业版套餐包),计费详见AOM-价格说明。 AOM与其他云服务组合使用,为您提供通知发送、日志转储、性能管理等功能,这些功能可能产生额外费用,具体费用由提供该功能的云服务结算。 阈值规则和告警通知:依赖消息通
Exporter”卡片当前仅华北-北京四卡片改名为“弹性云服务器 ECS”。 Prometheus 云服务接入 通过该功能可接入云服务相关指标,例如CPU使用率、内存使用率、健康状态。 ModelArts服务默认自动将指标上报到AOM,其指标数据开箱即用。ModelArts指标的详细说明请参考基础指标-Modelarts指标。
> 进程监控”,在右侧区域选择“组件监控”页签,进入组件监控界面,查看组件列表。 组件列表中对组件名称、所属应用、部署方式、应用发现规则、使用率、操作等参数进行展示。 为了方便查看组件列表,可以在组件列表上方设置运行状态、所属应用、集群名称、部署方式、组件名称等过滤条件,实现组件列表过滤显示。
可对指定日志进行一次性转储,操作详见添加一次性转储。 添加日志转储时,除需拥有AOM和LTS使用权限外,还需要拥有OBS Administrator权限。 如果需要周期性转储日志,推荐使用LTS的日志转储功能将当前日志实时转储到OBS桶中长期保存。 添加周期性转储 下面以als0
欠费说明 用户在使用云服务时,账户的可用额度小于待结算的账单,即被判定为账户欠费。欠费后,可能会影响云服务资源的正常运行,请及时充值。 欠费原因 按需计费模式下,您的账户的余额不足会导致欠费。 欠费影响 当您的账号因AOM按需资源自动扣费导致欠费后,账号将变成欠费状态。欠费后,按
aom_node_gpu_memory_usage 显存使用率 该指标用于统计测量对象已使用的显存占显存容量的百分比。 0~100 百分比(%) aom_node_gpu_memory_used_megabytes 显存使用量 该指标用于统计测量对象已使用的显存。 ≥0 兆字节(MB) aom_node_gpu_usage
日志路径”,选择“主机日志”页签。 在虚机列表中单击虚机所在行“操作”列的“配置”,为单个虚机配置一条或多条日志采集路径。 您既可使用ICAgent自动识别的路径,也可手动配置。 使用ICAgent自动识别的路径 ICAgent会自动扫描您虚机的日志文件,自动发现虚机中所有持有文件句柄且类型为*.log、*
通过事件类告警规则可对服务设置事件条件,当服务发生了某种变化,资源数据满足事件条件时产生事件类告警。 注意事项 当服务的资源数据满足事件条件时,如需使用邮件或短信等方式发送通知,请参考“创建告警行动规则”设置告警行动规则。 操作步骤 登录AOM控制台,在左侧导航栏中选择“告警 > 告警规则”,单击右上角的“添加告警”。
指标是对资源性能的数据描述或状态描述,指标由命名空间、维度、指标名称和单位组成。指标分为系统指标和自定义指标。 系统指标:AOM提供的基础指标,例如:CPU使用率、CPU内核占用等。 自定义指标:您自己定义的指标。可参考如下两种方式上报自定义指标。 方式一:通过AOM提供的接口上报自定义指标,接口详见添加监控数据和查询监控数据。
关联资源 为组件创建对应环境后,即可为环境关联相关资源实例,后续可通过应用监控功能实时监控资源的使用情况。 查看资源列表 登录AOM 2.0控制台。 在左侧导航栏选择“应用洞察(日落) > 应用资源管理”,进入“应用资源管理”界面。 选择企业项目并在左侧导航栏中选择“应用管理”。
重启CCE工作负载 使用重启CCE工作负载卡片可以创建任务重启一个或多个CCE工作负载。 只支持对有状态负载和无状态负载进行重启,其余类型负载不支持。 创建重启CCE工作负载任务 登录AOM 2.0控制台。 在左侧导航栏单击“自动化运维(日落)”,即可进入“自动化运维”界面。 在
创建抑制规则 使用抑制规则,您可以抑制或阻止与某些特定告警相关的其他告警通知。例如:当严重级别的告警产生时,可以抑制与其相关的低级别的告警。或当节点故障发生时,抑制节点上的进程或者容器的所有其他告警。 注意事项 若在发送告警通知之前抑制条件对应的源告警已恢复正常,则抑制规则失效,
标集下的应用监控数据。 您还可以根据需要执行以下操作: 设置时间范围,查看已设时间范围内的数据。可通过如下两种方式设置时间范围: 方式一:使用AOM预定义好的时间标签,例如,近1小时、近6小时等,您可根据实际需要选择不同的时间粒度。 方式二:通过开始时间和结束时间,自定义时间范围,您最长可设置为30天。