检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
一区域,需要根据场景选择合适的网络联通方案。 本Region内 服务器类型 选择云服务器类型支持以下两种: ECS云服务器:ECS云服务器管理下的主机。 其他服务器:其他服务器管理下的主机。 ECS云服务器 选择安装模式 选择安装模式当前仅支持命令行安装。 控制台会提供安装命令,您需要远程登录机器执行安装命令。
日志路径”的虚机列表中查看到您的虚机。 注意事项 AOM日志采集路径配置的虚拟机列表,只展示操作系统为Linux的弹性云服务器或裸金属服务器。 若日志采集路径配置的是目录,则默认采集目录下的日志(只采集*.log、*.trace和*.out类型的文本日志文件);若配置的为具体某个
M AOM提供获取当前Prometheus实例的Remote Write地址的能力,支持将原生Prometheus的指标通过Remote Write上报到AOM服务端,即可实现时序数据的长期存储。 前提条件 已购买弹性云服务器ECS。 服务已接入可观测Prometheus 监控。
确保您的服务持久稳定运行。弹性云服务器创建成功后,您就可以像使用自己的本地PC或物理服务器一样,在云上使用弹性云服务器。 您购买了弹性云服务器(弹性云服务器操作系统需满足表1中的使用限制,且购买后需要给弹性云服务器安装ICAgent,否则无法使用AOM监控)后,在AOM界面可对弹
单击“安装ICAgent”,主机类型选择“华为云主机”,安装方式选择“获取AK/SK凭证”。 单击“复制命令”复制安装命令。 通过ECS控制台提供的远程登录方式登录ECS。 登录ECS控制台,在“弹性云服务器”界面的列表中单击ECS所在行“操作”列的“远程登录”,根据界面提示以root用户登录ECS。 图1 远程登录ECS
ICAgent会加密存储您的AKSK,有效保护敏感信息。 容器监控 在CCE容器监控场景下,AOM的采集器(ICAgent)必须以特权容器的方式运行,请合理的评估特权容器的安全风险,谨慎识别您的容器业务场景。如:节点对外提供的业务属于逻辑多租的共享容器方式,建议采用开源Prome
表示在一个时间间隔内,驻留在SM上的线程束与该SM最大可驻留线程束的比例。 该值表示一个时间间隔内的所有SM的平均值。 占用率越高不代表GPU使用率越高。只有在GPU内存带宽受限的工作负载(DCGM_FI_PROF_DRAM_ACTIVE)情况下,更高的占用率表示更有效的GPU使用率。 0~1.0
介绍IEF服务上报到AOM的监控指标,包括指标的类别、名称、含义等信息。 IEF服务的指标上报到AOM后,系统会根据指标映射规则将IEF指标转换后,呈现在AOM控制台的“指标浏览”界面。 表1 IEF服务监控指标 指标类别 分类 AOM呈现的指标 IEF上报的指标 指标名称 指标含义
该指标用于统计测量对象上的尚未被使用的物理内存。 ≥0 兆字节(MB) 可用虚拟内存(aom_cluster_virtual_memory_free_megabytes) 该指标用于统计测量对象上的尚未被使用的虚拟内存。 ≥0 兆字节(MB) 显存可用量(aom_cluster_gpu_memory_free_megabytes)
检查内网域名配置 由于上述配置中的数据上报是通过内网进行数据传输,因此需要确保您的Prometheus所在的主机能够解析内网域名,请参考配置内网DNS。 重新启动Prometheus。 可通过通过grafana查看AOM中的指标数据中grafana查询指标数据的方法,来验证上述配置修改后数据上报是否成功。
采集开关 为了减少内存、数据库、磁盘空间占用,您可以按需进行采集设置。 日志采集开关 前提条件:弹性云服务器上已安装ICAgent,详细操作请参见安装ICAgent。 登录AOM控制台,选择“配置管理 > 日志配置”,选择“采集开关”页签。 开启或者关闭日志采集开关。 “日志采集
通过ECS验证到AOM域名的连通性。 登录弹性云服务器 ECS控制台。 在左侧导航栏中选择“弹性云服务器 > 弹性云服务器”。 单击弹性云服务器名称,进入弹性云服务器的“基本信息”页签。 检查弹性云服务器中的“虚拟私有云”与步骤一购买终端节点时选择的虚拟私有云是否一致。 若一致,则继续后续操作。
运行环境接入AOM 卡片 相关操作 弹性云服务器 ECS 弹性云服务器(Elastic Cloud Server),提供安全稳定、可随时自助获取、弹性伸缩的计算服务,灵活计费,极简运维,极大降低企业成本。具体操作请参见: 弹性云服务器ECS日志接入(LTS) 弹性云服务器ECS指标接入(AOM) 裸金属服务器BMS
单击主机列表右上角的按钮,可对已接入的虚机展示列进行设置。 过滤主机信息 在主机列表的表头,单击各列的,可按特定类型过滤显示主机的信息。 切换主机排序 在主机列表的表头,单击“UniAgent心跳时间”列的可切换主机的排序。为默认排序,为按时间正序排序(即最新的UniAgent心跳时间显示在最后方),为按时间
与文件系统容量的百分比。仅支持1.11及其更高版本的kubernetes集群中驱动模式为devicemapper的容器。 0~100 百分比(%) 显存容量(aom_container_gpu_memory_free_megabytes) 该指标用于统计测量对象的显存容量。 >0
在“网关和DNS”区域单击“DNS服务器地址”后的。 DNS服务器地址与3中的nameserver保持一致。 图4 修改DNS服务器地址 单击“确定”,保存设置。 在控制台修改DNS,需重启ECS服务器后生效。 添加安全组(管理控制台方式):登录管理控制台后,修改ECS安全组规则。操作步骤如下:
示资源的TMS标签”开关用来控制告警通知的消息内容是否显示不同云资源的标签。 前提条件:弹性云服务器上已安装ICAgent,详细操作请参见安装ICAgent。 登录AOM控制台,选择“配置管理 > 指标配置”。 根据需要开启或者关闭“指标采集开关”和“告警消息内容显示资源的TMS标签”开关。
单击主机列表右上角的按钮,可对已接入的虚机展示列进行设置。 过滤主机信息 在主机列表的表头,单击各列的,可按特定类型过滤显示主机的信息。 切换主机排序 在主机列表的表头,单击“UniAgent心跳时间”列的可切换主机的排序。为默认排序,为按时间正序排序(即最新的UniAgent心跳时间显示在最后方),为按时间
指标维度 通过ICAgent上报的虚机指标的指标维度 表1 通过ICAgent上报的虚机指标的指标维度 指标类别 指标维度 说明 网络指标 clusterId 集群ID。 hostID 主机ID。 nameSpace 集群的命名空间。 netDevice 网卡名称。 nodeIP
ebug中的日志文件。 一个虚机最多可配置20条日志采集路径。 同一资源空间下的所有ECS主机,无法同时使用AOM和LTS的日志采集功能,只能匹配系统中最新的日志采集配置。例如,当前在AOM中配置了ECS主机的日志采集路径,则之前在该资源空间下,LTS中所有ECS主机的采集配置都失效。