检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
stringData: datasource: "mongodb://{user}:{passwd}@{host1}:{port1},{host2}:{port2},{host3}:{port3}/admin" # 对应连接URI 密码已按照Opaque加密。 配置密钥的详细操作参见创建密钥。
以root用户登录已安装ICAgent的CCE集群的某个主机服务器。 执行以下命令,查看正在使用的hostIP地址,如图1所示。 netstat -nap | grep establish -i 图1 查看hostIP地址 执行以下命令,查看IP地址对应的网卡,如图2所示。 ifconfig |
该指标用于统计每秒写入磁盘的数据量。 ≥0 千字节/秒(kB/s) 表2 磁盘指标维度 维度 说明 clusterId 集群ID。 diskDevice 磁盘名称。 hostID 主机ID。 nameSpace 集群的命名空间。 nodeIP 主机IP。 nodeName 主机名称。 父主题: 指标总览
}, { "name": "hostID", "value": "4100f512-c4e9-4b65-b0dd-2b94ea5e1a84"
源信息的告警。 XX+正则+表达式:表示根据正则表达式匹配告警的XX参数的值。例如设置为:资源类型+正则+host*,表示筛选出metedata字段中资源类型的值包含host字样的告警。 设置规则说明: 根源告警最多可设置10个并行条件,每个并行条件下最多可设置10个串行条件。多
事件级别:重要,即可查询出指定时间范围内事件级别为“重要”的事件。 资源类型 支持选择资源类型别进行搜索。 资源类型:Host,即可查询出指定时间范围内资源类型为“Host”的事件。 事件源 支持选择事件源进行搜索。 事件源源:AOM,即可查询出指定时间范围内告警源为“AOM”的事件。
有效保护敏感信息。 容器监控 在CCE容器监控场景下,AOM的采集器(ICAgent)必须以特权容器的方式运行,请合理的评估特权容器的安全风险,谨慎识别您的容器业务场景。如:节点对外提供的业务属于逻辑多租的共享容器方式,建议采用开源Prometheus等工具进行监控,避免使用AOM的采集器监控您的业务。
表2 文件系统指标维度 维度 说明 clusterId 集群ID。 clusterName 集群名称。 fileSystem 文件系统。 hostID 主机ID。 mountPoint 挂载点。 nameSpace 集群的命名空间。 nodeIP 主机IP。 nodeName 主机名称。
ElasticSearch连接串的格式为 <proto>://<user>:<password>@<host>:<port>,例如 http://admin:pass@localhost:9200。也可以不设置密码,例如设置为:http://10.247.43.50:9200。 密码已按照Opaque加密。
ElasticSearch连接串的格式为 <proto>://<user>:<password>@<host>:<port>,例如 http://admin:pass@localhost:9200。也可以不设置密码,例如设置为:http://10.247.43.50:9200。 密码已按照Opaque加密。
有效保护敏感信息。 容器监控 在CCE容器监控场景下,AOM的采集器(ICAgent)必须以特权容器的方式运行,请合理的评估特权容器的安全风险,谨慎识别您的容器业务场景。如:节点对外提供的业务属于逻辑多租的共享容器方式,建议采用开源Prometheus等工具进行监控,避免使用AOM的采集器监控您的业务。
意的是,AOM每24小时仅支持一次从按需版退回到基础版本的操作,退回基础版本后资源使用超出基础版本配额限制的,将进行数据清理,请确认并了解风险。 登录AOM控制台,进入“总览>监控概览”,单击顶部“切换版本”。 选择版本,勾选提示信息,单击“立即切换”。
GPU名称。 gpuID GPU ID。 npuName NPU名称。 npuID NPU ID。 hostID 主机ID。 nameSpace 集群的命名空间。 nodeIP 主机IP。 hostName 主机名称。 父主题: 指标总览
源信息的告警。 XX+正则+表达式:表示根据正则表达式匹配告警的XX参数的值。例如设置为:资源类型+正则+host*,表示筛选出metedata字段中资源类型的值包含host字样的告警。 设置规则说明: 分组条件最多可设置10个并行条件,每个并行条件下最多可设置10个串行条件,每
的环境变量。 checkType为scope时checkMode填equals,checkContent格式为节点ID数组["hostId1”,”hostId2”],表示规则仅会在这些节点上生效(如果不指定节点范围,规则将下发到该项目所有的节点)。 规则发现部分,数组中有多个对象
该指标用于统计测试对象出方向和入方向的网络流速之和。 ≥0 字节/秒(Byte/s) 表2 网络指标维度 维度 说明 clusterId 集群ID。 hostID 主机ID。 nameSpace 集群的命名空间。 netDevice 网卡名称。 nodeIP 主机IP。 nodeName 主机名称。
AOM有哪些使用限制? 操作系统使用限制 AOM支持多个操作系统,在购买主机时您需选择AOM支持的操作系统,详见表1,否则无法使用AOM对主机进行监控。 表1 AOM支持的操作系统及版本 操作系统 版本 SUSE SUSE Enterprise 11 SP4 64bit SUSE
告警级别:重要,即可查询出指定时间范围内告警级别为“重要”的告警。 资源类型 支持选择资源类型别进行搜索。 资源类型:Host,即可查询出指定时间范围内资源类型为“Host”的告警。 告警源 支持选择告警源进行搜索。 告警源:AOM,即可查询出指定时间范围内告警源为“AOM”的告警。 告警关键字
AOM与APM有何区别? AOM与APM同属于立体化运维解决方案体系,共享采集器。AOM提供了应用级故障分析、告警管理、日志采集与分析等能力,能够有效预防问题的产生及快速帮助应用运维人员定位故障,降低运维成本。APM提供了用户体验管理、分布式性能追踪、事务分析等能力,可以帮助运维
根据业务情况进行调整。侦听端口 listen [::]:8080; # 根据业务情况进行调整,ipv6侦听端口 server_name localhost; # 根据业务情况进行调整 location = /stub_status { # 具体路径可根据业务情况进行调整 stub_status