检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
在左侧导航栏选择“系统管理 > 通用配置”。 通用配置 探针统计 支持对租户使用的探针数量进行统计,您可以从多个维度(时间、区域、探针类型)查看租户使用的探针数量。 登录AOM 2.0控制台。 在左侧导航栏选择“APM配置 > 探针统计”。 登录APM控制台。 在左侧导航栏选择“系统管理 >
如需查看Prometheus格式命令行的详细说明,请将光标移至搜索框后的处,单击“了解更多”。 系统自动填充:不确定指标信息或对Prometheus格式不了解时,可采用系统自动填充方式。系统自动填充方式需要从“指标浏览”界面跳转后填充。 具体操作:在左侧导航栏中选择“监控 > 指标浏
时,通过事件类告警规则,简化告警通知,快速识别服务的某一类资源使用问题并及时解决。 系统支持创建的阈值规则和事件类告警规则总计不能超过1000条,即创建的告警规则数量不能超过1000条。如果系统中的告警规则数量已达到上限,请删除不需要的告警规则后重新创建。 父主题: 告警规则(新版)
/metrics 访问地址:http://{集群任意节点的公网IP}:30378/metrics 如发现未能得到数据,请检查一下部署RedisExporter时YAML中的REDIS_ADDR和REDIS_PASSWORD是否正确,示例如下: 图2 访问地址 在实例列表中单击操作列下的“更多
监控 查询时间序列 查询时序数据 查询指标 查询监控数据 添加监控数据 添加或修改服务发现规则 删除服务发现规则 查询系统中已有服务发现规则 添加阈值规则 查询阈值规则列表 修改阈值规则 删除阈值规则 查询单条阈值规则 批量删除阈值规则 父主题: API
扩展名(.log、.trace和.out)限制;被采集日志文件必须为文本文件。 2019-8-30 容器指标增加对“文件系统可用”“文件系统容量”和“文件系统使用率”的支持。 主机和容器指标增加对NPU指标的支持。 2019-8-21 支持统计分析APP的用户运营数据,便于您更有针对性地开展运营活动。
个云服务下的多个指标批量创建阈值告警规则、事件告警规则和PromQL告警规则。 约束与限制 系统支持创建的指标告警规则、事件告警规则、应用性能监控告警规则总计不能超过3000条。如果系统中的告警规则数量已达到上限,请删除不需要的告警规则后重新创建。 父主题: 配置AOM告警规则
指标总览 简介 网络指标及其维度 磁盘指标及其维度 磁盘分区指标 文件系统指标及其维度 主机指标及其维度 集群指标及其维度 容器组件指标及其维度 虚机组件指标及其维度 实例指标及其维度 服务指标及其维度
给用户组授权之前,请您了解用户组可以添加的自动化运维权限,并结合实际需求进行选择。若您需要对除自动化运维之外的其他服务授权,IAM支持服务的所有系统权限请参见系统权限。 示例流程 图1 给用户授权自动化运维权限流程 创建用户组并授权 在IAM控制台创建用户组,并授予自动化运维只读权限“CMS ReadOnlyAccess”。
配置指标存储时长 通过仪表盘监控Prometheus实例指标数据 配置Remote Read地址实现自建Prometheus读取AOM的Prometheus数据 配置Remote Write地址实现自建Prometheus数据上报到AOM 通过Grafana查看Prometheus实例数据
diskPartition 磁盘分区。 diskPartitionType 磁盘分区类型。 文件系统指标 clusterId 集群ID。 clusterName 集群名称。 fileSystem 文件系统。 hostID 主机ID。 mountPoint 挂载点。 nameSpace 集群的命名空间。
- args: - --kafka.server=120.46.215.4:30092 # 对应Kafka实例的地址信息 image: swr.cn-north-4.myhuaweicloud.com/mall-swarm-demo/kafka-exporter:latest
"alarm", "resource_provider" : "ecs", "resource_type" : "vm", "resource_id" : "ecs123" }, "annotations" : {
"group" : "ecs_instance", "ecs_id_list" : "[\"xxx\"]", "ecs_instance_status" : null, "ecs_instance_tags" : null, "ecs_inst
进行立体排查。 告警灵活通知:提供多种异常检测策略并支持丰富的异常告警触发方式及API。 图1 巡检与问题定界 立体化运维 您需全方位掌控系统的运行状态,并快速响应各类问题。 AOM提供从云平台到资源,再到应用的监控和微服务调用链的立体化运维分析能力。 优势 体验保障:实时掌控业务KPI健康状态,对异常事务根因分析。
trics curl http://{集群任意节点私有IP}:30003/metrics 访问地址:http://{集群任意节点的公网IP}:30003/metrics。 图2 访问地址 在实例列表中单击操作列下的“更多 > 远程登录”,执行如下命令。 curl http://l
trics curl http://{集群任意节点私有IP}:30921/metrics 访问地址:http://{集群任意节点的公网IP}:30921/metrics。 图2 访问地址 在实例列表中单击操作列下的“更多 > 远程登录”,执行如下命令。 curl http://l
分页查询的起始页数(第几页)。默认值:1。 page_size 否 Long 每页查询数量,默认20。每页最多支持查询100条数据。 ecs_id_list 否 Array of strings ecs ID列表信息。最多支持传入100条数据。 agent_id_list 否 Array of strings
3”,“告警级别”设置为,表示监控对象连续3个周期平均值大于0.5时,生成紧急告警。 图3 设置告警规则详情 单击“高级设置”,设置检查频率、告警恢复等信息。本示例可保持系统默认设置。 设置告警通知策略。告警通知策略有两种方式,如图4所示,此处选择直接告警方式。 直接告警:满足告警条件,直接发送告警。选择直接告
ReadOnlyAccess:企业项目管理服务只读权限 单击模板上的“编辑”可将AOM系统监控数据(如告警数据、Prometheus监控数据等),呈现在业务指标监控大屏页面上,详情请参见监控AOM系统指标数据。 根据自身实际业务的需求,您还可以自定义大屏页面呈现的内容,详情请参见自定义业务指标监控大屏。