检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
服务”下方查找并选择AOM的云服务,并且勾选“创建内网域名”,选择终端节点所在的虚拟私有云和子网,其他参数默认设置,更多操作请参考购买终端节点。 图1 购买终端节点 设置完成后,单击“立即购买”。购买成功后,即可完成AOM终端节点的创建。 重复上面步骤,需要再购买1个终端节点,选
取值范围说明: 告警级别:指标或事件告警的级别,可以设置为:紧急、重要、次要、提示。例如设置为:告警级别+等于+紧急。 资源类型:创建告警规则或自定义上报告警时选定的资源类型。可以设置为:host、container、process等类型。例如设置为:资源类型+等于+container。
告警的XX参数的值。例如设置为:资源类型+正则+host*,表示筛选出metedata字段中资源类型的值包含host字样的告警。 设置规则说明: 分组条件最多可设置10个并行条件,每个并行条件下最多可设置10个串行条件,每个并行条件下可设置一个或多个告警行动规则。 多个串行条件之
9187 targetPort: 9187 访问地址: http://{集群任意节点的公网IP}:30433/metrics,即可通过自定义的queries.yaml查询到Postgres实例启动时间指标。 图1 访问地址 配置CCE集群指标采集规则 通过“新增PodMoni
登录AOM控制台,在左侧导航栏中选择“告警 > 告警规则”,单击右上角的“添加告警”。 自定义阈值规则。 设置规则的基本信息:在“规则名称”文本框中输入阈值规则名称,并根据需要填写规则的描述信息。 设置阈值规则的详细信息。 设置“规则类型”为“阈值规则”。 选择监控对象。通过以下两种方式选择: 选择资源对象
单击“新建告警行动规则”添加。设置告警行动规则的操作详见创建告警行动规则。 启用告警行动规则后,需要设置是否开启告警恢复通知。开启告警恢复通知后,当满足“高级设置-告警恢复”中设置的告警恢复条件,则按照选择的告警行动规则发送告警恢复通知。 图6 设置直接告警方式 告警降噪:对告警
tal DNS请求次数 coredns_dns_request_do_count_total 设置了DO标志位的请求总数 coredns_dns_do_requests_total 设置了DO标志位的请求总数 coredns_dns_request_type_count_total
集下的应用监控数据。 您还可以根据需要执行以下操作: 设置时间范围,查看已设时间范围内的数据。您可以使用AOM预定义的时间标签,例如近1小时、近6小时等,也可以自定义时间范围,最长可设置为30天。 单击列表右上角,在“表格设置”弹框中通过选中或取消选中可选列前的单选框,自定义可选列的展示与隐藏。
通知规则”,单击右上角的“创建通知规则”。 AOM已对接SMN,单击“创建主题”,在SMN界面设置通知策略。如果均已设置,请跳过该步骤。 创建一个主题,操作详见创建主题。 例如,创建名称为Topic1的主题。 设置主题策略,操作详见设置主题策略。 设置主题策略时,“可发布消息的服务”必须选择“APM”,否则会导致通知发送失败
在页面左上角选择需要统计的Prometheus实例。 在页面右上角设置该Prometheus实例上报的资源信息的统计条件。 设置时间范围。您可以使用AOM预定义的时间标签,例如近1小时、近6小时等,也可以自定义时间范围,最长可设置为30天。 建议将指标查询的时间范围设置为大于1小时。 设置信息的刷新频率。单击,根据需
本示例可不填写。 - 分组条件 根据设置的条件对告警过滤,筛选出符合分组条件的告警,并为符合分组条件的告警设置告警行动规则。 告警级别:指标或事件告警的级别,可以设置为:紧急、重要、次要、提示。 告警源:触发告警或事件的服务名称。可以设置为AOM 、LTS、CCE等服务名称。 告警级别+等于+紧急、重要
UserAccess”策略,并单击“下一步”。 DMS UserAccess策略:分布式消息服务普通用户权限(无实例创建、修改、删除、扩容、转储)。 在“设置最小授权范围”页签设置授权范围方案为“指定区域项目资源”,并在下方“项目[所属区域]”选定生效区域。 单击“确定”,委托关系创建成功。 父主题: 其他常见问题
效。 如需设置审批配置、执行策略,可展开“更多设置”进行配置,配置参数如表3。 表3 更多设置 参数类别 参数名称 说明 审批配置 人工审核 选择是否开启人工审核开关,默认不打开。 审批配置不允许更改,如需更改,需在工具市场中对该原子服务卡片进行审批配置。 审批人设置 开启人工审核后,需要选择审批人。
删除工作负载 workload deleteWorkload 更新工作负载 workload updateWorkload 上报ECS主机信息 ecs aomImportECS 资源监控 创建仪表盘 dashboard updateDashboard 删除仪表盘 dashboard deleteDashboard
remote_write_url String Prometheus实例remote-write地址。 remote_read_url String Prometheus实例remote-read地址。 prom_http_api_endpoint String Prometheus实例调用url。
标,可以按如下方案设置: 告警条件a的指标设置为“aom_node_cpu_used_core”,其余参数采用默认设置。该指标用于统计测量对象已经使用的CPU核个数。 告警条件b的指标设置为“aom_node_cpu_limit_core”,其余参数采用默认设置。该指标用于统计测量对象申请的CPU核总量。
您还可以根据需要执行以下操作: 设置时间范围,查看已设时间范围内的数据。您可以使用AOM预定义的时间标签,例如近1小时、近6小时等,也可以自定义时间范围,最长可设置为30天。 告警时延设置:支持配置0.5s、1s、3s、5s、10s。 错误时延设置:支持配置1s、3s、5s、10s、15s。
在页面右上角单击,根据需要在下拉列表中设置组件信息的统计条件。 设置时间范围,查看已设时间范围内组件。可通过如下两种方式设置时间范围: 方式一:使用AOM预定义好的时间标签,例如,近30分钟、近1小时等,可根据实际需要选择不同的时间粒度。 方式二:通过设置开始时间和结束时间,自定义时间段,最长可设置为30天。
效。 如需设置审批配置、执行策略,可展开“更多设置”进行配置,配置参数如表3。 表3 更多设置 参数类别 参数名称 说明 审批配置 人工审核 选择是否开启人工审核开关,默认不打开。 审批配置不允许更改,如需更改,需在工具市场中对该原子服务卡片进行审批配置。 审批人设置 开启人工审核后,需要选择审批人。
Exporter,并创建采集任务。详情请参考:安装UniAgent。 创建ECS类型Prometheus实例,采集任务通过关联ECS Prometheus实例,对采集数据进行标记分类。详情请参考:创建ECS Prometheus实例。 配置中间件及自定义插件接入AOM。详情请参考