检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
自建Prometheus数据上报到AOM 在default、ECS、CCE、通用实例类型的Prometheus实例的“设置”页签,可以获取当前Prometheus实例的Remote Write地址。将原生Prometheus的指标通过Remote Write上报到AOM服务端,即可实现时序数据的长期存储。
APM应用。 设置告警规则详情。具体的参数说明如表2所示。 设置完成后,监控的指标数据以折线图形式显示在告警条件上方,单击每条指标数据前的折线符号可将对应指标数据在当前图表中隐藏。单击“新增指标”可多次添加监控指标,并为指标设置统计周期和检测规则等信息。 将光标移动到指标数据和对
OBS桶 文件包所在的OBS桶,请从下拉列表中选择。 OBS对象路径 输入OBS服务对象的路径。获取OBS对象之前,您需要在“设置 > 访问凭证”界面设置访问凭证。 复制OBS服务对象路径的方式如下: 单击“前往对象存储服务OBS”,跳转到“对象”界面。 在右侧对象列表中选择合适的对象,单击“操作”列的“复制路径”。
配置虚机日志采集路径 AOM支持虚机(这里的虚机指操作系统为Linux的弹性云服务器或裸金属服务器)日志采集,即采集您自定义的日志文件并展现在AOM界面中,以供您检索。使用该功能前首先要配置日志采集路径,配置方法详见如下操作。 前提条件 您需先为您的虚机安装ICAgent,详见安
403 Forbidden 请求被拒绝访问。 返回该状态码,表明请求能够到达服务端,且服务端能够理解用户请求,但是拒绝做更多的事情,因为该请求被设置为拒绝访问,建议直接修改该请求,不要重试该请求。 404 NotFound 所请求的资源不存在。 建议直接修改该请求,不要重试该请求。 405
钟”,检测规则设置为“平均值>1”,触发条件为连续周期“3”,告警级别为“紧急”,表示连续三个统计周期,指标的平均值大于已设置的阈值1时,生成紧急告警。 图6 设置告警规则 单击“高级设置”,设置检查频率、告警恢复等信息,具体参数说明请参见表3。 表3 “高级设置”填写说明 参数名称
不一定会引起业务异常,事件一般用来表达一些重要信息。 事件列表展示已设时间范围内产生的事件。 告警规则 通过告警规则可对服务设置事件条件或者对资源的指标设置阈值条件。当服务的资源数据满足事件条件时产生事件类告警。当资源的指标数据满足阈值条件时产生阈值告警,当没有指标数据上报时产生
选择所属的企业项目。 描述 作业的描述信息,最多可输入1000个字符。 添加全局参数。 在“新建作业”页面,“全局参数”中,单击“添加全局参数”。 设置全局参数信息,具体的参数说明请参见表2。 图2 添加全局参数基本信息 表2 添加全局参数列表 参数名称 说明 添加方式 添加参数方式,包括新建和从参数库选择两种。
时,“作用范围”需要选择“区域级项目”,然后在指定区域(如华北-北京1)对应的项目(cn-north-1)中设置相关权限,并且该权限仅对此项目生效;如果在“所有项目”中设置权限,则该权限在所有区域项目中都生效。访问AOM时,需要先切换至授权区域。 权限根据授权精细程度分为角色和策略。
e:Pod名称/容器名称。 采集路径 设置采集路径可以更精确的指定采集内容,当前支持以下设置方式: 不设置则默认采集当前路径下.log .trace .out文件。 设置**表示递归采集5层目录下的.log .trace .out文件。 设置*表示模糊匹配。 例子: 采集路径为/tmp/**/test*
测;如果探测到符合的进程,将可进入下一步的操作,否则不能进入后续操作。 设置应用名称及组件名称。 设置应用名称。 设置应用名称。 在“应用名称设置”下单击“添加命名项”,为已发现的进程设置应用名。 若您未设置应用名,则应用名默认为unknownapplicationname。 当
上报APM(调用链、JVM)指标使用 30200: ICAgent的控制端口 30201: ICAgent的控制端口 如果界面上点击升级操作失败,该怎么办? 自定义集群场景下,如果界面上点击升级操作失败,您可以登录到vm节点上,直接执行安装命令再次安装即可。 ICAgent的安装是覆盖式安装,无需先卸载,直接安装即可。
单击“Prometheus”,进入Prometheus配置页面。 图4 进入Prometheus配置页面 参考下图示例配置参数。 Password:将Password设置为2中生成的AccessCode。 User:aom_access_code。 URL: {URI-scheme}://{Endpoint}/v1/{project_id}
单击“新建告警行动规则”添加。设置告警行动规则的操作详见创建告警行动规则。 启用告警行动规则后,需要设置是否开启告警恢复通知。开启告警恢复通知后,当满足“高级设置-告警恢复”中设置的告警恢复条件,则按照选择的告警行动规则发送告警恢复通知。 图6 设置直接告警方式 告警降噪:对告警
创建告警行动规则 前提条件 已创建一个主题,操作详见创建主题。 已设置主题策略,操作详见设置主题策略。 已为主题添加相关的订阅者,即通知的接收人(例如:邮件或短信),操作详见订阅主题。 注意事项 您最多可创建1000个告警行动规则,如果告警行动规则数量已达上限1000时,请删除不需要的行动规则。
效。 如需设置审批配置、执行策略,可展开“更多设置”进行配置,配置参数如表3。 表3 更多设置 参数类别 参数名称 说明 审批配置 人工审核 选择是否开启人工审核开关,默认不打开。 审批配置不允许更改,如需更改,需在工具市场中对该原子服务卡片进行审批配置。 审批人设置 开启人工审核后,需要选择审批人。
从资源列表中选择合适的资源实例。 在资源列表上方设置过滤条件,可实现资源列表过滤显示。 单击右上角的,可实时获取到所有资源实例的最新信息。 单击右上角的,通过选中/取消选中各展示项前的复选框,自定义其展示/隐藏。 资源列表仅展示与应用企业项目相同的资源。 设置完成后,单击“关联”。 如果关联的
您还可以根据需要执行以下操作: 设置时间范围,查看已设时间范围内的指标数据。可通过如下两种方式设置时间范围: 方式一:使用AOM预定义好的时间标签,例如,近1小时、近6小时等,您可根据实际需要选择不同的时间粒度。 方式二:通过开始时间和结束时间,自定义时间范围,您最长可设置为30天。 单击响应
自定义静态阈值模板。 输入模板名称,选择资源类型,设置指标名称、统计方式、阈值条件等参数。 统计方式:指标数据按照所设置的统计方式进行聚合。 阈值条件:阈值告警的触发条件,由判断条件(≥、≤、>、<)和阈值组成。例如,阈值条件设置为“>85”,表示指标的实际值大于已设置的阈值85时,生成阈值告警。
取值范围 单位 设备总数 iotda_device_status_onlineCount 在线设备数 统计租户在当前实例/资源空间下的在线的设备数量 ≥0 个 iotda_device_status_totalCount 设备总数 统计租户在当前实例/资源空间下的总的设备数量 ≥0 个