检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
口“39338”和“39339”,用于查询日志级别,采集任务等。 其他相关操作 您可以对已安装UniAgent的主机执行如下相关操作: 表5 相关操作 操作 说明 搜索主机 在主机列表上方的搜索框,可以通过服务器ID,服务器名称,运行状态来搜索对应主机。 刷新主机列表 单击主机列表右上角的按钮,可刷新主机列表信息。
就会发送邮件或短信。 图3 单条阈值规则 更多阈值规则操作 阈值规则创建完成后,您还可以执行表1中的操作。 表1 相关操作 操作 说明 修改阈值规则 单击“操作”列的“修改阈值”。 删除阈值规则 删除一个阈值规则:单击“操作”列的“删除”。 删除一个或多个阈值规则:选中一个或多个
口“39338”和“39339”,用于查询日志级别,采集任务等。 其他相关操作 您可以对已安装UniAgent的主机执行如下相关操作: 表5 相关操作 操作 说明 搜索主机 在主机列表上方的搜索框,可以通过服务器ID,服务器名称,运行状态来搜索对应主机。 刷新主机列表 单击主机列表右上角的按钮,可刷新主机列表信息。
设置完成,单击“确定”完成消息模板创建。 更多操作 消息模板创建完成后,您还可以对消息模板列表执行表4中的相关操作。 表4 相关操作 操作 说明 编辑消息模板 单击“操作”列的“编辑”。 复制消息模板 单击“操作”列的“复制”。 删除消息模板 删除单条消息模板:单击对应规则“操作”列的“删除”,随后在提示页面单击“确定”即可删除。
提升企业海量运维的自动化能力和效率。将ECS接入AOM后,可以通过AOM实时监控ECS主机状态,并提供告警通知。 本文以监控ECS主机的“node_network_up”指标为例,帮助您快速上手使用AOM。 操作流程 ECS主机手动安装UniAgent:手动为ECS主机安装Uniagent,统一管理指标采集插件。
内容等)改变。 1小时 单击“立即创建”。 步骤二:创建全量指标告警规则 通过指标告警规则可对资源的指标设置阈值条件。当指标数据满足阈值条件时产生阈值告警,当没有指标数据上报时产生数据不足事件。 下面的操作以按全量指标创建为例说明,创建一个监控ELB业务层全量指标的告警规则。 在左侧导航栏中选择“告警管理
常见使用问题 没有消息通知服务的访问权限? 资源运行异常怎么办? 如何设置全屏模式在线时长? 日志配额已达到90%或已满怎么办? 如何获取AK/SK? 如何查询服务不可用时间? AOM告警规则状态为什么显示“数据不足”? 正常状态的工作负载,AOM界面显示异常是什么原因? 如何创建委托apm_admin_trust
设置搜索条件后,单击,查看在已设时间范围内满足搜索条件的事件。 您可参考表1执行如下操作: 表1 操作说明 操作 方法 说明 查看事件统计数据 单击“事件分布图”,可通过柱状图查看在指定时间范围内和搜索条件下事件的统计数据。 - 父主题: 告警管理
Forbidden 请求被拒绝访问。 返回该状态码,表明请求能够到达服务端,且服务端能够理解用户请求,但是拒绝做更多的事情,因为该请求被设置为拒绝访问,建议直接修改该请求,不要重试该请求。 500 InternalServerError 表明服务端能被请求访问到,但是不能理解用户的请求。
Forbidden 请求被拒绝访问。返回该状态码,表明请求能够到达服务端,且服务端能够理解用户请求,但是拒绝做更多的事情,因为该请求被设置为拒绝访问,建议直接修改该请求,不要重试该请求。 500 InternalServerError 表明服务端能被请求访问到,但是不能理解用户的请求。
安装文件包提示没有OBS权限。 可能原因 自动化运维需要访问凭证授权访问OBS,用来获取OBS中的文件包。 解决方法 请在左侧导航栏单击“自动化运维(日落)”,进入“设置 > 访问凭证”页面,检查是否已创建访问凭证,如果没有创建访问凭证,请新建访问凭证。 父主题: 运维管理(即将下线)
更多告警模板操作 告警模板创建完成后,您还可以执行表7中的操作。 表7 相关操作 操作 说明 查看告警模板 在模板列表中,可查看模板规则集名称、规则数/告警条件数、关联集群、企业项目等信息。 将告警模板关联到Prometheus实例或集群 单击“操作”列的,详细操作请参见将告警模
搜索日志 当需要通过日志来分析和定位问题时,使用日志搜索功能可帮您快速在海量日志中查询到所需的日志,您还可结合日志的来源信息和上下文原始数据一起辅助定位问题。 登录AOM 2.0控制台。 在左侧导航栏中选择“日志分析 > 日志搜索”。 使用日志分析(新版)功能的区域可以通过表2中描述的入口进入“日志路径”页面。
基础指标:Modelarts指标 介绍Modelarts通过Agent上报到AOM的指标。 表1 Modelarts通过Agent上报到AOM的指标 指标类别 指标 指标名称 指标含义 取值范围 单位 CPU ma_container_cpu_util CPU使用率 该指标用于统计测量对象的CPU使用率。
单击、可在视图模板中分别添加曲线图、数字图。您还可对视图模板中的指标图表进行删除、移动、复制等操作,详细操作请参见仪表盘。 添加到仪表盘 通过右上角“更多”下拉列表框,可添加视图模板到仪表盘并在“ 仪表盘”界面进行监控。 您还可执行如下操作。 添加应用 对相同或相近业务的默认发现规则发现的组件或没有安装AP
下的应用监控数据。 您还可以根据需要执行以下操作: 设置时间范围,查看已设时间范围内的数据。您可以使用AOM预定义的时间标签,例如近1小时、近6小时等,也可以自定义时间范围,最长可设置为30天。 单击列表右上角,在“表格设置”弹框中通过选中或取消选中可选列前的单选框,自定义可选列的展示与隐藏。
仪表盘中的数据每分钟自动刷新一次。 关闭 仪表盘中的数据不会自动刷新。 更多仪表盘操作 仪表盘创建完成后,您还可以执行表1中的操作。 表1 相关操作 操作对象 操作 说明 仪表盘 另存为 保存仪表盘后,通过页面右侧的“更多”下拉列表框,可另存、重命名或删除仪表盘。 重命名 删除 导出监控报告
查看CCE类型Prometheus实例的指标:可以通过集群名称、Job名称或指标类型筛选指标,也可以通过输入指标名称中的关键字进行模糊搜索指标。 查看云服务类型Prometheus实例的指标:可以通过指标类型或资源类型过滤显示指标,也可通过输入指标名称中的关键字进行模糊搜索指标。 查看
服务类型,用于标记服务的分类,仅用于规则分类和界面展示。可以填写任意字段,如按技术栈分类可填写Java,Python。按作用分类可填写collector(采集),database(数据库)等。 attrList Array of strings 属性列表(暂不使用,可不传)。 cmdLine、env detectLog
现规则等基本操作后,可以根据自身的业务需求使用应用运维管理提供的一系列常用实践。 表1 常用最佳实践 实践 描述 阈值告警最佳实践(新版) 告警作为AOM应用运维管理中一项基础功能,在日常运维中发挥着重要作用。AOM告警可以对接华为云租户虚机、组件等数十种指标,通过短信、邮件等多种方式通知客户当前系统存在的问题。