检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
账号接入”页面,选择需要接入的账号,云服务及云服务指标。 例如,成员账号接入“paas_apm、paas_aom”。云服务选择接入“函数工作流 FunctionGraph、分布式缓存 DCS、弹性云服务器 ECS”。在云服务列表中选择云服务后,单击“新增指标”,可以在新增指标弹框里勾选任意需要接入的指标。
登录控制台,将鼠标移动到右上方的用户名称,并在下拉列表中选择“我的凭证”。 在“我的凭证”页面中选择“访问密钥”页签。 在列表上方单击“新增访问密钥”,输入验证码或密码。 单击“确定”,生成并下载AK/SK。 创建访问密钥成功后,您可以在访问密钥列表中查看访问密钥ID(AK),在下载的.csv文件中查看秘密访问密钥(SK)。
入门实践 当您完成了安装ICAgent、配置服务发现规则等基本操作后,可以根据自身的业务需求使用应用运维管理提供的一系列常用实践。 表1 常用最佳实践 实践 描述 阈值告警最佳实践(新版) 告警作为AOM应用运维管理中一项基础功能,在日常运维中发挥着重要作用。AOM告警可以对接华
登录控制台,将鼠标移动到右上方的用户名称,并在下拉列表中选择“我的凭证”。 在“我的凭证”页面中选择“访问密钥”页签。 在列表上方单击“新增访问密钥”,输入验证码或密码。 单击“确定”,生成并下载AK/SK。 创建访问密钥成功后,您可以在访问密钥列表中查看访问密钥ID(AK),在下载的.csv文件中查看秘密访问密钥(SK)。
健康状态。 资源监控使用说明 告警管理 AOM支持通过告警规则对应用、资源及业务设置告警条件,当AOM自身或外部服务存在异常或可能存在异常时,将告警信息通过邮件、短信、企业微信等方式发送给指定人员,帮助用户及时发现故障。 告警管理使用说明 父主题: 安全
集群监控 主机监控 指标浏览 告警管理 AOM支持通过告警规则对应用、资源及业务设置告警条件,当AOM自身或外部服务存在异常或可能存在异常时,将告警信息通过邮件、短信、企业微信等方式发送给指定人员,帮助用户及时发现故障。 告警管理使用说明 父主题: 安全
unavailable. 服务器不可用 请联系技术支持工程师解决。 503 AOM.04008503 Server unavailable. 服务器不可用 请联系技术支持工程师解决。 503 AOM.07001503 Service error. 服务异常 请检查后台服务是否正常。 503
统计当前实例/资源空间下查询设备影子失败数 ≥0 次 消息下发 iotda_message_down_totalCount 消息下发总数 统计当前实例/资源空间下消息下发总数 ≥0 次 iotda_message_down_successCount 消息下发成功数 统计当前实例/资源空间下消息下发成功数 ≥0 次
欠费说明 用户在使用云服务时,账户的可用额度小于待结算的账单,即被判定为账户欠费。欠费后,可能会影响云服务资源的正常运行,请及时充值。 欠费原因 按需计费模式下,您的账户的余额不足会导致欠费。 欠费影响 当您的账号因AOM按需资源自动扣费导致欠费后,账号将变成欠费状态。欠费后,按
通知消息的模板,请从下列列表中选择。 若没有合适的消息模板,请单击消息模板选择栏右侧“创建消息模板”,新建消息模板。 - 设置完成后,单击“确定”。 配置告警 按照配置方式的不同,创建指标告警规则可分为:按全量指标创建和按Prometheus命令创建。 下面的操作以按全量指标创建告警规则为例说明。
单击卡片右上角的并选择“下架”,下架后服务场景页面将不展示该卡片。下架服务卡片后,原子服务场景关联的原子任务不能再次被执行,待该原子场景被重新上架后,关联的原子任务恢复执行功能。 服务下架时,需确认服务是否被定时运维场景引用,如果已被引用,需先删除被引用场景,才能下架服务,具体见警告提示框的“引用详情”。
附录 状态码 错误码 获取账号ID、项目ID、企业项目ID 公共请求消息头 公共响应消息头
常见使用问题 没有消息通知服务的访问权限? 资源运行异常怎么办? 如何设置全屏模式在线时长? 日志配额已达到90%或已满怎么办? 如何获取AK/SK? 如何查询服务不可用时间? AOM告警规则状态为什么显示“数据不足”? 正常状态的工作负载,AOM界面显示异常是什么原因? 如何创建委托apm_admin_trust
日志订阅和阈值告警订阅:依赖分布式消息服务Kafka版,发送日志或阈值告警数据到Kafka队列中,可从分布式消息服务的Kafka队列中获取消费日志或阈值告警数据。分布式消息服务Kafka版-价格说明 应用性能管理:AOM集成了应用性能管理服务(简称APM),方便提供更高级的运维能力。APM-价格说明
如您的组织已经设定AOM服务的相关标签策略,则需按照标签策略规则添加告警标签。标签如果不符合标签策略的规则,则可能会导致添加标签失败,请联系组织管理员了解标签策略详情。 告警标注 单击添加告警标注。告警标注为告警非标识性属性,key:value键值对格式,主要应用于告警通知、消息模板等场景。
当阈值规则的状态(正常、超限阈值、数据不足)发生变化时,会以邮件或短信等方式通知,以便您在第一时间发现异常并进行处理。 通知规则 当AOM自身或外部服务存在异常或可能存在异常而产生告警时,可将告警信息通过邮件或短信发送给您指定的人员,以便提醒相关人员及时采取措施清除故障,避免造成业务损失。
在左侧导航栏单击“体验新版”,进入AOM 2.0服务页面。 图2 进入AOM 2.0服务页面 在弹出的“通知”对话框中仔细阅读从AOM 1.0切换到AOM 2.0计费方式变化的说明。 单击“授权”,然后在“云服务授权”页面中仔细阅读授权声明后,勾选“我已阅读并同意授权声明”。 单击“免费开通服务并授权”,即可免费开通AOM
导航栏中选择“告警管理 > 告警列表”,在告警列表中查看该告警。 只要该告警满足已设的通知策略,系统就会以邮件、短信或企业微信等方式发送告警通知给指定人员。 图6 接收告警通知
根据提示输入待卸载ICAgent的服务器root用户密码。 如果已安装ICAgent的服务器安装过expect工具,执行上述命令后,即可完成卸载。如果已安装ICAgent的服务器未安装expect工具,请根据提示输入,进行安装。 请确保已安装ICAgent的服务器可以使用root用户执行
告警降噪:选择告警降噪的分组规则进行告警降噪。 告警行动规则 告警行动规则定义产生告警之后,按照规则做何种动作。包括消息发送到哪里和以什么形式发送。消息发送到哪里通过华为云服务SMN主题设置。 Prometheus实例 Prometheus监控功能提供的管理Prometheus数据采集和数据存储分析的逻辑单元。