检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
当您调用API时,如果遇到“APIGW”开头的错误码,请参见API网关错误码进行处理。 更多服务错误码请参见API错误中心。 状态码 错误码 错误信息 描述 处理措施 200 SVCSTG.INV.2000000 null 请求正常执行 请求执行完成无需处理。 200 SVCSTG_AMS_2000000 null
要应用于告警通知、消息模板等场景,为告警非标识性属性。 告警标签说明 告警标签可应用于告警降噪模块的分组规则、抑制规则和静默规则,告警管理系统根据标签属性进行告警管理和通知。 告警标签为key:value键值对格式,支持用户自定义。key 和value只能包含中文、字母、数字和下划线。
自动化运维自定义策略 如果系统预置的自动化运维权限不能满足您的授权要求,您可以创建自定义策略。自定义策略中可以添加的授权项(Action),请参考策略和授权项说明。 目前华为云支持以下两种方式创建自定义策略: 可视化视图创建自定义策略:无需了解策略语法,按可视化视图导航栏选择云服
机,ICAgent会自动安装。 AOM和LTS使用的ICAgent功能完全相同,ICAgent采集的指标数据均上报到AOM分析处理,日志数据则只能匹配系统中最新的日志采集配置。 例如,当前在AOM中配置了ECS主机的日志采集路径,则之前在该资源集下,LTS中所有ECS主机的采集配置都失效。
概述 传统ITIL流程中面向基础设施资源的管理方式,易造成各运维服务之间数据割裂、信息不一致等问题。应用资源管理将所有资源对象与应用统一管理,为AOM和LTS、APM等运维服务提供准确、及时、一致的资源配置数据,并通过开放配置数据接口,辅助第三方系统运维场景建设。 注意事项 如需
维也转向云上的运维服务。对于云上应用的运维也提出了新的挑战。 图1 运维现有问题 运维人员技能要求高,配置繁杂,同时需要维护多套系统。对于分布式追踪系统,学习和使用成本高,并且稳定性差。 云化场景下的分布式应用问题分析困难主要表现在如何可视化微服务间的依赖关系、如何提高应用性能体
接华为云租户虚机、组件等数十种指标,通过短信、邮件等多种方式通知客户当前系统存在的问题。 应用发现最佳实践 应用发现是指AOM通过配置的规则发现和收集主机上部署的应用和关联的指标。可在“应用监控”界面和“监控概览”界面查看发现的应用和应用对应的指标数据。
创建日志告警规则 AOM支持通过关键词统计、搜索分析以及SQL统计创建告警规则,实时监控日志数据并上报告警信息。 前提条件 已创建需要映射的日志组和日志流。创建方法请参见:创建日志组和日志流。 已使用新版结构化功能。结构化配置请参见:日志结构化配置。 已创建相关日志流的图表。创建方法请参见:日志可视化。
增的主机。 单击“添加”,完成配置。AOM会采集进程的指标数据。 等待大约两分钟后,您可在左侧导航栏中选择“监控 > 组件监控”,在集群下拉列表框中选择主机,找到已被监控的组件。 更多应用发现规则操作 应用发现规则添加完成后,您还可以执行表2中的操作。 表2 相关操作 操作 说明
配置完成后,配置完成后,单击“下一步”,即可成功接入弹性云服务器ECS。 成功接入弹性云服务器ECS后,您还可以执行以下操作: 前往“基础设施监控 > 主机监控”页面查看主机监控信息,详情请参见主机监控。 前往“指标浏览”页面使用PromQL命令查询指标,详情请参见指标浏览。 可前往“接入管理”页面查看该指标接入规则的配置信息,详情请参见接入管理。
过各种角度、范围分析成本和用量的趋势及驱动因素。 企业还可以通过成本中心的“成本监控”,及时发现计划外费用,做到成本的可监控、可分析和可追溯。 详细介绍请参见通过成本分析探索成本和使用量、通过成本监控识别异常成本。 成本优化 成本控制 企业可以在成本中心的“预算管理”页面创建精细
获取资源列表 √ √ 查询节点拓扑关系 √ √ 查询操作记录 √ √ 资源监控常用操作与系统权限 表3列出了资源监控常用操作与系统权限的授权关系,您可以参照该表选择合适的系统权限。 表3 资源监控常用操作与系统权限的关系 操作 AOM FullAccess AOM ReadOnlyAccess
或中划线。 事件名称 请从下拉列表中选择,系统默认按选择全部事件处理。 触发方式 事件类告警的触发方式。 累计触发:某个监控周期内达到累计次数则触发告警,按照设置的频率发送对应的事件告警通知。 例如,设置事件名称为“数据卷扩容失败”,监控周期为“20分钟”,累计次数为“3”,频率
ICAgent和UniAgent是同一个插件吗? 如何处理界面“ICAgent状态”为“离线”的问题? 在主机上手工安装ICAgent后提示安装成功,但采集器管理器界面上提示状态异常? ICAgent安装成功后,无法在界面上获取到ICAgent状态 ICAgent安装成功后,AOM中无法监控到CPU内存使用率等信息
项请参见策略和授权项说明。 如表1所示,包括了AOM的所有系统权限。 表1 AOM系统权限 策略名称 描述 类别 依赖系统权限 AOM FullAccess AOM管理员权限,拥有该权限的用户可以操作并使用AOM。 系统策略 CCE Administrator、OBS Administrator、LTS
知。 如图1所示,当分组条件设为“告警级别等于紧急”时,表示系统会先根据分组条件从告警中过滤出满足告警级别为紧急的告警子集,然后根据通知合并方式对告警子集合并,合并后的告警可以关联行动规则,触发告警通知。 图1 分组流程 创建分组规则 用户最多可创建100条分组规则。 在左侧导航栏中选择“告警
图。 折线图:属于趋势类分析图表,一般用于表示一组数据在一个有序数据类别(多为连续时间间隔)上的变化情况,用于直观分析数据变化趋势。当需要监控一段时间内一个或多个资源的指标数据趋势时,请使用此类型图表。 使用折线图可对不同资源的同一指标进行对比,如下图所示,在同一个图表中展示了不同主机的CPU使用率。
root|usr|var|proc|opt|srv)+\\s* vi /etc/vconsole.conf 直接修改系统文件可能会影响系统和服务的正常运行或使系统进入到不可恢复的状态 service xxx restart/stop command \\s*service\\s+
实时监控环境中主机、组件等资源使用情况。当资源使用告警过多,告警通知过于频繁时,通过事件类告警规则,简化告警通知,快速识别服务的某一类资源使用问题并及时解决。 系统支持创建的阈值规则和事件类告警规则总计不能超过1000条,即创建的告警规则数量不能超过1000条。如果系统中的告警
快速分析日志 日志包含了系统性能及业务等信息,例如,关键词ERROR的多少反应了系统的健康度,关键词BUY的多少反应了业务的成交量等,当您需要了解这些信息时,可以通过快速分析功能,指定查询日志关键词,AOM能够针对您配置的关键词进行统计,并生成指标数据,以便您实时了解系统性能及业务等信息。