检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
深入了解。 巡检与问题定界 日常运维中,遇到异常难定位、日志难获取等问题,需要一个监控平台对资源、日志、应用性能进行全方位的监控。 AOM深度对接应用服务,一站式收集基础设施、中间件和应用实例的运维数据,通过指标监控、日志分析、服务异常报警等功能,支持日常巡检资源、应用整体运行情况,及时发现并定界应用与资源的问题。
维服务。对于云上应用的运维也提出了新的挑战。 图1 运维现有问题 运维人员技能要求高,配置繁杂,同时需要维护多套系统。对于分布式追踪系统,学习和使用成本高,并且稳定性差。 云化场景下的分布式应用问题分析困难主要表现在如何可视化微服务间的依赖关系、如何提高应用性能体验、如何将散落的日志进行关联分析、如何快速追踪问题。
脚本管理 “脚本管理”页面展示现有的所有脚本信息。您可以在这里创建脚本,也可以修改、复制已创建的脚本。创建完成后,可以为脚本新建执行任务,也可创建任务后在任务管理中执行并查看。每个脚本支持最多创建20个版本,单用户支持创建的所有脚本的版本合计最多1000个。 创建脚本 登录AOM
消息通知服务 消息通知服务(Simple Message Notification,简称SMN)可以依据您的需求主动推送通知消息,最终您可以通过短信、电子邮件、应用等方式接收通知信息。您也可以在应用之间通过消息通知服务实现应用的功能集成,降低系统的复杂性。 AOM使用SMN提供的消息
时间范围:可选择查询最近1小时、最近1天、最近1周的操作事件,也可以自定义最近7天内任意时间段的操作事件。 您可以参考云审计服务应用示例,来学习如何查询具体的事件。 在事件列表页面,您还可以导出操作记录文件、刷新列表、设置列表展示信息等。 在搜索框中输入任意关键字,按下Enter键,可以在事件列表搜索符合条件的数据。
在“概览”页签,展示环境指标以及应用层和基础设施类信息。 在“日志”页签,可以查看该环境的原始日志、实时日志详情和进行日志可视化分析,详情请参见日志流。如果显示“未查询到应用的日志,请接入日志”,可以单击“立即接入”接入日志,详情请参见日志接入。 在“性能”页签,查看该环境的性
定时运维 “定时运维”页面展示所有定时任务的执行记录。您可以在这里创建定时任务,也可以管理已创建的定时任务。创建定时任务后,系统按确定时间或周期定时触发脚本执行、文件管理、服务场景以及作业管理等操作。定时任务单用户最多支持创建100个。 创建任务 登录AOM 2.0控制台。 在左
警通知之前对告警按照策略规则链条进行处理,通过所有规则后,再发送通知。 2021-08-20 支持AOM日志接入LTS 通过添加接入规则,可以将AOM中的CCE或自定义集群的日志映射至LTS,通过LTS查看和分析日志。映射不会产生额外的费用(除重复映射外)。 2021-07-12
DS实例类型的CPU使用率指标。 单击“新增指标”可多次添加监控指标,并为指标设置统计周期等信息。将光标移动到指标数据和对应监控条件后,还可以根据需要执行以下操作: 单击监控条件后的,可将对应行的指标数据在当前图表中隐藏。 单击监控条件后的,可将对应行的指标数据和监控条件转换为Prometheus命令。
免费体验AOM服务 在华为云学院沙箱实验室,您可以免费体验AOM服务,完成电子商城网站应用的一站式运维。体验地址: 使用AOM实现云端应用一站式运维。
消息通知服务 消息通知服务(Simple Message Notification,简称SMN)可以依据您的需求主动推送通知消息,最终您可以通过短信、电子邮件、应用等方式接收通知信息。您也可以在应用之间通过消息通知服务实现应用的功能集成,降低系统的复杂性。 AOM使用SMN提供的消息
通知模板 发送告警通知的模板,根据用户输入的普罗语句自动生成。 说明: 通知模板可以使用变量的方式,变量即维度变量,填写方式${维度}。 “插入变量符号”功能当前仅在华东-上海一区域开放。单击“插入变量符号”,可以新增一个“${}”。 单击“立即创建”,完成创建。创建完成后,单击“查看告警规则”可查看已创建的告警规则。
total_megabytes 虚拟内存总量 该指标用于统计测量对象申请的虚拟内存总量。 ≥0 兆字节(MB) 当主机类型为“CCE”时,可以查看磁盘分区指标,支持的系统为:CentOS 7.6版本、EulerOS 2.5。 以root用户登录CCE节点,执行docker info
查询指标 功能介绍 该接口用于查询系统当前可监控的指标列表,可以指定指标命名空间、指标名称、维度、所属资源的编号(格式为:resType_resId),分页查询的起始位置和返回的最大记录条数。 调用方法 请参见如何调用API。 URI POST /v1/{project_id}/ams/metrics
日志包含了系统性能及业务等信息,例如,关键词ERROR的多少反应了系统的健康度,关键词BUY的多少反应了业务的成交量等,当您需要了解这些信息时,可以通过快速分析功能,指定查询日志关键词,AOM能够针对您配置的关键词进行统计,并生成指标数据,以便您实时了解系统性能及业务等信息。 约束与限制
如果节点时间与实际时间相差过大,会导致ICAgent指标上报延迟,从而导致状态判断出现问题。 遇到工作负载状态显示不对的问题,需要排查节点的时间与当前时间相比是否过快或过慢,也可以通过在AOM页面查看NTP指标的偏移进行确认。 父主题: 常见使用问题
实例列表”,在实例列表中单击已创建的Prometheus实例的实例名称。 在实例详情页面左侧导航栏选择“设置”页签,获取当前实例的服务地址。 单击“内网”或“公网”页签,可以获取对应“内网”或“公网”下的Remote Read Prometheus配置代码。在代码右侧单击可复制该代码到对应文件。 Remote Read配置为:
功能介绍 支持邮件、短信、企业微信、钉钉、飞书、语音、welink、HTTP或HTTPS消息模板。 welink消息模板当前受限开放,如有需求可以通过提交工单,联系工程师为您开放此功能。 支持消息模板自定义。参考自定义消息模板内容。 约束与限制 您最多可创建100个“指标或事件”类型
mit_bytes 容器可以使用的总内存量限制 container_spec_memory_reservation_limit_bytes 容器可以使用的预留内存限制 container_spec_memory_swap_limit_bytes 容器可以使用的虚拟内存限制 con
用关系,可以是从调用方统计,也可以是从被调用方统计。通过拓扑图线条,可以查看该调用关系的趋势图;同时拓扑图也会展示中间件的调用关系。通过拓扑图,一方面可以自动梳理服务之间的调用关系,同时也可以从全局视角查看服务之间调用是否正常,帮助用户快速定位问题。 全局应用拓扑不仅可以查看当前