检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
什么是应用运维管理 运维遇到挑战 随着容器技术的普及,越来越多的企业通过微服务框架开发应用,业务实现更多使用云上服务,运维也转向云上的运维服务。对于云上应用的运维也提出了新的挑战。 图1 运维现有问题 运维人员技能要求高,配置繁杂,同时需要维护多套系统。对于分布式追踪系统,学习和使用成本高,并且稳定性差。
每批间隔 开启分批发布后需填写每批发布的时间间隔。 审批配置 人工审核 选择是否开启人工审核开关,默认不打开。 审批配置不允许更改,如需更改,需在工具市场中对该原子服务卡片进行审批配置。 审批人设置 开启人工审核后,需要选择审批人。 通过选择“主题”的方式配置审批人,您需要在消息通知服务
网络指标及其维度 表1 网络指标 指标名称 指标含义 取值范围 单位 下行Bps(aom_node_network_receive_bytes) 该指标用于统计测试对象的入方向网络流速。 ≥0 字节/秒(Byte/s) 下行Pps(aom_node_network_receive_packets)
String 指定用于计算 PromQL 的时间戳,(Unix时间戳格式,单位:秒)。例如:2024-10-16 16:03:01需要通过工具转换成UNIX秒级时间戳:1729065781。不指定则查询当前时间数据。 请求参数 表3 请求Header参数 参数 是否必选 参数类型
表5 更多设置 参数类别 参数名称 说明 审批配置 人工审核 选择是否开启人工审核开关,默认不允许更改。如需更改,系统默认的服务场景请前往工具市场对原子卡片进行设置。作业执行方案需前往作业中设置,文件管理需前往文件包中设置,脚本执行需前往脚本中设置。 审批人设置 开启人工审核后,需要选择审批人。
应用监控 应用监控概述 查看应用性能指标 监控组件性能指标 通过全局拓扑图查看应用间调用关系 通过调用链查看微服务间调用关系 管理APM探针启停状态 APM配置
应用资源管理 表1 应用资源管理基本概念 术语 说明 应用资源管理 简称CMDB,在AOM2.0中管理应用与云资源的关系,并为AOM的监控、自动化运维、APM服务提供统一、及时的资源环境管理服务。 应用TOPO结构 资源与应用关系的层次结构。CMDB遵循“应用 + 子应用(可选)+
单击“下一步”。 图1 选择策略 选择授权范围方案,勾选“指定区域项目资源”,根据需要勾选对应区域,单击“确定”。 使用postman等工具获取X-Subject-LoginToken参数。(以下示例截图仅供参考,请以实际获取的参数为准) 通过账号密码获取UserB用户的X-Subject-Token。
据收集时间需要满足过去24小时到未来30分内。 取值范围: UNIX时间戳,单位毫秒。例如:2024-10-16 16:03:01需要通过工具转换成UNIX毫秒级时间戳:1729065781000。 说明: 如果数据上报时间早于当天8点,则指标监控页面只显示当天8点后的数据。 metric
通过调用链查看微服务间调用关系 在企业微服务之间调用复杂的场景下,Agent会抽样一些请求,拦截对应请求及后续一系列的调用信息。您可以通过调用链查看微服务间调用关系。 通过调用链查看微服务间调用关系 登录AOM 2.0控制台。 在左侧导航栏选择“应用监控 > 调用链”,进入调用链页面。
应用资源管理概述 传统ITIL流程中面向基础设施资源的管理方式,易造成各运维服务之间数据割裂、信息不一致等问题。应用资源管理将所有资源对象与应用统一管理,为AOM和LTS、APM等运维服务提供准确、及时、一致的资源配置数据,并通过开放配置数据接口,辅助第三方系统运维场景建设。 约束与限制
配置AOM告警规则 AOM告警规则概述 创建AOM指标告警规则 创建AOM事件告警规则 创建AOM应用性能监控告警规则 创建AOM日志告警规则 批量创建AOM云服务告警规则 管理AOM告警规则 标签和标注 普罗语句说明 父主题: 告警监控
修订记录 表1 版本说明列表 发行时间 更新说明 2022-04-16 告警降噪功能优化。 2022-01-25 支持创建告警规则。通过告警规则可对服务设置事件条件或者对资源的指标设置阈值条件。当服务的资源数据满足事件条件时产生事件类告警。当资源的指标数据满足阈值条件时产生阈值告
添加环境 组件创建完成后,可根据主机、区域等信息为组件添加不同的环境,方便统一管理各资源或应用。 添加环境 登录AOM 2.0控制台。 在左侧导航栏选择“应用洞察(日落) > 应用资源管理”,进入“应用资源管理”界面。 选择企业项目并在左侧导航栏中选择“应用管理”。 在左侧树节点,将光标移至待操作的组件名称后,单击。
采集管理 表1 采集管理基本概念 术语 说明 UniAgent 统一数据采集Agent,完成统一插件生命周期管理,并为AOM提供指令下发,如脚本下发和执行。它自身不提供数据采集能力,运维由不同的插件分工采集,插件按需安装、升级和卸载。后续逐步上线其它插件(如云监控和主机安全),统一规范管理。
产品优势 兼容开放 支持各类开源协议低门槛接入,开放了运营、运维数据查询接口和采集标准,提供全托管、免运维、低成本的云原生监控能力。 开箱即用 无需修改业务代码即可接入使用, 非侵入式数据采集,安全无忧。 丰富的数据源 融合云监控、云日志、应用性能、真实用户体验、后台链接数据等多维度可观测性数据源。
使用流程 应用运维管理(Application Operations Management,以下简称AOM)是云上应用的一站式立体化运维管理平台,实时监控您的应用及相关云资源,分析应用健康状态,提供灵活的告警及丰富的数据可视化功能,帮助您及时发现故障,全面掌握应用、资源及业务的实时运行状况。
责任共担 华为云秉承“将公司对网络和业务安全性保障的责任置于公司的商业利益之上”。针对层出不穷的云安全挑战和无孔不入的云安全威胁与攻击,华为云在遵从法律法规业界标准的基础上,以安全生态圈为护城河,依托华为独有的软硬件优势,构建面向不同区域和行业的完善云服务安全保障体系。 安全性是华为云与您的共同责任,如图1所示。
责任共担 华为云秉承“将公司对网络和业务安全性保障的责任置于公司的商业利益之上”。针对层出不穷的云安全挑战和无孔不入的云安全威胁与攻击,华为云在遵从法律法规业界标准的基础上,以安全生态圈为护城河,依托华为独有的软硬件优势,构建面向不同区域和行业的完善云服务安全保障体系。 安全性是华为云与您的共同责任,如图1所示。
通过全局拓扑图查看应用间调用关系 拓扑图的每根线条代表服务之间一段时间的调用关系,可以是从调用方统计,也可以是从被调用方统计。通过拓扑图线条,可以查看该调用关系的趋势图;同时拓扑图也会展示中间件的调用关系。通过拓扑图,一方面可以自动梳理服务之间的调用关系,同时也可以从全局视角查看