检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
使用新版仪表盘编辑旧版仪表盘中创建的图表时,新版仪表盘的图表配置可以兼容旧版仪表盘的图表配置。 创建仪表盘 登录AOM 2.0控制台。 在左侧导航栏选择“仪表盘”,单击页面右上角“体验新版”。当前仅华南-广州区域的菜单路径为“仪表盘 > 仪表盘”。 在“仪表盘”字样后单击,新建仪表盘分组。 单击列表左上角的“添加仪表盘”。
通过仪表盘监控Prometheus实例指标数据 配置Remote Read地址实现自建Prometheus读取AOM的Prometheus数据 配置Remote Write地址实现自建Prometheus数据上报到AOM 通过Grafana查看Prometheus实例数据 查看Prometheus实例指标上报量
PC中某一台主机设置为安装机,该VPC其它主机均可通过界面远程安装。 代理区/代理机 为解决多云之间网络互通,需要在华为云购买和配置ECS主机为代理机,同时代理机上需要绑定公网IP,AOM通过该代理机下发部署控制命令到远程主机,运维数据也将经过该代理机至AOM。代理区由多个代理机组成,主要是考虑代理机的高可用性。
None 操作指导 应用运维管理 AOM 如何创建告警规则 04:10 创建告警规则
资产价值的最大化。通过云审计服务,您可以记录与AOM服务相关的操作事件,便于日后的查询、审计和回溯。 资源类型为pe的事件,其实际执行服务为AOM,但操作入口位于云容器引擎(CCE)或应用管理与运维平台(ServiceStage)。 表1 云审计服务支持的AOM操作列表 操作名称
模板到仪表盘并在“ 仪表盘”界面进行监控等。 监控主机的显卡、网卡等常用系统设备。 单击“实例列表”页签,可在列表中查看实例状态、类型等基本信息,单击实例名称,可在“实例详情页面”查看该实例的各种指标。 单击“显卡”页签,在列表中可查该主机显卡的基本信息,单击显卡名称,可在“监控视图”页面监控该显卡的各种指标。
应用洞察 应用监控 应用资源管理 日志接入
日志管理 日志管理使用说明 搜索日志 查看日志文件 添加日志桶 查看桶日志 添加日志转储 创建统计规则 接入LTS 容器日志采集配置
配置管理 ICAgent管理(华为云主机) ICAgent管理(非华为云主机) 接入管理 日志配置 配额设置 指标配置 数据订阅
当您完成了应用管理、容器管理等基本操作后,可以根据自身的业务需求使用应用运维管理提供的一系列常用实践。 表1 常用最佳实践 实践 描述 通过告警降噪清除告警风暴 该实践介绍如何为告警规则配置告警降噪功能,在发送告警通知前按告警降噪规则对告警进行处理,处理完成后再发送通知,避免产生告警风暴。
查看组件接口调用监控项 接口调用主要是对外部服务调用当前应用程序进行监控,主要包括URL监控、dubbo服务端监控、cse服务端监控、CSEProvider集群监控、Functiongraph监控等。 查看组件接口调用 登录AOM 2.0控制台。 在左侧导航栏选择“应用监控 > 组件列表”,进入组件列表页面。
通过界面卸载ICAgent后如果需要再次安装,请等待5分钟后执行安装操作,否则可能出现被再次自动卸载的情况。 登录服务器卸载 以root用户登录需卸载ICAgent的服务器。 执行如下命令卸载ICAgent。 bash /opt/oss/servicemgr/ICAgent/bin/manual/uninstall
通过AOM查看故障传播链 故障传播链图谱基于服务的调用链和平均RT、错误率等分析关键指标数据,找出异常调用在调用链追踪链路trace中的传播关系,并展示服务及其关联服务的关键指标数据,可以更有效地定位根因。 查看故障传播链图谱 登录AOM 2.0控制台。 左侧导航栏单击“智能洞察(BETA)”。
京一、华南-广州等),您需切换区域后分别进行开通操作。 操作步骤如下: 登录华为云管理控制台。 在左上角单击,在下拉列表中选择操作区域。 单击左侧,选择“管理与监管 > 应用运维管理 AOM”,进入AOM服务页面。 在弹出的对话框中单击“免费开通”,即可免费开通AOM。 切换版本
事件巡检:提供基于应用性能管理APM平台的应用监控服务,通过应用服务和流量Top N接口的平均RT、错误率等关键指标看护服务质量,自动检测指标异常。 事件根因分析:提供基于应用性能管理APM平台的调用链追踪根因定位技术。可以从应用服务和流量Top N接口的指标、调用链维度,全局分析问题,快速诊断并定位故障根因。
采集开关 为了减少内存、数据库、磁盘空间占用,您可以按需进行采集设置。 日志采集开关 前提条件:弹性云服务器上已安装ICAgent,详细操作请参见安装ICAgent。 登录AOM控制台,选择“配置管理 > 日志配置”,选择“采集开关”页签。 开启或者关闭日志采集开关。 “日志采集
全局开关针对整个AOM 2.0服务生效。 开启“告警消息内容显示资源的TMS标签”开关后,在告警消息模板中配置的“TMS标签: $event.annotations.tms_tags;”变量才会生效。 关闭“指标采集开关”后,ICAgent会停止虚机指标数据采集,相关指标数据不再更新,用户自定义指标还可以继续上报。
服务韧性 AOM服务提供了多种可靠性容灾能力,可以通过AZ内实例容灾、多AZ容灾、多集群容灾、数据多副本等技术方案,保障服务的持久性和可靠性。 表1 AOM服务可靠性架构 可靠性方案 简要说明 AZ内实例容灾 单AZ内,AOM实例通过多实例方式实现实例容灾,快速剔除故障节点,保障实例持续提供服务。