检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
应用服务整体平均响应时间突增:基于应用的调用链数据,针对应用粒度提供下钻分析,分析应用下每个组件的平均时延以快速定位根因,找到导致应用整体RT突增的具体组件。 图1 应用服务整体平均响应时间突增 应用服务整体错误率突增:基于应用的调用链数据,针对应用粒度提供下钻分析,分析应用下每个组件的错误率以快速定位
APM Agent会周期性采集一些App监控的性能指标数据,用来衡量Android端、iOS端以及Harmony端的总体健康状况。可以采集崩溃、卡顿、错误、启动性能、网络请求、终端设备以及自定义上报等数据,帮助用户全面掌握App应用的运行情况。 登录AOM 2.0控制台。 在左侧导航栏选择“App监控
为了减少调用链数据频繁上报给服务造成的性能影响,APM探针侧发送的调用链数据,默认情况下以最大100TPS的速率上报。在服务并发量超过100TPS的情况下,调用链不会全部上报,如有需要可以通过修改配置文件的方式修改上报阈值,但请做好性能开销的评估。 全采样功能在设置100%采样率
不同组件的CPU内核总量。 图1 曲线图 数字图:当需要实时监控某个指标的最新数值时,可使用此类型的图表。 如下图所示,可实时查看组件的上行bps的平均值。 图2 数字图 健康状态类图表(包括阈值状态、主机状态、组件状态图表) 支持阈值、主机、组件状态的展示。可将关注的一个或多个
此卡片主要展示了3种信息: 统计最新时间前1分钟内的主机的磁盘读/写速率在TOP5的主机信息。 最近1小时内的所选主机的磁盘读/写速率的趋势图,趋势图的每一个点分别表示1分钟内主机的磁盘读/写速率的值。 趋势图上方的值为所选主机的磁盘监控的最新时间点主机的磁盘读/写速率的值。 主机监控(网络)卡片 图8
单击“全量指标”,选择需要监控的指标,即可查看该账号下的指标。如图5所示,选择指标“aom_node_cpu_usage”,即可在图表中实时监控“paas_apm”与“paas_aom”账号下该指标的指标值与趋势。 图5 查看指标 单击指标列表右上角的,为选择的指标新增告警规则。 设置告警规则的规则名称等基本信息,具体的参数说明如表2所示。
code的key”、“业务code的正确值”参数后,会采集相应的应用码。一般情况下,应用码的值与业务code的正确值相同。配置url监控项详见:配置url监控项。 选填 设置时间范围,查看已设时间范围内的数据。可通过如下两种方式设置时间范围: 方式一:使用AOM预定义好的时间标签
应用资源管理使用限制 限制项 说明 应用数量 租户创建的应用个数最多不超过1000。 子应用数量 应用下创建的子应用数量最多不超过50。 组件数量 子应用下的创建的组件数量最多不超过50。 环境数量 组件下可创建的环境数量最多不超过20。 资源数量 单个环境管理的同类实例资源数量最多不超过2000。
日志文件的方式是append(追加模式),否则可能出现文件空洞问题。 当前主流的日志组件例如Log4j、Logback等均已经具备日志文件的绕接能力,如果您的日志文件已经实现了绕接能力,则无需设置。否则可能出现冲突。 建议您的业务自己实现绕接,可以更灵活的控制绕接文件的大小和个数。
什么是应用运维管理 运维遇到挑战 随着容器技术的普及,越来越多的企业通过微服务框架开发应用,业务实现更多使用云上服务,运维也转向云上的运维服务。对于云上应用的运维也提出了新的挑战。 图1 运维现有问题 运维人员技能要求高,配置繁杂,同时需要维护多套系统。对于分布式追踪系统,学习和使用成本高,并且稳定性差。
议。 Endpoint为指定承载REST服务端点的服务器域名或IP,不同服务不同区域的Endpoint不同,您可以从地区和终端节点中获取。例如AOM服务在“华北-北京一”区域的Endpoint为“aom.cn-north-1.myhuaweicloud.com”。 project_id
规则。 分组条件最多可设置10个并行条件,每个并行条件下最多可设置10个串行条件,每个并行条件下可设置一个或多个告警行动规则。 多个串行条件之间是“和”的关系,多个并行条件之间是“或”的关系,告警需满足其中一个并行条件下的所有的串行条件。 例如一个并行条件下设置了两个串行条件,依
causeType 发生异常的类 exceptionType 异常类型 数量 该异常的发生次数 异常消息 该异常产生的异常消息 异常堆栈 该异常产生的堆栈信息 在下拉列表中选择您想要查看的“实例名称”和“监控项”,可以查看该实例在对应采集器下的不同指标集下的应用监控数据。 您还可以根据需要执行以下操作:
以查看该实例在对应采集器下的不同指标集下的应用监控数据。 您还可以根据需要执行以下操作: 设置时间范围,查看已设时间范围内的数据。可通过如下两种方式设置时间范围: 方式一:使用AOM预定义好的时间标签,例如,近1小时、近6小时等,您可根据实际需要选择不同的时间粒度。 方式二:通过
在“事件列表”页面中查看事件。 设置时间范围,查看已设时间范围内产生的事件。可通过如下两种方式设置时间范围: 方式一:使用AOM预定义好的时间标签,例如,近1小时、近6小时、近一天等,您可根据实际需要选择不同的时间粒度。 方式二:通过开始时间和结束时间,自定义时间范围,您最长可设置为31天。
访问地址:http://{集群任意节点的公网IP}:30378/metrics 如发现未能得到数据,请检查一下部署RedisExporter时YAML中的REDIS_ADDR和REDIS_PASSWORD是否正确,示例如下: 图2 访问地址 在实例列表中单击操作列下的“更多 > 远程登录”,在弹出的控制台中执行如下命令。
设置搜索条件后,单击,查看在已设时间范围内满足搜索条件的告警。 您可参考表1执行如下操作: 表1 操作说明 操作 方法 说明 查看告警统计数据 单击“告警分布图”,可通过柱状图查看在指定时间范围内和搜索条件下告警的统计数据。 - 清除告警 在当前告警列表中单击目标告警所在“操作”列中的。 告警故障已经解除时可进行清除操作。
访问地址:http://{集群任意节点的公网IP}:30378/metrics 如发现未能得到数据,请检查一下部署RedisExporter时YAML中的REDIS_ADDR和REDIS_PASSWORD是否正确,示例如下: 图2 访问地址 在实例列表中单击操作列下的“更多 > 远程登录”,在弹出的控制台中执行如下命令。
本文档介绍通过配置统一监控告警,同时监控不同账号下的指标数据。 自定义OS镜像自动接入采集管理器Uniagent 本文档介绍如何在Linux环境和Windows环境下,基于应用运维服务的采集管理器Uniagent进行镜像打包。您可以使用打包的镜像购买新的ECS主机,就可以为该主机自动安装采集管理器Uniagent。
配置Grafana数据源参数。 URL:将URL设置为3获取的HTTP URL信息。 User:将User设置为3获取的用户名信息。 Password:将Password设置为3获取的密码信息。 Auth下Basic auth和Skip TLS Verify的开关必须开启。 图4 配置参数 配置完成