云服务器内容精选

  • Apdex Apdex全称是Application Performance Index,是由Apdex联盟开发的用于评估应用性能的工业标准。Apdex标准从用户的角度出发,将对应用响应时间的表现,转为用户对于应用性能的可量化范围为0-1的满意度评价。 Apdex的原理 Apdex定义了应用响应时间的门槛为T(即Apdex阈值,T由性能评估人员根据预期性能要求确定),然后根据应用响应时间结合T定义了三种不同的性能表现: Satisfied(满意):应用响应时间低于或等于T,比如T为1.5s,则一个耗时1s的响应结果则可以认为是satisfied的。 Tolerating(可容忍):应用响应时间大于T,但同时小于或等于4T。假设应用设定的T值为1s,则4*1=4s为应用响应时间的容忍上限。 Frustrated(烦躁期):应用响应时间大于4T。 APM 如何计算Apdex APM中,Apdex阈值即请求响应达到满意程度的最大时间。应用响应时延即服务时延,Apdex取值范围为0~1,计算公式如下: Apdex=(满意样本+可容忍样本*0.5)/样本总数
  • CMDB配置管理数据库 CMDB全称是Configuration Management DataBase,通过CMDB,可以结构化的组织并展示应用相关的资源配置信息,方便用户对应用进行全方位的监控和管理。主要概念如下: 应用: 一个应用代表一个逻辑单元,是一个全局概念,各个region都可以看到相同的应用信息,比如一个租户下面比较独立的功能模块可以定义为一个应用。应用可以跟企业项目关联,也可以不关联,关联企业项目后,按企业项目的权限进行管理,如果不关联企业项目,那么按照 IAM 权限进行管理。 子应用:在一个应用下面可以创建多个子应用,主要起文件夹和管理的功能。子应用为全局概念,当前最多支持三层子应用。 组件:组件指一个应用程序或者微服务,为全局概念,一般跟下面的环境一起组合使用,一个组件可以包含一个或者多个环境。比如一个订单的应用程序,包含功能测试环境,压力测试环境,预发环境以及现网环境等。 环境:一个组件或者程序,由于部署不同的配置参数,形成多个环境。每个环境都有region属性,可以通过region信息实现环境的过滤,也可以在环境上打上一个或多个标签,通过标签进行环境过滤。 实例:实例是环境下的一个进程,名称由主机名+ip+实例名称组成。一个环境一般是部署在不同主机上或不同容器中,如果部署在同一主机上,会通过实例名称进行区分。 环境标签:环境标签是在环境上的一个属性,多个环境可能具有相同的标签,可以通过标签对环境进行过滤。标签也承载公共配置能力,比如在某个标签上设置的配置,各个具有标签的环境都共享。需注意环境标签定义在应用层面,也就是说一个标签只能添加在本应用下的环境,不能跨应用进行。
  • 应用拓扑 应用拓扑是针对应用的调用关系和依赖关系的可视化展示。应用拓扑图主要是由圆圈、箭头连线、资源组成。每个箭头连线代表一个调用关系。连线上的数据表示请求量、平均RT和error数。拓扑使用平均RT进行量化,使用不同颜色对不同区间RT值进行标识,方便用户快速发现问题,并进行定位。 数据库:当数据库调用时间 ≥100ms时会被标记为黄色,当数据库调用时间≥200ms时会被标记为红色。 缓存:当缓存调用时间 ≥10ms时会被标记为黄色,当缓存调用时间≥30ms时会被标记为红色。 其他接口调用:当其他接口调用时间 ≥500ms时会被标记为黄色,当其他接口调用时间≥1000ms时会被标记为红色。 当出现error数大于0时会被标记为红色。 图1 应用拓扑
  • JavaAgent更新说明 目前仅支持主流的jdk8和jdk17,jdk17环境请选用末尾带-jdk17的版本。 下载Agent请参见探针下载地址。 表1 JavaAgent更新列表 版本号 更新说明 2.4.12 1、优化并发数递增逻辑。 2.4.12-profiler 1、优化Debugging诊断处理逻辑。 2.4.11-jdk11 1、支持jdk11,目前仅上线上海一,限部分用户测试使用。 2.4.11-profiler 1、支持Profiler的Live Object Memory类型。 2、支持全采样设置。 2.4.10-profiler 1、支持Debugging诊断。 2.4.9-profiler 1、Profiler时延度量线程采集算法优化。 2.4.9 1、优化springbean启动时间。 2.4.8-profiler 1、Profiler支持性能优化推荐。 2.4.8 1、支持redisson支持3.17.x。 2、url接口调用支持分位数。 2.4.7-profiler 1.支持用户包数据采集。 2.4.7 1.支持sql字节数的配置。 2.支持springbean插件。 3.支持jedis2.9.3。 2.4.6-profiler 支持时延持续性能剖析。 2.4.5-profiler 支持CPU、内存持续性能剖析。 2.4.5-jdk17 新增支持httpclient5,仅支持同步场景。 2.4.5 指标采集队列增加老化机制。 2.4.4 新增支持SpringCloudGateway(2.1.x~3.1.x)。 2.4.3 1.修复异常数未清零问题。 2.修复日志过大问题。 3.新增redisson基本信息。 2.4.2-jdk17 该版本只支持jdk17。 2.4.2 支持FunctionGraph在启动时关闭agent。 2.4.1 1.支持动态修改指标采集阈值。 2.接口调用维度新增异常数,统计url中日志标记的异常。 3.新增通过代理传输数据的功能。 2.3.19 1.支持日志自动打印traceId。 2.提高线程详情上限。 2.3.17 1.AKSK可以从环境变量读取。 2.调用链增加sqlId。 3.sql增加最近调用链。 4.补齐接口调用的集群维度分析能力。 2.3.16 1.指定注册协议。 2.兼容ibm sdk不支持线程内存获取。 2.3.15 1.新增支持dubbo2.8.x版本。 2.新增支持JDKhttp子类。 2.3.13 1. CS E Provider bizcode支持多key。 2.支持hikari插件。 2.3.12 1.客户端统计时,hashmap的key数量溢出后,之前是停止采集,现在修改为继续采集。 2.Url支持自动规整能力,当在后台配置为自动规整后,url按照原始格式规整。 3.oracle插件补齐读取行数和更新行数能力。 4.CSE Provider提供显示bizCode的功能。 5.修复CSE Provider修复状态码400时调用链没有标红。 2.3.5 1.支持启动脚本配置access地址。 2.3.2 1.支持jetty-client。 2.取消对com.huawei.bsp.commonlib.roa.restclient的支持。 3.url支持采集apdex。 2.3.1 1.支持cce解密sk。 2.支持jedis拦截key和value。 3.支持cassandra3。 2.2.15 1.支持sk自定义解密。 2.支持在启动脚本中配置master地址。 3.支持apacheHttpclient的responseBody采集。 2.2.13 1.使NamedTransformer加载接口类时直接返回原字节码。 2.解决mariadb3.0.4 sql没有采集到的问题。 3.支持oracle。 2.2.10 1.支持gauss-zenith数据库。 2.支持com.huawei.bsp.commonlib.roa.restclient。 2.2.9 1.支持jetcd 5.x - 6.x。 2.支持采集netty直接内存。 表2 CCE和Servicestage界面上 JavaAgent latest版本指向说明 版本号 实际版本号 latest-x86_64 2.4.3,支持x86架构。 latest-aarch64 2.4.3,支持arm架构。 latest-noroot-x86_64 2.4.3,支持x86架构,支持非root用户身份运行容器。 latest-noroot-aarch64 2.4.3,支持arm架构,支持非root用户身份运行容器。 latest 2.1.17,兼容x86和arm架构。
  • 产品规格差异 APM产品规格包括免费版和企业版,当前支持Java应用接入APM。各版本支持的功能详见下表。 版本 免费版 企业版 版本说明 完全免费,最多可接入10个Agent在线。 所有功能完全开放。 数据存储时长 7天 30天 应用拓扑 √ √ 调用链 链路追踪调用链公测期间仅支持2天存储,其它场景支持7天存储。 √ 指标监控 √ √ URL跟踪分析 √ √ 告警 √ √ CMDB √ √ 说明(是否支持,√表示支持,x表示不支持) 不支持企业版降级回免费版(基础版)。
  • 产品优势 非侵入式性能数据采集,无需修改业务代码即可轻松接入APM,数据来源如下: APM Agent:基于自研Agent通过非侵入方式采集业务调用数据、服务存量数据、调用的KPI数据等应用指标。 支持亿级调用链业务吞吐,无惧流量凶猛,为用户体验保驾护航。 开放了运营、运维数据查询接口和性能指标、采集标准,支持自主开发。 AI智能阈值检测,机器学习历史基线数据产生告警,通过RCA(Root Cause Analysis)分析找到问题根因。
  • 应用运维遇到挑战 在云时代微服务架构下应用日益丰富,纷杂的应用异常问题接踵而来。应用运维面临巨大挑战: 分布式应用关系错综复杂,应用性能问题分析定位困难,应用运维面临如何保障应用正常、快速完成问题定位、迅速找到性能瓶颈的挑战。 应用体验差导致用户流失。运维人员如果无法实时感知并追踪体验差的业务,不能及时诊断应用异常,将严重影响用户体验。 业务系统的应用多、分布广,跨系统、跨区域、跨应用的调用频繁,如何降低应用的管理和运维成本,提升应用运维的效率是迫切需要解决的问题。
  • APM帮您解决 华为云 应用性能管理 服务(Application Performance Management,简称APM)帮助运维人员快速发现应用的性能瓶颈,以及故障根源的快速定位,为用户体验保驾护航。 您无需修改代码,只需为应用安装一个APM Agent,就能够对该应用进行全方位监控,帮助您快速定位出错接口和慢接口、重现调用参数、发现系统瓶颈,从而大幅提升线上问题诊断的效率。目前支持JAVA、Python、Node.js、Go、Php和.Net应用,具体的应用监控能力概览如下表。 表1 APM监控能力 场景能力 说明 非侵入的应用性能数据采集 用户无需更改应用代码,只需要部署APM Agent包,修改相应的应用启动参数,就可以实现应用监控。 应用指标监控 无需配置,自动监控应用相关大量监控指标,如JVM、JavaMethod、URL、Exception、Tomcat、httpClient、Mysql、Redis、kafka等。 应用拓扑 通过对RPC调用信息进行动态分析、智能计算,自动生成分布式应用间拓扑关系。 调用链追踪 多个应用接入APM后,自动针对某一些请求进行采样,采集单个请求的服务之间调用关系以及中间调用的健康情况,实现全局调用链路的自动跟踪。 常用诊断场景的指标下钻分析 根据应用响应时间、请求数、错误率等指标下钻分析,按应用、组件、环境、数据库和中间件等多维度查看。 异常URL跟踪和慢URL跟踪捕捉 基于调用URL跟踪的超时和异常分析,并有效自动关联到对应的接口调用,如 SQL、MQ 等。 前端监控 APM Agent会周期性采集一些前端监控的性能指标数据,用来衡量浏览器/H5端、小程序端的总体健康状况。 链路追踪 链路追踪采集分布式应用的完整调用链路,提供了接口调用、数据库、异常等数据采集类型,可以帮助开发者快速分析和诊断分布式应用架构下的性能瓶颈,提高微服务时代下的开发诊断效率。 App监控 APM Agent会周期性采集一些App监控的性能指标数据,用来衡量Android端、iOS端以及鸿蒙端的总体健康状况。 接入APM:应用通过APM自身的AK/SK鉴权进行接入。 数据采集:APM可以通过非侵入方式采集APM Agent提供的应用数据、基础资源数据、用户体验数据等多项指标。 业务实现:APM支持应用指标监控、应用拓扑、调用链追踪和智能告警功能。 业务拓展: 通过APM的应用拓扑、调用链追踪等快速诊断应用性能异常,并结合 AOM 应用运维管理 )的应用运维指标进行综合判断。 找到应用性能瓶颈后,可以通过CodeArts PerfTest(性能测试 )关联分析生成性能报表。 通过智能算法学习历史指标数据,APM多维度关联分析异常指标,提取业务正常与异常时上下文数据特征,通过聚类分析找到问题根因。
  • 计费周期 开源探针和SDK以及Profiler数据上报后,会经过聚合、分析等计算处理,最终存储到APM平台,因此APM统计的数据量并非原始数据量。 OpenTelemetry、SkyWalking以及Profiler按上报量计费,计费周期为1小时。假设您是2024/11/06 16:29:30开始使用OpenTelemetry、SkyWalking以及Profiler,则计费周期如下。 第一个计费周期为:2024/11/06 17:15:00开始结算2024/11/06 16:29:30 ~ 2024/11/06 16:59:59之间的数据量。 第一个计费周期为:2024/11/06 18:15:00开始结算2024/11/06 17:00:00 ~ 2024/11/06 17:59:59之间的数据量。
  • 计费说明 APM提供按需计费模式,计费项按照数据量计费。具体内容如表1所示。 表1 计费规则 - 区域 产品规格 免费存储时长 计费方式 价格 说明 OpenTelemetry, SkyWalking 北京四、华南-广州、上海一、上海二 企业版 30天 按需计费 0.42元/GB 每个Region免费数据量为5G/月,超出5G数据量之后开始计费。 免费版 - - 每个Region免费数据量为5G/月,超出5G数据量之后将停止上报数据。 Profiler 北京四、华南-广州、上海一、上海二 企业版 7天 按需计费 0.42元/GB 每个Region免费数据量为5G/月,超出5G数据量之后开始计费。 免费版 - - 不支持Profiler功能。
  • 声明SDK处理的个人信息 在您接入、使用【华为云应用性能分析服务数据采集SDK】服务前,华为要求您在隐私政策中向用户告知华为SDK的名称、SDK提供方名称、收集个人信息类型、使用目的、隐私政策链接,并获取用户的同意或取得其他合法性基础。您可以参考如下方式提供条款内容: 以文字方式向用户告知 第三方SDK名称:华为云应用性能分析服务数据采集SDK(iOS/Android/HarmonyOS/web/微信小程序/百度小程序/钉钉小程序/支付宝小程序/快应用) 第三方公司名称: 华为云计算 技术有限公司 收集个人信息类型:收集设备型号、设备名称、设备磁盘信息、设备内存信息、设备品牌、设备CPU信息、操作系统名称、操作系统版本、APP版本、APP名称、APP进程信息、APP线程信息、Wi-Fi状态信息。 使用目的:帮助用户采集APP性能分析相关数据,并上报到华为云应用性能分析服务。 隐私政策链接:隐私与敏感信息保护声明 以表格方式向用户告知 第三方SDK名称 第三方公司名称 收集个人信息类型 使用目的 隐私政策链接 华为云应用性能分析服务数据采集SDK(iOS/Android/HarmonyOS/web/微信小程序/百度小程序/钉钉小程序/支付宝小程序/快应用) 华为云计算技术有限公司 收集设备型号、设备名称、设备磁盘信息、设备内存信息、设备品牌、设备CPU信息、操作系统名称、操作系统版本、APP版本、APP名称、APP进程信息、APP线程信息、Wi-Fi状态信息。 帮助用户采集APP性能分析相关数据,并上报到华为云应用性能分析服务。 隐私与敏感信息保护声明
  • 查看JAVA方法 APM默认不对JAVA方法进行监控,如需进行监控需要先配置JavaMethod监控项。 配置完成后系统会对JAVA方法的方法、类进行监控。 在“基础监控”下选择对应的实例、选择“JAVA方法”,查看对应的监控详情,参见表5。 图7 查看JAVA方法 表5 JAVA方法指标说明 指标集 指标 说明 JAVA方法 类名 JAVA方法的类名。 方法名 方法名。 调用次数 该方法的调用次数。 平均响应时间(ms) 平均响应时间。 错误数 该方法的错误数。 最大并发 该方法的最大并发。 最慢调用(ms) 该方法的最大响应时间。 0-10ms 响应时间在0-10ms范围请求数。 10-100ms 响应时间在10-100ms范围请求数。 100-500ms 响应时间在100-500ms范围请求数。 500-1000ms 响应时间在500-1000ms范围请求数。 1-10s 响应时间在1-10s范围请求数。 10s以上 响应时间在10s以上请求数。 单击“调用次数”、“错误数”等列的数值,可以查看所选时间段内该线程的趋势图。 单击“方法”列表右上角的自定义列表项,使界面上显示您需要查看的指标数据。 单击“方法”列表右上的导出列表项,可以导出当前页的列表信息,最大支持导出100条。
  • 查看GC监控 在APM服务支持对GC进行监控指标,具体指标以及说明,参见表2。 图5 查看GC监控 表3 GC监控指标说明 指标集 指标 说明 GC统计信息 fullgc次数 采集周期内fullgc的次数。 fullgc时间(ms) 采集周期内fullgc的时间。 younggc次数 采集周期内younggc的次数。 younggc时间(ms) 采集周期内younggc的时间。 gc详情 gc类型 gc类型,分为major和minor两种。 gc原因 发生gc的原因。 次数 gc发生的次数。 耗时(ms) gc消耗的时间。 最大耗时(ms) 最慢一次gc消耗的时间。 gc回收器 gc回收器的名称。 最慢gc详情 最慢一次gc的详细信息。 单击“次数”、“耗时”、“最大耗时”等列的蓝色字体数值,可以查看默认20分钟内该gc的趋势图。 选中某一个时间节点时,图表支持联动,展示该时间节点下各个指标的实际数值。 gc详情支持查看gc类型、gc原因、次数、耗时(ms)、最大耗时(ms)、gc回收器以及最慢gc详情(查看详情和历史信息)。 单击“gc详情”列表右上角的自定义列表项,使界面上显示您需要查看的指标数据。 单击“gc详情”列表右上的导出列表项,可以导出当前页的列表信息,最大支持导出100条。
  • 查看线程 可以直接在APM服务页面查看对应实例的线程信息,参见表4。 图6 查看线程 表4 线程指标说明 指标集 指标 说明 线程详情 线程名称 线程名称。 线程数量 线程数量。 cpu耗时(ms) 线程cpu耗时。 内存(M) 内存(M)。 线程堆栈 线程堆栈。 单击“个数”列的数值,可以查看所选时间段内该线程的趋势图。 单击“线程堆栈”列的“查看详情”,可以查看对应线程下线程详情。 单击“线程堆栈”列的“历史信息”,可以查看对应线程的线程堆栈信息。
  • 查看JVM监控 在APM服务支持对JVM进行监控指标,具体指标以及说明,参见表2。JVM进行监控指标以图表的形式展现在界面上,方便您对JVM监控数据更直观的查看与分析。 选中某一个时间节点时,图表支持联动,展示该时间节点下各个指标的实际数值。 单击“内存池”的列表右上角的自定义列表项,使界面上显示您需要查看的指标数据。 单击“内存池”的列表右上的导出列表项,可以导出当前页的列表信息,最大支持导出100条。 图4 查看JVM监控 表2 JVM监控指标说明 指标集 指标 说明 线程 当前线程数 当前线程数。 死锁线程数 死锁线程数。 守护线程数 守护线程数。 所有启动线程数 所有已经启动的线程数。 峰值线程数 峰值线程数。 线程状态 WAITING状态线程数 等待状态线程数量。 TERMINATED状态线程数 终止状态线程数量。 RUNNABLE状态线程数 运行状态线程数量。 BLOCKED状态线程数 阻塞状态线程数量。 NEW状态线程数 新状态线程数量。 TIMED_WAITING状态线程数 超时等待状态线程数量。 内存 非堆内存的使用 非堆内存的使用大小。 堆内存使用 堆内存使用的大小。 直接内存使用 直接内存使用大小。 类加载 已加载类数量 类加载器已加载类数量。 总加载类数量 类加载器总加载类数量。 卸载类数量 类加载器卸载类数量。 内存池 可使用内存 当前可使用的内存大小。 初始化内存 初始化内存大小。 最大内存 最大内存大小。 内存池名称 内存池名称。 已使用内存 已经被使用的内存大小。 CPU cpu使用率 java进程的cpu使用率。