华为云用户手册

  • 步骤四:启动镜像 原生docker启动命令中添加java探针所需参数,其中应用名称与服务名称根据实际调整。以vmall应用、服务名称vmall-dao-service为例。 修改docker启动脚本。 示例 原始启动命令如下: docker run -p 8080:8080 demo:latest 配置后启动命令如下: docker run -e JAVA_TOOL_OPTIONS="-javaagent:/opt/oss/servicemgr/ICAgent/pinpoint/pinpoint-bootstrap.jar -Dapm_application=vmall -Dapm_tier=vmall-dao-service -Dapm_container=true" -v /opt/apm-container:/paas-apm/collectors/pinpoint -v /opt/oss/servicemgr/ICAgent/pinpoint:/opt/oss/servicemgr/ICAgent/pinpoint -p 8080:8080 demo:latest 运行docker run命令来启动镜像,可以将镜像的应用接入 APM
  • 步骤四:开启应用监控 在E CS 或CCE上,配置Deployment应用的启动脚本:在yaml描述文件中增加如下示例中加粗配置。 执行如下命令编辑yaml文件: vi xxx.yaml 其中xxx为文件名称,是您在创建Deployment应用时自定义的应用描述文件。如下为示例,Deployment的详细说明请参见kubernetes官方文档。 kind: Deployment apiVersion: apps/v1 metadata: name: user-service namespace: default selfLink: /apis/apps/v1/namespaces/default/deployments/user-service uid: b231788d-9abd-11e8-80a5-fa163e3a2cc7 resourceVersion: '50972062' generation: 13 creationTimestamp: '2018-08-08T03:46:56Z' labels: app: user-service stack-name: auto-test annotations: deployment.kubernetes.io/revision: '5' description: '' enable: true spec: replicas: 1 selector: matchLabels: app: user-service template: metadata: creationTimestamp: null labels: app: user-service enable: true spec: #容器外主机上的挂载目录,包括数据输出路径、Java探针包路径 volumes: - name: paas-apm hostPath: path: /opt/apm-container - name: pinpoint-pkg hostPath: path: /opt/oss/servicemgr/ICAgent/pinpoint containers: - name: user-service image: '100.125.0.198:20202/zhyyy/user-service:v1' ports: - containerPort: 8080 protocol: TCP env: - name: PAAS_APP_NAME #工作负载名称(服务名称) value: user-service - name: PAAS_NAMESPACE #CCE集群namespace,如果非CCE集群则不填该环境变量 value: default - name: PAAS_PROJECT_ID #租户项目projectId value: d698369a975645bfb35f8437d11c5a12 - name: PAAS_CLUSTER_ID #CCE集群ID,可以在CCE界面通过f12查看,如果非CCE集群则不填该环境变量 value: 89b49857-5433-11e8-941c-0255ac101f3e - name: PAAS_POD_ID valueFrom: fieldRef: fieldPath: metadata.uid - name: PAAS_MONITORING_GROUP #应用名称(监控组),建议完成一个功能的多个服务填写相同应用名称 value: shoppingmall - name: JAVA_TOOL_OPTIONS value: -javaagent:/opt/oss/servicemgr/ICAgent/pinpoint/pinpoint-bootstrap.jar -Dapm_container=true resources: {} #挂载进容器内数据输出路径、Java探针包路径 volumeMounts: - name: paas-apm mountPath: /paas-apm/collectors/pinpoint - name: pinpoint-pkg mountPath: /opt/oss/servicemgr/ICAgent/pinpoint terminationMessagePath: /dev/termination-log terminationMessagePolicy: File imagePullPolicy: Always restartPolicy: Always terminationGracePeriodSeconds: 30 dnsPolicy: ClusterFirst securityContext: {} schedulerName: default-scheduler strategy: type: RollingUpdate rollingUpdate: maxUnavailable: 0 maxSurge: 1 revisionHistoryLimit: 10 progressDeadlineSeconds: 600 status: observedGeneration: 13 replicas: 1 updatedReplicas: 1 readyReplicas: 1 availableReplicas: 1 conditions: - type: Progressing status: 'True' lastUpdateTime: '2018-09-02T13:25:46Z' lastTransitionTime: '2018-08-08T03:46:56Z' reason: NewReplicaSetAvailable message: ReplicaSet "user-service-f584f46b7" has successfully progressed. - type: Available status: 'True' lastUpdateTime: '2018-12-21T11:01:33Z' lastTransitionTime: '2018-12-21T11:01:33Z' reason: MinimumReplicasAvailable message: Deployment has minimum availability. 使用修改后的Deployment重启应用,开启应用性能监控。
  • 步骤四:在APM上管理应用 应用启动后,等待3分钟应用数据就会呈现在APM界面中,此时登录APM,您可以在APM上通过拓扑、调用链等进行应用性能优化,详细操作请参考用户指南。 (可选)如果您想访问示例应用,可以进行如下操作: 修改ECS安全组规则,配置安全组入方向80端口访问许可,以确保可以通过浏览器访问示例应用。 在浏览器中打开“http://ECS的弹性IP”,访问示例应用并进行查询商品、查看购物车等操作。
  • 步骤三:开启应用监控 ICAgent安装完成后,需通过修改应用启动参数开启应用性能监控功能来加载ICAgent,否则无法正常使用APM对应用进行监控。针对示例应用,APM已经提供了修改后的脚本,所以您无需再进行修改,只需要在应用所在的ECS上执行如下命令启动修改后的脚本即可。 cd /root/testdemo chmod +x start_apminside.sh bash start_apminside.sh
  • 云审计 服务支持的APM操作列表 APM通过云审计服务记录与APM服务相关的操作事件,便于日后的查询、审计和回溯。 表1 云审计服务支持的APM操作列表 操作名称 资源类型 事件名称 删除应用 APM clearApps 设置事务别名 APM setAlias 更新虚机服务分组 APM updateVirtualService 更新事务配置 APM updateTxTypeSettings 更新拓扑Apdex阈值 APM updateThresholds 设置事务分组 APM txtypeGroupOperation 删除应用配置 apm deleteAppGroup 更新采集开关配置 apm setAppPpswitcherConfig 更新智能采样配置 apm setAppCallChainConfig 更新内存检测机制配置 apm setAppMwsConfig 更新日志增加TraceID配置 apm setAppLogTransacConfig 更新SQL分析开关配置 apm setAppSqlConfig 更新忽略HTTP响应代码或忽略错误和异常配置 apm setAppIgnoreConfig 父主题: 云审计服务支持的关键操作
  • 注意事项 针对 AOM 和APM,您总共可以创建不超过50个静态阈值模板,如果静态阈值模板数量已达上限50个时,请删除不需要的静态阈值模板后重新创建。APM界面只展示APM的静态阈值模板,如需查看全部模板请在AOM控制台进行查看。 设置通知策略 阈值规则的状态(正常、超限阈值)发生变化时,如需使用邮件或短信等方式发送通知,请参考下面操作在 SMN 界面设置通知策略。如不需接收邮件或短信通知,请跳过下面操作。具体操作如下: 创建一个主题,操作详见创建主题。 设置主题策略,操作详见设置主题策略。 设置主题策略时,“可发布消息的服务”必须选择“APM”,否则会导致通知发送失败。 为主题添加相关的订阅者,即通知的接收人(例如:邮件或短信),操作详见订阅主题。
  • 更多静态阈值模板操作 静态阈值模板创建完成后,您还可以执行表1中的操作。 表1 相关操作 操作 说明 使用静态阈值模板创建一条批量阈值规则 单击“操作”列的“创建规则”,操作详见使用模板创建批量阈值规则。 修改静态阈值模板 单击“操作”列的“编辑”。 删除静态阈值模板 删除一个静态阈值模板:单击“操作”列的“删除”。 删除一个或多个静态阈值模板:选中一个或多个静态阈值模板前的复选框,单击页面上方的“删除”。 搜索静态阈值模板 在右上角的搜索框中输入模板名称关键字,单击后显示匹配对象。
  • 创建方式 阈值规则支持创建批量阈值规则,供您选择使用。 批量阈值规则(该功能仅对华北-北京一区域和华东-上海二区域生效):资源和规则是多对一的关系,当监控多个资源时,一次创建操作完成后,只生成一条规则,多个资源是通过同一条规则进行监控。 当需要集中监控多个资源时,您需使用静态阈值模板进行创建,操作详见使用模板创建批量阈值规则。静态阈值模板是为创建批量阈值规则做准备的,您需先创建一个静态阈值模板,操作详见创建静态阈值模板。
  • 注意事项 针对AOM和APM,您总共可以创建不超过1000条阈值规则,如果阈值规则数量已达上限1000条时,请删除不需要的阈值规则后重新创建。APM界面只展示APM的阈值规则,如需查看全部规则请在AOM控制台进行查看。 设置通知策略 阈值规则的状态(正常、超限阈值)发生变化时,如需使用邮件或短信等方式发送通知,请参考下面操作在SMN界面设置通知策略。如不需接收邮件或短信通知,请跳过下面操作。具体操作如下: 创建一个主题,操作详见创建主题。 设置主题策略,操作详见设置主题策略。 设置主题策略时,“可发布消息的服务”必须选择“APM”,否则会导致通知发送失败。 为主题添加相关的订阅者,即通知的接收人(例如:邮件或短信),操作详见订阅主题。
  • APM自定义策略样例 示例1:授权用户安装ICAgent权限 { "Version": "1.1", "Statement": [ { "Effect": "Allow", "Action": [ "apm:icmgr:create" ] } ] } 示例2:拒绝用户卸载采集组件 拒绝策略需要同时配合其他策略使用,否则没有实际作用。用户被授予的策略中,一个授权项的作用如果同时存在Alow和Deny,则遵循Deny优先。 如果您给用户授予APM FullAccess的系统策略,但不希望用户拥有APM FullAccess中定义的卸载采集组件权限,您可以创建一条拒绝卸载采集组件的自定义策略,然后同时将APM FullAccess和拒绝策略授予用户,根据Deny优先原则,则用户可以对APM执行除了卸载采集组件外的所有操作。拒绝策略示例如下: { "Version": "1.1", "Statement": [ { "Effect": "Deny", "Action": [ "apm:icmgr:delete" ] } ] } 示例3:多个授权项策略 一个自定义策略中可以包含多个授权项,且除了可以包含本服务的授权项外,还可以包含其他服务的授权项,可以包含的其他服务必须跟本服务同属性,即都是项目级服务。多个授权语句策略描述如下: { "Version": "1.1", "Statement": [ { "Effect": "Allow", "Action": [ "aom:*:list", "aom:*:get", "apm:*:list", "apm:*:get" ] }, { "Effect": "Allow", "Action": [ "cce:cluster:get", "cce:cluster:list", "cce:node:get", "cce:node:list" ] } ] }
  • 线程指标图表 如图3所示,展示设置的时间段内某个实例的New线程数、Runnable线程数、Blocked线程数、Waiting线程数等线程执行情况的趋势。 图3 线程指标图 表2 线程说明 线程名称 说明 总数 是指总线程数,包含活动线程数和备用线程数。粘滞线程和专用线程在执行完成后变为备用线程。 死锁 是指两个或两个以上的线程在执行过程中,由于竞争资源或彼此通信而造成的阻塞现象,导致系统处于死锁状态。 New线程数 新建线程数量。 Runnable线程数 可运行线程数量。 Blocked线程数 阻塞线程数量。 Waiting线程数 等待中线程数量。 TimedWaiting线程数 限时等待线程数量。 Terminated线程数 终结线程数量。 最大连接数 Tomcat可用的最大连接数。 当前连接数 Tomcat当前已占用的连接数。 最大线程数 Tomcat最大执行线程数。 当前线程数 Tomcat当前执行线程数。 繁忙线程数 Tomcat当前处理任务的执行线程数。
  • 内存指标图表 如图1所示,展示设置的时间段内某个实例的总内存、堆内存、非堆内存等JVM不同内存区域的最大值、分配值和使用情况的趋势,也展示设置的时间段内某个实例的垃圾收集堆的GC时间和GC次数趋势。 图1 内存指标图 JVM内存介绍 JVM区域总体分为Heap memory和Non-Heap memory。 Heap memory:堆是Java 虚拟机运行时数据区域,分配所有实例和数组的内存。对象的堆内存由称为垃圾回收器的自动内存管理系统回收。Heap区分为Eden Space、Survivor Space和Tenured Space。 Non-Heap memory:Java 虚拟机管理堆之外的内存。Non-Heap区分为Code Cache、Permanent Space或Meta Space。 Java堆是垃圾收集器管理的主要区域,又称为Garbage Collection Heap,GC方式包括Full GC和Minor GC。 表1 内存区域说明 区 域名 称 说明 Eden Space 用于最初从线程池分配内存给大部分对象。 Survivor Space 用于保存在Eden区内存池中经过垃圾回收后没有被回收的对象。 Tenured Space 用于保持已经在Survivor区内存池中存在了一段时间的对象。 Code Cache 用于编译和保存本地代码的内存。 Permanent Space 用于保存虚拟机的静态数据,例如,类和方法对象。 Meta Space 用于保存本地化内存中类的元数据。Java 8之后Meta Space替代Permanent Space。 Direct Buffer 监控直接缓冲区的使用情况。 Full GC 当内存回收之后仍无法满足内存空间分配需求时, 对整个堆空间(新生代、老年代和永久代)进行垃圾收集。 Minor GC 当分配对象遇到内存不足时,对新生代空间(Eden区和Survivor区)进行垃圾收集。 JVM采用分代垃圾回收。在JVM的内存空间中把堆空间分为老年代和新生代。将大量(90%以上)创建后短期消亡的对象存储在新生代,而老年代中存放生命周期长久的实例对象。新生代空间分为Eden区和两个Survivor区。新对象首先分配在Eden区,Survivor区作为Eden区和Tenured区的缓冲,在Survivor区的对象经历若干次收集仍然存活的,就会被转移到老年区,如图2所示。 图2 内存区域图解 新生代共有两个Survivor区,分别用from和to指针指代,其中to指针指向空的Survivor区。
  • 添加阈值规则 您可以给JVM内存及线程的各个指标添加阈值规则,当满足规则条件时会触发告警,提醒您关注。 在“JVM监控”界面,先在页面左上角选择应用,再选择服务的具体某个实例。 在右侧的趋势图中可给内存或线程的每个指标设置阈值规则。单击趋势图上的“添加阈值规则”。 填写规则参数,如下图示例,最后单击“确认”。若需要发送告警通知,则“发送通知”需要选择“是”,并选择主题。 添加至服务参数说明: 若选择“是”,表示添加阈值规则到整个服务; 若选择“否”,表示添加阈值规则到单个实例。
  • 阈值规则 通过创建阈值规则创建“资源类型”为SQL的阈值规则。 如果产生告警后,需要查看产生告警具体的SQL语句,需要如下步骤: 从告警详情中查看告警上报的时间、sqlId,以及数据库实例tier。 在APM的SQL分析页面,根据查询到的tier和时间选择查询范围,查询到对应数据库实例当前时间内的SQL语句列表。 用查询到的sqlId搜索,查询到具体的SQL语句。 查询到SQL语句后,根据业务场景和SQL语句的指标值进行分析。
  • 自定义Apdex阈值 在左侧导航栏中选择“配置中心”。 在下拉列表框中选择需要设置Apdex阈值的应用。 设置阈值。什么是Apdex及Apdex阈值 在“拓扑Apdex阈值”后单击并输入拓扑Apdex阈值,单击保存。 拓扑Apdex阈值默认为100毫秒。 在“事务Apdex阈值”后单击并输入事务Apdex阈值,单击保存。 事务Apdex阈值默认为500毫秒。 该设置对应用内所有事务均生效。若用户已对某个事务的Apdex阈值单独进行了设置,则该设置对此事务不生效,但对此事务外的其他事务生效。单独设置某个事务Apdex阈值操作如下: 在左侧导航栏中选择“事务列表”。 在左上方的下拉列表框中选择事务所在的应用。 在事务列表中,找到该事务的“Apdex阈值(ms)”,单击并输入Apdex阈值,单击保存。
  • 远程卸载 除了上述登录服务器上执行uninstall.sh脚本卸载ICAgent的方式,还有类似继承安装的方式对主机进行远程卸载。 在已安装ICAgent的服务器上执行如下命令,其中x.x.x.x表示服务器IP地址。 bash /opt/oss/servicemgr/ICAgent/bin/remoteUninstall/remote_uninstall.sh -ip x.x.x.x 根据提示输入待卸载ICAgent的服务器root用户密码。 如果已安装ICAgent的服务器安装过expect工具,执行上述命令后,即可完成卸载。如果已安装ICAgent的服务器未安装expect工具,请根据提示输入,进行卸载。 请确保已安装ICAgent的服务器可以使用root用户执行SSH、SCP命令,来与待卸载ICAgent的服务器进行远端通信。 当显示“ICAgent uninstall success”时,表示卸载成功。 卸载完成后,可在 应用性能管理 左侧导航栏中选择“Agent管理”,查看该服务器ICAgent状态。
  • 继承批量安装 当您已有服务器安装过ICAgent,且该服务器“/opt/ICAgent/”路径下ICAgent安装包ICProbeAgent.tar.gz存在,通过该方式可对多个远端服务器进行一键式继承批量安装。 批量安装的ECS需和已安装成功的节点保持网络互通,scp、ssh命令可用。 如果已安装的服务器使用了委托方式安装,其它批量安装的节点也需要设置委托,请参考如何通过创建委托获取AK/SK。 批量安装脚本依赖python版本,建议在python2.x版本的机器上执行此操作,python3.x版本不支持。
  • ICAgent状态 ICAgent状态说明详见下表。 表2 ICAgent状态 状态 说明 运行 该主机ICAgent运行正常。 未安装 该主机未安装ICAgent。安装ICAgent,详细操作请参见安装ICAgent(Linux)。 安装中 正在为该主机安装ICAgent。安装ICAgent预计需要1分钟左右,请耐心等待。 安装失败 该主机ICAgent安装失败,请登录服务器卸载后重新安装。 升级中 正在升级该主机ICAgent。升级ICAgent预计需要1分钟左右,请耐心等待。 升级失败 该主机ICAgent升级失败。请登录服务器卸载后重新安装。 离线 输入的AK/SK错误或ECS委托设置错误导致该主机ICAgent功能异常。请获取正确的AK/SK或正确设置ECS委托。 异常 该主机ICAgent功能异常,请联系技术支持。
  • 安装方式说明 ICAgent有两种安装方式,您可以按照您的场景进行选择。您需要注意的是,下述两种安装方式,都不适用于容器节点(通过ServiceStage、AOS、CCE创建的集群容器节点),容器节点要使用APM,可参考快速入门根据应用的部署方式进行操作。安装方式见表1: 表1 安装方式 方式 适用场景 首次安装 当满足以下条件时,您需要按照该方式安装: 服务器已经绑定了EIP。绑定EIP的详细操作请参见为弹性云服务器申请和绑定弹性IP。 该服务器上未安装过ICAgent。 继承安装 当满足以下条件时,您需要按照该方式安装: 您有多个服务器需要安装ICAgent,其中一个服务器绑定了EIP,而剩余的没有绑定EIP。其中一个服务器已经通过首次安装方式装好了ICAgent,对于没有绑定EIP的服务器,您可以采用该安装方式。
  • 自定义事务 为了更精准定义事务,精准采集事务相关的调用链数据,您可以利用URI模板自定义事务,将多个请求分类放至不同的事务中。当采集器接收到请求时,优先计算自定义事务。 在事务界面,单击“自定义事务”。事务是由请求方法和正则表达式组成的,事务格式为{Request Method}_/{pattern},例如:请求方法为GET、POST,正则表达式为 /{name},则事务为GET,POST_/{name}。 选择“请求方法”。请求方法是一个或多个请求的方法名,包括GET、PUT、DELETE、POST、HEAD、CONNECT、OPTIONS、PATCH、TRACE、ALL,其中ALL表示可以匹配所有的请求方法。 在“正则表达式”文本框中,输入事务规则,单击“确定”,自定义事务规则保存成功。 正则表达式采用Spring MVC框架的URI模板匹配方式,例如:@RequestMapping(path="/owners/{ownerId}/pets/{petId}", method=RequestMethod.GET),其中ownerId、petId为变量。 如果您需要添加多条自定义事务规则,请单击“添加正则匹配”。 事务规则只能由英文大小写字母、数字、特殊字符“?”“*”“|”“=”“{}”“&”组成,且以“/”开头,不以“/”结尾,长度限制为1~50个字符。 “?”“*”支持模糊匹配,“?”可以匹配一个字符,“*”可以匹配一个URI中两个“/”中间的0到n个字符,“**”可以无限匹配字符。例如:输入/first/*,可以匹配/first/test,不能匹配/first/test/test,输入/first/**,可以匹配/first/test、/first/test/test。
  • 总览 应用是提供服务所需功能的软件,可以对相同或者相近业务的一组服务进行逻辑划分。您可以将某类相同业务的服务放到同一个应用中,并实现整个业务的应用性能管理。例如,可以将账户、产品、支付等服务,放入“商城”应用中。 通过总览您可以快速了解应用的健康情况。在总览界面中可进行如下操作: 图1 总览界面 应用卡片中的企业项目只有在您开通了企业项目后才会显示。开通企业项目后,历史探针应用及新增探针应用默认归类到default企业项目下,如需修改应用所属企业项目,可点击应用卡片上的企业项目名称跳转到企业项目页面对APM应用进行迁入迁出操作。企业项目管理提供了一种按企业项目管理云资源的方式,帮助您实现以企业项目为基本单元的资源及人员的统一管理,默认项目为default。关于开通、创建和管理企业项目的详情,请参见《企业管理用户指南》。 以下场景中您可以删除卡片服务: 已经将接入APM的服务删除掉了。 已经将ICAgent卸载了且不需要再采集服务数据了。 如果您已接入APM的服务目前仍在运行中,则删除此卡片三分钟左右之后,该卡片会重新显示出来。 父主题: 应用概览
  • 使用导读 本地图介绍了APM功能的使用场景的相关指导,您可以根据需要选择。 拓扑 可视化展示应用间调用关系和依赖关系,应用拓扑自发现,异常应用实例无处躲藏。 调用链 拓扑发现异常服务,通过查看调用状态、耗时、接口调用的详细信息,进一步定界问题产生的原因。 事务 展示事务的关键指标,使用Apdex对应用打分,直观体现用户对应用的满意度。 当事务异常,则上报告警。 对于用户体验差的事务,通过拓扑和调用链完成事务问题定位。 方法追踪 帮助应用的开发人员在线定位方法级性能问题。 SQL分析 分析异常SQL语句导致的数据库性能问题。拓扑展示数据库或SQL语句的关键指标。 JVM监控 实时监控JVM运行环境的内存和线程指标,快速发现内存泄漏、线程异常等问题。 拓扑展示实例的JVM指标数据。 当JVM指标异常,则上报告警。 了解更多 权限管理 创建用户并授权使用APM。 快速入门 使用APM功能前,了解多种场景下应用如何接入APM。 操作视频 拓扑、调用链、事务等的操作指导。 论坛 求助、技术分享、活动等。
  • 方案概述 Kafka将Topic划分为多个分区,消息被分布式存储在分区中。同一个消费组内,一个消费者可同时消费多个分区,但一个分区在同一时刻只能被一个消费者消费。 在消息处理过程中,如果客户端的消费速度跟不上服务端的发送速度,未处理的消息会越来越多,这部分消息就被称为堆积消息。消息没有被及时消费就会产生消息堆积,从而会造成消息消费延迟。 消息堆积原因 导致消息堆积的常见原因如下: 生产者短时间内生产大量消息到Topic,消费者无法及时消费。 消费者的消费能力不足(消费者并发低、消息处理时间长),导致消费效率低于生产效率。 消费者异常(如消费者故障、消费者网络异常等)导致无法消费消息。 Topic分区设置不合理,或新增分区无消费者消费。 Topic频繁重平衡导致消费效率降低。
  • 方案概述 Kafka将Topic划分为多个分区,所有消息分布式存储在各个分区上。每个分区有一个或多个副本,分布在不同的Broker节点上,每个副本存储一份全量数据,副本之间的消息数据保持同步。Kafka的Topic、分区、副本和代理的关系如下图所示: 在实际业务过程中可能会遇到各节点间或分区之间业务数据不均衡的情况,业务数据不均衡会降低Kafka集群的性能,降低资源使用率。 业务数据不均衡原因 业务中部分Topic的流量远大于其他Topic,会导致节点间的数据不均衡。 生产者发送消息时指定了分区,未指定的分区没有消息,会导致分区间的数据不均衡。 生产者发送消息时指定了消息Key,按照对应的Key发送消息至对应的分区,会导致分区间的数据不均衡。 系统重新实现了分区分配策略,但策略逻辑有问题,会导致分区间的数据不均衡。 Kafka扩容了Broker节点,新增的节点没有分配分区,会导致节点间的数据不均衡。 业务使用过程中随着集群状态的变化,多少会发生一些Leader副本的切换或迁移,会导致个别Broker节点上的数据更多,从而导致节点间的数据不均衡。
  • 实施步骤 业务数据不均衡的处理措施: 优化业务中Topic的设计,对于数据量特别大的Topic,可对业务数据做进一步的细分,并分配到不同的Topic上。 生产者生产消息时,尽量把消息均衡发送到不同的分区上,确保分区间的数据均衡。 创建Topic时,使分区的Leader副本分散到各个Broker节点中,以保障整体的数据均衡。 Kafka提供了分区重平衡的功能,可以把分区的副本重新分配到不同的Broker节点上,解决节点间负载不均衡的问题。具体分区重平衡的操作请参考修改分区平衡。
  • 如何查看安全数据采集和安全数据资源包的剩余量? 已包周期购买 安全云脑 的安全数据采集和安全数据保留资源包,可以通过以下方法查看剩余量: 在安全云脑总览页面右上角,将鼠标悬停在“标准版”或“专业版”上,页面显示版本管理窗口。 在版本管理窗口中,单击安全数据采集或安全数据保留栏中的“查看”。 图1 安全数据采集示例 在费用中心的资源包页面的资源包列表中,查看资源包的总量及剩余量。 图2 查看资源包剩余量 父主题: 计费FAQ
  • 约束与限制 包周期计费的标准版和专业版中,资产配额与增值包功能需分别退订/取消。 当资产配额(专业版或标准版)被全部退订/取消后,当前为基础版时,您再执行退订/取消增值包功能操作。 按需计费的专业版中,退订/取消专业版资产配额时,增值包功能将一并退订/取消。 增值包功能不支持单独使用。 如果您在购买了标准版或专业版的基础上,开通了增值包功能,当专业版或标准版的退订/取消后,未退订/取消增值包功能,对应功能将无数据支撑,无法使用。因此,如果您退订/取消了专业版或标准版,须再执行退订/取消增值包功能操作。 安全云脑退订后,需要手动释放以下资源: 如果使用了数据采集功能,需要手动释放用于采集数据的ECS资源,详细操作请参见如何释放ECS资源?。 如果使用了数据采集功能,需要手动释放用于连通和管理采集节点的 VPC终端节点 ,详细操作请参见删除终端节点。
  • 成本分配 成本管理的基础是树立成本责任制,让各部门、各业务团队、各责任人参与进来,为各自消耗云服务产生的成本负责。企业可以通过成本分配的方式,将云上成本分组,归集到特定的团队或项目业务中,让各责任组织及时了解各自的成本情况。 华为云成本中心支持通过多种不同的方式对成本进行归集和重新分配,您可以根据需要选择合适的分配工具。 通过关联账号进行成本分配 企业主客户可以使用关联账号对子客户的成本进行归集,从而对子账号进行财务管理。详细介绍请参见通过关联账号维度查看成本分配。 使用成本分组进行成本分配 企业可以使用成本中心的“成本分组”来拆分公共成本。公共成本是指多个部门共享的计算、网络、存储或资源包产生的云成本,或无法直接通过企业项目、成本标签分配的云成本。这些成本不能直接归属于单一所有者,因此不能直接归属到某一类别。使用拆分规则,可以在各团队或业务部门之间公平地分配这些成本。详细介绍请参见使用成本分组查看成本分配。
  • 成本优化 成本控制 企业可以在成本中心的“预算管理”页面创建精细粒度的预算来管理成本和使用量,在实际或预测超过预算阈值时,自动发送通知给指定消息接收人。企业还可以创建预算报告,定期将指定预算进展通知给指定消息接收人。 例如企业需要创建一个安全云脑的按需成本预算,每月预算金额为20000元,当预测金额高于预算金额的80%时发送预算告警。那么,创建的预算如下: 图1 预算基本信息 图2 设置成本范围 图3 设置提醒 详细介绍请参见使用预测和预算来跟踪成本和使用量。 资源优化 成本中心可以通过监控安全云脑的历史消费情况和资源使用率,为客户提供安全云脑资源的空闲识别和优化建议,寻找节约成本的机会。 计费模式优化 不同类型的业务对资源使用周期有不同的要求,为每一类业务确定合适的计费模式,灵活组合以达到最优效果。 针对长期稳定的成熟业务,使用包周期计费模式。 针对不能中断的短期、突增或不可预测的业务,使用按需计费模式。
  • 核对资源用量是否与实际相符 假设用户在2024/04/08 10:09:06购买了1个主机配额的按需计费专业版安全云脑(版本:专业版,主机配额:1),并在2024/04/08 12:09:06时刻将其删除。 安全云脑流水账单 按需计费安全云脑按秒计费,每一个小时整点结算一次费用,您可以在流水账单中核对每一个计费周期的信息是否和实际相符,具体如表1所示。 表1 安全云脑流水账单 产品类型 安全云脑 SecMaster 产品 安全云脑专业版 计费模式 按需 消费时间 2024/04/08 10:09:06 ~ 2024/04/08 12:09:06时段计费系统将生成3笔流水账单,对应每一个计费周期,分别如下: 2024/04/08 10:09:06 ~ 2024/04/08 11:00:00 2024/04/08 11:00:00 ~ 2024/04/08 12:00:00 2024/04/08 12:00:00 ~ 2024/04/08 12:09:06 官网价 官网价=使用量*单价 本例中,在第一个计费周期内安全云脑的使用量为3054秒,单价可在安全云脑价格详情中查询,以0.3125元/个(次)/小时为例,那么官网价=(3054 ÷ 3600) * 0.3125 = 0.26510417 元。同理,您可以计算剩余计费周期内资源的官网价。 优惠金额 用户使用云服务享受折扣优惠如商务折扣、伙伴授予折扣以及促销优惠等减免的金额。基于官网价的优惠金额。 抹零金额 华为云产品 定价精度为小数点后8位(单位:元),因此在计费过程中会产生小数点后8位的资源使用费用。而在实际扣费时,仅扣除到小数点后2位,小数点后第3位到第8位部分金额会被舍弃,这种舍弃部分的金额称作抹零金额。 以第一个计费周期为例,抹零金额为:0.00510417 元 应付金额 应付金额=官网价-优惠金额-抹零金额 以第一个计费周期为例,假设优惠金额为0,那么应付金额=0.26510417 - 0 - 0.00510417 = 0.26 元 安全云脑明细账单 明细账单可以通过多维度展示客户账单的详细信息。一般通过设置统计维度为“按使用量”,统计周期为“按账期”来统计资源在某个月份的总开销,建议您核对表2所示的信息是否和实际相符。 表2 安全云脑明细账单 产品类型 安全云脑 SecMaster 产品 安全云脑专业版 计费模式 按需 资源名称/ID 安全云脑的版本和ID 例如:professional,f31d48c3-2613-44a2-a145-c82573e23967 规格 安全云脑的版本 本例为安全云脑专业版 使用量类型 按需计费安全云脑的使用量类型为“时长” 单价 按需计费模式为简单 定价 (使用量*单价)时提供单价信息。 按需计费安全云脑属于简单定价,您可以在安全云脑价格详情中查询单价。 单价单位 在安全云脑价格详情中查询到的单价单位:元/个(次)/小时 使用量 按产品单价单位显示使用量,安全云脑的单价单位为元/个(次)/小时,因此使用量以小时为单位。本例中,2024/04/08 10:09:06 ~ 2024/04/08 12:09:06时段总计使用量为2小时。 使用量单位 小时 官网价 官网价=使用量*单价 本例中,使用量为2小时,单价可在安全云脑价格详情中查询,以0.3125元/个(次)/小时为例,那么官网价=2 * 0.3125 = 0.63 元。 优惠金额 用户使用云服务享受折扣优惠如商务折扣、伙伴授予折扣以及促销优惠等减免的金额。基于官网价的优惠金额。 应付金额 用户使用云服务享受折扣优惠后需要支付的费用金额。
共100000条
提示

您即将访问非华为云网站,请注意账号财产安全