华为云用户手册

  • 为云资源更换EIP配置流程 图1 为云资源更换EIP配置流程 表1 自定义路由表配置流程说明 序号 步骤 说明 1 为云资源解绑已有EIP 为资源解绑已有EIP后,云资源可以通过新的EIP访问公网。 2 申请新的EIP 当您已有需要绑定的EIP时,请忽略此步骤。 3 为云资源绑定新的EIP 为资源绑定新的EIP后,云资源可以通过新的EIP访问公网。 4 释放已被解绑的EIP 当已被解绑的EIP还需要继续使用时,请忽略此步骤。 当已被解绑的EIP不再使用时,您可以释放EIP。解绑后如果不及时释放该弹性公网IP,会产生弹性公网IP保有费。
  • 步骤三:为扩展网卡配置策略路由 远程登录E CS 。 ECS有多种登录方法,具体请参见登录弹性云服务器。 执行以下命令,查询网卡的路由信息。 route -n 显示如下图所示,本示例中: 主网卡路由的目的地址为192.168.11.0/24。 扩展网卡路由的目的地址为192.168.17.0/24。 执行以下命令,查看云服务器网卡名称。 ifconfig 显示如下图所示,通过网卡地址查找对应的网卡名称,本示例中: 192.168.11.42为主网卡地址,对应的名称为eth0。 192.168.17.191为扩展网卡地址,对应的名称为eth1。 执行以下步骤,设置网络默认通过扩展网卡访问公网。 执行如下命令,删除主网卡默认路由。 route del -net 0.0.0.0 gw 子网网关 dev 网卡名称 参数说明如下: 0.0.0.0:目的地址,表示匹配多有IP,请不要修改。 子网网关:填写表1中收集的主网卡所在子网的网关地址。 网卡名称:填写3中所查的主网卡名称。 命令示例: route del -net 0.0.0.0 gw 192.168.11.1 dev eth0 此操作会导致ECS流量中断,请谨慎操作。 执行如下命令,配置扩展网卡默认路由。 route add default gw 子网网关 参数说明如下: 子网网关:填写表1中收集的扩展网卡所在子网的网关地址。 命令示例: route add default gw 192.168.17.1 验证网络通信情况。 执行以下命令,验证ECS是否可以访问公网。 ping 公网IP地址或者 域名 命令示例: ping support.huaweicloud.com 回显类似如下信息,表示ECS可以访问公网。 [root@ecs-a01 ~]# ping support.huaweicloud.com PING hcdnw.cbg-notzj.c.cdnhwc2.com (203.193.226.103) 56(84) bytes of data. 64 bytes from 203.193.226.103 (203.193.226.103): icmp_seq=1 ttl=51 time=2.17 ms 64 bytes from 203.193.226.103 (203.193.226.103): icmp_seq=2 ttl=51 time=2.13 ms 64 bytes from 203.193.226.103 (203.193.226.103): icmp_seq=3 ttl=51 time=2.10 ms 64 bytes from 203.193.226.103 (203.193.226.103): icmp_seq=4 ttl=51 time=2.09 ms ... --- hcdnw.cbg-notzj.c.cdnhwc2.com ping statistics --- 4 packets transmitted, 4 received, 0% packet loss, time 3004ms rtt min/avg/max/mdev = 2.092/2.119/2.165/0.063 ms
  • 步骤一:创建资源并绑定扩展网卡 创建一个VPC,并在VPC下添加两个子网。 本示例中,ECS主网卡和扩展网卡位于同一个VPC内的不同子网。 具体请参见创建虚拟私有云和子网。 基于已有的VPC和子网,创建一个ECS。 具体方法请参见自定义购买ECS。 创建弹性网卡,并将弹性网卡绑定至ECS,用作扩展网卡。 创建弹性网卡时,请选择VPC下的另一个子网,和ECS的主网卡所属不同的子网,具体请参见创建弹性网卡。 将弹性网卡绑定至ECS,具体请参见将弹性网卡绑定至云服务器实例。 购买一个EIP,并将EIP绑定至ECS的扩展网卡。 购买EIP,具体操作请参见申请弹性公网IP。 将EIP绑定至ECS的扩展网卡,具体操作请参见将弹性网卡绑定至弹性公网IP。
  • 排查步骤 根据以下排查思路,如果解决完某个可能原因后,问题仍未解决,请继续排查其他可能原因。如果以下方法均不能解决您的疑问,请提交工单寻求更多帮助。 图1 排查思路 确定带宽是否超过限制 查看带宽的监控数据。 查看出入云带宽和带宽使用率等数据是否有超带宽,查看方法请参考导出监控指标。 查看带宽超限事件。 查看方法请参考查询EIP独享带宽历史超限情况。 如果未设置EIP带宽超限事件,请设置EIP带宽超限事件。当系统出现异常丢包或卡顿情况,您就可以通过“事件监控”查看EIP独享带宽历史超限详情。 偶尔短暂的超带宽不影响业务的情况下,可以忽略。如果持续超带宽或者多次瞬时超带宽,可参考步骤2排查处理。 带宽超限处理方法 流量突发可能会导致带宽瞬时超出上限,造成云服务器丢包。 建议您确认流量突发是否正常: 1. 正常流量突发,建议参考修改带宽提升带宽。 2. 非正常流量突发(比如攻击类流量导致的超带宽等),可参考系统资源被占用进行处理。 带宽未超限处理方法 根据步骤1中数据排查结果,带宽未超过限制,或未超过购买时的带宽大小,您可以考虑如下处理方法。 排查 云监控 告警设置是否异常 云监控设置EIP带宽超限告警时,告警策略设置不合理,系统将发送异常的带宽超限告警信息。解决方法请参考云监控告警设置异常。 EIP连接异常 EIP已绑定EIP,但是无法连接到Internet。解决方法请参考EIP连接出现问题时,如何排查?。
  • 服务器下载速度慢怎么办? 对于服务器下载速度慢,您可以按照以下可能原因排查解决: 带宽超限:您当前的使用流量太大,超过了带宽的基准速率,此种情况下限速策略就会生效,会导致一定程度的丢包,反应在业务侧则访问速度变慢。建议您排查业务情况或提升带宽的上限。 如果您的业务量后续会持续较大,您可参考修改共享带宽大小提升带宽。 如果您的业务量短期内会较大,您可以使用带宽加油包来短期提升带宽。 服务器内存使用率较高(如:超过80%),导致服务器卡顿。 可参考Linux云服务器卡顿怎么办?或Windows云服务器卡顿怎么办?解决。 运营商线路不稳定:服务器本地至云这一段的网络(即运营商公网)线路不稳定,建议咨询运营商了解线路情况。 跨境访问场景下,国际链路不稳定:跨境访问场景下,偶尔会因为跨境网路运营商线路拥堵或线路切换绕行以及国内运营商出境带宽限制导致网络短时间出现时延抖动或丢包。 可参考弹性云服务器访问中国大陆外网站时加载缓慢怎么办?和跨境访问出现短时间时延抖动或丢包,如何解决?解决。 此外,还可以使用国外服务器上传文件至邮箱或网盘,然后在国内访问邮箱或网盘下载至本地服务器。 父主题: 连接类
  • 如何访问弹性公网IP 通过管理控制台、基于HTTPS请求的API(Application Programming Interface)两种方式访问弹性公网IP。 管理控制台方式 管理控制台是网页形式的,您可以使用直观的界面进行相应的操作。登录管理控制台,从主页选择“弹性公网IP”。 API方式 如果用户需要将云平台上的弹性公网IP集成到第三方系统,用于二次开发,请使用API方式访问弹性公网IP,具体操作请参见《弹性公网IP API参考》。
  • 功能总览 表1列出了弹性公网IP的常用功能。 表1 弹性公网IP常用功能 功能分类 功能名称 功能描述 弹性公网IP和带宽 弹性公网IP 弹性公网IP提供独立的公网IP资源,包括公网IP地址与公网出口带宽服务,可以与云资源灵活绑定及解绑。 华为云提供的弹性公网IP相关功能包括:为云资源申请和绑定弹性公网IP、解绑和释放云资源的弹性公网IP、修改弹性公网IP带宽、静态BGP转换为动态BGP。 详细内容,请参见弹性公网IP简介。 共享带宽 共享带宽可以实现多个弹性公网IP共同使用一条带宽。提供区域级别的带宽共享及复用能力,同一区域下的所有已绑定弹性公网IP的弹性云服务器、裸金属服务器、弹性负载均衡等实例共用一条带宽资源。 华为云提供的共享带宽相关功能包括:申请共享带宽、修改共享带宽、删除共享带宽、添加弹性公网IP到共享带宽、从共享带宽中移出弹性公网IP。 详细内容,请参见共享带宽简介。 共享流量包 共享流量包是一款带宽流量套餐产品,使用方便,价格实惠。购买共享流量包后立即生效,并自动抵扣按需计费(按流量计费)的EIP带宽产生的流量资费,直到流量包用完或到期。 详细内容,请参见共享流量包简介。 带宽加油包 带宽加油包用来临时调大带宽上限,适用于在有效期内的包年/包月独享带宽和共享带宽。 华为云提供的带宽加油包相关功能包括:购买带宽加油包、修改带宽加油包和退订带宽加油包。 详细内容,请参见带宽加油包简介。 监控 查看监控指标 当用户开通了虚拟私有云服务后,无需额外安装其他插件,即可在云监控查看带宽、弹性公网IP的使用情况,也可以创建和设置告警规则,自定义监控目标与通知策略,及时了解虚拟私有云的状况,从而起到预警作用。 详细内容,请参见支持的监控指标。 标签 标签管理 标签功能方便您识别和管理云资源。华为云支持管理虚拟私有云标签、管理子网标签和管理弹性公网IP标签。 权限 权限管理 您可以使用 统一身份认证 服务 IAM 对您所拥有的弹性公网IP进行精细的权限管理,以满足企业基于组织划分、职能划分设置不同的访问权限。 说明: 弹性公网IP的权限包含在虚拟私有云中,由虚拟私有云的权限进行统一访问权限管理。 华为云提供的虚拟私有云权限管理功能包括:创建用户并授权使用VPC、创建VPC自定义策略。 详细内容,请参见权限管理。
  • EIP和GEIP配额限制 配额是在同一账号下或者某一区域下最多可同时拥有的某种资源的数量。 例如:华东-上海二区域下,EIP默认配额为5个,若在该区域下已创建2个EIP,则在该区域的剩余配额为3个。 华为云为防止资源滥用,对云服务每个区域的用户资源数量和容量做了配额限制。 如需查看每个配额项目支持的默认配额,请参考怎样查看我的配额?,登录控制台查询您的配额详情。如需扩大资源配额,请在华为云管理控制台申请扩大配额。 表1介绍EIP场景的默认配额限制。配额数据分区域呈现,默认每个区域的配额数据相同。 表1 EIP配额说明 配置名称 默认配额限制 是否支持调整 一个用户在单个区域可创建的弹性公网IP数量 不同用户根据其账户类型和服务等级享有不同的默认资源配额。请在配额限制查看您的个人配额详情。 是 提交工单申请提升配额 一个用户在单个区域内可创建的弹性公网IP池数量 不同用户根据其账户类型和服务等级享有不同的默认资源配额。请在配额限制查看您的个人配额详情。 是 提交工单申请提升配额 一个用户在单个区域内可创建的共享带宽数量 不同用户根据其账户类型和服务等级享有不同的默认资源配额。请在配额限制查看您的个人配额详情。 是 提交工单申请提升配额 一个用户在单个区域内,单个共享带宽可添加的IP数量 不同用户根据其账户类型和服务等级享有不同的默认资源配额。请在配额限制查看您的个人配额详情。 是 提交工单申请提升配额
  • 解决方法二 您还可以直接在helm部署pod的yaml文件中添加如下env相关参数,然后重新部署pod。 env: - name: PAAS_APP_NAME value: XXXXXXXXXXXX - name: PAAS_NAMESPACE value: XXXXXXXXXX - name: PAAS_PROJECT_ID value: 2a***********************cf PAAS_APP_NAME:应用名称,即要部署的工作负载名称。 PAAS_NAMESPACE:命名空间名称,即要部署的工作负载所在CCE集群的的命名空间。可进入CCE集的详情页的“命名空间”页面进行查询。 PAAS_PROJECT_ID:租户的项目ID。获取方法详情请参见:获取项目ID。 以上env相关参数的value请根据实际情况替换。 图3 添加env参数
  • 创建委托 登录IAM控制台。 在左侧导航栏,单击“委托”,进入委托页面。 单击右上角“创建委托”,进入创建委托页面。 参考表1设置创建委托的参数。 表1 创建委托 名称 说明 样例 委托名称 标识该委托代理的名称。 须知: 委托名称必须为apm_admin_trust。 - 委托类型 选择“云服务”。 云服务 云服务 请选择“ 应用运维管理 AOM ”。 - 持续时间 选择“永久”。 永久 描述 可选参数,用于补充说明该委托代理的详细信息。 - 单击“下一步”,进入“授权”页面。 在“选择策略”页签选择“DMS UserAccess”策略,并单击“下一步”。 DMS UserAccess策略:分布式消息服务普通用户权限(无实例创建、修改、删除、扩容、转储)。 在“设置最小授权范围”页签设置授权范围方案为“指定区域项目资源”,并在下方“项目[所属区域]”选定生效区域。 单击“确定”,委托关系创建成功。
  • 如何创建终端节点? 当前支持通过创建终端节点和AOM/LTS服务打通网络,进行心跳和指标上报,以及日志上报。如果要通过终端节点的方式打通AOM/LTS的网络,需要为AOM和LTS各自购买1个终端节点。 创建AOM/LTS终端节点的方法: 登录华为云 VPC终端节点 VPCEP控制台,进入终端节点页面。 单击“购买终端节点”。 在购买终端节点页面,选择终端节点所在的区域,“服务类别”选择“云服务”,在“选择服务”下方查找并选择AOM的云服务,并且勾选“创建内网域名”,选择终端节点所在的虚拟私有云和子网,其他参数默认设置,更多操作请参考购买终端节点。 设置完成后,单击“立即购买”。购买成功后,即可完成AOM终端节点的创建。 重复上面步骤,需要再购买1个终端节点,选择终端节点所在的区域,“服务类别”选择“云服务”,在“选择服务”下方查找并选择LTS的云服务,并且勾选“创建内网域名”,选择终端节点所在的虚拟私有云和子网,其他参数默认设置。 设置完成后,单击“立即购买”。购买成功后,即可完成了LTS终端节点的创建。 父主题: 采集管理
  • 解决方法 检查UniAgent的状态,UniAgent状态有运行中、异常、安装中、安装失败和未安装,若UniAgent为非“运行中”状态,请分别按照以下方法解决: 异常:表示主机安装的UniAgent功能异常,请联系技术支持。 安装中:表示该主机正在安装UniAgent。安装UniAgent预计需要1分钟左右,请耐心等待。 安装失败:表示主机安装UniAgent失败,请重新安装。 未安装:表示主机未安装UniAgent。安装UniAgent,详细操作请参见安装UniAgent。 UniAgent的状态变为“运行中”后,重新在ECS执行脚本任务。
  • 原因分析 当用户使用普罗函数(例如:"count"、"max"、"min"、"avg"、"sum"、"count_values"、"stddev"、"stdvar"、"group"、"bottomk"、"topk"、"quantile")或运算符(例如:"and"、"or"、"unless")作为自定义指标名称,并将该自定义指标上报到AOM时,为避免promql查询时有误,AOM会将此类指标名称默认增加前缀“aom_prom_fixed_”。例如:原始自定义指标名称为"count",会被自动转换为“aom_prom_fixed_count”。在废弃指标时,由于转换后aom_prom_fixed_开头的指标未能匹配到原始指标名称,导致指标废弃失败。
  • ICAgent安装类常见问题 ICAgent安装机和目标机器网络不通,报错提示“[warn] ssh connect failed, 1.2.1.2:22”如何解决? 答:安装之前先在安装页面单击连接测试,选择网络能通的安装机。 ICAgent安装成功后,后续的心跳和注册都失败,代理机网络不通,如何解决? 答:在目标机器上执行“telnet 代理机ip”,检查代理机和目标机器间的网络连通性。 安装ICAgent时需要开放8149、8102、8923、30200、30201和80端口,安装完成后80端口是否可以关闭? 答:80端口仅用作k8s软件包拉取,ICAgent安装完成后即可关闭。 在K8S集群中安装ICAgent,当K8S集群版本升级后是否会对原本安装的ICAgent有影响? 答:升级k8s集群版本后系统会重启ICAgent,并将ICAgent的版本升级到最新。 父主题: 采集管理
  • 操作步骤 登录AOM 2.0控制台,在左侧导航栏单击“自动化运维(日落)”,进入“自动化运维”界面。 在左侧导航栏中选择“作业管理”,单击右上角的“新建作业”。 设置“添加全局参数”,创建参数类型为“字符串”的参数 param1, 创建参数类型为“主机列表”的参数param2,并保存。 创建作业步骤,如创建脚本执行步骤时,可在“脚本参数”中通过 ${param1} 引用字符串参数,可在选择“目标实例”时选择“全局参数”,并通过下拉框选择 param2,保存作业步骤即可生效。 作业创建完成后,可以在每次执行时填入 param1 的值,并选择执行目标实例,即确定 param2 的值。
  • 步骤四:自建机器通过专线访问AOM域名 自建机器可以通过直接访问VPC终端节点VPC-EP的IP,访问VPC-EP对接的域名,也可以通过在机器上配置域名解析,通过接口访问AOM服务。以下通过配置域名解析为例访问AOM服务。 以Centos为例在自建机器中执行以下命令。 sudo vi /etc/hosts 配置域名解析。例如,新增配置: 192.168.0.31 aom-access.cn-north-4.myhuaweicloud.com “192.168.0.31”为VPC-EP的IP地址 ,“aom-access.cn-north-4.myhuaweicloud.com”为AOM的域名。
  • 应用场景 使用MongoDB过程中需要对MongoDB运行状态进行监控,以便了解MongoDB服务是否运行正常,排查MongoDB故障问题原因。Prometheus监控服务提供了CCE容器场景下基于Exporter的方式来监控MongoDB运行状态。本文介绍如何部署Exporter以及实现MongoDB Exporter告警接入等操作。 为了方便安装管理Exporter,推荐使用CCE进行统一管理。
  • 镜像概述 镜像是一个包含了软件及必要配置的云服务器或裸金属服务器模板,包含操作系统或业务数据,还可以包含应用软件(例如,数据库软件)和私有软件。镜像分为公共镜像、私有镜像、共享镜像和市场镜像。 镜像服务 (Image Management Service)提供简单方便的镜像自助管理功能。用户可以灵活便捷地使用公共镜像、私有镜像或共享镜像申请云服务器。同时,用户还能通过已有的云服务器或使用外部镜像文件创建私有镜像。
  • 在Linux环境打包镜像 用户在Linux环境下,可以使用以下打包镜像的方式。 用户基于使用的镜像创建一个弹性云服务器,详细操作请参考弹性 云服务器入门 。 执行以下命令(以华北-北京四区域为例),将install_uniagentd_self_OS.sh脚本下载到弹性云服务器上的/root 目录下: wget https://aom-uniagent-cn-north-4.obs.cn-north-4.myhuaweicloud.com/install_uniagentd_self_OS.sh {region_id}=cn-north-4 {obs_domain}=obs.cn-north-4.myhuaweicloud.com 下载命令的拼接规则:wget https://aom-uniagent-{region_id}.{obs_domain}/install_uniagentd_self_OS.sh 在/etc/init.d/目录下添加执行以下命令,将install_uniagentd_self_OS.sh脚本设置成开机自启动: bash /root/install_uniagentd_self_OS.sh config 如果在/etc/init.d/目录下有AOMInstall开机启动脚本,即设置成功。 执行以下命令,删除配置脚本: rm -f /root/install_uniagentd_self_OS.sh 执行完以上步骤之后,即可制作镜像,制作私有镜像之前,Linux机器不能重启。 在目标ECS弹性云服务器的操作列单击“创建镜像”去创建私有镜像,详细操作请参考创建镜像。 根据用户的使用需要,配置镜像信息。
  • 在CCE集群部署PostgreSQL Exporter 登录CCE控制台。 单击已接入的集群名称,进入该集群的管理页面。 执行以下操作完成Exporter部署。 使用Secret管理PostgreSQL密码。 在左侧导航栏中选择“工作负载”,在右上角单击“YAML创建”完成YAML配置。YAML配置说明:使用Kubernetes的Secret来管理密码并对密码进行加密处理,在启动PostgreSQL Exporter的时候直接使用Secret Key,需要调整对应的password。 YAML 配置示例如下: apiVersion: v1 kind: Secret metadata: name: postgres-test type: Opaque stringData: username: postgres #对应 PostgreSQL 用户名 password: *********** #对应 PostgreSQL 密码 部署PostgreSQL Exporter。 在左侧导航栏中选择“工作负载”,在右上角单击“YAML创建”,以YAML的方式部署Exporter。 YAML配置示例如下(请直接复制下面的内容,根据实际业务调整相应的参数): apiVersion: apps/v1 kind: Deployment metadata: name: postgres-test # 根据业务需要调整成对应的名称,建议加上 PG 实例的信息 namespace: default #需要和 postgres 的 service 在同一命名空间 labels: app: postgres app.kubernetes.io/name: postgresql spec: replicas: 1 selector: matchLabels: app: postgres app.kubernetes.io/name: postgresql template: metadata: labels: app: postgres app.kubernetes.io/name: postgresql spec: containers: - name: postgres-exporter image: swr.cn-north-4.myhuaweicloud.com/aom-exporter/postgres-exporter:v0.8.0 # 上传至 SWR 的 postgres-exporter 镜像 args: - "--web.listen-address=:9187" # Exporter 开启的端口 - "--log.level=debug" # 日志级别 env: - name: DATA_SOURCE_USER valueFrom: secretKeyRef: name: postgres-test # 对应上一步中的 Secret 的名称 key: username # 对应上一步中的 Secret Key - name: DATA_SOURCE_PASS valueFrom: secretKeyRef: name: postgres-test # 对应上一步中的 Secret 的名称 key: password # 对应上一步中的 Secret Key - name: DATA_SOURCE_URI value: "x.x.x.x:5432/postgres?sslmode=disable" # 对应的连接信息 ports: - name: http-metrics containerPort: 9187 获取指标。 通过“curl http://exporter:9187/metrics”无法获取Postgres实例运行时间,可以通过自定义一个queries.yaml来获取该指标。 创建一个包含queries.yaml的配置。 将配置作为Volume挂载到Exporter某个目录下。 通过extend.query-path来使用配置,将上述的Secret以及Deployment进行汇总,汇总后的YAML如下所示: # 以下 document 创建一个包含自定义指标的 queries.yaml --- apiVersion: v1 kind: ConfigMap metadata: name: postgres-test-configmap namespace: default data: queries.yaml: | pg_postmaster: query: "SELECT pg_postmaster_start_time as start_time_seconds from pg_postmaster_start_time()" master: true metrics: - start_time_seconds: usage: "GAUGE" description: "Time at which postmaster started" # 以下 document 挂载了 Secret 和 ConfigMap ,定义了部署 Exporter 相关的镜像等参数 --- apiVersion: apps/v1 kind: Deployment metadata: name: postgres-test namespace: default labels: app: postgres app.kubernetes.io/name: postgresql spec: replicas: 1 selector: matchLabels: app: postgres app.kubernetes.io/name: postgresql template: metadata: labels: app: postgres app.kubernetes.io/name: postgresql spec: containers: - name: postgres-exporter image: wrouesnel/postgres_exporter:latest args: - "--web.listen-address=:9187" - "--extend.query-path=/etc/config/queries.yaml" - "--log.level=debug" env: - name: DATA_SOURCE_USER valueFrom: secretKeyRef: name: postgres-test-secret key: username - name: DATA_SOURCE_PASS valueFrom: secretKeyRef: name: postgres-test-secret key: password - name: DATA_SOURCE_URI value: "x.x.x.x:5432/postgres?sslmode=disable" ports: - name: http-metrics containerPort: 9187 volumeMounts: - name: config-volume mountPath: /etc/config volumes: - name: config-volume configMap: name: postgres-test-configmap --- apiVersion: v1 kind: Service metadata: name: postgres spec: type: NodePort selector: app: postgres app.kubernetes.io/name: postgresql ports: - protocol: TCP nodePort: 30433 port: 9187 targetPort: 9187 访问地址: http://{集群任意节点的公网IP}:30433/metrics,即可通过自定义的queries.yaml查询到Postgres实例启动时间指标。 图1 访问地址
  • 数据库授权 登录集群执行以下命令,以root用户身份登录MySQL数据库: kubectl exec -it ${mysql_podname} bash mysql -u root -p 图1 登录数据库 登录数据库,执行以下命令为数据库授权: CREATE USER 'exporter'@'x.x.x.x(hostip)' IDENTIFIED BY 'xxxx(password)' WITH MAX_USER_CONNECTIONS 3; GRANT PRO CES S, REPLICATION CLIENT, SELECT ON *.* TO 'exporter'@'x.x.x.x(hostip)'; 验证授权是否成功。 输入以下命令查询sql,查看是否有exporter的数据,有exporter的数据则证明授权成功。host为mysql所在节点的IP。 select user,host from mysql.user; 图2 查询sql
  • 应用场景 使用ElasticSearch过程中需要对ElasticSearch运行状态进行监控,例如集群及索引状态等。Prometheus监控服务提供了CCE容器场景下基于Exporter的方式来监控ElasticSearch运行状态。本文介绍如何部署ElasticSearch Exporter以及实现ElasticSearch Exporter告警接入等操作。 为了方便安装管理Exporter,推荐使用CCE进行统一管理。
  • 基础指标:容器指标 介绍通过CCE的kube-prometheus-stack插件或者自建K8s集群上报到AOM集群容器指标的类别、名称、含义等信息。 表1 CCE/自建K8s集群容器指标 Target名称 Job名称 指标 指标含义 serviceMonitor/monitoring/coredns/0 serviceMonitor/monitoring/node-local-dns/0 coredns 和node-local-dns coredns_build_info CoreDNS的构建信息 coredns_cache_entries 缓存中元素的数量 coredns_cache_size 缓存大小 coredns_cache_hits_total 缓存命中次数 coredns_cache_misses_total 缓存未命中次数 coredns_cache_requests_total 不同维度下DNS解析请求的计数 coredns_dns_request_duration_seconds_bucket DNS请求耗时直方图bucket coredns_dns_request_duration_seconds_count DNS请求耗时直方图count coredns_dns_request_duration_seconds_sum DNS请求耗时直方图sum coredns_dns_request_size_bytes_bucket DNS请求大小直方图bucket coredns_dns_request_size_bytes_count DNS请求大小直方图count coredns_dns_request_size_bytes_sum DNS请求大小直方图sum coredns_dns_requests_total DNS请求次数 coredns_dns_response_size_bytes_bucket DNS响应大小直方图bucket coredns_dns_response_size_bytes_count DNS响应大小直方图count coredns_dns_response_size_bytes_sum DNS响应大小直方图sum coredns_dns_responses_total DNS响应码及数量 coredns_forward_conn_cache_hits_total 每个协议和数据流的缓存命中次数 coredns_forward_conn_cache_misses_total 每个协议和数据流的缓存未命中次数 coredns_forward_healthcheck_broken_total 健康检查broken次数 coredns_forward_healthcheck_failures_total 健康检查失败次数 coredns_forward_max_concurrent_rejects_total 并发超限拒绝次数 coredns_forward_request_duration_seconds_bucket forward请求耗时直方图bucket coredns_forward_request_duration_seconds_count forward请求耗时直方图count coredns_forward_request_duration_seconds_sum forward请求耗时直方图sum coredns_forward_requests_total 每个数据流的请求次数 coredns_forward_responses_total 每个数据流的响应次数 coredns_health_request_duration_seconds_bucket health请求耗时直方图bucket coredns_health_request_duration_seconds_count health请求耗时直方图count coredns_health_request_duration_seconds_sum health请求耗时直方图sum coredns_health_request_failures_total health请求失败总数 coredns_hosts_reload_timestamp_seconds 最近一次加载host文件的时间戳 coredns_kubernetes_dns_programming_duration_seconds_bucket DNS编程耗时直方图bucket coredns_kubernetes_dns_programming_duration_seconds_count DNS编程耗时直方图count coredns_kubernetes_dns_programming_duration_seconds_sum DNS编程耗时直方图sum coredns_local_localhost_requests_total localhost请求数量 coredns_nodecache_setup_errors_total nodecache设置错误次数 coredns_dns_response_rcode_count_total 每个Zone和Rcode的响应次数 coredns_dns_request_count_total DNS请求次数 coredns_dns_request_do_count_total 设置了DO标志位的请求总数 coredns_dns_do_requests_total 设置了DO标志位的请求总数 coredns_dns_request_type_count_total 每个Zone和Type的请求次数 coredns_panics_total 发生Panic的总数 coredns_plugin_enabled 各插件的启用状态 coredns_reload_failed_total reload失败次数 serviceMonitor/monitoring/kube-apiserver/0 apiserver aggregator_unavailable_apiservice 不可用的APIService数量 apiserver_admission_controller_admission_duration_seconds_bucket 准入控制器(Admission Controller)的处理延时 apiserver_admission_webhook_admission_duration_seconds_bucket 准入Webhook(Admission Webhook)的处理延时 apiserver_admission_webhook_admission_duration_seconds_count 准入Webhook(Admission Webhook)的处理请求统计 apiserver_client_certificate_expiration_seconds_bucket 证书剩余有效时长 apiserver_client_certificate_expiration_seconds_count 证书剩余有效时长 apiserver_current_inflight_requests 在处理读请求数量 apiserver_request_duration_seconds_bucket 客户端对APIServer的访问时延 apiserver_request_total 对APIServer不同请求的计数 go_goroutines 协程数量 kubernetes_build_info 构建信息 process_cpu_seconds_total 进程CPU累计时长 process_resident_memory_bytes 进程常驻内存集的大小 rest_client_requests_total REST请求数量 workqueue_adds_total 工作队列Add次数 workqueue_depth 工作队列深度 workqueue_queue_duration_seconds_bucket 任务在工作队列中存在的时长 aggregator_unavailable_apiservice_total 不可用的APIService总数 rest_client_request_duration_seconds_bucket REST请求耗时 serviceMonitor/monitoring/kubelet/0 kubelet kubelet_certificate_manager_client_expiration_renew_errors 证书续期错误次数 kubelet_certificate_manager_client_ttl_seconds Kubelet客户端证书的TTL kubelet_cgroup_manager_duration_seconds_bucket 控制组管理器操作的持续时间bucket kubelet_cgroup_manager_duration_seconds_count 控制组管理器操作的持续时间count kubelet_node_config_error 如果节点遇到与配置相关的错误,则此指标为true(1),否则为false(0) kubelet_node_name 节点名称,值始终为1 kubelet_pleg_relist_duration_seconds_bucket PLEG中relist Pod耗时bucket kubelet_pleg_relist_duration_seconds_count PLEG中relist Pod耗时count kubelet_pleg_relist_interval_seconds_bucket PLEG中relist时间间隔bucket kubelet_pod_start_duration_seconds_count Pod启动时间count kubelet_pod_start_duration_seconds_bucket Pod启动时间bucket kubelet_pod_worker_duration_seconds_bucket 同步单个Pod的持续时间。按操作类型细分:create、update、sync kubelet_running_containers 当前运行的容器数 kubelet_running_pods 当前运行的pod数 kubelet_runtime_operations_duration_seconds_bucket 运行时操作耗时bucket kubelet_runtime_operations_errors_total 按操作类型列出的运行时操作错误的累积数 kubelet_runtime_operations_total 按操作类型列出的运行时操作的累积数 kubelet_volume_stats_available_bytes volume可用量 kubelet_volume_stats_capacity_bytes volume容量 kubelet_volume_stats_inodes volume inode总数 kubelet_volume_stats_inodes_used volume 已使用inode数量 kubelet_volume_stats_used_bytes volume已用量 storage_operation_duration_seconds_bucket 存储操作耗时bucket storage_operation_duration_seconds_count 存储操作耗时count storage_operation_errors_total 存储操作错误次数 volume_manager_total_volumes Volume Manager中的volumes总数 rest_client_requests_total HTTP请求数,维度包含Status code、Method和Host rest_client_request_duration_seconds_bucket 请求时延bucket process_resident_memory_bytes 进程常驻内存集的大小 process_cpu_seconds_total 进程CPU累计时长 go_goroutines 协程个数 serviceMonitor/monitoring/kubelet/1 kubelet container_cpu_cfs_periods_total 容器已经执行的CPU时间周期数 container_cpu_cfs_throttled_periods_total 容器被限流的CPU时间周期数 container_cpu_cfs_throttled_seconds_total 容器被限流的CPU时间 container_cpu_load_average_10s 容器过去10秒内的CPU负载的平均值 container_cpu_usage_seconds_total 容器在所有CPU内核上的累积占用时间 container_file_descriptors 容器打开的文件描述符数量 container_fs_inodes_free 文件系统的可用inode数量 container_fs_inodes_total 文件系统的总计inode数量 container_fs_io_time_seconds_total 磁盘/文件系统花费在 I/O 上的累计秒数 container_fs_limit_bytes 容器可以使用的磁盘/文件系统总量 container_fs_read_seconds_total 容器累积读取磁盘/文件系统数据的秒数 container_fs_reads_bytes_total 容器累积读取磁盘/文件系统数据的总量 container_fs_reads_total 容器已完成读取磁盘/文件系统的累积计数 container_fs_usage_bytes 文件系统的使用量 container_fs_write_seconds_total 容器累计写入磁盘/文件系统的秒数 container_fs_writes_bytes_total 容器累积写入磁盘/文件系统数据的总量 container_fs_writes_total 容器已完成写入磁盘/文件系统的累积计数 container_memory_cache 容器总页缓存内存 container_memory_failcnt 容器内存使用达到限制的次数 container_memory_max_usage_bytes 容器历史最大内存使用量 container_memory_rss 容器常驻内存集的大小 container_memory_swap 容器虚拟内存使用量 container_memory_usage_bytes 容器当前的内存使用量 container_memory_working_set_bytes 容器工作集内存使用量 container_network_receive_bytes_total 容器网络累积接收数据总量 container_network_receive_errors_total 接收时遇到的错误累积计数 container_network_receive_packets_dropped_total 接收时丢弃的数据包的累积计数 container_network_receive_packets_total 接收数据包的累积计数 container_network_transmit_bytes_total 容器网络累积传输数据总量 container_network_transmit_errors_total 传输时遇到的错误累积计数 container_network_transmit_packets_dropped_total 传输时丢弃的数据包的累积计数 container_network_transmit_packets_total 传输数据包的累积计数 container_spec_cpu_quota 容器分配的CPU配额 container_spec_memory_limit_bytes 容器可以使用的总内存量限制 machine_cpu_cores 逻辑CPU个数 machine_memory_bytes 内存总数 serviceMonitor/monitoring/kube-state-metrics/0 kube-state-metrics-prom kube_cronjob_status_active 当前活动的周期任务 kube_cronjob_info 周期任务 kube_cronjob_labels 周期任务标签 kube_configmap_info ConfigMap信息 kube_daemonset_created Daemonset创建时间 kube_daemonset_status_current_number_scheduled 当前调度的DaemonSet数量 kube_daemonset_status_desired_number_scheduled 期望调度的DaemonSet数量 kube_daemonset_status_number_available 期望运行DaemonSet且已经至少运行一个Pod的节点数 kube_daemonset_status_number_misscheduled 期望之外运行DaemonSet的节点数 kube_daemonset_status_number_ready 期望运行DaemonSet且Pod已经就绪的节点数 kube_daemonset_status_number_unavailable 期望运行DaemonSet但没有Pod运行的节点数 kube_daemonset_status_updated_number_scheduled 正在运行已更新的DaemonSet的Pod的节点数 kube_deployment_created Deployment创建时间戳 kube_deployment_labels Deployment标签 kube_deployment_metadata_generation Deployment期望状态的generation kube_deployment_spec_replicas Deployment期望的副本数 kube_deployment_spec_strategy_rollingupdate_max_unavailable 滚动升级时最大不可用副本数 kube_deployment_status_observed_generation Deployment控制器观察到的generation kube_deployment_status_replicas Deployment当前的副本数 kube_deployment_status_replicas_available Deployment可用的replicas数量 kube_deployment_status_replicas_ready Deployment已Ready的replicas数量 kube_deployment_status_replicas_unavailable Deployment不可用的replicas数量 kube_deployment_status_replicas_updated Deployment已更新的replicas数量 kube_job_info job信息 kube_namespace_labels 命名空间标签 kube_node_labels 节点标签 kube_node_info 节点信息 kube_node_spec_taint 节点污点信息 kube_node_spec_unschedulable 节点是否可调度 kube_node_status_allocatable 节点可分配资源 kube_node_status_capacity 节点资源总量 kube_node_status_condition 节点状态condition kube_node_volcano_oversubscription_status 节点超卖状态 kube_persistentvolume_status_phase PV状态的phase kube_persistentvolumeclaim_status_phase PVC状态的phase kube_persistentvolume_info PV信息 kube_persistentvolumeclaim_info PVC信息 kube_pod_container_info Pod的容器信息 kube_pod_container_resource_limits 容器的资源limits kube_pod_container_resource_requests 容器的资源requests kube_pod_container_status_last_terminated_reason 上次terminated的原因 kube_pod_container_status_ready 容器的readiness是否成功 kube_pod_container_status_restarts_total 容器重启次数 kube_pod_container_status_running 容器是否running kube_pod_container_status_terminated 容器是否terminated kube_pod_container_status_terminated_reason terminated容器的reason kube_pod_container_status_waiting 容器是否waiting kube_pod_container_status_waiting_reason waiting容器的reason kube_pod_info Pod信息 kube_pod_labels Pod标签 kube_pod_owner Pod的Owner信息 kube_pod_status_phase Pod当前的phase kube_pod_status_ready Pod状态是否Ready kube_secret_info Secret信息 kube_statefulset_created StatefulSet的创建时间戳 kube_statefulset_labels StatefulSet的标签信息 kube_statefulset_metadata_generation StatefulSet期望状态的generation kube_statefulset_replicas StatefulSet期望的Pod数 kube_statefulset_status_observed_generation StatefulSet控制器观察到的generation kube_statefulset_status_replicas StatefulSet的replicas数量 kube_statefulset_status_replicas_ready StatefulSet已ready的replicas数量 kube_statefulset_status_replicas_updated StatefulSet已更新的replicas数量 kube_job_spec_completions 成功完成所需Pod数量 kube_job_status_failed 失败的Job kube_job_status_succeeded 成功的Job kube_node_status_allocatable_cpu_cores 节点可分配CPU核数 kube_node_status_allocatable_memory_bytes 节点可分配内存 kube_replicaset_owner RS的所有者信息 kube_resourcequota ResourceQuota信息 kube_pod_spec_volumes_persistentvolumeclaims_info Pod关联的PVC信息 serviceMonitor/monitoring/prometheus-lightweight/0 prometheus-lightweight vm_persistentqueue_blocks_dropped_total 发送队列Block丢弃数量 vm_persistentqueue_blocks_read_total 发送队列Block读取数量 vm_persistentqueue_blocks_written_total 发送队列Block写入数量 vm_persistentqueue_bytes_pending 发送队列Pending字节数 vm_persistentqueue_bytes_read_total 发送队列读取的字节数 vm_persistentqueue_bytes_written_total 发送队列写入的字节数 vm_promscrape_active_scrapers 活跃的采集数量 vm_promscrape_conn_read_errors_total 采集读取错误次数 vm_promscrape_conn_write_errors_total 采集写入错误次数 vm_promscrape_max_scrape_size_exceeded_errors_total 采集大小超限错误次数 vm_promscrape_scrape_duration_seconds_sum 采集耗时sum vm_promscrape_scrape_duration_seconds_count 采集耗时count vm_promscrape_scrapes_total 采集次数 vmagent_remotewrite_bytes_sent_total 远程写发送字节数 vmagent_remotewrite_duration_seconds_sum 远程写耗时sum vmagent_remotewrite_duration_seconds_count 远程写耗时count vmagent_remotewrite_packets_dropped_total 远程写丢弃包次数 vmagent_remotewrite_pending_data_bytes 远程写Pending字节数 vmagent_remotewrite_requests_total 远程写请求次数 vmagent_remotewrite_retries_count_total 远程写重试次数 go_goroutines 协程个数 serviceMonitor/monitoring/node-exporter/0 node-exporter node_boot_time_seconds 节点开机时间 node_context_switches_total 上下文切换次数 node_cpu_seconds_total 节点CPU时间 node_disk_io_now 当前运行的I/O数量 node_disk_io_time_seconds_total I/O总耗时 node_disk_io_time_weighted_seconds_total 执行I/O所花费的加权秒数 node_disk_read_bytes_total 读取成功的字节总数 node_disk_read_time_seconds_total 读取花费的总时长 node_disk_reads_completed_total 读取完成的次数 node_disk_write_time_seconds_total 写入花费的总时长 node_disk_writes_completed_total 写入完成的次数 node_disk_written_bytes_total 写入成功的字节总数 node_docker_thinpool_data_space_available docker thinpool数据可用空间 node_docker_thinpool_metadata_space_available docker thinpool元数据可用空间 node_exporter_build_info NodeExporter构建信息 node_filefd_allocated 已分配的文件描述符 node_filefd_maximum 最大文件描述符 node_filesystem_avail_bytes 挂载的文件系统可用空间 node_filesystem_device_error statfs获取文件信息失败 node_filesystem_free_bytes 挂载的文件系统剩余空间 node_filesystem_readonly 只读挂载的文件系统 node_filesystem_size_bytes 挂载的文件系统占用空间 node_forks_total 节点fork总数 node_intr_total 节点中断总数 node_load1 节点1分钟CPU负载 node_load15 节点15分钟CPU负载 node_load5 节点5分钟CPU负载 node_memory_Buffers_bytes 节点缓冲区的内存 node_memory_Cached_bytes 节点页面缓存中的内存 node_memory_MemAvailable_bytes 节点可用内存 node_memory_MemFree_bytes 节点空闲内存 node_memory_MemTotal_bytes 节点内存总量 node_network_receive_bytes_total 累积接收数据总量 node_network_receive_drop_total 接收时丢弃的累积计数 node_network_receive_errs_total 接收时遇到的错误累积计数 node_network_receive_packets_total 接收数据包的累积计数 node_network_transmit_bytes_total 累积传输数据总量 node_network_transmit_drop_total 传输时丢弃的累积计数 node_network_transmit_errs_total 传输时遇到的错误累积计数 node_network_transmit_packets_total 传输数据包的累积计数 node_procs_blocked 当前blocked的进程 node_procs_running 当前运行的进程 node_sockstat_sockets_used 正在使用的套接字总量 node_sockstat_TCP_alloc 已分配的TCP套接字数量 node_sockstat_TCP_inuse 正在使用的TCP套接字数量 node_sockstat_TCP_orphan 无主的TCP连接数 node_sockstat_TCP_tw 等待关闭的TCP连接数 node_sockstat_UDPLITE_inuse UDP-Lite 套接字当前使用量 node_sockstat_UDP_inuse UDP 套接字当前使用量 node_sockstat_UDP_mem UDP 套接字缓冲区使用量 node_timex_offset_seconds 时钟时间偏移 node_timex_sync_status 节点时钟同步状态 node_uname_info 节点uname信息 node_vmstat_oom_kill /proc/vmstat中的oom_kill process_cpu_seconds_total 进程CPU累计时长 process_max_fds 进程最大文件描述符 process_open_fds 进程当前打开的文件描述符 process_resident_memory_bytes 进程常驻内存集的大小 process_start_time_seconds 进程启动时间 process_virtual_memory_bytes 进程虚拟内存大小 process_virtual_memory_max_bytes 进程虚拟内存最大大小 node_netstat_Tcp_ActiveOpens 从CLOSED 状态直接转换到SYN-SENT 状态的TCP连接数 node_netstat_Tcp_PassiveOpens 从LISTEN 状态直接转换到SYN-RCVD 状态的TCP连接数 node_netstat_Tcp_CurrEstab 当前状态为ESTABLISHED 或CLOSE-WAIT 的TCP 连接数 node_vmstat_pgmajfault /proc/vmstat中的pgmajfault node_vmstat_pgpgout /proc/vmstat中的pgpgout node_vmstat_pgfault /proc/vmstat中的pgfault node_vmstat_pgpgin /proc/vmstat中的pgpgin node_processes_max_processes PID限制值 node_processes_pids PID个数 node_nf_conntrack_entries 链接状态跟踪表分配的数量 node_nf_conntrack_entries_limit 链接状态跟踪表总量 promhttp_metric_handler_requests_in_flight 当前正在处理的metrics数量 go_goroutines NodeExporter协程个数 podMonitor/monitoring/nvidia-gpu-device-plugin/0 monitoring/nvidia-gpu-device-plugin cce_gpu_utilization gpu卡算力使用率 cce_gpu_memory_utilization gpu卡显存使用率 cce_gpu_encoder_utilization gpu卡编码使用率 cce_gpu_decoder_utilization gpu卡解码使用率 cce_gpu_utilization_process gpu各进程算力使用率 cce_gpu_memory_utilization_process gpu各进程显存使用率 cce_gpu_encoder_utilization_process gpu各进程编码使用率 cce_gpu_decoder_utilization_process gpu各进程解码使用率 cce_gpu_memory_used gpu显存使用量 cce_gpu_memory_total gpu显存总量 cce_gpu_memory_free gpu显存空闲量 cce_gpu_bar1_memory_used gpu bar1 内存使用量 cce_gpu_bar1_memory_total gpu bar1 内存总量 cce_gpu_clock gpu时钟频率 cce_gpu_memory_clock gpu显存频率 cce_gpu_graphics_clock gpu图形处理器频率 cce_gpu_video_clock gpu视频处理器频率 cce_gpu_temperature gpu温度 cce_gpu_power_usage gpu功率 cce_gpu_total_energy_consumption gpu总能耗 cce_gpu_pcie_link_bandwidth gpu pcie 带宽 cce_gpu_nvlink_bandwidth gpu nvlink 带宽 cce_gpu_pcie_throughput_rx gpu pcie 接收带宽 cce_gpu_pcie_throughput_tx gpu pcie 发送带宽 cce_gpu_nvlink_utilization_counter_rx gpu nvlink 接收带宽 cce_gpu_nvlink_utilization_counter_tx gpu nvlink 发送带宽 cce_gpu_retired_pages_sbe gpu 单比特错误隔离页数量 cce_gpu_retired_pages_dbe gpu 双比特错误隔离页数量 xgpu_memory_total xgpu显存总量 xgpu_memory_used xgpu显存使用量 xgpu_core_percentage_total xgpu算力总量 xgpu_core_percentage_used xgpu算力使用量 gpu_schedule_policy gpu模式分成0、1、2三种:0为显存隔离算力共享模式;1为显存算力隔离模式;2为默认模式表示当前卡还没被用于xgpu设备分配。 xgpu_device_health xgpu设备的健康情况。0表示xgpu设备为健康状态,1表示为非健康状态。 serviceMonitor/monitoring/prometheus-server/0 prometheus-server prometheus_build_info Prometheus构建信息 prometheus_engine_query_duration_seconds 查询时间 prometheus_engine_query_duration_seconds_count 查询次数 prometheus_sd_discovered_targets 各个 job 发现的采集目标数 prometheus_remote_storage_bytes_total 发送字节数 prometheus_remote_storage_enqueue_retries_total 入队列重试次数 prometheus_remote_storage_highest_timestamp_in_seconds 存储在WAL中的任何样本的最大时间戳 prometheus_remote_storage_queue_highest_sent_timestamp_seconds 远程写入成功发送的最大时间戳 prometheus_remote_storage_samples_dropped_total 远程写丢弃sample数量 prometheus_remote_storage_samples_failed_total 远程写失败sample数量 prometheus_remote_storage_samples_in_total 远程写写入sample数量 prometheus_remote_storage_samples_pending 远程写pending sample 数量 prometheus_remote_storage_samples_retried_total 远程写重试sample数量 prometheus_remote_storage_samples_total 远程写sample总数 prometheus_remote_storage_shard_capacity 用于并行发送到远程存储的队列中每个分片的容量 prometheus_remote_storage_shards 当前用于并行发送到远程存储的分片数 prometheus_remote_storage_shards_desired 分片队列期望基于输入样本和输出样本的比率运行的分片数 prometheus_remote_storage_shards_max 可用于并行发送到远程存储的分片数的最大值 prometheus_remote_storage_shards_min 可用于并行发送到远程存储的分片数的最小值 prometheus_tsdb_wal_segment_current TSDB当前正在写入的WAL段索引 prometheus_tsdb_head_chunks head中保存的chunk数量 prometheus_tsdb_head_series head中保存的series数量 prometheus_tsdb_head_samples_appended_total head中添加的samples数量 prometheus_wal_watcher_current_segment 每个远程写入实例当前正在读取的WAL段文件 prometheus_target_interval_length_seconds 抓取时间间隔 prometheus_target_interval_length_seconds_count 抓取时间间隔count prometheus_target_interval_length_seconds_sum 抓取时间间隔sum prometheus_target_scrapes_exceeded_body_size_limit_total 采集body大小超限次数 prometheus_target_scrapes_exceeded_sample_limit_total 采集sample超限次数 prometheus_target_scrapes_sample_duplicate_timestamp_total 时间戳重复Samples数量 prometheus_target_scrapes_sample_out_of_bounds_total 时间戳超限Samples数量 prometheus_target_scrapes_sample_out_of_order_total 乱序Samples数量 prometheus_target_sync_length_seconds 同步scrape pool的间隔 prometheus_target_sync_length_seconds_count 同步scrape pool的间隔count prometheus_target_sync_length_seconds_sum 同步scrape pool的间隔sum promhttp_metric_handler_requests_in_flight 当前正在处理的metrics数量 promhttp_metric_handler_requests_total metrics处理次数 go_goroutines 协程个数 podMonitor/monitoring/virtual-kubelet-pods/0 monitoring/virtual-kubelet-pods container_cpu_load_average_10s 容器过去10秒内的CPU负载的平均值 container_cpu_system_seconds_total 容器系统CPU总时长 container_cpu_usage_seconds_total 容器在所有CPU内核上的累积占用时间 container_cpu_user_seconds_total 容器用户CPU总时长 container_cpu_cfs_periods_total 容器已经执行的CPU时间周期数 container_cpu_cfs_throttled_periods_total 容器被限流的CPU时间周期数 container_cpu_cfs_throttled_seconds_total 容器被限流的CPU时间 container_fs_inodes_free 文件系统的可用inode数量 container_fs_usage_bytes 文件系统的使用量 container_fs_inodes_total 文件系统的总计inode数量 container_fs_io_current 磁盘/文件系统当前正在进行的 I/O 数量 container_fs_io_time_seconds_total 磁盘/文件系统花费在 I/O 上的累计秒数 container_fs_io_time_weighted_seconds_total 磁盘/文件系统累积加权 I/O 时间 container_fs_limit_bytes 容器可以使用的磁盘/文件系统总量 container_fs_reads_bytes_total 容器累积读取磁盘/文件系统数据的总量 container_fs_read_seconds_total 容器累积读取磁盘/文件系统数据的秒数 container_fs_reads_merged_total 容器合并读取磁盘/文件系统的累积计数 container_fs_reads_total 容器已完成读取磁盘/文件系统的累积计数 container_fs_sector_reads_total 容器已完成扇区读取磁盘/文件系统的累积计数 container_fs_sector_writes_total 容器已完成扇区写入磁盘/文件系统的累积计数 container_fs_writes_bytes_total 容器累积写入磁盘/文件系统数据的总量 container_fs_write_seconds_total 容器累计写入磁盘/文件系统的秒数 container_fs_writes_merged_total 容器合并写入磁盘/文件系统的累积计数 container_fs_writes_total 容器已完成写入磁盘/文件系统的累积计数 container_blkio_device_usage_total 容器区分IO操作对磁盘的使用总量 container_memory_failures_total 容器内存分配失败的累积计数 container_memory_failcnt 容器内存使用达到限制的次数 container_memory_cache 容器总页缓存内存 container_memory_mapped_file 容器内存映射文件的大小 container_memory_max_usage_bytes 容器历史最大内存使用量 container_memory_rss 容器常驻内存集的大小 container_memory_swap 容器虚拟内存使用量 container_memory_usage_bytes 容器当前的内存使用量 container_memory_working_set_bytes 容器工作集内存使用量 container_network_receive_bytes_total 容器网络累积接收数据总量 container_network_receive_errors_total 接收时遇到的错误累积计数 container_network_receive_packets_dropped_total 接收时丢弃的数据包的累积计数 container_network_receive_packets_total 接收数据包的累积计数 container_network_transmit_bytes_total 容器网络累积传输数据总量 container_network_transmit_errors_total 传输时遇到的错误累积计数 container_network_transmit_packets_dropped_total 传输时丢弃的数据包的累积计数 container_network_transmit_packets_total 传输数据包的累积计数 container_processes 容器当前运行的进程数 container_sockets 容器当前打开套接字的个数 container_file_descriptors 容器当前打开文件描述符的个数 container_threads 容器内当前运行的线程数 container_threads_max 容器内允许运行的最大线程数 container_ulimits_soft 容器内1号进程的软 ulimit 值。如果为-1,则无限制,优先级和nice除外 container_tasks_state 处于给定状态的任务数(sleeping,running,stopped,uninterruptible,or ioawaiting) container_spec_cpu_period 容器分配的CPU周期 container_spec_cpu_shares 容器分配的CPU份额 container_spec_cpu_quota 容器分配的CPU配额 container_spec_memory_limit_bytes 容器可以使用的总内存量限制 container_spec_memory_reservation_limit_bytes 容器可以使用的预留内存限制 container_spec_memory_swap_limit_bytes 容器可以使用的虚拟内存限制 container_start_time_seconds 容器已经运行的时间 container_last_seen 最近一次监控采集器感知到容器的时间 container_accelerator_memory_used_bytes 容器正在使用的GPU加速卡内存量 container_accelerator_memory_total_bytes 总GPU加速卡可用内存量 container_accelerator_duty_cycle GPU加速卡实际运行时间百分比 podMonitor/monitoring/everest-csi-controller/0 monitoring/everest-csi-controller everest_action_result_total action结果数量 everest_function_duration_seconds_bucket action耗时直方图bucket everest_function_duration_seconds_count action耗时直方图count everest_function_duration_seconds_sum action耗时直方图sum everest_function_duration_quantile_seconds action所需的时间分位数 node_volume_read_completed_total 读操作完成次数 node_volume_read_merged_total 读操作merged次数 node_volume_read_bytes_total 扇区读字节总数 node_volume_read_time_milliseconds_total 读操作总耗时 node_volume_write_completed_total 写操作完成次数 node_volume_write_merged_total 写操作merged次数 node_volume_write_bytes_total 扇区写字节总数 node_volume_write_time_milliseconds_total 写操作总耗时 node_volume_io_now 当前正在进行的I/O次数 node_volume_io_time_seconds_total IO操作总耗时 node_volume_capacity_bytes_available 可用容量 node_volume_capacity_bytes_total 总容量 node_volume_capacity_bytes_used 已用容量 node_volume_inodes_available 可用inode node_volume_inodes_total 总inode node_volume_inodes_used 已用inode node_volume_read_transmissions_total 读取传输次数 node_volume_read_timeouts_total 读取超时次数 node_volume_read_sent_bytes_total 读取字节数 node_volume_read_queue_time_milliseconds_total 读取队列等待耗时 node_volume_read_rtt_time_milliseconds_total 读取rtt时长 node_volume_write_transmissions_total 写入传输次数 node_volume_write_timeouts_total 写入超时次数 node_volume_write_queue_time_milliseconds_total 写入队列等待耗时 node_volume_write_rtt_time_milliseconds_total 写入rtt时长 node_volume_localvolume_stats_capacity_bytes 本地存储容量 node_volume_localvolume_stats_available_bytes 本地存储可用量 node_volume_localvolume_stats_used_bytes 本地存储已用量 node_volume_localvolume_stats_inodes 本地存储inodes数量 node_volume_localvolume_stats_inodes_used 本地存储inodes已用量 podMonitor/monitoring/nginx-ingress-controller/0 monitoring/nginx-ingress-controller nginx_ingress_controller_bytes_sent 发送到客户端的字节数 nginx_ingress_controller_connect_duration_seconds 与上游服务器建立连接所花费的时间 nginx_ingress_controller_header_duration_seconds 从上游服务器接收第一个报头所花费的时间 nginx_ingress_controller_ingress_upstream_latency_seconds 上行服务延迟 nginx_ingress_controller_request_duration_seconds 请求处理时间(以毫秒为单位) nginx_ingress_controller_request_size 请求长度(包括请求行、请求头和请求体长度) nginx_ingress_controller_requests Nginx Ingress Controller自启动以来处理的所有HTTP请求的总数 nginx_ingress_controller_response_duration_seconds 从上游服务器接收响应所花费的时间 nginx_ingress_controller_response_size 响应长度(包括请求行、头和请求体长度) nginx_ingress_controller_nginx_process_connections 当前处于活动、读取、写入、等待状态,每种状态各自的客户端连接数 nginx_ingress_controller_nginx_process_connections_total 自启动以来处于接受、已处理状态,每种状态各自的客户端连接数 nginx_ingress_controller_nginx_process_cpu_seconds_total Nginx进程消耗的CPU时间总量(以秒为单位) nginx_ingress_controller_nginx_process_num_procs 进程数 nginx_ingress_controller_nginx_process_oldest_start_time_seconds 自1970/01/01以来的开始时间(以秒为单位) nginx_ingress_controller_nginx_process_read_bytes_total 读取的字节数 nginx_ingress_controller_nginx_process_requests_total 自启动以来,Nginx处理的请求总数 nginx_ingress_controller_nginx_process_resident_memory_bytes 进程的常驻内存使用量,即实际占用的物理内存大小 nginx_ingress_controller_nginx_process_virtual_memory_bytes 进程的虚拟内存使用量,即分配给进程的总内存大小,包括实际物理内存和虚拟交换空间 nginx_ingress_controller_nginx_process_write_bytes_total Nginx进程向磁盘或其他长期存储设备写入的数据量 nginx_ingress_controller_build_info 记录Nginx Ingress Controller的构建信息,包括版本号、编译时间等 nginx_ingress_controller_check_success Nginx Ingress Controller的健康检查结果。1为正常,0为异常 nginx_ingress_controller_config_hash 运行配置的哈希值 nginx_ingress_controller_config_last_reload_successful Nginx Ingress Controller的配置重新加载是否成功 nginx_ingress_controller_config_last_reload_successful_timestamp_seconds Nginx Ingress Controller最后一次配置重新加载是否成功的时间戳 nginx_ingress_controller_ssl_certificate_info Nginx Ingress Controller的证书信息 nginx_ingress_controller_success Nginx Ingress Controller的重新加载操作的累计次数 nginx_ingress_controller_orphan_ingress 入口孤立状态,1 表示孤立。0 表示正常。“namespace”为标识入口命名空间的字符串,“ingress”表示入口名称,“type”表示孤立类型 为“no-service”'或 “no-endpoint”。 nginx_ingress_controller_admission_config_size Admission准入控制器的配置大小 nginx_ingress_controller_admission_render_duration Admission准入控制器配置渲染所花费的时间 nginx_ingress_controller_admission_render_ingresses Admission准入控制器配置渲染的入口长度 nginx_ingress_controller_admission_roundtrip_duration Admission准入控制器处理新事件所花费的时间 nginx_ingress_controller_admission_tested_duration Admission准入控制器测试所花费的时间 nginx_ingress_controller_admission_tested_ingresses Admission准入控制器测试的入口长度 父主题: 指标总览
  • 采集管理使用限制 操作系统使用限制 表4 UniAgent支持的Linux操作系统及版本 操作系统 版本 EulerOS 1.1 64bit 2.0 64bit CentOS 7.1 64bit 7.2 64bit 7.3 64bit 7.4 64bit 7.5 64bit 7.6 64bit 7.7 64bit 7.8 64bit 7.9 64bit 8.0 64bit Ubuntu 16.04 server 64bit 18.04 server 64bit 20.04 server 64bit 22.04 server 64bit 对于Linux x86_64服务器,采集管理支持上表中所有的操作系统及版本。 对于Linux ARM服务器,当前CentOS操作系统支持7.4/7.5/7.6版本,EulerOS操作系统支持2.0版本,Ubuntu操作系统支持18.04版本。 表5 UniAgent支持的Windows操作系统及版本 操作系统 版本 Windows Server Windows Server 2012 R2 Standard 64bit Windows Server 2012 R2 Standard English 64bit Windows Server 2012 R2 Datacenter 64bit Windows Server 2012 R2 Datacenter English 64bit Windows Server 2016 Standard 64bit Windows Server 2016 Standard English 64bit Windows Server 2016 Datacenter 64bit Windows Server 2016 Datacenter English 64bit Windows Server 2019 Standard 64bit Windows Server 2019 Standard English 64bit Windows Server 2019 Datacenter 64bit Windows Server 2019 Datacenter English 64bit 资源使用限制 表6 资源使用限制 对象 使用限制 Agent客户端 当连续两分钟平均CPU使用率大于50%或者内存大于100M时,Agent客户端将自动重启。 Agent安装、升级或卸载 一次最多可对100台主机安装、升级或卸载Agent。 主机删除 一次最多可删除50台卸载了Agent的主机记录。
  • 资源监控使用限制 表2 资源监控使用限制 分类 对象 使用限制 仪表盘 仪表盘 1个区域中最多可创建1000个仪表盘。 仪表盘中的图表 1个仪表盘中最多可添加50个图表。 仪表盘中图表可选资源、阈值规则、组件或主机的个数 1个数字图最多可添加12个资源,只能展示1个资源,默认展示第一个资源。 1个阈值状态图表最多可添加10个阈值规则。 1个主机状态图表最多可添加10个主机。 1个组件状态图表最多可添加10个组件。 指标 指标数据 基础规格:指标数据在数据库中最多保存7天。 专业规格:指标数据在数据库中最多保存30天。 通过ICAgent插件采集指标数据时,采集周期为1分钟,不支持修改。 指标项 资源(例如,集群、组件、主机等)被删除后,其关联的指标项在数据库中最多保存30天。 维度 每个指标的维度最多为20个。 指标查询接口 单次最大可同时查询20个指标。 统计周期 最大统计周期为1小时。 单次查询返回指标数据 单个指标单次查询最大返回1440个数据点。 自定义指标 无限制。 上报自定义指标 单次请求数据最大不能超过40KB,上报指标所带时间戳不能超前于标准UTC时间10分钟,不接收乱序指标,即有新指标上报后,旧指标上报将会失败。 应用指标 JOB指标 每个主机的容器个数超过1000个时,ICAgent将停止采集该主机应用指标,并发送“ICAgent停止采集应用指标”告警(告警ID:34105)。 每个主机的容器个数缩减到1000个以内时,ICAgent将恢复该主机应用指标采集,并清除“ICAgent停止采集应用指标”告警 。 由于JOB在完成任务之后,会自动退出。如果您需要监控JOB指标,要保证存活时间大于90秒才能采集到指标数据。 采集器资源消耗 采集器在采集基础指标时的资源消耗情况和容器、进程数等因素有关,在未运行任何业务的VM上,采集器将消耗30M内存、1% CPU。为保证采集可靠性,单节点上运行的容器个数应小于1000。 告警规则 告警规则 告警规则(包含指标告警规则和事件告警规则)最多可创建3000个。 告警模板 告警模板最多可创建150个。 日志 日志功能限制 日志功能限制请参考LTS日志限制。 日志文件 只支持采集文本类型日志文件,不支持采集其他类型日志文件(例如二进制文件)。 每个通过卷挂载日志的路径下,ICAgent最多采集20个日志文件。 每个ICAgent最多采集1000个容器标准输出日志文件,容器标准输出日志只支持json-file类型。 采集日志文件的资源消耗 日志文件采集时消耗的资源和日志量、文件个数及网络带宽、backend服务处理能力等多种因素强相关。 日志丢弃 当单行日志长度超过10240字节时,此行会被丢弃。 日志采集路径 Linux 采集路径支持递归路径,**表示递归5层目录。示例:/var/logs/**/a.log。 采集路径支持模糊匹配,匹配目录或文件名中的任何字符。示例:/var/logs/*/a.log、/var/logs/service/a*.log。 采集路径如果配置的是目录,示例:/var/logs/,则只采集目录下后缀为“.log”、“.trace”和“.out”的文件;如果配置的是文件名,则直接采集对应文件,只支持文本类型的文件。 采集路径不能重复配置,即同一主机下的同一路径,即使跨日志组和日志流,也只能配置一次。 Windows Windows环境日志采集路径支持递归路径,**表示递归5层目录。配置样例:C:\var\service\**\a.log。 Windows环境日志采集路径支持模糊匹配,匹配目录或文件名中的任何字符。配置样例:C:\var\service\*\a.log、C:\var\service\a*.log。 采集路径不能重复配置,即同一主机下的同一路径,即使跨日志组和日志流,也只能配置一次。 windows事件日志采集不能重复配置,即同一主机下,即使跨日志组和日志流,也只能配置一次。 日志重复 当采集器被重启后,重启时间点附近可能会产生一定的数据重复。 历史日志 日志数据存储时长与您选择的版本有关,且收费不同,详见价格详情。 告警列表 告警 可查询最近一年内,时间跨度不超过31天的告警。 事件 可查询最近一年内,时间跨度不超过31天的事件。 应用发现 应用发现规则 应用发现规则最多可创建100个。
  • 自动化运维使用限制 表3 自动化运维使用限制 对象 使用限制 任务 单个操作ECS的任务最多支持选择100个实例。 单个操作RDS的任务最多支持选择20个实例。 单个操作CCE负载的任务最多支持选择10个实例。 作业 单用户支持最多可以创建1000个作业。 每个作业最多支持创建20个全局参数、20个作业步骤、50个执行方案。 脚本 单用户支持最多创建脚本版本合计1000个。 文件包 单用户支持最多创建文件包版本合计1000个。 OS账号 单用户支持最多创建100个账号。 磁盘空间 支持清理1-1000天前的文件。 定时运维 定时运维任务单用户最大配额100个。
  • 截图回调 直播截图回调用于推送截图状态信息,当截图文件生成时触发该回调事件。回调消息字段如表3所示。 表3 消息体字段说明 字段 描述 domain 推流域名。 app 应用名称。 stream_name 流名称。 snapshot_url 截图下载链接。 width 图片宽度。 单位:像素。 height 图片高度。 单位:像素。 obs_addr 截图所在的OBS桶地址,具体结构体说明如下所示: bucket:OBS的桶名称。 location:OBS桶所在数据中心。 object:OBS对象路径。 auth_timestamp 事件通知签名过期UNIX时间戳。当配置了“鉴权密钥”时,携带该字段。 格式为十进制的UNIX时间戳,即从1970年1月1日(UTC/GMT的午夜)以来的当前时间秒数。 示例:1592639100(即2020-06-20 15:45) auth_sign 事件通知签名。当配置了“鉴权密钥”时,携带该字段。 auth_sign = HmacSHA256(domain + app + stream_name + snapshot_url + width + height + obs_addr.bucket + obs_addr.location + obs_addr.object + auth_timestamp,key) 其中,key为鉴权密钥值。 消息示例如下所示: { "domain": "play.example.com", "app": "live", "stream_name": "test001", "snapshot_url": "https://xxx.obs.cn-north-4.myhuaweicloud.com:443...", "width":"720", "height":"1280", "obs_addr": { "bucket": "xxx", "location": "cn-north-4", "object": "xxx.jpg" }, "auth_timestamp":1587954140, "auth_sign":"4918b1axxxxxxb583cffa119d72513bbc35a989f8569fxxxxxx057646154a04a" }
  • 录制回调 直播录制至OBS提供了录制回调功能,用于推送录制状态信息,包括录制开始、开始创建新的录制文件、录制文件生成完成、录制结束和录制失败。回调消息字段如表2所示。 表2 消息体字段说明 字段 描述 project_id 项目ID。 job_id 用于标识同一个文件。当“event_type”为“RECORD_NEW_FILE_START”或“RECORD_FILE_COMPLETE”时,携带该字段。 task_id 录制任务ID,用于唯一标识一个录制任务。 event_type 消息类型。 取值如下: RECORD_START:表示录制开始。若配置了录制模板和录制回调,则直播推流开始时,开始录制,触发该事件。 RECORD_NEW_FILE_START:表示开始创建新的录制文件。以下情况会触发该事件: 直播推流开始,开始创建第一个录制文件。 直播断流恢复后,若“最大断流合并时长”配置为“断流后生成新文件”,则开始创建新的录制文件。 当前录制时长超过了配置的录制周期,则开始新的录制文件生成。 RECORD_FILE_COMPLETE:表示录制文件生成完成。以下情况会触发该事件: 录制时长达到配置的录制周期,则当前录制文件生成完成,并开始新的录制生成。 直播断流后,若“最大断流合并时长”配置为“断流后生成新文件”,则当前录制文件生成完成,若断流恢复,将开始新的录制文件生成。 RECORD_OVER:表示录制结束,直播断流时长超过了最大断流合并时长,当前录制任务结束,触发该事件。 RECORD_FAILED:表示录制失败,当拉流失败、录制文件上传OBS失败等因素导致录制失败时,触发该事件。 publish_domain 直播推流域名。 app 应用名。 stream 录制的流名。 record_format 录制格式,支持HLS、FLV和MP4格式。 download_url 录制文件的下载地址。当“event_type”为“RECORD_FILE_COMPLETE”时,携带该字段。 说明: 使用该下载地址用于视频播放无法保证播放效果。 asset_id 用于标识一个录制文件。 当“event_type”为“RECORD_FILE_COMPLETE”时,携带该字段。 file_size 文件大小。 单位:Byte。 record_duration 录制文件的时长。 单位:秒。 start_time 录制文件的开始时间,即接收到第一帧数据的时间,格式为yyyy-mm-ddThh:mm:ssZ。 当“event_type”为“RECORD_FILE_COMPLETE”时,携带该字段。 end_time 录制文件的结束时间,格式为yyyy-mm-ddThh:mm:ssZ。 当“event_type”为“RECORD_FILE_COMPLETE”时,携带该字段。 width 录制文件分辨率的宽。 当“event_type”为“RECORD_FILE_COMPLETE”时,携带该字段。 height 录制文件分辨率的高。 当“event_type”为“RECORD_FILE_COMPLETE”时,携带该字段。 obs_location 存储录制文件的OBS桶所在区域。 当“event_type”为“RECORD_FILE_COMPLETE”时,携带该字段。 obs_bucket 存储录制文件的OBS桶。 当“event_type”为“RECORD_FILE_COMPLETE”时,携带该字段。 obs_object OBS桶存储录制文件的路径。 当“event_type”为“RECORD_FILE_COMPLETE”时,携带该字段。 auth_sign 事件通知签名。当配置了“鉴权密钥”时,携带该字段。 MD5方式:auth_sign=MD5(key + auth_timestamp) HMACSHA256方式:HMACSHA256(auth_timestamp + event_type + publish_domain + app + stream + download_url + play_url,key) 其中,key为鉴权密钥值。 auth_timestamp 事件通知签名过期UNIX时间戳。当配置了“鉴权密钥”时,携带该字段。 格式为十进制的UNIX时间戳,即从1970年1月1日(UTC/GMT的午夜)开始所经过的秒数。 若 消息通知 中的auth_timestamp值所指定的时间已经过期,则此消息通知无效,进而防止网络重放攻击。 error_message 录制失败的描述信息。 当“event_type”为“RECORD_FAILED”时,携带该字段。 消息示例如下所示: 录制开始事件,即“event_type”=“RECORD_START”,若配置了录制模板和录制回调,则直播推流开始时,开始录制,产生该事件回调。 { "project_id" : "70b76xxxxxx34253880af501cdxxxxxx", "publish_domain" : "push.example.com", "event_type" : "RECORD_START", "app" : "live", "stream" : "mystream", "record_format" : "HLS", "file_size" : 3957964, "record_duration" : 120 }
  • 推流回调 推流回调用于推送推流状态信息,包括推流成功和推流中断,回调消息字段如表1所示。 表1 消息体字段说明 字段 描述 domain 推流域名。 app 应用名称。 stream 流名称。 user_args 推流参数。 client_ip 推流客户端IP。 node_ip 接受流的节点IP。 publish_timestamp 推流Unix时间戳,一次推流活动会产生相同时间戳的推流和断流消息。 event 直播推流和断流标识。 取值为: PUBLISH:开播。 PUBLISH_DONE:停播。 auth_timestamp 事件通知签名过期UNIX时间戳。当配置了“鉴权密钥”时,携带该字段。 格式为十进制的UNIX时间戳,即从1970年1月1日(UTC/GMT的午夜)以来的当前时间秒数。 示例:1592639100(即2020-06-20 15:45) auth_sign 事件通知签名。当配置了“鉴权密钥”时,携带该字段。 auth_sign = HmacSHA256(event + domain + app + stream + auth_timestamp, key) 其中,key为鉴权密钥值。 消息示例,如下所示: { "domain":"push.example.com", "app":"live", "stream":"example_stream", "user_args":"auth_info=yz1TG0PVN/5isfyrGrRj10gKPCWqSS2X02t6QsRrocH+mEq0gQ0g8k6KhalS84sQ+kDprFyqI0yajbYiFmUO8e45B7ryaS+MpJBlYkhwnuFLnRiKK/IXG7.33436b625354564f6e4d4d434f55&cdn=hw", "client_ip":"100.111.*.*", "node_ip":"112.11.*.*", "publish_timestamp":"1587954134,", "event":"PUBLISH" "auth_timestamp":1587954140, "auth_sign":"ff3b2bxxx5cfd56e76d72bed4c4aa2dxxxca8c2e46467d205a6417d4fc" }
  • RSA私钥格式要求 PEM格式的文件可以存放证书或私钥,如果*.PEM只包含私钥,一般用*.KEY代替。 通过记事本打开*.PEM或*.KEY的私钥文件,可以查看到类似图3所示的全部私钥信息。 RSA格式私钥: 以证书链“-----BEGIN RSA PRIVATE KEY-----”开头,以证书链“-----END RSA PRIVATE KEY-----”结尾。 证书链之间的内容,要求每行64个字符,最后一行允许不足64个字符。 证书内容不包含空格。
共100000条