检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
集群视图 基于集群的指标和PromQL语句,提供了集群Pod数、容器数、CPU、内存、网络、磁盘等关键资源相关图表,帮助您了解整体集群的资源运行状态。接下来主要从指标说明、指标清单两个部分来进行图表的说明,其中图表中对于数值过大的字节(bytes)会换算为MB、KB、GB等。 指标说明
Pod视图 从Pod视角呈现Pod维度集群资源、网络、磁盘等监控情况,帮助您详细了解Pod的运行状态。 指标说明 Pod视图暴露的指标包括Pod资源指标、Pod网络指标和Pod磁盘指标,具体说明如下: 图1 Pod资源指标 表1 Pod资源指标说明 指标名称 单位 说明 容器数 个
Kubelet视图 Kubelet是运行在集群中每个节点上的代理程序,它提供了一些指标可以更好地了解集群的运行状态。 指标说明 Kubelet视图暴露的指标如下: 表1 Kubelet图表说明 视图名称 单位 说明 运行中Kubelet 个 集群运行中的kubelet的数量 运行中
Prometheus Agent视图 Prometheus Agent是轻量化的容器监控模式,可以收集有关主机和应用程序的指标数据,并将数据上报并存储到AOM或三方监控平台。Prometheus Agent视图展示了Prometheus提供的一些内置指标,可用于监控和度量系统的性能和状态
nginx:latest name: nginx imagePullSecrets: - name: default-secret vi nginx-clusterip-svc.yaml apiVersion: v1 kind: Service
limits: cpu: 100m memory: 200Mi requests: cpu: 100m memory: 200Mi imagePullPolicy: Always imagePullSecrets
并且查看Pod事件可以发现,创建Pod实例过程中“镜像拉取中(Pulling image xx)”事件停留的时间过长。该现象表明Pod免费提供的30GiB临时存储,不能满足拉取镜像所需的磁盘空间大小,需要对磁盘进行扩容。
nginx:perl imagePullPolicy: IfNotPresent resources: requests: cpu: 10m memory:
imageTagValues:= "4.0.3-enterprise" valuesbody := &model.CreateReleaseReqBodyValues{ ImagePullPolicy: &imagePullPolicyValues, ImageTag:
/awesomeapp:v1 imagePullSecrets: - name: myregistrykey #使用上面创建的密钥 父主题: 配置工作负载
= "IfNotPresent" imageTagValues:= "v2" valuesbody := &model.UpdateReleaseReqBodyValues{ ImagePullPolicy: &imagePullPolicyValues, ImageTag
在CCE中创建工作负载时如果需要从SWR拉取镜像,需要配置imagePullSecrets的取值为default-secret,如下所示。
and push images" sh "/kaniko/executor -f Dockerfile -c .
问题现象 在Autopilot集群中创建工作负载时,出现以下错误: Failed to pull image "swr.cn-north-**.myhuaweicloud.com/**/nginx:latest": rpc error: code = Unknown desc =
image:工作负载的镜像。 mountPath:容器内挂载路径,示例中挂载到“/tmp”路径。
\":\"neo4j\",\"imagePullPolicy\":\"IfNotPresent\",\"imageTag\":\"4.0.3-enterprise\",\"name\":\"neo4j\",\"nodeSelector\":{},\"podDisruptionBudget
\":\"neo4j\",\"imagePullPolicy\":\"IfNotPresent\",\"imageTag\":\"4.0.3-enterprise\",\"name\":\"neo4j\",\"nodeSelector\":{},\"podDisruptionBudget
nginx:alpine imagePullPolicy: Always resources: requests: cpu: 250m memory: 512Mi
\":\"neo4j\",\"imagePullPolicy\":\"IfNotPresent\",\"imageTag\":\"4.0.3-enterprise\",\"name\":\"neo4j\",\"nodeSelector\":{},\"podDisruptionBudget
问题现象 在Autopilot集群中创建工作负载时,事件中出现以下错误: Failed to pull image "100.125.**.**:32334/**/nginx:1.0": rpcerror: code =DeadlineExceeded desc = failed