检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
在通过远程写入发送之前,从WAL读取后丢弃的样本速率。 样本失败率 次/秒 发送到远程存储时失败的样本失败速率,不可恢复错误。 样本重试率 次/秒 在发送到远程存储时失败但由于发送错误可恢复而重试的样本速率 入队失败重试率 次/秒 由于分片队列已满而入队失败重试速率 指标清单 Prometheus
码示例。 状态码 状态码 描述 200 表示成功获取指定集群的证书。证书文件格式参见kubernetes v1.Config结构 错误码 请参见错误码。 父主题: 集群管理
x.x),如果在创建Ingress时没有显示指定Ingress类别为nginx,该资源将被Nginx Ingress Controller忽略,Ingress规则失效,导致服务中断。详情请参见社区代码。 社区相关PR链接为:https://github.com/kubernete
FailedValidation:备份模板配置错误,可以查看 Backup.Status.ValidationErrors 发现错误配置原因 InProgress:备份正在进行中 Completed:备份完成,没有错误 PartiallyFailed:备份完成,但是备份某些对象的过程中出现错误(比如 hook
出现CRD尚未创建就创建CR的情况。如果您遇到此错误,建议您重新创建资源。 工作负载创建时,遇到节点Pod过多的错误,报错如下: 0/x nodes are available: x Too many pods. 解决方案: 该错误说明节点上调度的Pod超过节点最大实例数,建议扩容节点数。
一致的现象。 创建VPA策略 使用kubectl连接集群,详情请参见通过kubectl连接集群。 部署一个示例工作负载。如果已有工作负载可忽略本步骤。 kubectl create -f hamster.yaml hamster.yaml文件内容如下: apiVersion: apps/v1
且为有效的IPv4网段。 正确示例: 192.168.1.0/24 错误示例: 192.168.1.1/24 (不符合CIDR格式) 所设置的多个网段之间不得存在任何重叠。 正确示例: 192.168.1.0/24 和 192.168.2.0/24 错误示例: 192.168.1.0/24 和 192
查看工作负载实例非正常退出的容器ID。 docker ps -a | grep $podName 查看退出容器的错误日志。 docker logs $containerID 根据日志提示修复工作负载本身的问题。 查看操作系统的错误日志。 cat /var/log/messages | grep $containerID
等待后端服务器响应超时时间。请求转发后端服务器后,在等待超时member_timeout时长没有响应,负载均衡将终止等待,并返回 HTTP504错误码。 取值:1-300s,默认为60s。 使用说明:仅支持协议为HTTP/HTTPS的监听器。 配置建议: 取值:1-300s,默认为60s
xx-xxxxxxxxxxx2" } ] } 响应示例 无 状态码 状态码 描述 200 表示将节点迁移到自定义节点池成功。 错误码 请参见错误码。 父主题: 节点管理
取值为hard,即使用硬连接方式,若NFS请求超时,则客户端一直重新请求直至成功。 取值为soft,即软挂载方式挂载系统,若NFS请求超时,则客户端向调用程序返回错误。 默认为hard。 sharecache/nosharecache 无需填写 设置客户端并发挂载同一文件系统时数据缓存和属性缓存的共享方
源概况中还提供了API Server的总QPS和请求错误率指标。作为集群的API服务提供者,控制面API Server的异常可能会导致整个集群无法访问,同时也会影响依赖API Server的工作负载的正常运行,QPS和请求错误率可以帮助您快速识别和修复问题。 图2 健康概况 资源消耗Top统计
x.x),如果在创建Ingress时没有显示指定Ingress类别为nginx,该资源将被Nginx Ingress Controller忽略,Ingress规则失效,导致服务中断。 已纳入升级前检查,也可参照NGINX Ingress控制器插件升级检查进行自检。 v1.19升级至v1
为ELB Ingress配置了HTTPS证书后访问异常的原因有哪些? 为ELB Ingress配置了HTTPS证书后,如果证书配置出现以下问题,可能导致访问异常,您可以参考表格中的原因进行排查。 访问异常原因 问题现象 解决方案 证书已过期 通过curl命令测试时报错信息如下: SSL
检查节点上是否存在干扰的Containerd.Sock文件。该文件影响Euler操作系统下的容器运行时启动。 27 内部错误异常处理 该检查非常规检查项,表示升级前检查流程中出现了内部错误。 28 节点挂载点检查异常处理 检查节点上是否存在不可访问的挂载点。 29 K8s节点污点检查异常处理
是否开启未调度pod触发自动扩容,默认true。 ignoreDaemonSetsUtilization 否 bool 缩容门限判断时是否忽略daemonset型应用资源占用,默认false。 skipNodesWithCustomControllerPods 否 bool 节点
赖关系,因此当您首次登录CCE控制台时,CCE将自动请求获取当前区域下的云资源权限,从而更好地为您提供服务。如果您在当前区域已完成授权,可忽略本步骤。 使用华为账号登录CCE控制台。 单击管理控制台左上角的,选择区域。 在首次登录某个区域的CCE控制台时将跳出“授权说明”,请您在仔细阅读后单击“确定”。
nginx-ingress deployment安装成功,但是nginx-ingress-controller安装失败。 图1 一直处于创建中 图2 安装失败 错误显示资源不足。 添加节点资源为4U8G后,nginx-ingress安装正常。 问题原因 最初建立的集群中各节点的基本配置为2U4G,且各
如何让多个Pod均匀部署到各个节点上? 如何驱逐节点上的所有Pod? 网络管理 集群安全组规则配置 工作负载网络异常时,如何定位排查? 为什么访问部署的应用时浏览器返回404错误码? 节点无法连接互联网(公网),如何排查定位? 解析外部域名很慢或超时,如何优化配置? 存储管理 无法使用kubectl命令删除PV或PVC
/usr/local/nvidia/bin && ./nvidia-smi 若能正常返回GPU信息,说明设备可用,插件安装成功。 如果驱动地址填写错误,需要将插件卸载后重新安装,并配置正确的地址。 nvidia驱动建议放在OBS桶里,并设置为公共读。 相关链接 GPU节点使用nvidia驱动启动容器排查思路