检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
弹性云服务器-虚拟机节点操作系统 操作系统 集群版本 CCE Standard集群 CCE Turbo集群 最新内核信息 VPC网络模型 容器隧道网络模型 云原生网络2.0 Huawei Cloud EulerOS 2.0 v1.30 √ √ √ 5.10.0-182.0.0.95.r1941_123
云原生混部 云原生混部概述 开启云原生混部 动态资源超卖 基于Pod实例画像的资源超卖 CPU Burst弹性限流 出口网络带宽保障 父主题: 调度
集群删除 集群删除失败:安全组中存在残留资源 冻结或不可用的集群删除后如何清除残留资源 父主题: 集群
云原生可观测性插件 云原生监控插件 云原生日志采集插件 CCE节点故障检测 CCE容器网络扩展指标 Kubernetes Metrics Server Grafana Prometheus(停止维护) 父主题: 插件
域名DNS CCE集群内域名解析失败,如何定位处理? 为什么CCE集群的容器无法通过DNS解析? 为什么修改子网DNS配置后,无法解析租户区域名? 解析外部域名很慢或超时,如何优化配置? 如何设置容器内的DNS策略?
141.03 470.141.03 获取驱动链接-公网地址 登录CCE控制台。 创建节点,在节点规格处选择要创建的GPU节点,选中后下方显示的信息中可以看到节点的GPU显卡型号。 图1 查看显卡型号 登录到https://www.nvidia.com/Download/Find.aspx
Build:创建中,表示节点正处于创建过程中。 Installing:安装中,表示节点正处于纳管过程中。 Upgrading:升级中,表示节点正处于升级过程中。 Active:运行中,表示节点处于正常状态。 Abnormal:不可用,表示节点处于异常状态。 Deleting: 删除中,表示节点正处于删除过程中。 Error:错误,表示节点处于故障状态。
计费类 云容器引擎CCE如何定价/收费? CCE集群的计费方式如何由按需改为包年包月? CCE创建的节点是否支持按需转包周期? 华为云支持哪几种开具发票模式? CCE是否支持余额不足提醒? CCE是否支持账户余额变动提醒? 包周期的CCE集群到期可以直接删除吗? 如何退订我的云容器引擎?
在安装插件页面,设置“规格配置”。 表1 插件规格配置 参数 参数说明 插件规格 该插件可配置“高可用”、“单实例”或“自定义”规格。 实例数 选择上方插件规格后,显示插件中的实例数。 选择“自定义”规格时,您可根据需求调整插件实例数。 实例数为1时插件不具备高可用能力,当插件实例所在节点异常时可能导致插件功能无法正常使用,请谨慎选择。
将由AOM服务进行收费,详情请参见价格详情。对接AOM需要用户具备一定权限,目前仅华为云/华为账号,或者在admin用户组下的用户支持此操作。 公网访问 1.2.1及以上版本的插件支持开启公网访问,开启后需要选择一个负载均衡器作为Grafana服务入口。仅支持选择集群所在VPC下
节点池状态。 空值:可用(节点池当前节点数已达到预期,且无伸缩中的节点) Synchronizing:伸缩中(节点池当前节点数未达到预期,且无伸缩中的节点) Synchronized:伸缩等待中(节点池当前节点数未达到预期,或者存在伸缩中的节点) SoldOut:节点池当前不可扩容(兼容字
容器设置 在什么场景下设置工作负载生命周期中的“停止前处理”? 在同一个命名空间内访问指定容器的FQDN是什么? 健康检查探针(Liveness、Readiness)偶现检查失败? 如何设置容器umask值? CCE启动实例失败时的重试机制是怎样的? 父主题: 工作负载
OpenKruise是一个基于Kubernetes的扩展套件,使用CRD拓展来提供扩展工作负载和应用管理能力,实现云原生应用的自动化部署、发布、运维和可用性防护,使得应用的管理更加简单和高效。 OpenKruise的核心能力如下: 高级工作负载:OpenKruise包含一系列增强版本的工
规格配置变更 如何变更CCE集群中的节点规格? CCE节点池内的节点变更规格后会有哪些影响? CCE节点变更规格后,为什么无法重新拉起或创建工作负载? CCE集群的节点可以更改IP吗? 父主题: 节点
TFJob可在GPU场景下进行,该场景需要集群中包含GPU节点,并安装合适的驱动。 在TFJob中指定GPU资源。 创建tf-gpu.yaml文件,示例如下: 该示例的主要功能是基于Tensorflow的分布式架构,利用卷积神经网络(CNN)中的ResNet50模型对随机生成的图像进行
与告警规则 使用Prometheus监控Master节点组件指标 监控NGINX Ingress控制器指标 监控CCE Turbo集群容器网络扩展指标 Prometheus插件平滑迁移实践 父主题: 可观测性
metrics和node-exporter两个工作负载也会升级为由Operator统一管理,您后续对这两个工作负载的个性化配置也会在插件升级时最大程度的得到保留。 指标采集管理 您可按需选择每一个系统预置采集任务的指标采集行为进行管理: 若您选择采集全量指标,则会采集该采集任务的所有指标。
template是Pod的定义,内容与Pod中的定义完全一致。 将上面Deployment的定义保存到deployment.yaml文件中,使用kubectl创建这个Deployment。 使用kubectl get查看Deployment和Pod,可以看到READY值为2/2,前一个2表示当前有2个P
取值范围: 空值:可用(节点池当前节点数已达到预期,且无伸缩中的节点) Synchronizing:伸缩中(节点池当前节点数未达到预期,且无伸缩中的节点) Synchronized:伸缩等待中(节点池当前节点数未达到预期,或者存在伸缩中的节点) SoldOut:节点池当前不可扩容(兼容字
值超出其他资源限制要求。 例如,某一个命名空间的内存申请值不能超过2GiB,而VPA的建议值如果比较大,可能导致Pod更新后整个命名空间的资源申请量超过2GiB从而出现无法调度。 前提条件 集群版本需满足v1.25及以上。 使用VPA需要在集群中安装能够提供Metrics API的插件,您可根据实际需求选择其中之一: