检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
服务端 监控CoreDNS运行状态 调整CoreDNS部署状态 合理配置CoreDNS 父主题: CoreDNS配置优化实践
监控 使用Prometheus监控多个集群 使用dcgm-exporter监控GPU指标 将Prometheus监控数据上报至第三方监控平台 通过PromQL语句查询Prometheus数据
通过模板包部署Nginx Ingress Controller 自定义部署Nginx Ingress Controller Nginx Ingress Controller高级配置 父主题: 网络
使用Jenkins和Gitlab实现多集群隔离的DevOps流程 方案概述 资源规划 实施步骤 父主题: DevOps
实施步骤 搭建Jenkins和Gitlab环境 配置集群环境 配置Gitlab项目 持续集成及持续部署 父主题: 使用Jenkins和Gitlab实现多集群隔离的DevOps流程
GPU调度 GPU节点驱动版本 使用Kubernetes默认GPU调度 GPU虚拟化 监控GPU资源指标 CCE AI套件(NVIDIA GPU)插件使用DCGM-Exporter监控GPU指标 基于GPU监控指标的工作负载弹性伸缩配置 GPU虚拟化节点弹性伸缩配置 GPU故障处理
Kubernetes版本发布记录 Kubernetes 1.31版本说明 Kubernetes 1.30版本说明 Kubernetes 1.29版本说明 Kubernetes 1.28版本说明 Kubernetes 1.27版本说明 Kubernetes 1.25版本说明 Kubernetes
专属存储(DSS) 专属存储概述 通过静态存储卷使用专属存储 通过动态存储卷使用专属存储 在有状态负载中动态挂载专属存储 父主题: 存储
调度工作负载 工作负载调度策略概述 设置指定节点调度(nodeSelector) 设置节点亲和调度(nodeAffinity) 设置工作负载亲和/反亲和调度(podAffinity/podAntiAffinity) 父主题: 工作负载
VPC网络模型 VPC网络模型说明 扩展集群容器网段 父主题: 容器网络
Pod安全配置 PodSecurityPolicy配置 Pod Security Admission配置 父主题: 工作负载
Nginx Ingress管理 通过控制台创建Nginx Ingress 通过Kubectl命令行创建Nginx Ingress 用于配置Nginx Ingress的注解(Annotations) Nginx Ingress高级配置示例 父主题: 路由(Ingress)
云原生观测 云原生观测体系概述 云原生观测委托权限说明 健康中心 监控中心 日志中心 告警中心 日志审计 云原生观测FAQ 云原生观测最佳实践
监控中心 监控中心概述 开通监控中心 管理监控采集任务 集群监控 节点监控 工作负载监控 Pod监控 事件监控 仪表盘 父主题: 云原生观测
仪表盘 使用仪表盘 集群视图 APIServer视图 Pod视图 主机视图 Node视图 节点池视图 GPU视图 XGPU视图 CoreDNS视图 PVC视图 Kubelet视图 Prometheus Server视图 Prometheus Agent视图 父主题: 监控中心
业务优先级保障调度 优先级调度与抢占 父主题: Volcano调度
AI任务性能增强调度 公平调度(DRF) 组调度(Gang) 父主题: Volcano调度
配置管理 ConfigMap Secret
配置项与密钥 创建配置项 使用配置项 创建密钥 使用密钥 集群系统密钥说明
配置工作负载 安全运行时与普通运行时 设置时区同步 设置镜像拉取策略 使用第三方镜像 使用SWR企业版镜像仓库镜像 设置容器规格 设置容器生命周期 设置容器健康检查 设置环境变量 设置性能管理配置 设置工作负载升级策略 设置容忍策略 设置标签与注解 父主题: 工作负载