检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
在CCE集群中部署使用Kubeflow Kubeflow部署 Tensorflow训练 使用Kubeflow和Volcano实现典型AI训练任务 父主题: 批量计算
容器化改造 企业管理应用容器化改造(ERP)
DevOps 在CCE中安装部署Jenkins Gitlab对接SWR和CCE执行CI/CD 使用Argo CD实现持续交付 使用Jenkins和Gitlab实现多集群隔离的DevOps流程
客户端 优化域名解析请求 选择合适的镜像 避免IPVS缺陷导致的DNS概率性解析超时 使用节点DNS缓存NodeLocal DNSCache 及时升级集群中的CoreDNS版本 谨慎调整VPC和虚拟机的DNS配置 父主题: CoreDNS配置优化实践
发布 发布概述 使用Service实现简单的灰度发布和蓝绿发布 使用Nginx Ingress实现灰度发布和蓝绿发布 使用ASM实现灰度发布和蓝绿发布
日志中心 日志中心概述 收集容器日志 采集Kubernetes事件 采集NGINX Ingress访问日志 采集控制面组件日志 采集Kubernetes审计日志 父主题: 可观测性
GPU虚拟化 GPU虚拟化概述 准备GPU虚拟化资源 使用GPU虚拟化 兼容Kubernetes默认GPU调度模式 父主题: GPU调度
创建工作负载 创建无状态负载(Deployment) 创建有状态负载(StatefulSet) 创建守护进程集(DaemonSet) 创建普通任务(Job) 创建定时任务(CronJob) 父主题: 工作负载
调度 调度概述 CPU调度 GPU调度 NPU调度 Volcano调度 云原生混部
容器隧道网络模型 容器隧道网络模型说明 父主题: 容器网络
云原生网络2.0模型 云原生网络2.0模型说明 配置集群容器子网 使用注解为Pod绑定安全组 使用安全组策略为工作负载绑定安全组 使用容器网络配置为命名空间/工作负载绑定子网及安全组 为Pod配置固定IP 为Pod配置EIP 为Pod配置固定EIP 为IPv6双栈网卡的Pod配置共享带宽
集群网络配置 扩展集群VPC网段 父主题: 网络
云原生可观测性插件 云原生监控插件 云原生日志采集插件 CCE节点故障检测 CCE容器网络扩展指标 Kubernetes Metrics Server Grafana Prometheus(停止维护) 父主题: 插件
云原生异构计算插件 CCE AI套件(NVIDIA GPU) CCE AI套件(Ascend NPU) 父主题: 插件
容器安全插件 CCE密钥管理(对接 DEW) 容器镜像签名验证 父主题: 插件
告警中心 告警中心概述 通过告警中心一键配置告警 通过CCE配置自定义告警 通过AOM配置自定义告警 CCE事件列表 父主题: 可观测性
云原生成本治理 云原生成本治理概述 成本洞察
可观测性最佳实践 云原生监控插件兼容自建Prometheus 使用云原生监控插件监控自定义指标 使用AOM监控自定义指标 使用PrometheusRules配置普罗监控与告警规则 使用Prometheus监控Master节点组件指标 监控NGINX Ingress控制器指标 监控CCE
健康中心 健康中心概述 使用健康中心 诊断项及修复方案 父主题: 可观测性
集群Master节点是否高可用 是 集群为单控制节点或者存在控制节点异常,当再有控制节点故障时,集群将不可用,进而会影响集群中运行服务的可靠性。提升服务韧性建议使用高可用集群或者修复节点异常,当某个控制节点故障时,不影响集群业务。 集群当前时间CPU的Request水位是否超过80%