检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
支持X86、ARM、NPU等多种异构算力 调度 自研Volcano调度器,提供丰富调度策略,提升任务执行效率 调度器+智能混合调度,提升集群资源利用率 智能调度,容器秒级启动,负载自动调优 网络 VPC网络叠加容器网络(两层) VPC网络和容器网络融合,性能无损耗(一层) VP
检查集群升级后,新建节点是否能新建Pod。 检查步骤 基于新建节点检查创建了新节点后,通过创建DaemonSet类型工作负载,在每个节点上创建Pod。 登录CCE控制台,单击集群名称进入集群。 在导航栏中选择“工作负载”,单击右上角“创建工作负载”或“YAML创建”。创建DaemonSet的操作步骤详情请参见创建守护进程集(DaemonSet)。
5的节点池配置管理异常。 nodepool id(master)表示集群配置管理异常。 问题场景一:节点池配置管理异常 修复节点池异常配置步骤如下: 登录CCE控制台,进入“节点管理”。 找到问题节点池,单击“更多”并选择“配置管理”。 选择“网络组件配置(eni)”,修改节点池级别的节点预热容器网卡回收阈值
搜索DCGM-Exporter组件的“ServiceMonitor”并开启。 步骤三:在AOM中查看DCGM指标信息 进入AOM管理页面,在实例列表中选择所上报的AOM实例。 进入“指标管理”,查看DCGM指标。 步骤四:使用Grafana查看DCGM指标信息 在左侧导航栏中选择“插件中
余参数请根据需求选择,配置说明请参见NGINX Ingress控制器。 步骤二:在日志中心采集NGINX Ingress控制器插件日志 根据不同的场景,开通NGINX Ingress控制器插件日志采集的步骤如下: 集群未开通日志中心 集群已开通日志中心 如果集群未开通日志中心,您
升级storage-driver插件。 安装插件 本插件为系统默认安装,若因特殊情况卸载后,可参照如下步骤重新安装。 未安装storage-driver插件的集群,可参考如下步骤进行安装: 登录CCE控制台,单击集群名称进入集群,在左侧导航栏中选择“插件中心”,在右侧找到CCE容
图1 SNAT原理 前提条件 已创建一个CCE集群,具体操作步骤请参见创建集群。 在集群内已创建一个Pod,具体操作步骤请参见创建无状态负载(Deployment)。 从Pod访问公网的实现步骤 您可以通过如下步骤实现容器实例访问Internet。 确认Pod网段。 登录管理控制台。
roup1和group2。 在权限管理列表中可以看到新建的权限。 图8 权限管理列表 步骤四:权限验证 利用步骤一:创建用户与用户组新建的用户登录管理控制台,检查用户是否具有对应权限。本节以步骤一中新建的develop用户为例,验证权限是否配置成功。 利用新建用户登录管理控制台。
操作流程 操作步骤 说明 准备工作 您需要注册华为账号,并为账户充值。 步骤一:首次开通CCE并进行授权 当您的账号在当前区域中首次使用CCE时,您需要为CCE进行授权。 步骤二:创建集群 您需要在CCE服务中创建一个集群,以提供Kubernetes服务。 步骤三:在集群中创建节点池和节点
集群状态检查 检查项内容 集群升级后,需要检查集群状态是否为“运行中”状态。 检查步骤 系统会自动为您检查集群状态是否正常,您可以根据诊断结果前往集群列表页面进行确认。 解决方案 当集群状态异常时,请联系技术支持人员。 父主题: 升级后验证
创建RoleBinding: kubectl create -f myrolebinding.yaml 此时,用户信息配置完成,继续执行步骤5~步骤7将用户信息写入到配置文件中。 手动为ServiceAccount创建长期有效的Token。 vi my-sa-token.yaml 内容如下:
节点状态检查 检查项内容 集群升级后,需要检查节点状态是否为“运行中”状态。 检查步骤 系统会自动为您检查集群内节点的状态,您可以根据诊断结果前往节点列表页面进行确认。 解决方案 集群节点异常时,建议您通过重置节点来解决,若无法解决,请联系技术支持人员。 父主题: 升级后验证
新建节点检查 检查内容 检查集群是否可以正常创建节点。 检查步骤 登录CCE控制台,单击集群名称进入集群。 在导航栏中选择“节点管理”,并切换至“节点”页签,单击“创建节点”。节点配置详情请参见创建节点。 图1 创建节点 解决方案 若集群升级后您的集群无法创建节点,请联系技术支持人员。
业务检查 检查项内容 集群升级完毕,由用户验证当前集群正在运行的业务是否正常。 检查步骤 业务不同,验证的方式也有所不同,建议您在升级前确认适合您业务的验证方式,并在升级前后均执行一遍。 常见的业务确认方式有: 业务界面可用 监控平台无异常告警与事件 关键应用进程无错误日志 API拨测正常等
podSelector 目标Pod具有role=db标签,该Pod只允许带有role=frontend标签的Pod访问其6379端口。设置该网络策略的具体操作步骤如下: 创建名为access-demo1.yaml文件。 vim access-demo1.yaml 以下为YAML文件内容: apiVersion:
DNSCache可以提升服务发现的稳定性和性能。 关于NodeLocal DNSCache的介绍及如何在CCE集群中部署NodeLocal DNSCache的具体步骤,请参见使用NodeLocal DNSCache提升DNS性能。 父主题: 客户端
具体方法请参见创建告警行动规则。创建时选择在SMN创建主题创建并订阅的主题。 添加事件类告警 以添加“节点状态异常告警”为例,展示添加事件类告警的步骤,您可以参考表1添加其他告警。 表1 推荐配置的事件类告警 事件名称 来源 事件说明 处理建议 节点状态异常 CCE 节点异常立即触发告警
开通过程中系统将自动执行如下步骤:安装云原生监控插件、成本标签激活、创建默认租户OBS桶、订阅账单数据。等待3-5分钟,即可进入洞察界面。 安装云原生监控插件:为成本洞察功能提供基础监控数据。 成本标签激活:成本标签激活后费用中心导出的账单会增加集群的标签,成本洞察后台将按照集群进行分类。该步骤完成后
误删除不属于自己的集群。因此,您可以为重要的集群设置禁止删除的保护措施,防止通过控制台或API误删除集群,避免集群中的重要数据丢失。 操作步骤 登录CCE控制台,单击集群名称进入集群控制台。 在集群控制台左侧导航栏中选择“配置中心”。 单击“配置概览”页签,在“集群配置”中找到“
跳过节点检查 检查项内容 集群升级后,需要检测集群内是否有跳过升级的节点,这些节点可能会影响正常使用。 检查步骤 系统会为您检查集群内是否存在跳过升级的节点,您可以根据诊断结果前往节点列表页进行确认。跳过的节点含有标签upgrade.cce.io/skipped=true。 解决方案