检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
您可以在集群节点上查询GPU/NPU卡的信息,然后使用kubectl搜索到使用该卡的Pod。 GPU场景 NPU场景 登录CCE控制台,在左侧导航栏中选择“节点管理”,切换至“节点”页签,查看GPU节点的IP。本文中以192.168.0.106为例。 登录GPU节点,通过以下命令查看GPU卡的信息。 nvidia-smi
服务。 图1 SNAT 您可以通过如下步骤实现容器实例访问Internet。 创建弹性公网IP,具体请参见申请弹性公网IP。 登录管理控制台。 在管理控制台左上角单击,选择区域和项目。 在控制台首页,单击左上角的,在展开的列表中单击“网络 > 弹性公网IP”。 在“弹性公网IP”界面,单击“购买弹性公网IP”。
云原生混部配置 云原生混部以节点池粒度进行管理,您需要在节点池打开混部开关并进行混部配置。默认的混部配置,会启用混部所有能力并设置默认参数。您可以对默认的混部配置进行修改。 登录CCE控制台,单击集群名称进入集群。 在左侧导航栏中选择“节点管理”,单击节点池的“更多 > 混部配置”。
读写:可修改容器路径中的数据卷,容器迁移时新写入的数据不会随之迁移,会造成数据丢失。 本例中将磁盘挂载到容器中/data路径下,在该路径下生成的容器数据会存储到云硬盘中。 由于云硬盘为非共享模式,工作负载下多个实例无法同时挂载,会导致实例启动异常。因此挂载云硬盘时,工作负载实例数需为1。
读写:可修改容器路径中的数据卷,容器迁移时新写入的数据不会随之迁移,会造成数据丢失。 本例中将该存储卷挂载到容器中/data路径下,在该路径下生成的容器数据会存储到极速文件存储中。 其余信息都配置完成后,单击“创建工作负载”。 工作负载创建成功后,容器挂载目录下的数据将会持久化保持,
nal权限操作。 集群必须安装CoreDNS才能使用web-terminal。 注意事项 web-terminal插件能够对CCE集群进行管理,请用户妥善保管好登录密码,避免密码泄漏造成损失。 安装插件 登录CCE控制台,单击集群名称进入集群,单击左侧导航栏的“插件中心”,在右侧
rd其他差异请参考容器引擎说明。 默认节点池中的节点迁移步骤 登录CCE控制台,单击集群名称进入集群。 在集群控制台左侧导航栏中选择“节点管理”,切换至“节点”页签。 在节点列表中选择一个或多个需要重置的节点,单击“更多 > 重置节点”。 在容器引擎中选择Containerd,其
kube-controller-manager-{{clusterID}} kube-controller-manager组件是Kubernetes集群内部的管理控制中心,内嵌了Kubernetes发布版本中核心的控制链路。更多信息,请参见kube-controller-manager。 kube-scheduler
修改kubelet配置。 方式一:修改节点池kubelet配置(默认节点池不支持) 登录CCE控制台,进入集群。 单击节点池后“更多 > 配置管理”。 图1 节点池配置管理 修改kubelet配置参数,在“允许使用的不安全系统配置”中增加配置“[net.core.somaxconn]”。 图2 修改kubelet参数
节点数应大于CoreDNS副本数,避免单个节点上运行多个CoreDNS副本。 登录CCE控制台,进入集群,单击左侧导航栏的“节点管理”。 切换至“节点”页签,选择CoreDNS需要独占的节点,单击“标签与污点管理”。 添加以下标签: 标签键:node-role.kubernetes.io/coredns 标签值:true
快速入门。 CCE用户查看云审计日志方法,请参见云审计日志。 图1 云审计服务 日志 CCE支持配置工作负载日志策略,便于日志的统一收集、管理和分析,同时支持按周期进行防爆处理。 CCE配合AOM收集工作负载的日志,在创建节点时会默认安装AOM的ICAgent(在集群kube-s
层存储,但是PV创建比较复杂(可以看到PV中csi字段的配置很麻烦),通常都是由集群管理员管理,这非常不方便。 Kubernetes解决这个问题的方法是提供动态配置PV的方法,可以自动创PV。管理员可以部署PV配置器(provisioner),然后定义对应的StorageClas
订,未到期的包年/包月集群可以退订。 公安冻结:已被公安冻结的集群允许续费,不允许释放或删除。被公安冻结的包年/包月集群不允许退订,在退订管理页面仍然显示,只是不能退订。 集群冻结、解冻对业务的影响 集群冻结时:资源将被限制访问和使用,会导致您的业务中断。 资源解冻时:资源将被解
AI处理器),适用于图像识别、视频处理、推理计算以及机器学习等场景 支持配置docker baseSize 支持命名空间亲和调度 支持节点数据盘划分用户空间 支持集群cpu管理策略 支持集群下的节点跨子网(容器隧道网络) v1.13.7-r0 主要特性: Kubernetes同步社区1.13.7版本 支持网络平面
待纳管云服务器的企业项目需修改成和节点池相同的企业项目。 更多操作指导请参见迁出企业项目资源。 登录华为云控制台。 单击页面右上方的“企业 > 项目管理”。 在企业项目管理页面,选择企业项目,单击操作列的“ 查看资源 ”。 勾选待迁出资源,单击“迁出”。 选择“ECS关联迁出”,其关联的资源将自动同时迁出。
AI处理器),适用于图像识别、视频处理、推理计算以及机器学习等场景 支持配置docker baseSize 支持命名空间亲和调度 支持节点数据盘划分用户空间 支持集群cpu管理策略 支持集群下的节点跨子网(容器隧道网络) v1.13.7-r0 主要特性: Kubernetes同步社区1.13.7版本 支持网络平面
DNS配置:为工作负载单独配置DNS策略,详情请参见工作负载DNS配置说明。 性能管理配置:使用应用性能管理(APM)服务,为JAVA程序提供更精准的问题分析与定位,详情请参见设置性能管理配置。 网络配置: Pod入/出口带宽限速:支持为Pod设置入/出口带宽限速,详情请参见为Pod配置QoS。
支持双精度浮点类型,标签可以设为全unicode。 灵活而强大的查询语句(PromQL):在同一个查询语句,可以对多个metrics进行乘法、加法、连接、取分数位等操作。 易于管理:Prometheus server是一个单独的二进制文件,可直接在本地工作,不依赖于分布式存储。 高效:平均每个采样点仅占 3.5 bytes,且一个Prometheus
name}{"\n"}{end}' 若返回值非空,说明存在聚合API Server。 漏洞修复方案 除了升级之外,当前没有直接可用的缓解措施。集群管理员应注意控制权限,防止非受信人员通过APIService接口部署和控制聚合API Server。 该漏洞已在v1.23.5-r0、v1.21
Kubelet每秒执行的存储相关操作失败的次数 存储操作时延(99分位) 秒 Kubelet执行存储操作中99%的操作的时延分布情况 控制组管理器操作速率 次/秒 每秒执行销毁或更新操作的次数 控制组管理器操作时延(99分位) 秒 Kubelet执行销毁或更新操作中99%的操作的时延分布情况 PLEG relist速率