检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
Pod带宽限制不支持HostNetwork类型Pod。 通过控制台设置 通过控制台创建工作负载时,您可在创建工作负载页面的“高级配置 > 网络配置”中设置Pod入/出口带宽限速。 图1 网络配置 通过kubectl命令行设置 您可以通过对工作负载添加annotations指定出口带宽和入口带宽,如下所示。 apiVersion:
其他更高版本的集群 集群中需提前部署可用的工作负载用于对外提供访问。若您无可用工作负载,可参考创建无状态负载(Deployment)、创建有状态负载(StatefulSet)或创建守护进程集(DaemonSet)部署工作负载。 为提供对外访问的工作负载配置Service,ELB Ingre
onsumer)。该模式会延迟PV的创建和绑定,只有在创建工作负载时声明使用该PVC,对应的PV才会创建并绑定。 创建应用。 在左侧导航栏中选择“工作负载”,在右侧选择“无状态负载”页签。 单击页面右上角“创建工作负载”,在“容器配置”中选择“数据存储”页签,并单击“添加存储卷 >
共享型ELB ELB型Ingress 支持ELB使用双栈。 七层独享型ELB和后端服务器之间仅支持使用IPv4协议通信,详情请参见独享型负载均衡支持的网络类型。如Ingress使用IPv6/IPv4双栈协议,将产生相关告警事件(不支持在ELB添加IPv6地址后端),您可前往对应Ingress的“事件”查看相关告警。
时间序列数据通过metric名和键值对来区分。 所有的metrics都可以设置任意的多维标签。 数据模型更随意,不需要刻意设置为以点分隔的字符串。 可以对数据模型进行聚合,切割和切片操作。 支持双精度浮点类型,标签可以设为全unicode。 灵活而强大的查询语句(PromQL):在同一个查询语句,可以对多个
install:”后的信息,例如以下报错为default命名空间中的test-nginx工作负载出现冲突。 前往集群控制台或执行以下kubectl命令删除集群中的test-nginx工作负载。此处仅为示例,请根据实际报错信息进行删除。 kubectl delete deploy test-nginx
网络时延过高,或系统OOM,最终展示为不可用。 解决方案: 建议迁移业务,减少节点中的工作负载数量,并对工作负载设置资源上限,降低节点CPU或内存等资源负载。 将集群中对应的cce节点进行数据清理。 限制每个容器的CPU和内存限制配额值。 对集群进行节点扩容。 您也可以重启节点,
d的GPU资源。 创建GPU虚拟化应用 通过控制台创建 登录CCE控制台。 单击集群名称进入集群,在左侧选择“工作负载”,在右上角单击“创建工作负载”。 配置工作负载信息。 在“容器配置>基本信息”中设置xGPU配额: 显存:显存值单位为MiB,需为正整数,且为128的倍数。若配
集群管理基础设施,成本开销大。 云容器引擎成本低 您只需支付用于存储和运行应用程序的基础设施资源(例如云服务器、云硬盘、弹性IP/带宽、负载均衡等)费用和容器集群控制节点费用。 容器化的优势 Docker使用Google公司推出的Go语言进行开发实现,基于Linux内核的cgro
云硬盘不支持跨可用区挂载,且不支持被多个工作负载、同一个工作负载的多个实例或多个任务使用。由于CCE集群各节点之间暂不支持共享盘的数据共享功能,多个节点挂载使用同一个云硬盘可能会出现读写冲突、数据缓存冲突等问题,所以创建无状态工作负载时,若使用了EVS云硬盘,建议工作负载只选择一个实例。 1.19
在线离线业务混部:支持集群内在离线作业混部以及节点CPU和内存资源超卖,提升集群整体资源利用率。 建议搭配使用 GPU加速云服务器 + 弹性负载均衡ELB + 对象存储服务OBS 图1 AI计算 父主题: 应用场景
xlsx”格式,文件命名中包含时间戳。 当节点的CPU限制率或内存限制率超过100%时,意味着节点资源超分,节点上的负载限制值(可使用的最大值)之和已经超过了节点规格。如果负载占用资源过高,可能会导致业务负载互相抢占资源,引发业务异常乃至节点异常。 概览 图2 资源概况和监控概览 资源健康概况:包括节点状态、Pod数量以及异常事件。
cluster_name, cluster) (kube_pod_container_status_waiting_reason) > 0 更新负载均衡失败 检查更新负载均衡是否成功 事件类 云原生日志采集插件 不涉及 Pod内存不足OOM 检查Pod是否OOM 事件类 节点故障检测插件(1.18.41及以上版本)
Mapper作为存储驱动的节点。 详细限制说明请参见CCE接入 > 约束限制。 每个工作负载需单独配置。 日志采集策略与Pod配置耦合,修改日志配置会重启Pod。 日志采集策略与工作负载分开配置,调整日志采集策略不影响Pod运行。 可以指定采集某个容器的日志。 采集容器文件日志时,若节点存储模式为Device
入集群PV中。 prometheus工作负载近24小时内存使用率最大值是否超过80% 是 prometheus工作负载在Server部署模式下,prometheus-server的PVC使用率是否超过80% 是 prometheus工作负载近24小时是否出现OOM 否 云原生监控
等。对于不需要访问kube-apiserver的工作负载,建议关闭服务账号的自动关联功能。 禁用方法: 方法一:将服务账号的automountServiceAccountToken字段设置为false。完成设置后,创建的工作负载将不会默认关联default服务账号。注意:每个命名空间都要按需设置。
LD_LIBRARY_PATH=/usr/local/nvidia/lib64:$LD_LIBRARY_PATH && ..." 创建工作负载时定义LD_LIBRARY_PATH环境变量(需确保容器内未配置该变量,不然会被覆盖)。 ... env:
于无可用的底层存储,需要新创建的场景。 在有状态负载中动态挂载云硬盘存储:仅有状态工作负载支持,可以为每一个Pod关联一个独有的PVC及PV,当Pod被重新调度后,仍然能够根据该PVC名称挂载原有的数据。适用于多实例的有状态工作负载。 计费说明 挂载云硬盘类型的存储卷时,通过St
8.0以下版本,无需配置自定义指标采集开关。 插件安装完成后会在集群中部署一系列工作负载和Service。其中Prometheus的Server端会在monitoring命名空间下以有状态工作负载进行部署。 您可以创建一个公网LoadBalancer类型Service,这样就可以从外部访问Prometheus。
测试镜像验签功能是否生效。 在集群控制台左侧导航栏单击“工作负载”。 单击右上角“创建工作负载”。 选择已添加标签的命名空间,并填写未经签名的镜像地址,其余参数请参考创建无状态负载(Deployment)按需填写。 单击“创建工作负载”。 未经签名的镜像将被拦截,提示如下: admission