检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
在TFJob中指定GPU资源。
进入/usr/local/nvidia/bin目录。 执行nvidia-smi,观察执行结果中的设备ID,例如:00:0D.0。 若nvidia-smi命令不存在或执行失败,有可能是驱动安装未就绪导致,可以重新安装GPU驱动后,再重试。
获取方法:在CCE控制台,单击左侧栏目树中的“资源管理-存储管理”,在“文件存储卷”页签下单击PVC的名称,在PVC详情页中复制“PVC UID”后的内容即可。 storage 文件存储的大小。
获取方法:在CCE控制台,单击左侧栏目树中的“资源管理-存储管理”,在“对象存储卷”页签下单击PVC的名称,在PVC详情页的“PV详情”页签下复制“PV名称”后的内容即可。 storage 存储容量,单位为Gi。此处配置为固定值1Gi。
表2 VPC网络模型Master节点安全组默认端口说明 方向 端口 默认源地址 说明 是否支持修改 修改建议 入方向规则 TCP:5444 VPC网段 kube-apiserver服务端口,提供K8s资源的生命周期管理。
、P50的请求时延 响应数据包(UDP) 字节数 基于UDP协议的响应数据包的P99、P90、P50的大小 响应数据包(TCP) 字节数 基于TCP协议的响应数据包的P99、P90、P50的大小 缓存记录数 个 CoreDNS缓存的DNS记录数 缓存命中率 个/秒 CoreDNS缓存每秒的命中请求数
推荐您使用挂载目录的方式挂载sock文件。例如,若宿主机sock文件路径为/var/run/docker.sock,您可参考下述配置进行整改。注意,该整改生效时会触发Pod重建。
controller.resources.requests.memory Nginx controller的内存资源申请值,可根据需求自定义。
表1 从Pod访问云服务的方式(同一VPC) 容器网络模型 方式 容器隧道网络 容器隧道网络在节点网络基础上通过隧道封装网络数据包。当从容器访问同一VPC下的其他资源时,节点访问权限的有效性决定了容器访问的通畅性。
作用范围 request-timeout 大于等于0 1m0s 系统配置,不支持修改 CCE Standard/CCE Turbo 请求处理的超时时间 配置建议: 除特殊情况,建议保持默认值1m0s 调低该配置可能导致请求超时 开启过载防护 集群过载控制开关,开启后将根据控制节点的资源压力
该字段不传(或传为字符串'0'),则将资源绑定给默认企业项目。 父主题: 路由
该字段不传(或传为字符串'0'),则将资源绑定给默认企业项目。 父主题: 服务
请替换为实际IP),执行下述命令查看canal-agent版本: kubectl get packageversions.version.cce.io 10.0.50.187 -o yaml | grep -A 1 canal-agent 回显如图: 解决办法 如果您希望继续使用该节点资源
此处Key对应Prometheus数据中的LabelName,请确认Prometheus指标数据中有此LabelName。
约束限制: 不涉及 取值范围: 集群ID 默认取值: 不涉及 partition_name 是 String 分区名称 请求参数 无 响应参数 状态码: 200 表2 响应Body参数 参数 参数类型 描述 kind String 资源类型 apiVersion String API
监控 使用Prometheus监控多个集群 使用dcgm-exporter监控GPU指标 将Prometheus监控数据上报至第三方监控平台 通过PromQL语句查询Prometheus数据
排查项二:集群开启CPU管理策略后变更节点规格 集群开启CPU管理策略(绑核)时,kubelet启动参数中会将CPU Manager的策略设置为static,允许为节点上具有某些资源特征的pod赋予增强的CPU亲和性和独占性。
方案二:您可以将Ingress使用的证书,覆写到集群对应的Secret资源中,避免在升级时出现ELB侧证书被更新。 请登录CCE控制台,前往“配置与密钥”页面找到该Secret并编辑,填入您正在使用的证书并保存。 图2 修改Secret 父主题: 升级前检查异常问题排查
data 配置数据 配置项承载的配置信息内容 参数名 取值范围 默认值 是否允许修改 作用范围 data 数据为key:value键值对形式的数组,其中 key: 由小写字母、数字、中划线(-)、下划线(_)、点(.)组成,长度不超过253位 value值无特别限制 整体数据量不超过
完成配置后,在“规格确认”页面,查看根据配置生成的API数据,您可以通过下载或复制进行使用。 图2 生成创建节点池/节点的API参数 使用生成的API数据作为Body体,调用创建节点池/节点接口,详情请参见创建节点池或创建节点。 父主题: 附录