检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
Pod驱逐 参数名 取值范围 默认值 是否允许修改 作用范围 eviction-soft 无 无 允许 CCE Standard/CCE Turbo 满足设置的阈值且持续时间超过设置的驱逐宽限期(evictionSoftGracePeriod)后才会驱逐节点上的 Pod,可配阈值范围与硬驱逐相同
约束与限制 ICAgent兼容Prometheus的监控数据规范,Pod提供的自定义指标必须满足Prometheus的监控数据规范才能够被ICAgent采集,参见Prometheus监控数据采集说明。 ICAgent仅支持上报Gauge指标类型的指标。
使用内容分发网络CDN:静态资源可能通过CDN提供,而CDN域名与主站域名不同,需要使用跨域访问来加载这些资源。 ELB Ingress的跨域访问功能依赖ELB能力,使用该功能前请提交工单申请开通ELB跨域访问能力。
由于Kubeflow与Kustomize的早期版本不兼容,仅支持Kustomize 5及更高版本,本文中使用5.1.0版本。
在左侧导航栏中选择“配置与密钥”,并切换至“monitoring”命名空间,找到名为“persistent-user-config”的配置项。 单击“更新”,对配置数据进行编辑,并在serviceMonitorDisable字段下删除以下配置。
"jobmanager"] # 运行容器时传递的参数,指定这个容器运行为JobManager ports: # 用于暴露容器内相关端口 - containerPort: 6123 # 用于TaskManager与JobManager
约束与限制 挂载参数暂不支持安全容器。 对象存储挂载参数 CCE的存储插件everest在挂载对象存储时默认设置了表1和表2的参数,其中表1中的参数不可取消。
创建工作负载 使用构建的hpa-example镜像创建无状态工作负载,副本数为1,镜像地址与上传到SWR仓库的组织有关,需要替换为实际取值。
创建工作负载 使用构建的hpa-example镜像创建无状态工作负载,副本数为1,镜像地址与上传到SWR仓库的组织有关,需要替换为实际取值。
约束与限制 集群中使用“AI加速型”节点时必须安装CCE AI套件(Ascend NPU)插件。
echo net.ipv4.tcp_keepalive_time=600 >> /etc/sysctl.conf && sysctl -p 执行表1中的查看参数命令检查是否修改成功,当返回与修改值一致时说明修改正确。
重置节点操作可能导致与节点有绑定关系的资源(本地存储,指定调度节点的负载等)无法正常使用。请谨慎操作,避免对运行中的业务造成影响。 重新配置节点参数。 如需对容器存储空间进行调整,请重点关注以下配置。
约束与限制 ICAgent只采集*.log、*.trace和*.out类型的文本日志文件。 费用说明 AOM每月赠送每个账号500M免费日志采集额度,超过免费额度部分将产生费用(了解计费详情)。当前日志使用情况请点此查看。
Autoscaler检测未调度Pod进行扩容时,使用的是与Kubernetes社区版本一致的调度算法进行模拟调度计算,若应用调度采用非内置kube-scheduler调度器或其他非Kubernetes社区调度策略,此类应用使用Autoscaler扩容时可能因调度算法不一致出现无法扩容或多扩风险
template:备份的模板,与备用应用(立即备份)中spec一致。 删除备份 删除集群中创建的备份对象及其相关对象(比如:Backup/Restore/Schedule等),并且将后端存储库中的备份内容删除,适用于产生大量备份数据时进行的清理工作。
前提条件 已开通成本洞察功能 约束与限制 由于实际账单的获取存在两天时间延迟,开通成本洞察后,成本洞察成本数据会延迟2天显示。 使用成本洞察期间,需要保证云原生监控插件运行正常,否则影响成本洞察中命名空间、工作负载、节点池等相关视图的呈现。
DCGM_FI_DEV_DEC_UTIL Gauge % 解码器利用率 表2 内存指标 指标名称 指标类型 单位 说明 DCGM_FI_DEV_FB_FREE Gauge MB 表示帧缓存剩余数,帧缓存一般被称为显存 DCGM_FI_DEV_FB_USED Gauge MB 表示帧缓存已使用数,该值与nvidia-smi
本例中sni-test-secret为SNI证书,该证书指定的域名必须与证书中的域名一致。 请参见通过kubectl连接集群,使用kubectl连接集群。 创建名为“ingress-test.yaml”的YAML文件,此处文件名可自定义。
表1 容器启动失败 日志或事件信息 问题原因与解决方案 日志中存在exit(0) 容器中无进程。 请调试容器是否能正常运行。
集群中已安装插件详情见获取AddonInstance列表 operation 是 String 参数解释: 升级插件的执行动作 约束限制: 不涉及 取值范围: "patch",表示升级插件版本 version 是 String 参数解释: 目标插件版本号 约束限制: 目标插件版本必须与目标集群版本配套