检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
NPU调度 Volcano调度 Volcano是一个基于Kubernetes的批处理平台,提供了机器学习、深度学习、生物信息学、基因组学及其他大数据应用所需要而Kubernetes当前缺失的一系列特性,提供了高性能任务调度引擎、高性能异构芯片管理、高性能任务运行管理等通用计算能力。 功能
找到CCE集群弹性引擎插件,单击“安装”。 在安装插件页面,根据需求选择“规格配置”。 CCE根据集群规模提供三种“系统预置规格”,您可根据自身需求进行选择,系统会根据不同的预置规格配置插件的实例数及资源配额,具体配置值请以控制台显示为准。 设置插件实例的部署策略。 调度策略对于
apiVersion String API版本,固定值“v3”,该值不可修改。 metadata JobMetadata object 任务元数据。 spec JobSpec object 任务详细参数。 status JobStatus object 任务状态信息。 表4 JobSpec
prometheus实例规格。 说明: PVC资源使用率的检查在kube-prometheus-stack插件为“本地数据存储”时执行,该模式下,采集到的指标数据会存放入集群PV中。 prometheus工作负载近24小时内存使用率最大值是否超过80% 是 prometheus工
设置存活/就绪探针:在容器配置中选择“健康检查”,开启存活探针和就绪探针。示例中均为TCP端口检查,请根据应用实际情况进行设置。检测周期、延时时间、超时时间等数据需要合理设置,部分应用启动时间较长,如果设置的时间过短,会导致Pod反复重启。 本示例中配置就绪探针延迟探测时间为20s,用于控制工作负载批量滚动的时间间隔。
value.split("\\s+")).groupByKey(value => value).count().count() 下述命令定义了各种数据来源: var alluxio = spark.read.textFile("alluxio://alluxio-master:19998/sample-1g")
表5 污点容忍配置 node_match_expressions 否 Array of 表6 插件实例亲和性配置 表4 resources字段数据结构说明 参数 是否必选 参数类型 描述 limitsCpu 是 String CPU大小限制,单位:m。 limitsMem 是 String
表5 污点容忍配置 node_match_expressions 否 Array of 表6 插件实例亲和性配置 表4 resources字段数据结构说明 参数 是否必选 参数类型 描述 limitsCpu 是 String CPU大小限制,单位:m limitsMem 是 String
metadata.labels.app 其中LABELS为显示的列标题,可以自己设置,“.metadata.labels.app”为查询的数据需要按照之前的YAML或JSON获取。 create kubectl命令用于根据文件或输入创建集群资源。 如果已经定义了相应资源的YAML
参数 参数类型 描述 server String 服务器地址。 certificate-authority-data String 证书授权数据。 insecure-skip-tls-verify Boolean 不校验服务端证书,在 cluster 类型为 externalCluster
节点干扰ContainerdSock检查异常处理 检查项内容 检查节点上是否存在干扰的Containerd.Sock文件。该文件影响Euler操作系统下的容器运行时启动。 解决方案 问题场景:节点使用的docker为定制的Euler-docker而非社区的docker 登录相关节点。 执行rpm
Warning NodeNotReady 17s node-controller Node is not ready 问题原因 节点关机后,系统会自动给节点添加污点,比如: node.kubernetes.io/unreachable:NoExecute node.cloudprovider
应用场景 表4 应用场景不同 云容器引擎CCE 云容器实例CCI 适用所有场景,一般运行大规模长期稳定的应用,例如: 电商 业务中台 IT系统 适用于有明显的波峰波谷特征的场景,灵活申请资源,提高资源利用率。例如: 批量计算 高性能计算 突发扩容 CI/CD测试 图2 CCE和CCI应用场景区别
安装插件 本插件为系统默认安装,若因特殊情况卸载后,可参照如下步骤重新安装。 登录CCE控制台,单击集群名称进入集群,在左侧导航栏中选择“插件中心”,在右侧找到CoreDNS域名解析插件,单击“安装”。 在安装插件页面,根据需求选择“规格配置”。 选择“系统预置规格”时,您可根
--short HEAD命令的返回值,即commit ID,作为镜像的tag build_tag = sh(returnStdout: true, script: 'git rev-parse --short HEAD').trim()
使用时请根据业务的特点选择合适的画像周期,以覆盖业务完整的资源使用规律周期。 等待大约2分钟让Volcano agent完成配置切换和画像数据的积累,然后重新运行3中的施加负载命令,通过查询的超卖资源量,可以再次绘制CPU超卖量图表。 可以看到,在整个脚本运行过程中,基于Pod实
Ingress控制器插件时预留的监听端口,默认HTTP为80,HTTPS为443。使用HTTPS需要配置相关证书。 证书来源:使用证书以支持HTTPS数据传输加密认证。 如果您选择“TLS密钥”,需要提前创建IngressTLS或kubernetes.io/tls类型的密钥证书,创建密钥的方法请参见创建密钥。
鲲鹏集群Docker容器挂载点被卸载 故障现象 鲲鹏集群Docker容器挂载点被卸载。 问题根因 鲲鹏集群节点为EulerOS 2.8系统时,如果在Docker服务文件中配置了MountFlags=shared字段,会因为systemd特性的原因导致容器挂载点被卸载。 解决方法
安装Spark 前提条件 您需要准备一台可访问公网的Linux机器,节点规格建议为4U8G及以上。 配置JDK 以CentOS系统为例,安装JDK 1.8。 查询可用的JDK版本。 yum -y list java* 选择安装JDK 1.8。 yum install -y java-1
Seccomp是一种系统调用过滤机制,它能够限制进程能够使用的系统调用,从而减少潜在的攻击面。Linux操作系统提供了数百个系统调用,但并非所有这些调用对于容器化应用都是必需的。通过限制容器可以执行的系统调用,您可以显著降低应用程序受到攻击的风险。 Seccomp的核心原理是拦截所有系统调用,