检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
为集群升级过程中跳过的节点打标签), UpgradeStrategy(集群升级策略) Value: Support 支持,Disable 关闭,Default 使用CCE服务默认规则判断 表3 Metadata 参数 参数类型 描述 uid String 唯一id标识 name String
行确认。 在跳转的“修改自动续费”页面中,修改自动续费的参数。 续费方式:如果节点开通自动续费的节点,默认设置为“到期自动续费”。如果需要关闭自动续费配置,请选择“手动续费”。 选择续费时长:支持修改每次续费的时长,每次续费最短为1个月,最长为1年。 自动续费次数:勾选后,可设置
transparent-client-ip String 仅TCP/UDP协议的服务支持配置。 true:表示开启客户端源IP能力。 false:表示关闭客户端源IP能力。 父主题: 负载均衡(LoadBalancer)
智能告警中心功能会默认生成容器场景下的告警规则模板(包含异常事件告警、异常指标告警)。告警规则被分类为若干个告警规则集,您可以为告警规则集关联多个联系组,并开启或关闭告警项。告警规则集中包含多个告警规则,一个告警规则对应单个异常的检查项。关于默认告警规则模板,请参见表1。 表1 默认告警规则 告警规则类型
户。详细的退订规则请参见云服务退订规则概览。 如果您已开启“自动续费”功能,为避免继续产生费用,请在自动续费扣款日(默认为到期前7日)之前关闭自动续费。 按需计费资源 对于按需计费模式的资源,例如按需计费的集群、按需计费的节点(弹性云服务器)等,若不再使用这些资源且需停止计费,请删除相应资源。需要注意的是:
单个节点负载过高而导致的应用程序或节点故障。 配置案例1 开启负载感知调度策略,使用默认权重值5。插件详情与配置方法请参见负载感知调度。 关闭装箱调度策略(binpack)。插件详情与配置方法请参见装箱调度(Binpack)。 配置建议如下: 优先确保各节点CPU资源负载趋于均衡
为每个Job找到一个最合适的节点。将该Job 绑定到这个节点。action中执行的具体算法逻辑取决于注册的plugin中各函数的实现。 关闭本次会话。 Volcano自定义资源 Pod组(PodGroup):Pod组是Volcano自定义资源类型,代表一组强关联Pod的集合,主
模板实例的值 表4 ReleaseReqBodyParams 参数 是否必选 参数类型 描述 dry_run 否 Boolean 开启后,仅验证模板参数,不进行安装 name_template 否 String 实例名称模板 no_hooks 否 Boolean 安装时是否禁用hooks
模板实例的值 表4 ReleaseReqBodyParams 参数 是否必选 参数类型 描述 dry_run 否 Boolean 开启后,仅验证模板参数,不进行安装 name_template 否 String 实例名称模板 no_hooks 否 Boolean 安装时是否禁用hooks
1的优先级高于Job 2。 图1 DRF调度示意图 配置公平调度策略 安装Volcano后,您可通过“配置中心 > 调度配置”选择开启或关闭DRF调度能力,默认开启。 登录CCE控制台。 单击集群名称进入集群,在左侧选择“配置中心”,在右侧选择“调度配置”页签。 在“AI任务性
ring名空间下,默认不识别任何其他命名空间的ServiceMonitor和PodMonitor。 只支持无本地存储的模式。 开启后不支持关闭,可通过插件卸载安装的方式切换为正常模式。 暂不支持成本优化。 暂不支持在AOM页面进行指标废弃。 暂不支持在AOM页面进行Service
新调度后还是能访问到相同的持久化数据,在删除Pod时,PVC不会被删除。 图2 StatefulSet的Pod重建过程 下面将通过实际操作验证这一点是如何做到的,执行下面的命令,在nginx-1的目录/usr/share/nginx/html中写入一些内容,例如将index.html的内容修改为“hello
节点上的安全组是否对ELB暴露了相关的协议或端口。 四层ELB的健康检查是否开启(未开启的话,请开启)。 七层ELB的访问方式中使用的证书是否过期。 常见问题: 发布四层ELB时,如果客户在界面未开启健康检查,ELB可能会将流量转发到异常的节点。 UDP协议的访问,需要放通节点的ICMP协议。
the VPC of master 重要 检查集群删除控制节点VPC是否成功。 删除集群证书失败 Failed to delete certificate of cluster 重要 检查集群删除集群证书是否成功。 删除控制节点云服务器组失败 Failed to delete the server
sh/preemptable: "true" 表示作业是否可抢占。开启后,认为该作业可以被抢占。 取值范围: true:开启抢占。(默认为开启状态) false:关闭抢占。 可通过查询Pod详情查看Pod是否由Volcano调度,以及被分配的队列: 使用以下命令查询Pod详情并获取scheduling.k8s
ernetes PVC相关接口。 存储管理的URL格式为:https://{clusterid}.Endpoint/uri。其中{clusterid}为集群ID,uri为资源路径,也即API访问的路径。如果使用https://Endpoint/uri,则必须指定请求header中的X-Cluster-ID参数。
服务,无需独立配置。您可以手动配置日志采集路径,详情请参见通过ICAgent采集容器日志(不推荐)。 如需要关闭当前负载的标准输出,您可在标签与注解中添加键为kubernetes.AOM.log.stdout,值为[]的注解,即可关闭当前负载下全部容器的标准输出。该注解的使用方法请参见表1。 镜像访问凭证:用于
ernetes PVC相关接口。 存储管理的URL格式为:https://{clusterid}.Endpoint/uri。其中{clusterid}为集群ID,uri为资源路径,也即API访问的路径。如果使用https://Endpoint/uri,则必须指定请求header中的X-Cluster-ID参数。
Caffe分类范例 本实践采用caffe官方的分类例子,地址为https://github.com/BVLC/caffe/blob/master/examples/00-classification.ipynb。 使用CPU 创建一个普通job,镜像输入第三方镜像bvlc/caffe:cpu,设置对应的容器规格。
$HOME/.kube/config 执行kubectl命令验证集群的连通性。 以查看集群信息为例,执行以下命令。 kubectl cluster-info 回显如下: Kubernetes master is running at https://*.*.*.*:5443 CoreDNS is