检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
详细操作可参考通过kubectl连接集群。 集群上安装了CCE AI套件(GPU/NPU),可参考CCE AI套件(NVIDIA GPU)和 CCE AI套件(Ascend NPU)。其中NPU驱动版本应大于23.0。
根据指定的Replicas数量自动创建对应数量的云硬盘,便于快速扩展 - metadata: name: disk-csi spec: accessModes: [ "ReadWriteOnce" ] # 云硬盘只支持以读写模式被单个节点挂载和访问
登录ECS控制台。 在左侧导航树中,选择“弹性云服务器 > 云服务器组”。 单击“操作”列下的“添加云服务器”。 在“添加云服务器”页面,选择待添加的弹性云服务器。 单击“确定”,将弹性云服务器加入云服务器组。 父主题: 节点池
登录CCE控制台。 在创建工作负载基本信息页面,开启“时区同步”,即容器与节点使用相同时区。 图2 开启时区同步 登录节点进入容器,修改catalina.sh脚本。
默认域名修改为Prometheus Service的IP和端口,可通过kubectl get service -n monitoring命令查询。 ...
访问模式 云硬盘类型的存储卷仅支持ReadWriteOnce,表示存储卷可以被一个节点以读写方式挂载,详情请参见存储卷访问模式。 加密 选择底层存储是否加密,使用加密时需要选择使用的加密密钥。使用前请确认云硬盘所在区域(Region)是否支持硬盘加密能力。
因此,不能依赖密钥的加密机制保证用户态的信息安全,敏感信息需要用户额外加密后再配置到data字段, 否则可能导致敏感信息泄露等安全问题 父主题: 密钥
升级或编辑插件参数时修改驱动版本也只对未安装 NPU 驱动的节点生效。 驱动安装成功后需要重启节点才能生效,驱动安装成功确认方式请参见如何确认节点NPU驱动已安装完成。 插件卸载不会自动删除已安装的NPU驱动,如需卸载,卸载方式请参见NPU驱动卸载。
登录CCE控制台,进入集群,在左侧选择“节点管理”,在右侧单击节点名称,跳转到弹性云服务器详情页。 在弹性云服务器详情页中,单击右上角的“关机”,关机完成后单击“更多 > 变更规格”。
登录IAM控制台,在左侧导航栏中选择“权限管理>权限”,单击右上方的“创建自定义策略”。 配置自定义策略参数。详情请参见创建自定义策略。 策略名称:设置为CCE Subscribe Operator。 策略配置方式:选择“JSON视图”。 策略内容:设置策略内容如下。
登录到目标端容器所在虚拟机,并登录SWR。详细步骤请参考客户端上传镜像。 给镜像打标签。
已通过kubectl连接集群,详情请参见通过kubectl连接集群。 步骤一:安装云原生监控插件 登录CCE控制台,单击集群名称进入集群,单击左侧导航栏的“插件中心”。 在“插件中心”页面右侧找到云原生监控插件,单击“安装”。 建议您关注以下配置,其他配置可按需进行设置。
登录成本中心,查找CCE-Cluster-ID,在操作一列单击“激活”,如下图所示。 图1 激活成本标签 激活成功后显示如下。 图2 激活成功 给集群所使用资源打标签。
登录节点。 执行如下命令,删除配置文件中MountFlags=shared字段,然后保存。 vi /usr/lib/systemd/system/docker.service 重启Docker。 systemctl restart docker 父主题: 其他
开启节点Core Dump 登录节点,执行如下命令开启Core Dump,设置core文件的存放路径及格式。 echo "/tmp/cores/core.%h.%e.%p.
所以容器隧道网络适用于对性能要求不是特别高的业务场景,比如:Web应用、访问量不大的数据中台、后台服务等。
图1 节点私网IP地址和所在子网 登录ECS控制台,找到节点,先关机,然后进入节点详情页,在弹性网卡页签修改私网IP。注意此时要选择对应的子网。 图2 修改私有IP 图3 修改私有IP 修改完成后再次开机。 父主题: 规格配置变更
安全加固 等保加固会对身份鉴别、访问控制、安全审计、入侵防范、恶意代码防范进行检查并加固。详情请参见Huawei Cloud EulerOS 2.0等保2.0三级版镜像概述。 登录方式 密码 用户名默认为“root”,请输入登录节点的密码,并确认密码。
集群调度器配置 开启GPU共享 是否开启GPU共享能力 参数名 取值范围 默认值 是否允许修改 作用范围 enable-gpu-share true/false true 允许 CCE Standard/CCE Turbo 配置建议: true 默认调度器 集群调度器选择开关,用户可自定义调度器模式
根据应用对资源质量需求的差异,在线应用可以归纳为延时敏感型LS(Latency Sensitive),通常对请求压力(QPS)或访问延迟(RT)等指标有明确的要求,对资源质量较为敏感;离线应用可以归纳为资源消耗型BE(Best Effort),通常是一些计算密集型的任务类应用,有较好的容错重试能力