检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
XGPU共享技术架构 XGPU通过自研的内核驱动为容器提供虚拟的GPU设备,在保证性能的前提下隔离显存和算力,为充分利用GPU硬件资源进行训练和推理提供有效保障。您可以通过命令方便地配置容器内的虚拟GPU设备。 图1 XGPU共享技术架构图 产品优势 节约成本 随着显卡技术的不断
下XGPU只用来做显存的隔离。 固定算力调度(policy=1) 固定算力调度表示以固定的算力百分比为容器分配算力。例如为容器1和容器2分别分配5%和15%的算力,如下图所示。 平均调度(policy=2) 平均调度表示每个容器固定获得1/max_inst的算力。以max_ins
版本升级和回退 本节介绍对整体HCE系统的升级及回退操作。 版本升级或回退时,会同时将RPM包更新到目标系统对应的RPM包版本,和osmt.conf配置文件中的黑白名单rpm列表无关。 版本升级 确认repo源配置正常。 请检查默认的/etc/yum.repos.d/hce.re
- - - 否 确保无需修改的分区以只读方式挂载 - - - 否 确保无需挂载设备的分区以nodev方式挂载 - - - 否 确保无可执行文件的分区以noexec方式挂载 - - - 否 确保无需SUID和SGID的分区以nosuid方式挂载 - - - 否 避免使用USB存储 √
更新HCE系统和RPM包 升级概述 使用dnf或yum命令升级 使用OSMT工具升级 附录
附录 OSMT命令帮助信息 /etc/osmt/osmt.conf配置文件说明 父主题: 更新HCE系统和RPM包
镜像更新记录 公共镜像更新记录分为x86架构和Arm架构,具体参考如下: x86架构公共镜像的更新记录请参见镜像更新记录(x86)。 Arm架构公共镜像的更新记录请参见镜像更新记录(Arm)。
HCE提供操作系统和RPM包的更新维护,包括部署在HCE上的RPM包、安全更新涉及的RPM包和漏洞修复。为了操作系统和RPM包的使用更加安全,请及时升级。 HCE支持使用dnf/yum命令和OSMT工具两种升级方式。 Linux自身支持dnf/yum命令,可对RPM包进行升级和回退,升级操作简单。
使用OSMT工具升级 概述 约束限制 版本升级和回退 更新RPM包 升级后续操作 回退RPM包 父主题: 更新HCE系统和RPM包
重启;若没有,则不重启。时间格式如 "2020-02-02 2:02:02"。 -b, --between 指定osmt执行更新的开始时间和结束时间,格式为"HH:MM-HH:MM"。 如果截止时间小于开始时间,则表示本次升级时间段跨越自然日。如“22:00-05:00”表示升级
使用dnf或yum命令升级 本节介绍HCE1.1及以上版本的RPM包升级和回退操作。dnf和yum命令的使用方法相同,本节以dnf命令为例,HCE 1.1用yum的相同命令执行。 Huawei Cloud EulerOS 2.0及之后版本支持yum和dnf命令。 Huawei Cloud EulerOS
约束限制 升级和回退的耗时受更新的RPM包数量、大小和从repo源下载速度等影响,一般会在30分钟内完成,具体时间视实际环境确定,执行操作时注意预留足够的时间。 OSMT工具仅支持对base、updates两个官方repo源中的RPM包进行升级,请确保这两个源配置的正确性。修改repo源后需要执行systemctl
不支持cgroup v2。 升级oncn-tbwm软件包不会影响升级前的使能状态。卸载oncn-tbwm软件包会关闭对所有设备的使能。 仅支持识别数字、英文字母、中划线“-” 和下划线“_”四类字符类型的网卡名,其他字符类型的网卡不被识别。 实际使用过程中,带宽限速有可能造成协议栈内存积压
升级后续操作 升级成功后,请及时确认业务运行情况。如业务运行正常,请在合适的时候执行osmt remove命令删除备份内容。删除后将无法回退本次升级内容。 安全规范要求chronyd服务在安装/升级后默认处于disabled状态,所以从HCE-2.0.2206版本升级至新版本后,
OSMT是华为云提供的对HCE系统及RPM包升级和回退的工具。OSMT可自定义配置RPM包的升级范围,并支持周期性定时升级、在指定的时间段单次升级、延时升级并重启等功能。 版本升级和回退:介绍对整体HCE系统的升级及回退操作。 更新RPM包:介绍仅对RPM包的升级和回退操作。 OSMT仅支持针对HCE
EulerOS、openEuler和EulerOS镜像的主要区别是什么? Huawei Cloud EulerOS、openEuler和EulerOS镜像均为华为自研镜像,主要区别如下表 1所示: 表1 Huawei Cloud EulerOS、openEuler和EulerOS镜像的区别与联系
更新的RPM包。 白名单优先级大于黑名单,如果某RPM包同时配置在白名单和黑名单,则会升级此RPM包。 说明: 如果使用命令指定了黑名单和白名单,以命令指定的黑名单和白名单为准,不再根据配置文件中的黑名单和白名单列表更新RPM包。 need_reboot_rpms:升级后要重启的RPM包。
/etc/osmt/osmt.conf配置文件说明 本节对OSMT工具的配置文件osmt.conf不建议修改的配置项进行说明。 [auto] # if auto_upgrade is True, the osmt-agent will auto upgrade rpms use osmt
更新RPM包 准备工作 osmt update命令更新 osmt-agent服务自动更新 父主题: 使用OSMT工具升级
回退RPM包 执行osmt rollback --reboot_config always命令回退RPM包。仅支持回退最近一次更新的RPM包。 --reboot_config always:可选,若上次升级有need_reboot_rpms列表中的RPM包,请使用此参数。 如果不带--reboot_config