检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
业务场景下,一个AI应用并不需要一整张的GPU卡。XGPU的出现让多个容器共享一张GPU卡,从而实现业务的安全隔离,提升GPU利用率,节约用户成本。 可灵活分配资源 XGPU实现了物理GPU的资源任意划分,您可以按照不同比例灵活配置。 支持按照显存和算力两个维度划分,您可以根据需要灵活分配。
升级概述 HCE提供操作系统和RPM包的更新维护,包括部署在HCE上的RPM包、安全更新涉及的RPM包和漏洞修复。为了操作系统和RPM包的使用更加安全,请及时升级。 HCE支持使用dnf/yum命令和OSMT工具两种升级方式。 Linux自身支持dnf/yum命令,可对RPM包进行升级和回退,升级操作简单。
定义二进制文件的相关属性。binary参数详情参见表2。 parameter 用户定义的参数集合,工具根据此集合生成参数集。至少定义一个参数。 通过llvm-bolt -h命令可查看所有参数。 include 用户定义参数集中需包含的参数,允许定义多个参数,多个参数之间采用“与”逻辑。
XGPU算力调度示例 当使用XGPU服务创建XGPU时,XGPU服务会按照最大容器数量(max_inst)为每张显卡设置时间片(X ms)用于为容器分配GPU算力,以单元1、单元2…单元N表示。本节max_inst以20为例,介绍使用不同调度策略时对算力的调度示例。 原生调度(policy=0)
安装工具 确认repo源配置正常。 请检查默认的/etc/yum.repos.d/hce.repo配置文件中参数是否正确,正确的配置如下。 [base] name=HCE $releasever base baseurl=https://repo.huaweicloud.com/
检查安全更新 执行yum check-update --security命令,检查系统当前可用的安全更新。 [root@localhost ~]# yum check-update --security Last metadata expiration check: 0:11:39
制作Docker镜像并启动容器 本节介绍在HCE上制作HCE系统的Docker镜像并启动容器。 约束限制 运行容器镜像的HCE系统版本和制作的HCE容器镜像版本须保持一致。 制作镜像归档文件 确认repo源配置正常。 请检查默认的/etc/yum.repos.d/hce.repo
安全更新概述 本节主要介绍如何使用yum或dnf命令查询并安装Huawei Cloud EulerOS中的安全更新。 各版本对yum和dnf命令的支持情况不同,本节以yum命令为例介绍。 dnf作为yum的替代者,提供更好的性能,dnf和yum命令的使用方法相同。 Huawei Cloud
查询安全更新 命令格式:yum updateinfo <command> [option] 执行yum updateinfo命令,查询全部可用的安全更新信息。 [root@localhost ~]# yum updateinfo Last metadata expiration check:
安装安全更新 执行yum upgrade --security命令,安装全部安全更新。 [root@localhost ~]# yum upgrade --security Last metadata expiration check: 5:21:24 ago on Tue 13
使用OSMT工具升级 概述 约束限制 版本升级和回退 更新RPM包 升级后续操作 回退RPM包 父主题: 更新HCE系统和RPM包
将操作系统迁移至HCE 1.1 约束限制 迁移操作 父主题: 系统迁移
内核memory的多级内存回收策略 需求背景 在容器高密度混合部署场景中,IO读写较多的离线业务消耗大量page cache,导致系统空闲内存降低,达到全局空闲内存水位线后触发全局内存回收,使得在线任务申请内存时进入内存回收的慢路径,引发时延抖动。 为解决此问题,HCE 2.0新
将操作系统迁移至HCE 2.0 约束限制 迁移操作 冲突包列表 父主题: 系统迁移
x2hce-ca应用兼容性评估 工具概述 约束限制 安装x2hce-ca 评估软件兼容性 父主题: 系统迁移
cgroup支持多级混部调度,提供cgroup接口/sys/fs/cgroup/cpu/cpu.qos_level将任务调度级别扩展到5个级别,支持用户对每个cgroup组单独设置优先级。 约束与限制 内核cpu cgroup的多级混部调度基于5.10.0-60.18.0.50.r692_16
内核memory的OOM进程控制策略 背景信息 现有操作系统中,支持配置离线业务和在线业务。当内存发生OOM时,会优先选择离线业务控制组中的消耗内存最多的进程,结束进程回收内存,但是对于某些离线业务也有核心业务,因此会造成很大的影响。 针对这个问题,HCE调整了OOM时回收内存的
t服务。 建议通过osmt config命令来修改配置文件,使用其他方式修改配置文件,可能导致OSMT功能异常。 升级操作必须使用root用户。 系统或RPM包的升级回退对剩余空间的要求: 剩余内存至少512M。 根分区剩余空间至少1.5G。 备份内容的存储目录(store_path)剩余空间至少8G。
工具概述 x2hce-ca是华为云对系统迁移提供的一款免费的应用兼容性评估工具。x2hce-ca通过对待迁移应用进行快速扫描分析,帮助您评估应用在源操作系统和目标操作系统的兼容性。 表1 支持兼容性评估的x86公共镜像 OS发行系列 源操作系统 目标操作系统 HCE 64bit:Huawei
约束限制 由于x2hce-ca工具安装会有额外资源包引入,不建议在业务环境中运行。x2hce-ca工具仅支持在HCE 2.0的操作系统进行安装使用。 x2hce-ca工具支持扫描的文件格式为jar、py、pyc、bin、sh、rpm、ko。其中,只支持扫描源码为C、C++、Java和Python语言的rpm格式文件。