XGPU算力调度示例 当使用XGPU服务创建XGPU时,XGPU服务会按照最大容器数量(max_inst)为每张显卡设置时间片(X ms)用于为容器分配GPU算力,以单元1、单元2…单元N表示。本节max_inst以20为例,介绍使用不同调度策略时对算力的调度示例。 原生调度(policy=0)
> 创建镜像”。 在“创建私有镜像”页面,配置如下镜像信息。 区域:服务器所在区域,请保持此默认配置。 创建方式:创建私有镜像,请保持此默认配置。 镜像类型:系统盘镜像,请保持此默认配置。 镜像源:迁移系统的弹性云服务器,请保持此默认配置。 名称:填写便于识别的镜像名称。 协议:阅读并勾选协议。
全隔离,提高GPU硬件资源的利用率并降低使用成本。 XGPU共享技术架构 XGPU通过自研的内核驱动为容器提供虚拟的GPU设备,在保证性能的前提下隔离显存和算力,为充分利用GPU硬件资源进行训练和推理提供有效保障。您可以通过命令方便地配置容器内的虚拟GPU设备。 图1 XGPU共享技术架构图
约束限制 由于x2hce-ca工具安装会有额外资源包引入,不建议在业务环境中运行。x2hce-ca工具支持在HCE 2.0和CentOS的操作系统进行安装使用。 x2hce-ca工具支持扫描的文件格式为jar、py、pyc、bin、sh、rpm、ko。其中,只支持扫描源码为C、C
检查是否下载成功。如下所示表示下载成功。 使用rpm -ivh hadoop-3.1-common-3.1.4-4.oe2203.noarch.rpm命令安装RPM包,如下所示表示安装成功。 如果安装过程中提示需要依赖其他的安装包,请根据同样的操作步骤先安装所依赖的安装包。 通过repo文件批量下载RPM包
执行如下命令安装python3。 [root@localhost ~]# yum install -y python3 //任意目录执行安装命令 如果CentOS 7.9系统已经安装python3,请忽略此步骤。 关闭selinux。 为了保证迁移前后系统配置文件一致,需要关闭selinux。
如何设置自动注销时间TMOUT? 操作背景 为了保证系统的安全性,以及减少用户在不使用系统时所造成的资源浪费,在用户离开系统一段时间后,必须对连接进行注销。注销有诸多方法,修改TMOUT变量为其中的解决方案之一。 TMOUT是一个环境变量,它决定了在系统自动注销前所空闲的秒数。因
约束限制 对于HCE 1.1镜像,仅支持从CentOS7.9迁移到HCE 1.1,并且不支持配置图形化界面的CentOS7.9系统的迁移。 操作系统迁移过程中涉及rpm卸载、安装及更新,操作系统存在异常重启的风险。请在迁移前做好操作系统的系统盘备份,可以通过快速创建云服务器备份。
将操作系统迁移至HCE 1.1 约束限制 迁移操作 父主题: 系统迁移
工具类 毕昇编译器 应用加速工具 Pod带宽管理工具 安全加固工具
内核功能与接口 内核memory的OOM进程控制策略 内核memory的多级内存回收策略 内核cpu cgroup的多级混部调度 内核异常事件分析指南
将操作系统迁移至HCE 2.0 约束限制 迁移操作 冲突包列表 父主题: 系统迁移
更新HCE系统和RPM包 升级概述 使用dnf或yum命令升级 使用OSMT工具升级 附录
漏洞公告 OpenSSH远程代码执行漏洞公告(CVE-2024-6387)
安全 Huawei Cloud EulerOS 2.0等保2.0三级版镜像概述 安全启动
系统迁移 x2hce-ca应用兼容性评估 将操作系统迁移至HCE 2.0 将操作系统迁移至HCE 1.1
兼容性认证,基本能够替代CentOS的各种部署。 为满足CentOS系列到HCE搬迁的准确性和安全性,请您使用兼容性工具对待迁移软件快速进行扫描,获取评估结果。 对于可兼容的应用软件,迁移过程中并不会修改软件配置,迁移完成后无需重新配置;对于部分不兼容的应用软件,评估报告给出相应
原系统无本地yum源或者yum源不通,需要重新配置。 10006 目标系统yum源配置有误,检查/etc/centos2hce2.conf配置文件中web_link_dir参数填写是否有误。 10007 安装sut失败,检查/etc/centos2hce2.conf配置文件中web_link_dir参数填写是否有误。
能应用程序二进制。该过程不需要应用程序代码做修改或者仅需要对编译器参数做调整。静态加速有两种优化方式。 使用原生的BOLT工具优化应用程序:只能使用固定参数组合优化应用。 使用hce-wae-auto命令优化应用程序:可以根据自定义参数范围,生成不同的参数组合分别来优化应用。 动态加速:
指定对应修改key值的value值。 -V, --verbose 可选参数,显示详细的过程日志。 建议只通过osmt config命令来修改配置文件,使用其他方式修改配置文件,可能导致OSMT功能异常。 指定osmt job -h命令,显示任务管理的帮助信息。 usage: osmt job [-h]
您即将访问非华为云网站,请注意账号财产安全