执行/etc/init.d/openibd status命令查看驱动安装结果。 显示如图2表示驱动安装成功。 图2 驱动安装成功
/etc/osmt/osmt.conf配置文件说明 本节对OSMT工具的配置文件osmt.conf不建议修改的配置项进行说明。 [auto] # if auto_upgrade is True, the osmt-agent will auto upgrade rpms use osmt.conf
前提条件 本功能固定使用ifb0,使用前请确定虚拟网卡ifb0未被使用,并加载ifb驱动。 约束与限制 仅HCE 2.0 x86架构支持使用tbwmcli命令。 仅允许root用户执行tbwmcli命令。
GPU实例已安装535.54.03、535.216.03或570.86.15版本的NVIDIA驱动。 GPU实例已安装18.09.0-300或更高版本的docker。
如何解决证书切换导致的安全启动失败问题 问题背景 2025年3月份之前,在HCE版本发布的rpm包hce-sign-certificate-1.0-1.hce2中,针对安全启动功能提供了两本验签证书:HCE_Secure_Boot_RSA_Code-Signing_Authority
如何关闭HCE的SELinux功能? HCE默认开启SELinux功能。如果业务需要关闭SELinux 功能,请参照本节指导操作。 1. 执行getenforce查看SElinux状态,显示Enforcing表示SElinux已经开启。 图1 SElinux已开启示例 2. 打开配置文件
HCE获取openEuler扩展软件包 HCE默认不加载开源社区openEuler的repo源,避免openEuler的软件包和HCE的软件包冲突。 当前HCE 2.0版本仅兼容openEuler 22.03 LTS版本。本节介绍HCE 2.0版本如何获取openEuler 22.03
I/O error Linux I/O error报错通常表示输入/输出操作失败,在网卡、磁盘等IO设备驱动异常,或文件系统异常都可能打印这个错误。 原理 错误原因取决于代码执行失败的条件。常见的触发异常的原因是硬件故障、磁盘损坏、文件系统错误、驱动程序问题、权限问题等。
XGPU共享技术架构 XGPU通过自研的内核驱动为容器提供虚拟的GPU设备,在保证性能的前提下隔离显存和算力,为充分利用GPU硬件资源进行训练和推理提供有效保障。您可以通过命令方便地配置容器内的虚拟GPU设备。
常用硬件兼容性列表 本网页表格所列产品均已满足华为云HCE技术兼容要求,表格中部分“*”标识的产品是基于技术兼容实现了合作双方互认证。本表格所列产品将持续更新。 表1 常用服务器兼容性表 厂商 服务器型号 操作系统 四川华鲲振宇智能科技有限责任公司 AT800 (Model 3000
使用dnf或yum命令升级 本节介绍HCE 1.1从低版本向高版本的升级和回退操作。dnf和yum命令的使用方法相同,本节以dnf命令为例,HCE 1.1用yum的相同命令执行。 HCE 2.0及以上版本支持yum和dnf命令。 HCE 1.1版本仅支持yum命令。 前提条件 HCE
XGPU算力调度示例 当使用XGPU服务创建XGPU时,XGPU服务会按照最大容器数量(max_inst)为每张显卡设置时间片(X ms)用于为容器分配GPU算力,以单元1、单元2…单元N表示。本节max_inst以20为例,介绍使用不同调度策略时对算力的调度示例。 原生调度(policy
安装安全更新 执行yum upgrade --security命令,安装全部安全更新。 [root@localhost ~]# yum upgrade --security Last metadata expiration check: 0:16:41 ago on Wed 26
内核cpu cgroup的多级混部调度 需求背景 在业务混部场景中,Linux内核调度器需要为高优先级任务赋予更多的调度机会,并需要把低优先级任务对内核调度带来的影响降到最低。原有的在线、离线两级混部调度无法满足业务需求。 为解决此问题,HCE 2.0内核cpu cgroup支持多级混部调度
IPVS报错问题说明 问题背景 IPVS(IP Virtual Server)指IP虚拟服务器,用于负载均衡、网络转发等目的。用户在系统上配置了IPVS虚拟服务器,但未配置真实服务器的情况下,会在VNC上出现错误日志。 问题现象 配置了IPVS虚拟服务器,但未配置真实服务器时,当网络请求发往该虚拟服务器地址后
内核memory的OOM进程控制策略 背景信息 现有操作系统中,支持配置离线业务和在线业务。当内存发生OOM时,会优先选择离线业务控制组中的消耗内存最多的进程,结束进程回收内存,但是对于某些离线业务也有核心业务,因此会造成很大的影响。 针对这个问题,HCE调整了OOM时回收内存的策略
冲突包列表 冲突包列表表示在原系统中存在与HCE系统冲突的软件包,会影响升级过程。 冲突包会在升级过程中自动卸载并且不会再安装上,升级前请评估原系统依赖的软件包是否在此冲突列表内,以免造成升级完成后软件缺失。 如果发现升级后软件包丢失,可以通过yum命令安装新版本软件包。 如果升级过程中遇到其他冲突问题
评估软件兼容性 扫描方式 x2hce-ca工具支持两种软件包扫描方式,请明确要使用的扫描方式和待评估的软件包。 扫描源操作系统上单个或多个应用软件包。 扫描源操作系统上单个或多个目录下的所有应用软件包。 操作步骤 默认登录并切换到root用户下进行工具使用。 使用如下命令对软件包进行兼容性扫描
迁移操作 迁移前须知 1. 在进行迁移操作前,请仔细阅读系统迁移与系统切换的相关介绍,并根据您的实际业务情况来评估是选择系统迁移还是系统切换方案;系统切换的详细指南参见这里; 2. 不同的软件、版本对操作系统的兼容性存在差异,在迁移开始前,请充分测试您所使用的软件与HCE系统的兼容性
迁移操作 本节介绍从CentOS7.9迁移到HCE 1.1的操作过程。 准备迁移工具依赖的软件包 远程连接待迁移的操作系统。 根据弹性云服务器控制台操作指导,远程登录到待迁移虚拟机内部,远程登录的具体操作,请参见连接方式概述,并确保虚拟机能够与互联网建立正常通信。 先关闭CentOS
您即将访问非华为云网站,请注意账号财产安全