检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
约束限制 由于x2hce-ca工具安装会有额外资源包引入,不建议在业务环境中运行。x2hce-ca工具支持在HCE 2.0和CentOS的操作系统进行安装使用。 x2hce-ca工具支持扫描的文件格式为jar、py、pyc、bin、sh、rpm、ko。其中,只支持扫描源码为C、C
使用OSMT工具升级 概述 约束限制 版本升级和回退 更新RPM包 升级后续操作 回退RPM包 父主题: 更新HCE系统和RPM包
力单元,容器3、4共享剩余19个算力单元。 在混合调度下,根据GPU_CONTAINER_QUOTA_PERCENT是否为0来区分容器是否开启算力隔离,GPU_CONTAINER_QUOTA_PERCENT为0的所有容器共享GPU的空闲算力。 混合调度策略不支持高优先级容器。 权重弱调度(policy=6)
更新RPM包 准备工作 osmt update命令更新 osmt-agent服务自动更新 父主题: 使用OSMT工具升级
always,上次升级有涉及need_reboot_rpms列表中的RPM包,需要手动重启后才能回退生效。 请使用最新版本的OSMT工具进行操作,不建议通过OSMT工具回退OSMT自身版本。 父主题: 使用OSMT工具升级
安装安全更新 执行yum upgrade --security命令,安装全部安全更新。 [root@localhost ~]# yum upgrade --security Last metadata expiration check: 5:21:24 ago on Tue 13
d/openibd status命令查看驱动安装结果。 显示如下信息表示驱动安装成功。 在Arm架构安装mlnx驱动 下载CX6网卡驱动安装包MLNX_OFED_LINUX-23.10-1.1.9.0-openeuler22.03-aarch64.tgz。 解压驱动安装包并进入工作目录。 tar -xf
gnome-classic-session gnome-shell-extension-apps-menu gnome-shell-extension-auto-move-windows gnome-shell-extension-drive-menu gnome-shell-extension-launch-new-instance
一个父节点内的子节点之间cpu.qos_level生效。 子cgroup创建时默认继承父cgroup的cpu.qos_level,支持重新配置cpu.qos_level值。 同优先级的qos_level之间的资源竞争服从CFS调度器的策略。 同一个cpu上,qos_level <
hadoop-3.1-common-3.1.4-4.oe2203.noarch.rpm命令安装RPM包,如下所示表示安装成功。 如果安装过程中提示需要依赖其他的安装包,请根据同样的操作步骤先安装所依赖的安装包。 通过repo文件批量下载RPM包 本节以openEuler-22.03-LT
XGPU通过自研的内核驱动为容器提供虚拟的GPU设备,在保证性能的前提下隔离显存和算力,为充分利用GPU硬件资源进行训练和推理提供有效保障。您可以通过命令方便地配置容器内的虚拟GPU设备。 图1 XGPU共享技术架构图 产品优势 节约成本 随着显卡技术的不断发展,单张GPU卡的算力越来越强,同时价格也
memory.min、memory.low和memory.high接口在非根的memory cgroup下面默认存在,可以向文件内写值配置,也可以读取当前配置。合理的取值大小顺序为memory.min≤memory.low<memory.high,三者可独立使用,也可联合使用。 内存回收机制如下图。
升级概述 HCE提供操作系统和RPM包的更新维护,包括部署在HCE上的RPM包、安全更新涉及的RPM包和漏洞修复。为了操作系统和RPM包的使用更加安全,请及时升级。 HCE支持使用dnf/yum命令和OSMT工具两种升级方式。 Linux自身支持dnf/yum命令,可对RPM包进行升级和回退,升级操作简单。
EulerOS 2.0及之后版本支持yum和dnf命令。 Huawei Cloud EulerOS 1.1版本仅支持yum命令。 前提条件 HCE中已安装dnf组件,dnf命令可用。 [root@localhost bin]# dnf usage: dnf [options] COMMAND
漏洞公告 OpenSSH远程代码执行漏洞公告(CVE-2024-6387)
x2hce-ca应用兼容性评估 工具概述 约束限制 安装x2hce-ca 评估软件兼容性 父主题: 系统迁移
从社区获取0.4.11及以上版本进行升级。 本教程介绍如何在HCE 2.0上下载qperf 0.4.11源码并编译。 准备工作 准备一台ECS实例,并分配公网IP或者弹性公网IP(EIP)。 操作步骤 执行以下命令下载qperf 0.4.11源码文件。 wget https://github
存在处于D状态超过设置时长(默认120秒)的进程。如果存在这样的进程,则打印并上报相关警告和进程堆栈。如果配置了hung_task_panic(通过proc或内核启动参数配置),则直接发起panic。 触发方法 创建内核线程,设成D状态,scheduler释放时间片。 global
附录 OSMT命令帮助信息 /etc/osmt/osmt.conf配置文件说明 父主题: 更新HCE系统和RPM包
可选参数,进行回退重试。 --nocheck 可选参数,回退前不进行任何检查,直接进入回退阶段。 执行osmt config -h命令,显示修改配置项或显示配置项的帮助信息。 usage: osmt config [-h] [-k] { minimal_interval,cycle_time…}