检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
安装并使用XGPU 本章节介绍如何安装和使用XGPU服务。 约束限制 XGPU功能仅在Nvidia Tesla T4、V100上支持。 HCE内核版本为5.10及以上版本。 XGPU功能仅支持cuda 12.2版本。 GPU实例已安装535.54.03版本的NVIDIA驱动。 GPU实例已安装18
OOM优先级策略开关。 0:不开启优先级配置。当OOM时,按照系统原有的OOM操作结束进程,结束内存消耗最大的进程,回收内存。 1:开启优先级配置并以cgroup为粒度。当OOM时,结束优先级低的cgroup所有进程,并回收内存。 2:开启优先级配置并以单个进程个为粒度。当OOM时,结
支持SSH完整的安全和身份验证功能。本教程介绍如何在HCE 2.0上部署SFTP服务。 准备工作 准备一台ECS实例,并分配公网IP或者弹性公网IP(EIP)。 安全组的入方向规则已放行22端口。 操作步骤 配置SFTP服务。 执行如下命令创建sftp组。 groupadd sftp
Gnome桌面安装 简介 Gnome是一种桌面环境,它的目标系统是Linux,但是大部分的BSD系统也支持Gnome。本教程介绍如何在HCE 2.0上安装Gnome图形化界面,以及中文支持。 准备工作 准备一台ECS主机。 操作步骤 安装Gnome桌面 执行如下命令安装Gnome桌面。
支持6大类400种板卡,基本覆盖主流计算产品。北向100%兼容主流的应用场景(云原生、存储、数据库、大数据、WEB等)。超过5000种应用软件通过兼容性认证,基本能够替代CentOS的各种部署。 为满足CentOS系列到HCE搬迁的准确性和安全性,请您使用兼容性工具对待迁移软件快速进行扫描,获取评估结果。
切换到Debian或Ubuntu具体操作、详见切换操作系统。 将CentOS操作系统切换为支持切换的操作系统。 如果现有的ECS配置(网卡、磁盘、VPN等配置的类型和数量)都不需要改变,仅需要修改ECS的操作系统镜像,并且您的软件和原操作系统耦合度较低,建议使用系统切换。 切换到Huawei Cloud
概述 OSMT是华为云提供的对HCE系统及RPM包升级和回退的工具。OSMT可自定义配置RPM包的升级范围,并支持周期性定时升级、在指定的时间段单次升级、延时升级并重启等功能。 版本升级和回退:介绍对整体HCE系统的升级及回退操作。 更新RPM包:介绍仅对RPM包的升级和回退操作。
autorelabel文件确保下次不会再重复执行relabel动作。 打开配置文件/etc/selinux/config,设置SELINUX=permissive,并执行reboot重启操作系统。 再次打开配置文件/etc/selinux/config,设置SELINUX=enfo
存在处于D状态超过设置时长(默认120秒)的进程。如果存在这样的进程,则打印并上报相关警告和进程堆栈。如果配置了hung_task_panic(通过proc或内核启动参数配置),则直接发起panic。 触发方法 创建内核线程,设成D状态,scheduler释放时间片。 global
不影响工具再次使用。异常中断的任务请重新执行。 安装和运行x2hce-ca工具的系统参数要求如下所述。 表1 运行x2hce-ca工具的操作系统参数要求 硬件类型 说明 架构 x86_64 CPU 双核及以上 内存 系统空闲内存要求8GB及以上 硬盘 20GB及以上 父主题: x2hce-ca应用兼容性评估
器,然后打开新终端。在新终端中,就可以使用原生的clang编译语言。 安装毕昇编译器 确认repo源配置正常。 请检查默认的/etc/yum.repos.d/hce.repo配置文件中参数是否正确,正确的配置如下。 [base] name=HCE $releasever base
参数 说明 update 升级操作系统或RPM包。 rollback 回退操作系统或RPM包。 remove 删除存储路径中的备份文件。 config 查询或修改配置文件。 job 查询或管理升级任务。 -h, --help 可选参数,提供osmt命令的帮助信息。 执行osmt update
加到应用程序的最后链接步骤中。 采集应用运行时的日志数据。 部署并预热应用后,即可使用llvm-bolt -instrument -o -instrumentation-file命令配置应用的日志采集方式。 例如,配置test.so文件运行后每隔30秒收集一次日志,日志保存到运行时test
hadoop-3.1-common-3.1.4-4.oe2203.noarch.rpm命令安装RPM包,如下所示表示安装成功。 如果安装过程中提示需要依赖其他的安装包,请根据同样的操作步骤先安装所依赖的安装包。 通过repo文件批量下载RPM包 本节以openEuler-22.03-LT
Nothing to do. Complete! 升级成功后,请及时确认业务运行情况。 升级过程中遇到的常见问题: 安全规范要求chronyd服务在安装/升级后默认处于disabled状态,所以从HCE-2.0.2206版本升级至新版本后,chronyd服务会处于disable
auto_upgrade_window:配置后台osmt-agent服务自动升级的时间窗,格式为"HH:MM-HH:MM",表示升级的开始时间和截止时间。 如果截止时间小于开始时间,则表示本次升级时间段跨越自然日。如“22:00-05:00”表示升级时间段为当日22:00到次日凌晨5:00。 例如,配置当日23
安装安全更新 执行yum upgrade --security命令,安装全部安全更新。 [root@localhost ~]# yum upgrade --security Last metadata expiration check: 5:21:24 ago on Tue 13
一个父节点内的子节点之间cpu.qos_level生效。 子cgroup创建时默认继承父cgroup的cpu.qos_level,支持重新配置cpu.qos_level值。 同优先级的qos_level之间的资源竞争服从CFS调度器的策略。 同一个cpu上,qos_level <
d/openibd status命令查看驱动安装结果。 显示如下信息表示驱动安装成功。 在Arm架构安装mlnx驱动 下载CX6网卡驱动安装包MLNX_OFED_LINUX-23.10-1.1.9.0-openeuler22.03-aarch64.tgz。 解压驱动安装包并进入工作目录。 tar -xf
XGPU通过自研的内核驱动为容器提供虚拟的GPU设备,在保证性能的前提下隔离显存和算力,为充分利用GPU硬件资源进行训练和推理提供有效保障。您可以通过命令方便地配置容器内的虚拟GPU设备。 图1 XGPU共享技术架构图 产品优势 节约成本 随着显卡技术的不断发展,单张GPU卡的算力越来越强,同时价格也