检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
安装并使用XGPU 本章节介绍如何安装和使用XGPU服务。 约束限制 XGPU功能仅在Nvidia Tesla T4、V100上支持。 HCE内核版本为5.10及以上版本。 XGPU功能仅支持cuda 12.2版本。 GPU实例已安装535.54.03版本的NVIDIA驱动。 GPU实例已安装18
安全更新概述 本节主要介绍如何使用yum或dnf命令查询并安装Huawei Cloud EulerOS中的安全更新。 各版本对yum和dnf命令的支持情况不同,本节以yum命令为例介绍。 dnf作为yum的替代者,提供更好的性能,dnf和yum命令的使用方法相同。 Huawei Cloud
OOM相关参数 表1 OOM相关参数 参数名称 参数说明 取值 修改方式 panic_on_oom panic_on_oom参数是控制系统遇到OOM时如何反应的。当系统遇到OOM的时候,通常会有两种选择: 触发系统panic,可能会出现频繁宕机的情况。 选择一个或者几个进程,触发OOM ki
memcg OOM优先级策略开关。 0:不开启优先级配置。当OOM时,按照系统原有的OOM操作结束进程,结束内存消耗最大的进程,回收内存。 1:开启优先级配置并以cgroup为粒度。当OOM时,结束优先级低的cgroup所有进程,并回收内存。 2:开启优先级配置并以单个进程个为粒度。当O
执行systemctl status osmt-agent.service命令确认osmt-agent服务是否正常开启。 Active为active (running)状态,表示osmt-agent正常开启。 如果osmt-agent没有处于active (running)状态,请执行systemctl
单位是秒。默认值为3600秒。 motd_setup: 设置登录提示是否开启。默认为True。 True:开启登录提示。 False:关闭登录提示,设置后会立刻删除登录提示,并且不会再次生成。如果重新开启,需要使用osmt update -s或任意升级命令重新触发生成。 [Package]
力单元,容器3、4共享剩余19个算力单元。 在混合调度下,根据GPU_CONTAINER_QUOTA_PERCENT是否为0来区分容器是否开启算力隔离,GPU_CONTAINER_QUOTA_PERCENT为0的所有容器共享GPU的空闲算力。 混合调度策略不支持高优先级容器。 权重弱调度(policy=6)
error是由于ext4格式的文件系统中,文件节点的错误导致。 原理 文件储存的最小存储单位叫做“扇区”(sector),连续多个扇区组成“块”(block)。inode节点储存文件的元信息,包括文件的创建者、创建日期、大小、属性、实际存储的数据块(block number)。EXT4格式的inode信息校验失败会触发EXT4-fs
exit 表1 参数说明 参数 说明 update 升级操作系统或RPM包。 rollback 回退操作系统或RPM包。 remove 删除存储路径中的备份文件。 config 查询或修改配置文件。 job 查询或管理升级任务。 -h, --help 可选参数,提供osmt命令的帮助信息。