检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
安装x2hce-ca 确认repo源配置正常。 请检查默认的/etc/yum.repos.d/hce.repo配置文件中参数是否正确,正确的配置如下。 [base] name=HCE $releasever base baseurl=https://repo.huaweicloud
准备工作 RPM包的更新方法有两种:使用osmt update命令更新和使用后台osmt-agent服务自动更新。此两种方法,都须先执行本节操作。 确认repo源配置正常。 请检查默认的/etc/yum.repos.d/hce.repo配置文件中参数是否正确,正确的配置如下。 [base]
OSMT命令帮助信息 执行osmt -h命令,显示OSMT的帮助信息。 [root@localhost SOURCES]# osmt -h usage: osmt [-h] {update,rollback} ... positional arguments: {update
内核异常事件分析指南 背景说明 HCE运行时,不可避免地会出现一些内核事件,例如soft lockup、RCU(Read-Copy Update) stall、hung task、global OOM、cgroup OOM、page allocation failure、list
约束限制 升级和回退的耗时受更新的RPM包数量、大小和从repo源下载速度等影响,一般会在30分钟内完成,具体时间视实际环境确定,执行操作时注意预留足够的时间。 OSMT工具仅支持对base、updates两个官方repo源中的RPM包进行升级,请确保这两个源配置的正确性。修改repo源后需要执行systemctl
yum命令参数 命令格式:yum <command> [option] 表1 command的主要参数 参数 说明 help 显示帮助信息。 updateinfo 显示软件包更新信息摘要。 upgrade 升级软件包。 check-update 检查可用的软件包更新。 表2 option的主要参数
XGPU算力调度示例 当使用XGPU服务创建XGPU时,XGPU服务会按照最大容器数量(max_inst)为每张显卡设置时间片(X ms)用于为容器分配GPU算力,以单元1、单元2…单元N表示。本节max_inst以20为例,介绍使用不同调度策略时对算力的调度示例。 原生调度(policy=0)
对HCE进行安全更新 安全更新概述 关于通用漏洞披露(CVE) yum命令参数 查询安全更新 检查安全更新 安装安全更新
迁移操作 本节介绍从CentOS7.9迁移到HCE 1.1的操作过程。 准备迁移工具依赖的软件包 远程连接待迁移的操作系统。 根据弹性云服务器控制台操作指导,远程登录到待迁移虚拟机内部,远程登录的具体操作,请参见连接方式概述,并确保虚拟机内部与Internet相通。 先关闭CentOS系统/etc/yum
回退RPM包 执行osmt rollback --reboot_config always命令回退RPM包。仅支持回退最近一次更新的RPM包。 --reboot_config always:可选,若上次升级有need_reboot_rpms列表中的RPM包,请使用此参数。 如果不带--reboot_config
osmt update命令更新 手动更新RPM包有两种方式。 根据配置文件中的filters字段更新RPM包。 osmt update --auto --reboot_config [重启配置] 表1 重启配置参数说明 参数 说明 never 若未指定重启配置参数,或指定为never时,更新结束后,不重启。
/etc/osmt/osmt.conf配置文件说明 本节对OSMT工具的配置文件osmt.conf不建议修改的配置项进行说明。 [auto] # if auto_upgrade is True, the osmt-agent will auto upgrade rpms use osmt
如何设置自动注销时间TMOUT? 操作背景 为了保证系统的安全性,以及减少用户在不使用系统时所造成的资源浪费,在用户离开系统一段时间后,必须对连接进行注销。注销有诸多方法,修改TMOUT变量为其中的解决方案之一。 TMOUT是一个环境变量,它决定了在系统自动注销前所空闲的秒数。因
配置文件 本节提供了静态加速配置文件和动态加速配置文件中每个配置项的说明。 静态加速配置文件 应用加速工具默认静态加速配置信息如下,您可以自定义配置文件来优化应用。 表1 配置信息说明 模块名 描述 binary 定义二进制文件的相关属性。binary参数详情参见表2。 parameter
安装并使用XGPU 本章节介绍如何安装和使用XGPU服务。 约束限制 XGPU功能仅在Nvidia Tesla T4、V100上支持。 HCE内核版本为5.10及以上版本。 XGPU功能仅支持cuda 12.2版本。 GPU实例已安装535.54.03版本的NVIDIA驱动。 GPU实例已安装18
OOM相关参数配置与原因排查 OOM相关概念 OOM(Out Of Memory,简称OOM)指系统内存已用完,在linux系统中,如果内存用完会导致系统无法正常工作,触发系统panic或者OOM killer。 OOM killer是linux内核的一个机制,该机制会监控那些占
如何开启HCE操作系统的SELinux功能? HCE操作系统默认关闭SELinux功能。如果业务需要开启SELinux 功能,请参照本节指导操作。 请按照本节指导开启SELinux功能,勿直接通过/etc/selinux/config开启SELinux功能,否则可能会出现无法登录的问题。
CentOS Linux停止维护后如何应对? CentOS官方已计划停止维护CentOS操作系统,华为云上CentOS公共镜像来源于CentOS官方,当CentOS操作系统停止维护后,华为云将会同时停止对该操作系统的支持。本文主要介绍CentOS操作系统停止维护带来的影响,并针对影响提供应对策略。
IPVS报错问题说明 问题背景 IPVS(IP Virtual Server)指IP虚拟服务器,用于负载均衡、网络转发等目的。用户在系统上配置了IPVS虚拟服务器,但未配置真实服务器的情况下,会在VNC上出现错误日志。 问题现象 配置了IPVS虚拟服务器,但未配置真实服务器时,当
内核memory的OOM进程控制策略 背景信息 现有操作系统中,支持配置离线业务和在线业务。当内存发生OOM时,会优先选择离线业务控制组中的消耗内存最多的进程,结束进程回收内存,但是对于某些离线业务也有核心业务,因此会造成很大的影响。 针对这个问题,HCE调整了OOM时回收内存的