检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
XGPU共享技术 XGPU共享技术概述 安装并使用XGPU XGPU算力调度示例
XGPU共享技术概述 XGPU共享技术是华为云基于内核虚拟GPU开发的共享技术。XGPU服务可以隔离GPU资源,实现多个容器共用一张显卡,从而实现业务的安全隔离,提高GPU硬件资源的利用率并降低使用成本。 XGPU共享技术架构 XGPU通过自研的内核驱动为容器提供虚拟的GPU设备
应用加速工具 概述 安装工具 静态加速 动态加速 配置文件 父主题: 工具类
x2hce-ca应用兼容性评估 工具概述 约束限制 安装x2hce-ca 评估软件兼容性 父主题: 系统迁移
将操作系统迁移至HCE 2.0 约束限制 迁移操作 冲突包列表 父主题: 系统迁移
将操作系统迁移至HCE 1.1 约束限制 迁移操作 父主题: 系统迁移
内核功能与接口 内核memory的OOM进程控制策略 内核memory的多级内存回收策略 内核cpu cgroup的多级混部调度 内核异常事件分析指南
系统迁移 x2hce-ca应用兼容性评估 将操作系统迁移至HCE 2.0 将操作系统迁移至HCE 1.1
用户当前在线、离线业务分离部署,导致资源闲置现象严重,整体资源利用率偏低,亟需降本增效。 HCE结合云容器引擎做了CPU利用率优化。HCE采用混部引擎技术和隔离技术可使云容器引擎的CPU利用率达到40%-60%,并且QoS<1%,应用不卡顿,体验更流畅。 HCE结合云容器引擎做了弹性优化。基于云容
升级成功后,请及时确认业务运行情况。如业务运行正常,请在合适的时候执行osmt remove命令删除备份内容。删除后将无法回退本次升级内容。 安全规范要求chronyd服务在安装/升级后默认处于disabled状态,所以从HCE-2.0.2206版本升级至新版本后,chronyd服务会处
安全 Huawei Cloud EulerOS 2.0等保2.0三级版镜像概述 安全启动
附录 OSMT命令帮助信息 /etc/osmt/osmt.conf配置文件说明 父主题: 更新HCE系统和RPM包
漏洞公告 OpenSSH远程代码执行漏洞公告(CVE-2024-6387)
对HCE进行安全更新 安全更新概述 关于通用漏洞披露(CVE) yum命令参数 查询安全更新 检查安全更新 安装安全更新
工具类 毕昇编译器 应用加速工具 Pod带宽管理工具 安全加固工具
换时会影响其他容器的算力,该算力波动属于正常情况。当某个容器从空闲切换到忙碌时,其抢回算力的时延不超过100ms。 父主题: XGPU共享技术
更新HCE系统和RPM包 升级概述 使用dnf或yum命令升级 使用OSMT工具升级 附录
更新RPM包 准备工作 osmt update命令更新 osmt-agent服务自动更新 父主题: 使用OSMT工具升级
使用OSMT工具升级 概述 约束限制 版本升级和回退 更新RPM包 升级后续操作 回退RPM包 父主题: 更新HCE系统和RPM包
GPU实例已安装535.54.03版本的NVIDIA驱动。 GPU实例已安装18.09.0-300或更高版本的docker。 受GPU虚拟化技术的限制,容器内应用程序初始化时,通过nvidia-smi监测工具监测到的实时算力可能超过容器可用的算力上限。 当CUDA应用程序创建时,会