检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
更新RPM包 准备工作 osmt update命令更新 osmt-agent服务自动更新 父主题: 使用OSMT工具升级
XGPU共享技术 XGPU共享技术概述 安装并使用XGPU XGPU算力调度示例
安装x2hce-ca 确认repo源配置正常。 请检查默认的/etc/yum.repos.d/hce.repo配置文件中参数是否正确,正确的配置如下。 [base] name=HCE $releasever base baseurl=https://repo.huaweicloud.com
内核异常事件分析指南 背景说明 HCE运行时,不可避免地会出现一些内核事件,例如soft lockup、RCU(Read-Copy Update) stall、hung task、global OOM、cgroup OOM、page allocation failure、list
准备工作 RPM包的更新方法有两种:使用osmt update命令更新和使用后台osmt-agent服务自动更新。此两种方法,都须先执行本节操作。 确认repo源配置正常。 请检查默认的/etc/yum.repos.d/hce.repo配置文件中参数是否正确,正确的配置如下。 [base
XGPU共享技术概述 XGPU共享技术是华为云基于内核虚拟GPU开发的共享技术。XGPU服务可以隔离GPU资源,实现多个容器共用一张显卡,从而实现业务的安全隔离,提高GPU硬件资源的利用率并降低使用成本。 XGPU共享技术架构 XGPU通过自研的内核驱动为容器提供虚拟的GPU设备,
概述 OSMT是华为云提供的对HCE系统及RPM包升级和回退的工具。OSMT可自定义配置RPM包的升级范围,并支持周期性定时升级、在指定的时间段单次升级、延时升级并重启等功能。 版本升级和回退:介绍对整体HCE系统的升级及回退操作。 更新RPM包:介绍仅对RPM包的升级和回退操作。
约束限制 升级和回退的耗时受更新的RPM包数量、大小和从repo源下载速度等影响,一般会在30分钟内完成,具体时间视实际环境确定,执行操作时注意预留足够的时间。 OSMT工具仅支持对base、updates两个官方repo源中的RPM包进行升级,请确保这两个源配置的正确性。修改repo
制作Docker镜像并启动容器 本节介绍在HCE上制作HCE系统的Docker镜像并启动容器。 约束限制 运行容器镜像的HCE系统版本和制作的HCE容器镜像版本须保持一致。 制作镜像归档文件 确认repo源配置正常。 请检查默认的/etc/yum.repos.d/hce.repo配置文件中参数是否正确
静态加速 准备工作 执行如下命令检查待优化的二进制文件中是否可以重新定位。可以重新定位表示可以进行应用优化。 readelf -a application | grep .rela.text 如果二进制文件中.rela.text段存在,表示可以重新定位。 如果不存在,为了允许BOLT
Pod带宽管理工具 在业务混合部署的场景下,Pod带宽管理功能根据QoS分级对资源进行合理调度,提升网络带宽利用率。HCE提供oncn-tbwm带宽管理工具,使用tbwmcli命令对收发包方向的网络限速功能,实现网络QoS。 前提条件 本功能固定使用ifb0,使用前请确定虚拟网卡ifb0