检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
暂不支持同时在裸机环境以及该环境直通卡的虚拟机中同时使用。 XGPU服务的隔离功能不支持以UVM的方式申请显存,即调用CUDA API cudaMallocManaged(),更多信息,请参见NVIDIA官方文档。请使用其他方式申请显存,例如调用cudaMalloc()等。
概述 应用加速工具是华为云提供的一款对应用进行性能优化的工具。 应用加速工具优化应用程序有两种方式。 静态加速: 静态加速只需要在应用程序运行时采集所在CPU上的pmu监控信息,基于采集到的监控信息将应用程序做静态重新制作,生成新的高性能应用程序二进制。该过程不需要应用程序代码做修改或者仅需要对编译器参数做调整
首先确保虚拟机能访问https://repo.openeuler.org/openEuler-22.03-LTS/网址。 配置yum源。 进入/etc/yum.repos.d目录,新建一个openEuler.repo文件,并将以下内容复制到该文件里面。
静态加速 准备工作 执行如下命令检查待优化的二进制文件中是否可以重新定位。可以重新定位表示可以进行应用优化。 readelf -a application | grep .rela.text 如果二进制文件中.rela.text段存在,表示可以重新定位。 如果不存在,为了允许BOLT
升级后续操作 升级成功后,请及时确认业务运行情况。如业务运行正常,请在合适的时候执行osmt remove命令删除备份内容。删除后将无法回退本次升级内容。 安全规范要求chronyd服务在安装/升级后默认处于disabled状态,所以从HCE-2.0.2206版本升级至新版本后,chronyd
安装安全更新 执行yum upgrade --security命令,安装全部安全更新。 [root@localhost ~]# yum upgrade --security Last metadata expiration check: 5:21:24 ago on Tue 13
XGPU算力调度示例 当使用XGPU服务创建XGPU时,XGPU服务会按照最大容器数量(max_inst)为每张显卡设置时间片(X ms)用于为容器分配GPU算力,以单元1、单元2…单元N表示。本节max_inst以20为例,介绍使用不同调度策略时对算力的调度示例。 原生调度(policy
安装x2hce-ca 确认repo源配置正常。 请检查默认的/etc/yum.repos.d/hce.repo配置文件中参数是否正确,正确的配置如下。 [base] name=HCE $releasever base baseurl=https://repo.huaweicloud.com
内核异常事件分析指南 背景说明 HCE运行时,不可避免地会出现一些内核事件,例如soft lockup、RCU(Read-Copy Update) stall、hung task、global OOM、cgroup OOM、page allocation failure、list
准备工作 RPM包的更新方法有两种:使用osmt update命令更新和使用后台osmt-agent服务自动更新。此两种方法,都须先执行本节操作。 确认repo源配置正常。 请检查默认的/etc/yum.repos.d/hce.repo配置文件中参数是否正确,正确的配置如下。 [base
XGPU共享技术概述 XGPU共享技术是华为云基于内核虚拟GPU开发的共享技术。XGPU服务可以隔离GPU资源,实现多个容器共用一张显卡,从而实现业务的安全隔离,提高GPU硬件资源的利用率并降低使用成本。 XGPU共享技术架构 XGPU通过自研的内核驱动为容器提供虚拟的GPU设备,
概述 OSMT是华为云提供的对HCE系统及RPM包升级和回退的工具。OSMT可自定义配置RPM包的升级范围,并支持周期性定时升级、在指定的时间段单次升级、延时升级并重启等功能。 版本升级和回退:介绍对整体HCE系统的升级及回退操作。 更新RPM包:介绍仅对RPM包的升级和回退操作。
约束限制 升级和回退的耗时受更新的RPM包数量、大小和从repo源下载速度等影响,一般会在30分钟内完成,具体时间视实际环境确定,执行操作时注意预留足够的时间。 OSMT工具仅支持对base、updates两个官方repo源中的RPM包进行升级,请确保这两个源配置的正确性。修改repo
制作Docker镜像并启动容器 本节介绍在HCE上制作HCE系统的Docker镜像并启动容器。 约束限制 运行容器镜像的HCE系统版本和制作的HCE容器镜像版本须保持一致。 制作镜像归档文件 确认repo源配置正常。 请检查默认的/etc/yum.repos.d/hce.repo配置文件中参数是否正确
Pod带宽管理工具 在业务混合部署的场景下,Pod带宽管理功能根据QoS分级对资源进行合理调度,提升网络带宽利用率。HCE提供oncn-tbwm带宽管理工具,使用tbwmcli命令对收发包方向的网络限速功能,实现网络QoS。 前提条件 本功能固定使用ifb0,使用前请确定虚拟网卡ifb0