检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
更新RPM包 准备工作 osmt update命令更新 osmt-agent服务自动更新 父主题: 使用OSMT工具升级
XGPU共享技术 XGPU共享技术概述 安装并使用XGPU XGPU算力调度示例
<val> tbwmcli -p waterlin 设置/查询在线网络带宽水线。 示例:设置在线网络带宽水线为20mb。 tbwmcli -s waterline 20mb set waterline success 示例:查询在线网络带宽水线。 tbwmcli -p waterline
如果原服务器使用的是密码登录方式,切换操作系统后使用密钥登录方式,请提前创建密钥文件。 如果您使用私有镜像切换操作系统请参考《镜像服务用户指南》提前完成私有镜像的制作。 如果需要指定云服务器的镜像,请提前使用指定云服务器创建私有镜像。 如果需要使用本地的镜像文件,请提前将镜像文件导入并注册为云平台的私有镜像。
HCE结合弹性云服务器做了快速启动优化。HCE根据弹性云服务器配置场景按需加载基础组件,启动更快速。 云容器引擎实例下首选HCE,实现企业降本增效。 用户当前在线、离线业务分离部署,导致资源闲置现象严重,整体资源利用率偏低,亟需降本增效。 HCE结合云容器引擎做了CPU利用率优化。HCE采用混部引擎
quota 只读 算力总权重。 utilization_line 读写 在离线混部的算力压制水位线。 当GPU整卡利用率超过该值时,在线容器完全压制离线容器,否则在线容器部分压制离线容器。 utilization_rate 只读 GPU整卡利用率。 xgpuIndex 读写 属于此显卡的xgpu子目录。
XGPU算力调度示例 当使用XGPU服务创建XGPU时,XGPU服务会按照最大容器数量(max_inst)为每张显卡设置时间片(X ms)用于为容器分配GPU算力,以单元1、单元2…单元N表示。本节max_inst以20为例,介绍使用不同调度策略时对算力的调度示例。 原生调度(policy=0)