检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
与调度。 本例中容器1、2、3占用的实际算力百分比均为33.33%。 权重抢占调度(policy=4) 权重抢占调度表示按照每个容器的算力比例为容器分配时间片。XGPU服务会从算力单元1开始调度,但如果某个算力单元没有分配给某个容器,则跳过调度切换到下一个时间片。例如为容器1、2
GPU卡,从而实现业务的安全隔离,提升GPU利用率,节约用户成本。 可灵活分配资源 XGPU实现了物理GPU的资源任意划分,您可以按照不同比例灵活配置。 支持按照显存和算力两个维度划分,您可以根据需要灵活分配。 XGPU支持只隔离显存而不隔离算力的策略,同时也支持基于权重的算力分
GPU_CONTAINER_QUOTA_PERCENT Integer 指定显卡算力分配百分比。 算力支持最小1%粒度的划分,推荐最小算力不低于4%。 为容器分配50%的算力比例: GPU_CONTAINER_QUOTA_PERCEN=50 GPU_POLICY Integer 指定GPU使用的算力隔离的策略。 0:不隔离算力,即原生调度。