检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
本案例仅适用于华为云北京四和上海一站点。
在Lite Cluster资源池上使用Snt9B完成分布式训练任务 场景描述 本案例介绍如何在Snt9B上进行分布式训练任务,其中Cluster资源池已经默认安装volcano调度器,训练任务默认使用volcano job形式下发lite池集群。
创建训练作业 本案例创建训练作业时,需要配置如下参数。 表1 创建训练作业的配置说明 参数名称 说明 “创建方式” 选择“自定义算法”。 “启动方式” 选择“自定义”。 “镜像” 选择用于训练的自定义镜像。 “代码目录” 执行本次训练作业所需的代码目录。
在Lite Cluster资源池上使用Snt9B完成推理任务 场景描述 本案例介绍如何在Snt9B环境中利用Deployment机制部署在线推理服务。
单击“名称/ID”,进入服务器详情页面,查看虚拟私有云配置信息。
快速配置Lite Cluster资源案例 下文提供一个快速配置的案例,配置完成后您可登录到节点查看加速卡信息并完成一个训练任务。在运行此案例前,您需要购买资源,购买资源的步骤请参考Lite Cluster资源开通。 登录节点。
步骤一:安装开发环境 本案例提供了两种安装开发环境的方法,您可根据使用习惯选择。 方法一:使用JupyterLab打开Notebook实例准备环境 登录ModelArts控制台,进入“开发空间>Notebook”。
该案例介绍了华为云一站式开发平台ModelArts的自动学习功能实现的常见生活垃圾分类,让您不用编写代码也可以实现生活垃圾分类。 本案例只适用于新版自动学习功能。
该案例介绍了华为云一站式开发平台ModelArts的自动学习功能实现的常见生活垃圾分类,让您不用编写代码也可以实现生活垃圾分类。 本案例只适用于新版自动学习功能。
具体可云日志服务价格详情 按实际日志量付费 超过免费额度后,按实际日志存储量和存储时长收费 计费示例 以下案例中出现的费用价格仅供参考,实际价格请参见各服务价格详情。 示例:使用公共资源池。
按需计费 规格单价 * 计算节点个数 * 使用时长 包年/包月 规格单价 * 计算节点个数 * 购买时长 计费示例 以下案例中出现的资源规格和费用价格仅供参考,实际价格请参见各服务价格详情。 示例:使用按需计费的专属资源池。
购买连接ModelArts终端节点 登录虚拟私有云(VPC)管理控制台,单击左侧导航栏中的“VPC 终端节点>终端节点”,进入“终端节点”页面。 单击右上角的“购买终端节点”,进入购买页面。 区域:终端节点所在区域。
单击“名称/ID”,进入服务器详情页面,查看虚拟私有云配置信息。
CANN,因此本案例仅面向有下载权限的渠道用户,非渠道用户建议参考其他自定义镜像制作教程。
图2 打通VPC 在打通VPC弹框中,打开“打通VPC”开关,在下拉框中选择可用的VPC和子网。 需要打通的对端网络不能和当前网段重叠。 图3 打通VPC参数选择 如果没有VPC可选,可以单击右侧的“创建虚拟私有云”,跳转到网络控制台,申请创建虚拟私有云。
虚拟私有云 Lite Server服务器创建时绑定的虚拟私有云,单击链接可跳转到虚拟私有云详情页。 裸金属服务器 Lite Server服务器为一台裸金属服务器,单击链接可跳转至对应弹性裸金属服务器的详情页。 镜像 Lite Server服务器的镜像。
本案例介绍如何在ModelArts Lite场景下使用ranktable路由规划完成Pytorch NPU分布式训练任务,训练任务默认使用Volcano job形式下发到Lite资源池集群。
编写工作流 基于编写工作流代码示例的场景案例进行改造,代码编写示例如下: from modelarts import workflow as wf # 定义统一存储对象管理输出目录 output_storage = wf.data.OutputStorage(name="output_storage
约束限制 本案例仅支持在专属资源池上运行。 支持的模型列表 本方案支持以下模型的训练,如表1所示。
具体案例参考在ECS中通过Dockerfile从0制作自定义镜像用于推理。 图3 模型的自定义镜像制作场景三 约束限制 自定义镜像中不能包含恶意代码。 创建模型的自定义镜像大小不超过50GB。