检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
训练算法 平台支持算法创建。用户可通过指定算法的运行镜像和上传符合平台规范的算法文件来完成算法的创建,创建的算法可用于训练任务中。创建训练算法时可根据算法类型单独上传训练文件或将训练文件放置在镜像中,通过选择对应镜像时获取算法文件。 添加算法 准备数据。
训练算法 添加自定义算法 添加自定义算法流程为“初始化训练算法 > 选择训练算法文件 > 上传训练算法文件”。具体操作步骤如下: 在左侧菜单栏中单击“训练服务 > 算法管理”。 单击“新建训练算法”,填写算法基本信息。
训练服务简介 训练服务模块上承接数据服务和标注服务两大模块,为自动驾驶研发提供方便易用的模型训练和评测平台,让用户无需过多关注底层资源,聚焦算法和模型开发。用户可上传符合Octopus平台规范的训练算法,使用成熟的算法创建训练任务生成训练模型。
算法管理 训练算法 算法文件说明 父主题: 训练服务
算法文件说明 上传到Octopus平台的本地算法文件包需要满足Octopus平台要求,本章节介绍算法文件基本要求及相关环境变量说明。 算法文件基本要求 算法文件目录结构可参考如下,需要包括启动文件“xxx.py”(启动文件名可自定义),以及一些必要的训练文件。
制作ModelArts集群训练镜像 制作训练镜像 八爪鱼训练镜像使用ma-user用户运行,用户需保证镜像内已创建ma-user用户,且训练过程中使用到的python环境或其他依赖对ma-user具有权限。本地镜像构建完成后,需要将镜像上传到八爪鱼平台镜像仓库。
训练服务 训练算法 模型评测 编译镜像 编译任务 父主题: 自动驾驶云服务全流程开发
制作CCE集群训练镜像 Octopus平台依赖算子镜像内的/bin/bash、stdbuf、tee软件,请确保基础镜像内包含上述软件且能通过PATH找到。 一般情况下,训练与评测定义为同一个引擎,主要包括算法或评测脚本运行所需要的基本依赖环境。
训练服务 训练服务简介 算法管理 开发环境 训练任务 模型评测 编译管理 推理服务 任务队列
制作镜像(训练) 制作CCE集群训练镜像 制作ModelArts集群训练镜像 父主题: 镜像仓库
√ - - - 提交失败 训练任务向平台提交失败。 - √ √ - 等待中 训练任务向平台提交成功,暂未运行。 √ - √ √ 运行中 训练任务向平台提交成功,处于运行中。 √ - - √ 运行异常 训练任务运行失败。 - √ √ - 已完成 训练任务运行成功。
模型文件说明(训练) Octopus模型管理模块,支持用户上传模型,并将其用于模型评测、模型编译任务。
模型评测 评测脚本 评测任务 评测对比 模型数据集支持 父主题: 训练服务
编译镜像 编译镜像可以将训练模型转换为特定芯片支持的可识别的文件,编译镜像模块支持对编译镜像的增加、查询、删除以及编辑。 创建编译镜像 在左侧菜单栏中选择“训练服务 > 编译管理”。 选择“编译镜像”页签,单击“新建编译镜像”,填写如下信息。
编译管理 编译任务 编译镜像 父主题: 训练服务
资源挂载 - 可选择平台上现有的模型、训练算法和数据集,开发环境启动时以挂载的方式加载到容器中。最多可选择5条。 模型:可选择用途为训练的非空模型仓库。 训练算法:可选创建成功的算法。 数据集:可选择有创建成功版本且非空的数据集。
Octopus平台提供评测脚本管理功能,支持用户创建、删除、编辑、在线编辑、查询评测脚本等功能。 创建评测脚本 添加评测脚本流程为“初始化评测脚本 > 选择评测脚本文件 > 上传评测脚本文件”。具体操作步骤如下: 在左侧菜单栏中选择“训练服务 > 模型评测”。
参数详情:训练算法参数以及环境参数信息。 编译版本:同一个源模型使用不同芯片编译,生成的结果为该模型的不同版本。 任务日志:任务运行过程中生成的日志信息,详情请查看编译任务日志查看下载。
评测对比 创建评测对比任务 平台支持创建2-4个评测任务结果对比。 在左侧菜单栏中单击“训练服务 > 模型评测”。 选择“评测对比”页签,单击“新建评测对比”,填写基本信息。 名称:对比任务名称,只能包含数字、英文、中文、下划线、中划线。
具体步骤如下: 在左侧菜单栏中选择“训练服务 > 模型评测”。 选择“评测任务”页签,单击“新建评测任务”,填写如下信息。 表1 新建评测任务 参数 描述 名称 任务组名称,包含中英文、数字、“_”“-”,不得超过32个字符。