检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
训练服务简介 训练服务模块上承接数据服务和标注服务两大模块,为自动驾驶研发提供方便易用的模型训练和评测平台,让用户无需过多关注底层资源,聚焦算法和模型开发。用户可上传符合Octopus平台规范的训练算法,使用成熟的算法创建训练任务生成训练模型。
训练服务 训练算法 模型评测 编译镜像 编译任务 父主题: 自动驾驶云服务全流程开发
训练算法 平台支持算法创建。用户可通过指定算法的运行镜像和上传符合平台规范的算法文件来完成算法的创建,创建的算法可用于训练任务中。创建训练算法时可根据算法类型单独上传训练文件或将训练文件放置在镜像中,通过选择对应镜像时获取算法文件。 添加算法 准备数据。
训练服务 训练服务简介 算法管理 开发环境 训练任务 模型评测 编译管理 推理服务 任务队列
用户无需输入启动文件路径的后缀“.py”,平台会自动添加。 当前只支持.py类型的启动文件。启动文件编写详细说明请参考算法文件说明。 文件路径只能包含数字、英文、下划线、中划线、点、斜杠和空格,且不能超过256字符。 参数列表 可以自定义boot文件的启动参数,需要在算法中定义。
CCE平台训练任务生成的日志文件有以下四种: train-{id}-{index}.log:用户实际训练任务的训练日志。 train-{id}-{index}-init.log:Octopus平台提供的前置数据的准备日志。
制作ModelArts集群训练镜像 制作训练镜像 八爪鱼训练镜像使用ma-user用户运行,用户需保证镜像内已创建ma-user用户,且训练过程中使用到的python环境或其他依赖对ma-user具有权限。本地镜像构建完成后,需要将镜像上传到八爪鱼平台镜像仓库。
制作镜像(训练) 制作CCE集群训练镜像 制作ModelArts集群训练镜像 父主题: 镜像仓库
制作CCE集群训练镜像 Octopus平台依赖算子镜像内的/bin/bash、stdbuf、tee软件,请确保基础镜像内包含上述软件且能通过PATH找到。 一般情况下,训练与评测定义为同一个引擎,主要包括算法或评测脚本运行所需要的基本依赖环境。
模型文件说明(训练) Octopus模型管理模块,支持用户上传模型,并将其用于模型评测、模型编译任务。
父主题: 训练服务
创建开发环境前提条件 已购买“AI处理节点”,且在“运维配置 > 集群纳管”中已存在类型为“ModelArts”且状态为“可用”的集群。 已创建类型为“训练/评测”用途的镜像,详情可参考制作开发环境镜像。 创建开发环境 在左侧菜单栏中选择“训练服务 > 开发环境”。
模型评测 评测脚本 评测任务 评测对比 模型数据集支持 父主题: 训练服务
算法管理 训练算法 算法文件说明 父主题: 训练服务
编译管理 编译任务 编译镜像 父主题: 训练服务
编译任务生成的日志文件有以下四种: compile-{id}.log:用户实际训练任务的训练日志。 compile-{id}-init.log:Octopus平台提供的前置数据的准备日志。
评测对比 创建评测对比任务 平台支持创建2-4个评测任务结果对比。 在左侧菜单栏中单击“训练服务 > 模型评测”。 选择“评测对比”页签,单击“新建评测对比”,填写基本信息。 名称:对比任务名称,只能包含数字、英文、中文、下划线、中划线。
算法文件说明 上传到Octopus平台的本地算法文件包需要满足Octopus平台要求,本章节介绍算法文件基本要求及相关环境变量说明。 算法文件基本要求 算法文件目录结构可参考如下,需要包括启动文件“xxx.py”(启动文件名可自定义),以及一些必要的训练文件。
Octopus平台提供评测脚本管理功能,支持用户创建、删除、编辑、在线编辑、查询评测脚本等功能。 创建评测脚本 添加评测脚本流程为“初始化评测脚本 > 选择评测脚本文件 > 上传评测脚本文件”。具体操作步骤如下: 在左侧菜单栏中选择“训练服务 > 模型评测”。
具体步骤如下: 在左侧菜单栏中选择“训练服务 > 模型评测”。 选择“评测任务”页签,单击“新建评测任务”,填写如下信息。 表1 新建评测任务 参数 描述 名称 任务组名称,包含中英文、数字、“_”“-”,不得超过32个字符。