检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
训练服务简介 训练服务模块上承接数据服务和标注服务两大模块,为自动驾驶研发提供方便易用的模型训练和评测平台,让用户无需过多关注底层资源,聚焦算法和模型开发。用户可上传符合Octopus平台规范的训练算法,将成熟的算法创建训练任务生成训练模型。此外,训练服务提供多种模型评测指标,从
训练算法 平台支持算法创建。用户可通过上传符合平台规范的算法文件来完成算法的创建,创建的算法可用于训练任务中。 添加算法 添加算法流程为“初始化训练算法 > 选择训练算法文件 > 上传训练算法文件”。具体操作步骤如下: 在左侧菜单栏中单击“训练服务 > 算法管理”。 单击“新建训练算法”,填写算法基本信息。
训练算法 添加自定义算法 添加自定义算法流程为“初始化训练算法 > 选择训练算法文件 > 上传训练算法文件”。具体操作步骤如下: 在左侧菜单栏中单击“训练服务 > 算法管理”。 单击“新建训练算法”,填写算法基本信息。 图1 新建训练算法 名称:包含中英文、数字、“_”“-”,不得超过64个字符。
训练服务 训练服务简介 算法管理 训练任务 模型评测 编译管理 推理服务
训练服务 训练算法 模型评测 编译镜像 编译任务 父主题: 自动驾驶云服务全流程开发
分布式训练任务 八爪鱼自动驾驶平台的多机分布式训练功能可以帮助用户加快模型训练速度,提高训练效率,并支持更大规模的深度学习任务。通过多机分布式训练,用户可以将训练任务分配到多台计算机或服务器上并行进行,充分利用硬件资源,加快模型收敛速度,提高训练效果。平台支持多种深度学习框架,如
镜像制作(训练) Octopus平台依赖算子镜像内的/bin/bash、stdbuf、tee软件,请确保基础镜像内包含上述软件且能通过PATH找到。 一般情况下,训练与评测定义为同一个引擎,主要包括算法或评测脚本运行所需要的基本依赖环境。用户可使用命令行模式或Dockerfile
训练任务 训练任务 任务队列 父主题: 训练服务
模型文件说明(训练) Octopus模型管理模块,支持用户上传模型,并将其用于模型评测、模型编译任务。如果需要将模型用于内置评测模板评测,除模型文件外,需另外包含推理启动文件: customer_inference.py 仅当需要使用内置评测指标计算时需要添加推理启动文件,文件名称可自定义,将该文件置于模型目录下。
ModelArts集群 训练镜像 八爪鱼训练镜像使用ma-user用户运行,用户需保证镜像内已创建ma-user用户,且训练过程中使用到的python环境或其他依赖对ma-user具有权限,以下分别从“从0到1构建”和“从已有镜像”迁移两种方式说明。 从0到1构建训练镜像 用户可以docker
评测对比 创建评测对比任务 平台支持创建2-4个评测任务结果对比。 在左侧菜单栏中单击“训练服务 > 模型评测”。 选择“评测对比”页签,单击“新建评测对比”,填写基本信息。 图1 新建评测对比 名称:对比任务名称,只能包含数字、英文、中文、下划线、中划线。 描述:简要描述任务,
推理服务 推理服务 任务队列 父主题: 训练服务
评测脚本 Octopus平台提供评测脚本管理功能,支持用户创建、删除、编辑、在线编辑、查询评测脚本等功能。 创建评测脚本 添加评测脚本流程为“初始化评测脚本 > 选择评测脚本文件 > 上传评测脚本文件”。具体操作步骤如下: 在左侧菜单栏中单击“训练服务 > 模型评测”。 选择“评
评测任务运行的过程中生成日志,训练服务提供日志的查看以及下载功能,支持查看评测任务的运行情况。 生成的日志文件共有四种形式: evaluate-xx-{id}.log:用户实际评测任务的训练日志。 evaluate-xx-{id}-init.log:Octopus平台提供的前置数据的准备日志。
编译管理 编译任务 任务队列 编译镜像 父主题: 训练服务
Octopus平台依赖算子镜像内的/bin/bash、stdbuf、tee软件,请确保基础镜像内包含上述软件且能通过PATH找到。 一般情况下,训练与评测定义为同一个引擎,主要包括算法或评测脚本运行所需要的基本依赖环境。用户可使用命令行模式或Dockerfile模式进行构建。以训练、评测
/user-job-dir/model 待增量模型版本在训练任务中的存放路径,可自行获取模型文件信息。 平台如果支持多类型资源池,强烈建议用户使用环境变量适配算法提交任务,可免去更换默认值的环节。 以CCE集群多数据集训练为例,数据集分别命名为“dataset-0”,“dataset-1”
四种: compile-{id}.log:用户实际训练任务的训练日志。 compile-{id}-init.log:Octopus平台提供的前置数据的准备日志。 compile-{id}-sidecar.log:Octopus平台提供的任务流程控制日志,包括日志同步、结果上传。
任务队列 训练任务在创建之后,可在此查看任务队列,同时支持对任务优先级的调整。 在左侧菜单栏中单击“训练服务 > 训练任务”。 选择“任务队列”页签,可查看任务。 图1 任务队列 训练任务队列相关操作 在“任务队列”页签,还可以进行以下操作。 表1 训练任务队列相关操作 任务 操作步骤
创建任务 Octopus平台提供对评测任务的管理,包括创建、删除、停止评测任务的操作。在评测任务页面, 实时显示多条评测任务的状态、任务创建时间等信息。评测任务创建完毕后,触发任务。评测任务结束后会生成评测任务结果文件,详细展示模型的各项评测指标得分。 创建评测任务 评测任务与评测参数和数据集有关。具体步骤如下: