检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
音频标注数据集文件说明 OCTOPUS格式文件基本要求(音频标注) 上传的OCTOPUS格式数据集需包含以下文件(以mp3格式为例)。音频文件支持的格式包含:wav、mp3、flac、m4a。 . ├─ 文件夹1 ├─ audio1.mp3 #音频文件
预计项目内所有任务的总量,即图片、3D点云、音频文件或文本总帧数。 数据类型 标注任务的数据类型。当前支持图片、3D点云、音频和文本四种类型。不同数据类型支持的文件格式请参见表2。 项目任务流程 除交付节点为必选之外 ,可自由选择其他任务流程节点。 说明: 数据类型为音频或文本时,项目任务流程不支持选择预初审和预终审。
资产识别与管理 资产识别 用户在数据资产包括用户上传的数据集以及用户提供的一些个人信息。 数据资产包括但不限于文本、图形、音频、视频、照片、图像、代码、算法、模型等。 资产管理 对于用户上传至Octopus的资产,Octopus会做统一的保存管理。 对于文件类型的资产,Octop
&*< > \”,不得超过255个字符。 数据集形式:选择“数据集”。 数据来源:选择“本地”。 数据类型:支持“图片”、“3D点云”、“音频”和“文本”。 数据格式:可选择“Octopus”、“USER_DEFINE”和自定义格式。 标注状态:设置标注状态,支持“未标注”和“已标注”。
单击标注任务列表操作栏的“播放”,可以播放当前标注的音频段落。 删除音频段落。 单击标注任务列表操作栏的“删除”,可以删除当前标注的音频段落。 审核音频段落。 单击标注任务列表操作栏的“审核”,可以审核当前标注的音频段落。 图5 审核音频段落 调整播放倍速。 拖动播放倍速进度条,调整播放倍速。调整范围为(0
注效率。单击项目名称后操作栏的“项目详情”,查看项目整体进度以及人员标注效率统计。项目详情分为项目概览、关联题库以及人员详情。 数据类型为音频和文本的项目,暂不支持关联题库。项目详情分为项目概览和人员详情两部分。 项目概览 项目概览包括项目信息、项目今日状态以及项目相关数据图表统计,管理员可以快速掌握项目当前进度。
编译镜像 编译镜像可以将训练模型转换为特定芯片支持的可识别的文件,编译镜像模块支持对编译镜像的增加、查询、删除以及编辑。 创建编译镜像 在左侧菜单栏中单击“训练服务 > 编译管理”。 选择“编译镜像”页签,单击“新建编译镜像”,填写基本信息。 图1 新建编译镜像 名称:包含中英文
编译镜像 编译镜像可以将训练模型转换为特定芯片支持的可识别的文件,编译镜像模块支持对编译镜像的增加、查询、删除以及编辑。 创建编译镜像 在左侧菜单栏中单击“训练服务 > 编译管理”。 选择“编译镜像”页签,单击“新建编译镜像”,填写基本信息。 图1 新建编译镜像 名称:包含中英文
编译任务 训练产生的模型版本,不可直接被车载芯片识别,需要经过编译工具,将训练产生的模型编译成车载芯片识别的模型。 创建编译任务 在左侧菜单栏中单击“训练服务 > 编译管理”。 选择“编译任务”页签,单击“新建编译任务”,填写基本信息。 图1 新建编译任务 名称:任务组名称,只能
数据批导 数据集 通用存储 数据合规递送 收集的个人数据项 路采数据包(含有人像的2D图片,音频或视频) 自定义数据集(含有人像的2D图片,音频或视频) 路采数据包(含有人像的2D图片,音频或视频) 个人数据收集的来源和方式 对象存储导入 本地 标注 OBS 通用存储 数据递送 使用个人数据的目的以及安全保护措施
预计项目内所有任务的总量,即图片、3D点云、音频文件或文本总帧数。 数据类型 标注任务的数据类型。当前支持图片、3D点云、音频和文本四种类型。不同数据类型支持的文件格式请参见表2。 项目任务流程 除交付节点为必选之外 ,可自由选择其他任务流程节点。 说明: 数据类型为音频或文本时,项目任务流程不支持选择预初审和预终审。
Octopus数据集格式说明 在上传数据集前,请用户仔细阅读本章节。 图片标注数据集文件说明 点云标注数据集文件说明 音频标注数据集文件说明 文本标注数据集文件说明 父主题: 数据集
数据类型:根据模板包含的样本类型选择图片、3D点云、音频或文本。 标注:从下拉框中选择符合用户业务所需的标注物。用户可自定义添加标注物以满足业务所需。 图3 预标注 标注类型:预标注,该标注模板用于预标注任务。 数据类型:根据模板包含的样本类型选择图片、3D点云、音频或文本。 模型来源:根据模型的来源来选择。
显示;支持点云类型的数据的显示、拖拽、三维旋转、缩放等效果;支持视频、音频类型的数据的播放、暂停、跳转、倍速调整、静音。 当前平台只支持h264编码的MP4可视化播放,非h264格式可视化播放不支持,只有音频。 图2 文件详情 查询仓库数据 可选择属性筛选,或输入关键字搜索数据。
标注物颜色 通过十六进制码指定颜色,建议不同种类标注物颜色做明显区分。 标注物形状 支持点、圆、2.5D、矩形、实线、虚线、多边形、立方体、音频、文本。具体参数请参考表2。 标注物描述 描述该标注物的主要作用,如标注对象、适用的标注场景等。 标注物额外属性 描述标注对象可能存在的特殊情况,如遮挡、截断等,支持自定义。
标注物颜色 通过十六进制码指定颜色,建议不同种类标注物颜色做明显区分。 标注物形状 支持点、圆、2.5D、矩形、实线、虚线、多边形、立方体、音频、文本。具体参数请参考表2。 标注物描述 描述该标注物的主要作用,如标注对象、适用的标注场景等。 标注物额外属性 描述标注对象可能存在的特殊情况,如遮挡、截断等,支持自定义。
模型评测:负责管理评测脚本、评测任务和评测对比任务。 编译管理:包含编译任务和编译镜像。训练产生的模型版本,一般不可直接被车载芯片识别,需要经过编译工具,模型编译成车载芯片识别的产物。 推理服务:将模型部署为在线服务进行推理。 父主题: 训练服务
模型评测 编译镜像 编译镜像可以将训练模型转换为特定芯片支持的可识别的文件,编译镜像模块支持对编译镜像的增加、查询、删除以及编辑。 编译镜像 编译任务 训练产生的模型版本,不可直接被车载芯片识别,需要经过编译工具,将训练产生的模型编译成车载芯片识别的模型。 编译任务 仿真任务 评测镜像
cn-north-5.myhuaweicloud.com/label-data/task-1368/data/txt/0000.txt" #音频源的obs路径url }, "label_task_id": 1691, #批次子任务ID "partitionId":
种 "sample_type" : "IMAGE", #样本类型:包含“IMAGE”、“POINT_CLOUD” 、“AUDIO”(音频)、“TEXT”(文本) "des_order" : "", #此份数据对应的原始数据包描述 "tag_names" : [], #标签名称