检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
音频标注数据集文件说明 OCTOPUS格式文件基本要求(音频标注) 上传的OCTOPUS格式数据集需包含以下文件(以mp3格式为例)。音频文件支持的格式包含:wav、mp3、flac、m4a。 . ├─ 文件夹1 ├─ audio1.mp3 #音频文件
分类 Octopus 目录 标注文件目录结构 +--- 1628568066600 | +--- 1628568066600.jpg | +--- 1628568066600.json +--- 1628654064999 | +--- 1628654064999.jpg
选择音频的性别和额外属性,填写音频的内容和讲话人角色信息。 图4 完善标注信息 性别:选择讲话人的性别。 内容:描述当前讲话的内容。 角色:判断当前讲话人的角色。 属性:选择音频的额外属性。 修改标注音频。 鼠标悬浮到已标注的音频段落前后,出现方向箭头后,拖动标注框,可以延长或缩短标注音频段落。 播放音频段落。
参数,这些参数都有一定的取值范围,根据这些参数可以派生出任意数量的具体场景。 逻辑场景库是不同逻辑场景的数据集合,以树状结构的形式表现出来,便于对逻辑场景进行统一的、有效的组织、管理和应用,比如当用户想系统管理和方便查看超车的逻辑场景,可以将所有超车相关的逻辑场景加入一个场景库中。
pt 评测参数项:根据用户选择的模型类别,动态生成评测所需的参数项,用户可参考前端提示填写。 评测指标项:根据用户选择的模型类别,动态生成的平台支持的内置指标项,用户单击选中对应指标项则可加入到待评测指标中。 单击“创建”,在评测任务页面显示新创建的任务信息。 父主题: 模型评测
选择镜像以及镜像版本。 启动脚本路径 选择脚本的启动文件路径,文件路径为在脚本中的相对路径,当前只支持.py类型的启动文件。 访问密钥 请输入访问密钥(AK)。 私有访问密钥 请输入私有访问密钥(SK)。 OBS地址 选择OBS桶中的地址,建议选择data、meta的上一级目录。 存放路径 “数据
Octopus平台提供ODD筛选对场景分类,同时还支持用户根据业务所需创建自定义标签,从其他维度分类场景,更高效管理场景库。在创建仿真评测任务时,基于分类标签体系,可快速筛选出符合评测任务需求的场景。 ODD筛选:每个自动驾驶系统运行的前提条件和适用范围可能不同,因此在进行场景测试时,对应的场景是属于自动
智驾模型简介 通过与AI模型、大模型的结合,提供高精度自动标注能力,大幅度降低传统人工标注数据真值的成本。提供场景数据集生成能力,帮助自动驾驶模型训练快速扩充数据集,低成本获取难例数据集。提供多模态场景理解和检索能力,帮助客户在海量样本库快速、智能的分类和检索。 前提条件 开通相应服务
用户在数据资产包括用户上传的数据集以及用户提供的一些个人信息。 数据资产包括但不限于文本、图形、音频、视频、照片、图像、代码、算法、模型等。 资产管理 对于用户上传至Octopus的资产,Octopus会做统一的保存管理。 对于文件类型的资产,Octopus会将资产保存在Octopus官方的OBS桶内。
选择需要归档的模型仓库。 模型仓库需提前在“数据资产 > 模型管理”中创建成功。 图3 常规训练 常规训练:基于数据集和用户算法训练新模型。 图4 增量训练 增量训练:基于用户导入的模型或已完成训练模型版本(可通过${MODEL}获取该模型版本的文件路径)和新数据集使用选择的算法再次
云类型的数据的显示、拖拽、三维旋转、缩放等效果;支持视频、音频类型的数据的播放、暂停、跳转、倍速调整、静音。 当前平台只支持h264编码的MP4可视化播放,非h264格式可视化播放不支持,只有音频。 图2 文件详情 查询仓库数据 可选择属性筛选,或输入关键字搜索数据。 导出仓库数据
预计项目内所有任务的总量,即图片、3D点云、音频文件或文本总帧数。 数据类型 标注任务的数据类型。当前支持图片、3D点云、音频和文本四种类型。不同数据类型支持的文件格式请参见表2。 项目任务流程 除交付节点为必选之外 ,可自由选择其他任务流程节点。 说明: 数据类型为音频或文本时,项目任务流程不支持选择预初审和预终审。
标注平台支持统计项目的进展情况以及团队成员的标注效率,便于管理员把控项目整体进度,及时掌握成员的标注效率。单击项目名称后操作栏的“项目详情”,查看项目整体进度以及人员标注效率统计。项目详情分为项目概览、关联题库以及人员详情。 数据类型为音频和文本的项目,暂不支持关联题库。项目详情分为项目概览和人员详情两部分。
Octopus数据集格式说明 在上传数据集前,请用户仔细阅读本章节。 图片标注数据集文件说明 点云标注数据集文件说明 音频标注数据集文件说明 文本标注数据集文件说明 父主题: 数据集
支持云审计的关键操作 通过云审计服务,您可以记录与Octopus相关的操作事件,便于日后的查询、审计和回溯。 前提条件 已开通云审计服务。 支持审计的关键操作列表 表1 云审计服务支持的公共服务关键操作列表 操作名称 资源类型 事件名称 新增纳管集群 octopus addCluster
预计项目内所有任务的总量,即图片、3D点云、音频文件或文本总帧数。 数据类型 标注任务的数据类型。当前支持图片、3D点云、音频和文本四种类型。不同数据类型支持的文件格式请参见表2。 项目任务流程 除交付节点为必选之外 ,可自由选择其他任务流程节点。 说明: 数据类型为音频或文本时,项目任务流程不支持选择预初审和预终审。
场景列表:该场景库中包含的所有场景。场景的具体操作请参考场景管理。 修改场景库信息/场景库分类信息 单击场景库名称或场景库分类后的,修改场景库或场景库分类的信息。 删除场景库/场景库分类 单击场景库名称或场景库分类后的,删除指定场景库或场景库分类。 查询场景 根据“场景名称”
数据合规递送 收集的个人数据项 路采数据包(含有人像的2D图片,音频或视频) 自定义数据集(含有人像的2D图片,音频或视频) 路采数据包(含有人像的2D图片,音频或视频) 个人数据收集的来源和方式 对象存储导入 本地 标注 OBS 通用存储 数据递送 使用个人数据的目的以及安全保护措施
场景列表:该逻辑场景库中包含的所有场景。逻辑场景的具体操作请参考逻辑场景管理。 修改逻辑场景库信息/逻辑场景库分类信息 单击场景库名称或场景库分类后的,修改逻辑场景库或场景库分类的信息。 删除逻辑场景库/逻辑场景库分类 单击场景库名称或场景库分类后的,删除指定逻辑场景库或场景库分类。 查询逻辑场景
数据类型:根据模板包含的样本类型选择图片、3D点云、音频或文本。 标注:从下拉框中选择符合用户业务所需的标注物。用户可自定义添加标注物以满足业务所需。 图3 预标注 标注类型:预标注,该标注模板用于预标注任务。 数据类型:根据模板包含的样本类型选择图片、3D点云、音频或文本。 模型来源:根据模型的来源来选择。