AI开发平台MODELARTS-发布ModelArts数据集中的数据版本:数据集版本文件目录结构

时间:2024-10-15 14:28:15

数据集版本文件目录结构

由于数据集是基于OBS目录管理的,发布为新版本后,对应的数据集输出位置,也将基于新版本生成目录。

以图像分类为例,数据集发布后,对应OBS路径下生成,其相关文件的目录如下所示。

|-- user-specified-output-path
    |-- DatasetName-datasetId
        |-- annotation
            |-- VersionMame1
                |-- VersionMame1.manifest
            |-- VersionMame2
                ...
            |-- ...

以物体检测为例,如果数据集导入的是Manifest文件,在数据集发布后,其相关文件的目录结构如下。

|-- user-specified-output-path 
    |-- DatasetName-datasetId 
        |-- annotation 
            |-- VersionMame1 
                |-- VersionMame1.manifest 
                |-- annotation
                   |-- file1.xml 
            |-- VersionMame2
                ...
            |-- ...

以视频标注为例,在数据集发布后,标注结果将标注结果文件(XML)存放在数据集输出目录下。

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13
14
|-- user-specified-output-path
     |-- DatasetName-datasetId
         |-- annotation
             |-- VersionMame1
                 |-- VersionMame1.manifest
                 |-- annotations
                   |-- images
                       |-- videoName1
                          |-- videoName1.timestamp.xml
                        |-- videoName2
                          |-- videoName2.timestamp.xml
            |-- VersionMame2
                ...
            |-- ...

视频标注的关键帧存在数据集的输入目录下。

|-- user-specified-input-path
     |-- images
        |-- videoName1
             |-- videoName1.timestamp.jpg
         |-- videoName2
             |-- videoName2.timestamp.jpg 
support.huaweicloud.com/usermanual-standard-modelarts/dataprepare-modelarts-0026.html