AI开发平台MODELARTS-从Manifest文件导入规范说明:图像分类

时间:2024-08-16 20:38:57

图像分类

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
{
    "source":"s3://path/to/image1.jpg",
    "usage":"TRAIN",
    "hard":"true",
    "hard-coefficient":0.8,
    "id":"0162005993f8065ef47eefb59d1e4970",
    "annotation": [
        {
            "type": "modelarts/image_classification",
            "name": "cat",
            "property": {
                "color":"white",
                "kind":"Persian cat"            
            },
            "hard":"true",
            "hard-coefficient":0.8,
            "annotated-by":"human",
            "creation-time":"2019-01-23 11:30:30"        
        },
        {
            "type": "modelarts/image_classification",
            "name":"animal",
            "annotated-by":"modelarts/active-learning",
            "confidence": 0.8,
            "creation-time":"2019-01-23 11:30:30"        
        }],
    "inference-loc":"/path/to/inference-output"
}
表1 字段说明

字段

是否必选

说明

source

被标注对象的URI。数据来源的类型及示例请参考表2

usage

默认为空,取值范围:

  • TRAIN:指明该对象用于训练。
  • EVAL:指明该对象用于评估。
  • TEST:指明该对象用于测试。
  • INFERENCE:指明该对象用于推理。

如果没有给出该字段,则使用者自行决定如何使用该对象。

id

此参数为系统导出的样本id,导入时可以不用填写。

annotation

如果不设置,则表示未标注对象。annotation值为一个对象列表,详细参数请参见表3

inference-loc

当此文件由推理服务生成时会有该字段,表示推理输出的结果文件位置。

表2 数据来源类型

类型

示例

OBS

“source”:“s3://path-to-jpg”

Content

“source”:“content://I love machine learning”

表3 annotation对象说明

字段

是否必选

说明

type

标签类型。取值范围为:

  • image_classification:图像分类
  • text_classification:文本分类
  • text_entity:文本命名实体
  • object_detection:对象检测
  • audio_classification:声音分类
  • audio_content:声音内容
  • audio_segmentation:声音起止点

name

是/否

对于分类是必选字段,对于其他类型为可选字段,本示例为图片分类名称。

id

是/否

标签ID。对于三元组是必选字段,对于其他类型为可选字段。三元组的实体标签ID格式为“E+数字”,比如“E1”“E2”,三元组的关系标签ID格式为“R+数字”,例如“R1”“R2”

property

包含对标注的属性,例如本示例中Cat有两个属性,颜色(color)和品种(kind)。

hard

表示是否是难例。“True”表示该标注是难例,“False”表示该标注不是难例。

annotated-by

默认为“human”,表示人工标注。

  • human

creation-time

创建该标注的时间。是用户写入标注的时间,不是Manifest生成时间。

confidence

表示机器标注的置信度。范围为0~1。

support.huaweicloud.com/usermanual-standard-modelarts/dataprepare-modelarts-0015.html