检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
英文,不支持小语种。 声音分类是对声音进行分类。语音内容是对语音内容进行标注。语音分割是对语音进行分段标注。 开始标注 登录ModelArts管理控制台,在左侧菜单栏中选择“数据准备> 数据标注”,进入“数据标注”管理页面。 在标注作业列表右侧“所有类型”页签下拉选择标注类型,基
NPU推理指导(6.3.907) Wav2Lip是一种基于对抗生成网络的由语音驱动的人脸说话视频生成模型。主要应用于数字人场景。不仅可以基于静态图像来输出与目标语音匹配的唇形同步视频,还可以直接将动态的视频进行唇形转换,输出与输入语音匹配的视频,俗称“对口型”。该技术的主要作用就是在将音频与图
支持 支持 - 文本分类 支持 支持 - 命名实体 不支持 支持 - 文本三元组 不支持 支持 - 声音分类 支持 支持 - 语音内容 不支持 支持 - 语音分割 不支持 支持 - 表格数据集 支持 不支持 新导入的表格数据的schema和数据集一致。 视频标注 不支持 支持 - 示例代码
标注任务的类型。可选值如下: 0:图像分类 1:物体检测 3: 图像分割 100:文本分类 101:命名实体 102:文本三元组 200:声音分类 201:语音内容 202:语音分割 400:表格数据集 600:视频标注 900:自由格式 description 否 String 标注任务的描述信息。 父主题:
支持 图像分割 支持 支持 支持 支持 支持 支持 支持 - 声音分类 支持 支持 - 支持 支持 支持 - - 语音内容 支持 支持 - 支持 支持 支持 - - 语音分割 支持 支持 - 支持 支持 支持 - - 文本分类 支持 支持 - 支持 支持 支持 - - 命名实体 支持
1:物体检测 3: 图像分割 100:文本分类 101:命名实体 102:文本三元组关系标签 103:文本三元组实体标签 200:语音分类 201:语音内容 202:语音分割 600:视频标注 表4 LabelAttribute 参数 是否必选 参数类型 描述 default_value 否
于NPU芯片训练。 Wav2Lip是一种基于对抗生成网络的由语音驱动的人脸说话视频生成模型。主要应用于数字人场景。不仅可以基于静态图像来输出与目标语音匹配的唇形同步视频,还可以直接将动态的视频进行唇形转换,输出与输入语音匹配的视频,俗称“对口型”。该技术的主要作用就是在将音频与图
103:文本三元组实体标签 200:语音分类 201:语音内容 202:语音分割 600:视频标注 表9 SampleLabelProperty 参数 参数类型 描述 @modelarts:content String 语音标签(包含语音内容和语音起止点)专用内置属性:语音文本内容。 @modelarts:end_index
103:文本三元组实体标签 200:语音分类 201:语音内容 202:语音分割 600:视频标注 表7 SampleLabelProperty 参数 参数类型 描述 @modelarts:content String 语音标签(包含语音内容和语音起止点)专用内置属性:语音文本内容。 @modelarts:end_index
103:文本三元组实体标签 200:语音分类 201:语音内容 202:语音分割 600:视频标注 表5 SampleLabelProperty 参数 是否必选 参数类型 描述 @modelarts:content 否 String 语音标签(包含语音内容和语音起止点)专用内置属性:语音文本内容。 @modelarts:end_index
Standard数据管理 ModelArts Standard数据管理提供了一套高效便捷的管理和标注数据框架。支持图片、文本、语音、视频等多种数据类型,涵盖图像分类、目标检测、音频分割、文本分类等多个标注场景,适用于计算机视觉、自然语言处理、音视频分析等AI项目场景。 ModelArts
103:文本三元组实体标签 200:语音分类 201:语音内容 202:语音分割 600:视频标注 表6 SampleLabelProperty 参数 参数类型 描述 @modelarts:content String 语音标签(包含语音内容和语音起止点)专用内置属性:语音文本内容。 @modelarts:end_index
103:文本三元组实体标签 200:语音分类 201:语音内容 202:语音分割 600:视频标注 表5 SampleLabelProperty 参数 是否必选 参数类型 描述 @modelarts:content 否 String 语音标签(包含语音内容和语音起止点)专用内置属性:语音文本内容。 @modelarts:end_index
物体检测:识别出图片中每个物体的位置及类别。 图像分割:根据图片中的物体划分出不同区域。 音频 声音分类:对声音进行分类。 语音内容:对语音内容进行标注。 语音分割:对语音进行分段标注。 文本 文本分类:对文本的内容按照标签进行分类处理。 命名实体:针对文本中的实体片段进行标注,如“时间”、“地点”等。
可以导入未标注或已标注数据 已标注数据格式规范:声音分类 语音内容 支持 导入的是未标注数据 支持 可以导入未标注或已标注数据 已标注数据格式规范:语音内容 语音分割 支持 导入的是未标注数据 支持 可以导入未标注或已标注数据 已标注数据格式规范:语音分割 文本 文本分类 支持 导入的是未标注或已标注数据
103:文本三元组实体标签 200:语音分类 201:语音内容 202:语音分割 600:视频标注 表8 SampleLabelProperty 参数 参数类型 描述 @modelarts:content String 语音标签(包含语音内容和语音起止点)专用内置属性:语音文本内容。 @modelarts:end_index
1:物体检测 3: 图像分割 100:文本分类 101:命名实体 102:文本三元组关系标签 103:文本三元组实体标签 200:语音分类 201:语音内容 202:语音分割 600:视频标注 请求参数 无 响应参数 状态码: 204 表3 响应Body参数 参数 参数类型 描述 error_code
服务预测请求体大小限制是多少? 服务部署完成且服务处于运行中后,可以往该服务发送推理的请求,请求的内容根据模型的不同可以是文本,图片,语音,视频等内容。 当使用调用指南页签中显示的调用地址(华为云APIG网关服务的地址)预测时,对请求体的大小限制是12MB,超过12MB时,请求会被拦截。
添加标签:单击“添加标签”可增加多个标签。 启用语音内容标注(语音分割) 仅“语音分割”类型数据集支持设置,默认关闭。如果启用此功能,支持针对语音内容进行标注。 启用团队标注(语音分割) 仅“语音分割”类型支持团队标注,因此选择创建语音分割类型时,支持设置是否启用团队标注。 启用团
该节点通过对算法、输入、输出的定义,实现ModelArts作业管理的能力。主要用于数据处理、模型训练、模型评估等场景。主要应用场景如下: 当需要对图像进行增强,对语音进行除噪等操作时,可以使用该节点进行数据的预处理。 对于一些物体检测,图像分类等模型场景,可以根据已有的数据使用该节点进行模型的训练。 属性总览