检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
评估标准创建完成后可以在“人工评估标准”页面查看创建的评估标准,并支持编辑与删除操作。 创建视频类数据集评估任务 平台仅支持对“加工数据集”执行评估操作。 创建视频类数据集评估任务前,请参考加工视频类数据集,生成一个“加工数据集”。 创建视频类数据集评估任务步骤如下: 登录ModelArts Studio大模型开
分类管理 可选项。 作为数据集发布后查询的筛选条件,根据数据集的实际情况在下拉框中直接选择或是搜索选择。 单击“保存”。 在“确认”对话框单击“确认”。 修改数据集的目录 修改数据集的入口。 在数据服务左侧导航,选择“首页>我的数据集”,单击需要修改的数据集,进入数据集详情页面。 在数据
根据数据集ID查询数据集的详细内容 功能介绍 根据数据集ID查询数据集相关的详细内容。 URI URI格式 GET /softcomai/datalake/v1.0/catalogs/api/dataset/{datasetId} 参数说明 参数名 是否必选 参数类型 备注 datasetId
发布详细的数据集信息 功能介绍 对请求中的数据集进行申请发布操作,申请发布后会提交到审批模块由Data Owner进行审批,审批通过后自动启动发布流程,将数据集发布到数据集服务中。 URI URI格式 PUT /softcomai/datalake/v1.0/dataSet/publish
下载数据集 下载数据集到OBS 父主题: 消费数据集
管理数据集授权 配置资源授权(旧) 父主题: 管理数据集
在完成数据清洗后,如果无需使用数据标注功能,可直接在“数据清洗”页面单击操作列“生成”,生成加工数据集。 加工后的数据集可在“数据工程 > 数据加工 > 加工数据集”中查看。 父主题: 加工视频类数据集
在“创建流通任务”页面,选择数据集模态,如“文本 > 预训练文本”类型的数据集。 图1 选择数据集模态 选择数据集,单击“下一步”。 在“格式配置”选择发布格式。由于数据工程需要支持对接盘古大模型或三方大模型,为了使这些数据集能够被这些大模型正常训练,平台支持发布不同格式的数据集。 当前支持默认格式、盘古格式:
数据集服务备份 功能介绍 为防止数据服务异常后用户数据丢失,数据资产管理服务通过该接口定期向数据集服务下发数据备份的命令,数据集服务受到备份的命令后以租户粒度将各租户下的数据备份。 URI URI格式 GET /softcomai/datalake/v1.0/datacatalog/backup/start
择企业项目。 在控制台右侧“我的项目”单击项目名称,进入项目页面。 单击“数据管理 > 数据集 ”,进入数据集页面。 单击数据集名称,进入数据集编辑页面。 由自定义SQL创建的数据集,数据集名称后会有“SQL”字样。 单击“SQL编辑”,进入SQL编辑页面,对SQL语句进行编辑修改。
申请本地下载数据集 公有云用户不支持本地下载。 本章节介绍申请下载到本地操作。 操作步骤 在数据服务左侧导航,选择“个人中心>数据集管理>已订阅数据集”。 在需要下载的数据集对应的“操作”列下,单击“申请下载到本地”。 本地下载申请不支持批量申请。 在“本地下载申请原因”界面,填写本地下载的原因,单击“提交”。
JSON 返回体。 page JSON 分页信息。 dataList JSON 数据集列表。 id String 数据集ID。 name String 数据集名称。 businessName String 数据集名称。 scheme String 模式,暂无用。 url String
数据清洗算子为用户提供了多种数据操作能力,包括数据提取、过滤、转换、打标签和评分等。这些算子能够帮助用户从海量数据中提取出有用信息,并进行深度加工,以生成高质量的训练数据。 平台支持视频类数据集的清洗操作,分为数据提取、数据过滤、数据打标三类,视频类加工算子能力清单见表1。 表1 视频类清洗算子能力清单 算子分类
下载数据集到OBS 功能介绍 下载数据集到OBS桶中。 URI URI格式 POST /softcomai/datalake/v1.0/download/obs 参数说明 无。 请求 请求样例 POST https://endpoint/softcomai/datalake/v1
任务管理”页面单击“生成”,生成加工数据集。 加工后的数据集可在“数据工程 > 数据加工 > 加工数据集”中查看。 审核标注后的视频类数据集 如果在创建视频类数据集标注任务时启用了标注审核功能,则在完成标注后可以在“标注审核”页面审核标注结果。 创建标注任务时如果指定了审核人员,则审核人员可以审核数据集,管理员(主账号)可以对所有数据集进行审核。
数据集成指导 业务使用介绍 接入数据源 创建数据集成任务(普通任务) 创建数据集成任务(组合任务) 创建数据集成任务(编排任务) 启停数据集成任务 数据集成任务管理 连接器
下架数据集 申请下架数据集 查看数据集下架申请 审批数据集下架申请 父主题: 管理数据集
datasetName 是 String 数据集名称。 sourceDirUrl 是 String 数据集在数据权限侧所在的目录。 targetDirUrl 是 String 数据集发布到数据集服务后所在的目录。 desc 否 String 数据集描述信息。 userId 是 String
在“创建流通任务”页面,选择数据集模态,如“预测 > 时序”类型的数据集。 图1 选择数据集模态 选择数据集,单击“下一步”。 在“格式配置”选择发布格式。当前预测类数据集仅支持发布默认格式。 填写数据集名称、描述,设置数据集“资产可见性”,设置扩展信息后,单击“确定”执行数据集流通操作。 当任务
理侧审批。 数据集上架成功后,数据集的状态变为已上架。 在AI市场的资产库中可以查看此数据集。 (可选)支持对已上架的数据集进行如下操作。 在数据服务“首页>我的资产>数据集”,或者“数据资产>数据目录”界面,单击某个数据集的名称,进入到数据集详情页面,单击"数据集下架"。 数据集下架成功后,支持再次上架此数据集。