检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
发布详细的数据集信息 功能介绍 对请求中的数据集进行申请发布操作,申请发布后会提交到审批模块由Data Owner进行审批,审批通过后自动启动发布流程,将数据集发布到数据集服务中。 URI URI格式 PUT /softcomai/datalake/v1.0/dataSet/publish
择企业项目。 在控制台右侧“我的项目”单击项目名称,进入项目页面。 单击“数据管理 > 数据集 ”,进入数据集页面。 单击数据集名称,进入数据集编辑页面。 由自定义SQL创建的数据集,数据集名称后会有“SQL”字样。 单击“SQL编辑”,进入SQL编辑页面,对SQL语句进行编辑修改。
审批数据集发布申请 如果免审批开关被打开后,则申请发布的数据集,系统会自动审批。如果免审批开关未打开,则申请发布的数据集需要审批人审批。本章节介绍审批人的审批操作,收到数据集发布申请后,根据实际情况进行审批。 前提条件 登录用户为具有“Data Owner”角色且被配置到一级审批人中的用户。
申请本地下载数据集 公有云用户不支持本地下载。 本章节介绍申请下载到本地操作。 操作步骤 在数据服务左侧导航,选择“个人中心>数据集管理>已订阅数据集”。 在需要下载的数据集对应的“操作”列下,单击“申请下载到本地”。 本地下载申请不支持批量申请。 在“本地下载申请原因”界面,填写本地下载的原因,单击“提交”。
据目录,可以查看到全部的数据集信息,勾选需要删除的数据集前面的复选框,右侧“待删除数据集信息”中会列出所有选中的数据集及其目录。 也可以在目录树右上角的搜索框中搜索数据集的名称或是数据集的目录名称,快速查找到需要删除的数据集。 单击“下一步”。 查看数据集信息、授权租户或用户及订阅列表,填写数据集删除的原因。
数据清洗算子为用户提供了多种数据操作能力,包括数据提取、过滤、转换、打标签和评分等。这些算子能够帮助用户从海量数据中提取出有用信息,并进行深度加工,以生成高质量的训练数据。 平台支持视频类数据集的清洗操作,分为数据提取、数据过滤、数据打标三类,视频类加工算子能力清单见表1。 表1 视频类清洗算子能力清单 算子分类
任务管理”页面单击“生成”,生成加工数据集。 加工后的数据集可在“数据工程 > 数据加工 > 加工数据集”中查看。 审核标注后的视频类数据集 如果在创建视频类数据集标注任务时启用了标注审核功能,则在完成标注后可以在“标注审核”页面审核标注结果。 创建标注任务时如果指定了审核人员,则审核人员可以审核数据集,管理员(主账号)可以对所有数据集进行审核。
datasetName 是 String 数据集名称。 sourceDirUrl 是 String 数据集在数据权限侧所在的目录。 targetDirUrl 是 String 数据集发布到数据集服务后所在的目录。 desc 否 String 数据集描述信息。 userId 是 String
理侧审批。 数据集上架成功后,数据集的状态变为已上架。 在AI市场的资产库中可以查看此数据集。 (可选)支持对已上架的数据集进行如下操作。 在数据服务“首页>我的资产>数据集”,或者“数据资产>数据目录”界面,单击某个数据集的名称,进入到数据集详情页面,单击"数据集下架"。 数据集下架成功后,支持再次上架此数据集。
数据集成指导 业务使用介绍 接入数据源 创建数据集成任务(普通任务) 创建数据集成任务(组合任务) 创建数据集成任务(编排任务) 启停数据集成任务 数据集成任务管理 连接器
数据集服务备份 功能介绍 为防止数据服务异常后用户数据丢失,数据资产管理服务通过该接口定期向数据集服务下发数据备份的命令,数据集服务受到备份的命令后以租户粒度将各租户下的数据备份。 URI URI格式 GET /softcomai/datalake/v1.0/datacatalog/backup/start
速识别和查找。 描述 填写任务的描述信息。 集成模式 选择数据集成的模式。 定时:指数据集成任务根据任务计划,在指定的时间执行任务,将源端数据集成到目标端。 实时:指数据集成任务不断检测源端数据的变更,并实时将新增的数据集成到目标端。 使用Kafka作为源端数据源时仅支持实时任务,此处选择“实时”。
查看数据集删除申请 前提条件 登录用户为具有“Data Operation Engineer”角色的用户。 操作步骤 在数据服务左侧导航,选择“个人中心>数据集管理>我的申请”界面,可以查看当前用户所有申请信息。 查看数据集删除申请信息,例如,当前审批人和审批结果等。 单击“操作
提升模型性能。 数据配比 数据配比是将多个数据集按特定比例组合并发布为“发布数据集”的过程。通过合理的配比,确保数据集的多样性、平衡性和代表性,避免因数据分布不均而引发的问题。 数据流通 数据流通是将单个数据集发布为特定格式的“发布数据集”,用于后续模型训练等操作。支持的发布格式
下架数据集 功能介绍 对请求中的数据集进行申请下架操作,申请发布后会提交到审批模块由Data Owner进行审批,审批通过后自动启动下架流程,将数据集从数据集服务下架,下架后的数据集将不能在数据集服务中查看到,且不能提供给消费侧订阅使用。 URI URI格式 DELETE /softcomai/datalake/v1
下载数据集到OBS 功能介绍 下载数据集到OBS桶中。 URI URI格式 POST /softcomai/datalake/v1.0/download/obs 参数说明 无。 请求 请求样例 POST https://endpoint/softcomai/datalake/v1
在以下情况下,需要执行本章节。 在发布数据集时,未将秘密及以上密级的数据集授权给某些特定的租户或用户,但这些特定租户或用户需要使用该数据集。 在发布数据集时,已将秘密及以上密级的数据集授权给某些特定的租户或用户,但需要修改或删除租户或用户使用该数据集。 前提条件 数据集发布或修改申请已审批通过。 登录用户为具有“Data
在“创建流通任务”页面,选择数据集模态,如“预测 > 时序”类型的数据集。 图1 选择数据集模态 选择数据集,单击“下一步”。 在“格式配置”选择发布格式。当前预测类数据集仅支持发布默认格式。 填写数据集名称、描述,设置数据集“资产可见性”,设置扩展信息后,单击“确定”执行数据集流通操作。 当任务
设置:详细信息请参见设置数据集的信息及可视范围,详细操作请参考修改数据集(新)。 批量订阅/我要订阅:订阅该数据集,详细操作请参见立即订阅数据集或申请订阅数据集。 数据信息 数据集的数据信息包含标签、描述信息、数据浏览器和关联数据集。 标签:在标签管理中,每个用户只能管理自己设定的标签。 新增标签:在“
下载数据集 下载数据集到OBS 父主题: 消费数据集