数据集 ,又称为资料集、数据集合或资料集合,是一种由数据所组成的集合。数据反映了真实世界的状况。数据集作为深度学习和机器学习的输入,对AI开发有至关重要的意义。
ModelArts 数据管理 提供了一套高效便捷的管理和标注数据集框架。不仅支持图片、文本、语音、视频等多种数据类型,涵盖图像分类、目标检测、音频分割、文本分类等多个标注场景,可适用于各种AI项目,如计算机视觉、 自然语言处理 、音视频分析等;同时提供数据筛选、数据分析、数据处理、智能标注、团队标注以及版本管理等功能,AI开发者可基于该框架实现数据标注全流程处理,轻松管理您的数据集。
ModelArts数据管理为数据集提供聚类分析、数据清洗、数据增强、数据选择、特征分析等处理,可帮助开发者进一步理解数据、筛选数据、挖掘数据信息,从而准备出一份满足开发目标或项目要求的高价值数据。
您也可以在AI Gallery订阅或共享数据集。AI Gallery的数据功能支持数据集的共享和下载。如果您是买家,可以在AI Gallery数据中,查找并下载满足业务需要的数据集。如果您是卖家,可以将自己本地的数据集,发布至AI Gallery中,共享给其他用户使用。
华为云推荐:
ModelArts 数据管理简介 https://support.huaweicloud.com/productdesc-modelarts/modelarts_01_0012.html
AI Gallery简介 https://support.huaweicloud.com/aimarket-modelarts/modelarts_18_0001.html#section3