检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
建议根据业务情况及使用习惯,选择OBS使用方法。 如果您的数据量较小(小于100MB)或数据文件少(少于100个),建议您使用控制台上传数据。控制台上传无需工具下载或多余配置,在少量数据上传时,更加便捷高效。 如果您的数据量较大或数据文件较多,建议选择OBS Browser+或obsutil工具上传。OBS
注册华为帐号并开通华为云 在使用华为云服务之前您需要注册华为帐号并开通华为云。通过此帐号,只需为使用的服务付费,即可使用所有华为云服务。 进入华为云官网,参考帐号注册指导及界面提示信息,完成帐号注册。 注册成功后即可自动登录华为云,您需要完成“实名认证”才可以正常使用服务。具体认证方式请参考帐号实名认证。
上传数据集失败如何处理? 问题原因 上传数据集失败,一般是因为数据集格式不对导致的。不同行业套件的工作流,对数据集要求也不同。 首先请检查数据集是否符合要求,各个套件的数据集要求如下: 文字识别套件 自然语言处理套件 视觉套件 HiLens套件 确认数据集符合要求后,将数据集上传至OBS桶。
如果您的数据量较小(小于100MB)或数据文件较少(少于100个),建议您使用控制台上传数据。控制台上传无需工具下载或多余配置,在少量数据上传时,更加便捷高效。 如果您的数据量较大或数据文件较多,建议选择OBS Browser+或obsutil工具上传。OBS Browser+是一个比较常用的图形化工
“编码”选择“UTF-8”格式。 以换行符作为分隔符,每行数据代表一个样本数据,单个样本不能有分行显示,不支持换行。 基于已设计好的分类标签准备文本数据。每个分类标签需要准备5个及以上数据,为了训练出效果较好的模型,建议每个分类标签准备100个以上的数据。 针对未标注数据,将待标注的内容放在一个文本文件内
以换行符作为分隔符,每行数据代表一个样本数据,单个样本不能有分行显示,不支持换行。 基于已设计好的实体标签准备文本数据。每个实体标签需要准备20个及以上数据,为了训练出效果较好的模型,建议每个实体标签准备100个以上的数据。 本工作流只支持上传未标注数据,将待标注的内容放在一个文本文件内。
场景尽量相似。 为保证模型的泛化能力,数据集尽量覆盖可能出现的各种场景。 每一类数据尽量多,尽量均衡。每个分类标签需要准备20个数据以上,为了训练出效果较好的模型,建议每个分类标签准备200个以上的数据。 针对未标注数据,要求将图片放在一个目录里,示例如下所示。 ├─dataset-import-example
不要把明显不同的多个任务数据放在同一个数据集内。 为了保证模型的预测准确度,训练样本跟真实使用场景尽量相似。 为保证模型的泛化能力,数据集尽量覆盖可能出现的各种场景。 数据集样本数应大于100,用于测试的已标注数据应不少于20张,样本数达1万张以上性能更优。 为了准确率,建议数据集中标注数据占总数
始标注”,在“数据标注”页面手动标注数据。 导入数据集 在“数据选择”页面,单击“导入数据集”。 弹出“导入数据集”对话框。 “导入数据集”对话框会显示您在刹车盘工作流创建的其他应用中已使用的数据集信息,包括“数据集名称”和“标注进度”。 图4 导入数据集 勾选数据集,然后单击“确定”。
在“数据选择”页面,单击“导入数据集”。 弹出“导入数据集”对话框。 “导入数据集”对话框会显示您在通用图像分类工作流创建的数据集信息,包括“数据集名称”和“创建时间”等信息。 图4 导入数据集 勾选数据集,然后单击“确定”。 数据集导入后,“数据选择”页面会显示已导入的数据。 创建标注任务
标注”,在“数据标注”页面手动标注数据。 导入数据集 在“数据选择”页面,单击“导入数据集”。 弹出“导入数据集”对话框。 “导入数据集”对话框会显示您在云状识别工作流创建的其他应用中已使用的数据集信息,包括“数据集名称”和“标注进度”。 图4 导入数据集 勾选数据集,然后单击“确定”。
在“数据选择”页面,新建数据集后,单击操作列的“标注”,进入数据概览页,单击右上角的“开始标注”,进入“数据标注”页面。 图1 数据标注 标注文本 数据集详情页中,展示了此数据集中“未标注”和“已标注”的文本,默认显示“未标注”的文本列表。 在“未标注”页签文本列表中,页面左侧罗列“
图3 新建数据集 表1 新建数据集参数说明 参数 说明 数据集名称 待新建的数据集名称。 描述 数据集简要描述。 数据集状态 通用实体抽取工作流只支持上传“未标注数据集”。 数据集输入位置 训练数据存储至OBS的位置。 单击“数据集输入位置”右侧输入框,在弹出的“数据集输入位置”
图3 新建数据集 表1 新建数据集参数说明 参数 说明 数据集名称 待新建的数据集名称。 描述 数据集简要描述。 数据集状态 上传的训练数据可以是已标注的数据,也可以是未标注的数据。 您可以根据自身业务选择“数据集状态”是“已标注数据集”还是“未标注数据集”。 数据集模板可在选
待新建的数据集名称。 描述 数据集简要描述。 数据集状态 按上传的数据是否标注分为“已标注数据集”和“未标注数据集”。数据格式请见数据集要求。 数据上传方式 训练数据上传的方式,当前仅支持把数据上传至OBS,默认为“选择obs文件”。 数据集输入位置 训练数据存储至OBS的位置。
包括“数据集名称”和“标注进度”。 图4 导入数据集 勾选数据集,然后单击“确定”。 数据集导入后,“数据选择”页面右上角会显示“数据集导入成功”。 导入勾选数据集后,在数据选择页面勾选当前应用开发所需的训练数据集。 由于模型训练过程需要有标签的数据,针对已上传的数据集,手动添加或修改标签。
单击数据集操作列的“标注测试图片”,进入数据集概览页单击右上角的“开始标注”,在“数据标注”页面手动标注数据。 导入数据集 在“数据选择”页面,单击“导入数据集”。 弹出“导入数据集”对话框。 “导入数据集”对话框会显示您在数据标注平台或套件其它应用导入可用状态的数据集信息,包
数据集名称”和“标注进度”。 单击数据集左侧的,可查看数据集的“创建时间”和“标签集”。 图4 导入数据集 勾选数据集,然后单击“确定”。 数据集导入后,“数据选择”页面右上角会显示“数据集导入成功”。 导入勾选数据集后,在数据选择页面勾选当前应用开发所需的训练数据集。 由于模型
图1 新建数据集 表1 新建数据集参数说明 参数 说明 数据集名称 待新建的数据集名称。 描述 数据集简要描述。 数据集状态 上传的训练数据可以是已标注的数据,也可以是未标注的数据。 您可以根据自身业务选择“数据集状态”是“已标注数据集”还是“未标注数据集”。 数据集模板可在选
”,在“数据标注”页面手动标注数据。 由于零售商品工作流标注数据时需要勾勒出商品形状,必须使用多边形标注框标注数据。 自动标注数据 单击“下一步”,创建SKU后,自动标注数据。 导入数据集 在“数据选择”页面,单击“导入数据集”。 弹出“导入数据集”对话框。 “导入数据集”对话框