检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
要新建或导入训练数据集,后续训练模型操作是基于您选择的训练数据集。 由于模型训练过程需要有标签的数据,如果您上传未标注数据,需要手动标注数据。 选择数据 训练模型 选择训练数据后,无需用户配置任何参数即可开始训练图像分类模型,并查看训练的模型准确率和误差的变化。 训练模型 评估模型
或导入训练数据集,后续训练模型操作是基于您选择的训练数据集。 由于模型训练过程需要有标签的数据,如果您上传未标注数据,需要手动标注数据。 选择数据 训练模型 选择训练数据后,无需用户配置任何参数即可开始训练热轧钢板表面缺陷检测模型,并查看训练的模型准确率和误差的变化。 训练模型 评估模型
在使用安全帽检测技能模板开发技能之前,您需要提前准备用于模型训练的数据,上传至OBS服务中。 数据集要求 文件名规范,不能有中文,不能有+、空格、制表符。 保证图片质量:不能有损坏的图片;目前支持的格式包括jpg、jpeg、bmp、png。 为了保证模型的预测准确度,训练样本跟真实使用场景尽量相似。 为保
标注数据 由于模型训练过程需要大量有标签的数据,如果开发应用时,上传的训练数据集是未标注的,需要对数据集中的数据进行标注。 针对文本分类场景,是对文本的内容按照标签进行分类处理,标签名是由中文、大小写字母、数字、中划线或下划线组成,且不超过32位的字符串。 进入数据标注页面 在“
在使用多模板分类工作流开发应用之前,必须要明确文字识别的模板类型,明确以哪几种板式图片作为模板训练文字识别模型,基于自己的业务需求制定针对性的文字识别模型。例如上传两种不同格式的发票图片作为模板,训练的文字识别模型就能识别并提取这两种格式发票上的关键字段。 前提条件 已授权ModelArts服务和对象存储服务(OBS)。
上传模板图片 在使用单模板工作流开发应用之前,必须要明确文字识别的模板类型,明确以哪张图片作为模板训练文字识别模型,基于自己的业务需求制定针对性的文字识别模型。例如上传某一格式的发票图片作为模板,训练的文字识别模型就能识别并提取同格式发票上的关键字段。 前提条件 已授权ModelArts服务和对象存储服务(OBS)。
多行业:积累10+行业/场景的预训练模型。 高精度:大部分模型的准确率高于90%。 少数据:训练所需的数据量更少。 智能标注:提升标注效率。 极致性能 依托ModelArts 基础平台,深度软硬件协同。 资源秒级调度,按需使用。 训练任务性能提升30%。 灵活开放 灵活的部署方式:支持在线部署、边缘部署、Hilens部署等多种部署方式。
入HiLens Studio自动创建技能,进一步调试技能。 前提条件 已在ModelArts Pro控制台选择“HiLens安全帽检测”可训练模板新建技能,并评估模型,详情请见评估模型。 由于部署服务涉及ModelArts功能,需消耗资源,要确保账户未欠费。 安装技能至设备,需要
选择“所属行业”和“选择工作流”。 图3 工作流配置 资源配置 图4 资源配置 分别选择“数据处理资源”、“模型训练资源”、“测试资源部署”,即用于数据处理、模型训练和在线测试的资源池和资源类型。 资源池可选“公共资源池”和“专属资源池”。 “公共资源池”:提供公共的大规模计算集群
“部署方式”:选择应用的部署方式。 “在线服务”:将服务部署为在线服务,进而在线使用服务,也可以直接调用对应的API。 “边缘服务”:将服务部署至边缘设备。当前边缘服务部署支持的智能边缘设备为Atlas 500。 热轧钢板表面缺陷检测工作流和零售商品识别工作流仅支持“在线部署”,云状识别工作流和
“删除”:单击“删除”,弹出“删除数据集”对话框,单击“确认”,即可删除当前数据集。 查看应用监控 如果应用的部署方式是在线部署,您可以在“应用详情”页的“应用监控”页签下查看当前版本应用的“基本信息”、“在线测试”、“历史版本”和“调用指南”,详情请见监控应用。 父主题: 视觉套件
本章节提供一个身份证样例,帮助您快速熟悉使用文字识别套件中的通用单模板工作流开发应用的过程。通过上传模板图片、框选参照字段和识别区,自动训练并生成文字识别模型,并将生成的模型部署为在线服务。部署完成后,用户可通过在线服务识别身份证模板中的文字。 首先,请仔细阅读准备工作罗列的要求,提前完成准备工作。使用通用单模板工作流开发应用的步骤如下所示:
应用详情 查看应用开发配置 在“应用详情”页,默认进入“应用开发”页签,您可以查看应用开发过程中各个步骤的配置信息,包括“数据选择”、“模型训练”、“模型评估”、“服务部署”。 您也可以在“应用开发”页签下,重新编辑应用开发的配置信息,并单击左上角版本号右侧的“更新版本”,将当前的应用设置成新的版本。
使用流程 ModelArts Pro是为企业级AI应用打造的专业开发套件。基于华为云的先进算法和快速训练能力,提供预置工作流和模型,提升企业AI应用的开发效率,降低开发难度。当前ModelArts Pro开放了文字识别套件、自然语言处理套件、视觉套件、HiLens套件,详细介绍请
准备数据 在使用通用文本分类工作流开发应用之前,您需要提前准备用于模型训练的数据,上传至OBS服务中。 设计分类标签 首先需要确定好文本分类的标签,即希望识别出文本的一种结果。例如分类用户对商品的评论,则可以以“positive”、“neutral”、“negative”等作为用
在使用多语种工作流开发应用时,您需要新建或导入训练数据集,后续训练模型操作是基于您选择的训练数据集。 选择数据 训练模型 选择训练数据后,基于已标注的训练数据,选择预训练模型、配置参数,用于训练文本分类模型。 训练模型 评估模型 训练得到模型之后,整个开发过程还不算结束,需要对模型进行评估和考察。
供“通用文本分类工作流”、“多语种文本分类工作流”、“通用实体抽取工作流”等。 资源配置 分别选择“数据处理资源”和“模型训练资源”,即用于数据处理和模型训练的资源池和资源类型。 资源池可选“公共资源池”和“专属资源池”。 “公共资源池”:提供公共的大规模计算集群,资源按作业隔离。您可以按需选择不同的资源类型。
在使用通用实体抽取工作流开发应用时,您需要新建或导入数据集,后续训练模型操作是基于您选择的数据集。 选择数据 训练模型 选择训练数据后,基于已标注的训练数据,选择预训练模型、配置参数,用于训练实体抽取模型。 训练模型 评估模型 训练得到模型之后,整个开发过程还不算结束,需要对模型进行评估和考察。
根据工作流指引,开发商品识别服务,通过上传训练数据,训练生成商品识别模型,自主更新和调整模型精度,实现高精度的商品识别功能。 零售商品识别工作流 热轧钢板表面缺陷检测工作流 根据工作流指引,开发热轧钢板表面缺陷检测服务,通过上传训练数据,训练生成缺陷识别模型,自主更新和调整模型精度
或导入训练数据集,后续训练模型操作是基于您选择的训练数据集。 选择数据 标注数据(可选) 由于模型训练过程需要大量有标签的数据,如果开发应用时,上传的训练数据集是未标注的,需要对数据集中的数据进行标注。 标注数据 训练模型 选择训练数据后,基于已标注的训练数据,选择预训练模型、配置参数,用于训练文本分类模型。