检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
与OBS关系 上传训练数据集 ModelArts Pro上传的训练数据集存储在OBS中。 管理数据集 数据集存储在OBS中。 数据集的标注信息存储在OBS中。 支持从OBS中导入数据。 训练模型 训练模型使用的数据集存储在OBS中。 训练模型的运行脚本存储在OBS中。 训练模型输出的模型存储在指定的OBS中。
标注数据 由于模型训练过程需要大量有标签的数据,如果开发应用时,上传的训练数据集是未标注的,需要对数据集中的数据进行标注。 针对文本分类场景,是对文本的内容按照标签进行分类处理,标签名是由中文、大小写字母、数字、中划线或下划线组成,且不超过32位的字符串。 进入数据标注页面 在“
或导入训练数据集,后续训练模型操作是基于您选择的训练数据集。 由于模型训练过程需要有标签的数据,如果您上传未标注数据,需要手动标注数据。 选择数据 训练模型 选择训练数据后,无需用户配置任何参数即可开始训练热轧钢板表面缺陷检测模型,并查看训练的模型准确率和误差的变化。 训练模型 评估模型
上传模板图片 在使用单模板工作流开发应用之前,必须要明确文字识别的模板类型,明确以哪张图片作为模板训练文字识别模型,基于自己的业务需求制定针对性的文字识别模型。例如上传某一格式的发票图片作为模板,训练的文字识别模型就能识别并提取同格式发票上的关键字段。 前提条件 已授权ModelArts服务和对象存储服务(OBS)。
Pro会自动标注数据,自动标注完成后,可对每个数据的标注结果进行核对和确认。 自动标注数据 训练模型 选择训练数据后,无需用户配置任何参数即可开始训练商品识别模型,并查看训练的模型准确率和误差的变化。 训练模型 评估模型 训练得到模型之后,整个开发过程还不算结束,需要对模型进行评估和考察。 评估结果
Pro会自动标注数据,自动标注完成后,可对每个数据的标注结果进行核对和确认。 工作流介绍 训练模型 选择训练数据后,无需用户配置任何参数即可开始训练第二相面积含量测定模型,并查看训练的模型准确率和误差的变化。 训练模型 评估模型 训练得到模型之后,整个开发过程还不算结束,需要对模型进行评估和考察。 评
在使用多模板分类工作流开发应用之前,必须要明确文字识别的模板类型,明确以哪几种板式图片作为模板训练文字识别模型,基于自己的业务需求制定针对性的文字识别模型。例如上传两种不同格式的发票图片作为模板,训练的文字识别模型就能识别并提取这两种格式发票上的关键字段。 前提条件 已授权ModelArts服务和对象存储服务(OBS)。
入HiLens Studio自动创建技能,进一步调试技能。 前提条件 已在ModelArts Pro控制台选择“HiLens安全帽检测”可训练模板新建技能,并评估模型,详情请见评估模型。 由于部署服务涉及ModelArts功能,需消耗资源,要确保账户未欠费。 安装技能至设备,需要
选择“所属行业”和“选择工作流”。 图3 工作流配置 资源配置 图4 资源配置 分别选择“数据处理资源”、“模型训练资源”、“测试资源部署”,即用于数据处理、模型训练和在线测试的资源池和资源类型。 资源池可选“公共资源池”和“专属资源池”。 “公共资源池”:提供公共的大规模计算集群
“删除”:单击“删除”,弹出“删除数据集”对话框,单击“确认”,即可删除当前数据集。 查看应用监控 如果应用的部署方式是在线部署,您可以在“应用详情”页的“应用监控”页签下查看当前版本应用的“基本信息”、“在线测试”、“历史版本”和“调用指南”,详情请见监控应用。 父主题: 视觉套件
“部署方式”:选择应用的部署方式。 “在线服务”:将服务部署为在线服务,进而在线使用服务,也可以直接调用对应的API。 “边缘服务”:将服务部署至边缘设备。当前边缘服务部署支持的智能边缘设备为Atlas 500。 热轧钢板表面缺陷检测工作流和零售商品识别工作流仅支持“在线部署”,云状识别工作流和
本章节提供一个身份证样例,帮助您快速熟悉使用文字识别套件中的通用单模板工作流开发应用的过程。通过上传模板图片、框选参照字段和识别区,自动训练并生成文字识别模型,并将生成的模型部署为在线服务。部署完成后,用户可通过在线服务识别身份证模板中的文字。 首先,请仔细阅读准备工作罗列的要求,提前完成准备工作。使用通用单模板工作流开发应用的步骤如下所示:
或导入训练数据集,后续训练模型操作是基于您选择的训练数据集。 选择数据 标注数据(可选) 由于模型训练过程需要大量有标签的数据,如果开发应用时,上传的训练数据集是未标注的,需要对数据集中的数据进行标注。 标注数据 训练模型 选择训练数据后,基于已标注的训练数据,选择预训练模型、配置参数,用于训练文本分类模型。
使用流程 ModelArts Pro是为企业级AI应用打造的专业开发套件。基于华为云的先进算法和快速训练能力,提供预置工作流和模型,提升企业AI应用的开发效率,降低开发难度。当前ModelArts Pro开放了文字识别套件、自然语言处理套件、视觉套件、HiLens套件,详细介绍请
在使用多语种工作流开发应用时,您需要新建或导入训练数据集,后续训练模型操作是基于您选择的训练数据集。 选择数据 训练模型 选择训练数据后,基于已标注的训练数据,选择预训练模型、配置参数,用于训练文本分类模型。 训练模型 评估模型 训练得到模型之后,整个开发过程还不算结束,需要对模型进行评估和考察。
不要把明显不同的多个任务数据放在同一个数据集内。 为了保证模型的预测准确度,训练样本跟真实使用场景尽量相似。 为保证模型的泛化能力,数据集尽量覆盖可能出现的各种场景。 每一类数据尽量多,尽量均衡。每个分类标签需要准备20个数据以上,为了训练出效果较好的模型,建议每个分类标签准备200个以上的数据。
ModelArts Pro的应用场景和用户群体 ModelArts Pro基于华为云的先进算法和快速训练能力,提供预置工作流和模型。用户可以使用ModelArts Pro套件中特定行业场景的预置行业工作流,满足快速定制的需求,快速进行应用开发。 当前ModelArts Pro开放
在使用通用实体抽取工作流开发应用时,您需要新建或导入数据集,后续训练模型操作是基于您选择的数据集。 选择数据 训练模型 选择训练数据后,基于已标注的训练数据,选择预训练模型、配置参数,用于训练实体抽取模型。 训练模型 评估模型 训练得到模型之后,整个开发过程还不算结束,需要对模型进行评估和考察。
应用详情 查看应用开发配置 在“应用详情”页,默认进入“应用开发”页签,您可以查看应用开发过程中各个步骤的配置信息,包括“数据选择”、“模型训练”、“模型评估”、“服务部署”。 您也可以在“应用开发”页签下,重新编辑应用开发的配置信息,并单击左上角版本号右侧的“更新版本”,将当前的应用设置成新的版本。
准备数据 在使用通用文本分类工作流开发应用之前,您需要提前准备用于模型训练的数据,上传至OBS服务中。 设计分类标签 首先需要确定好文本分类的标签,即希望识别出文本的一种结果。例如分类用户对商品的评论,则可以以“positive”、“neutral”、“negative”等作为用