检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
上传模板图片 在使用多模板分类工作流开发应用之前,必须要明确文字识别的模板类型,明确以哪几种板式图片作为模板训练文字识别模型,基于自己的业务需求制定针对性的文字识别模型。例如上传两种不同格式的发票图片作为模板,训练的文字识别模型就能识别并提取这两种格式发票上的关键字段。 前提条件
评估模板应用后,就可以部署模板应用至文字识别开发套件中,开发属于自己的文字识别应用,此应用用于识别自己所上传的模板样式的图片。 前提条件 已在文字识别套件控制台选择“通用单模板工作流”新建应用,并完成评估模板步骤,详情请见评估应用。 操作步骤 在“应用开发>部署”页面完成模板评估后,单击“下一步”,进入“创建模板>部
属于自己的文字识别应用,此应用用于识别自己所上传的图片属于哪种模板以及识别图片中的文字。 前提条件 已在文字识别套件控制台选择“多模板分类工作流”新建应用,并完成评估模板步骤,详情请见评估应用。 操作步骤 在“应用开发>部署”页面完成模板评估后,单击“下一步”,进入“创建模板>部
您可以创建新的字段类型。 前提条件 已在文字识别套件控制台选择“多模板分类工作流”新建应用,详情请见新建应用。 操作步骤 登录“ModelArts Pro>文字识别套件”控制台。 默认进入“应用开发>工作台”页面。 在“我的应用”页签下,选择应用并单击“操作”列的“查看”。 进入“应用资产”页面。
淆时,可以使用自动参照字段来简化模板制作过程,否则建议手动框选,详细步骤请参见操作步骤。 前提条件 已在文字识别套件控制台选择“多模板分类工作流”新建应用,并对上传的模板图片进行预处理,详情请见定义预处理。 操作步骤 图1 多模板框选参照字段 在“应用开发>框选参照字段”页面上方
您可以创建新的字段类型。 前提条件 已在文字识别套件控制台选择“通用单模板工作流”新建应用,详情请见新建应用。 操作步骤 登录“ModelArts Pro>文字识别套件”控制台。 默认进入“应用开发>工作台”页面。 在“我的应用”页签下,选择应用并单击“操作”列的“查看”。 进入“应用资产”页面。
上传模板图片 在使用单模板工作流开发应用之前,必须要明确文字识别的模板类型,明确以哪张图片作为模板训练文字识别模型,基于自己的业务需求制定针对性的文字识别模型。例如上传某一格式的发票图片作为模板,训练的文字识别模型就能识别并提取同格式发票上的关键字段。 前提条件 已授权ModelArts服务和对象存储服务(OBS)。
在使用通用文本分类工作流开发应用时,您需要选择训练数据集,后续训练模型操作是基于您选择的训练数据集。 训练数据集可以选择创建一个新的数据集,也可以选择导入在自然语言处理套件其他应用中已创建的文本数据集。 新建数据集 导入数据集 前提条件 已在自然语言处理套件控制台选择“通用文本分类工作流”新建应用,详情请见新建应用。
自己的文本分类应用,此应用用于分类自己所上传的文字内容,也可直接调用对应的API。 前提条件 已在自然语言处理套件控制台选择“通用文本分类工作流”新建应用,并评估模型,详情请见评估模型。 由于部署服务涉及ModelArts功能,需消耗资源,要确保账户未欠费。 如果部署服务使用专属
定的专属应用,此应用用于测定第二相面积含量,也可以直接调用对应的API和SDK识别。 前提条件 已在视觉套件控制台选择“第二相面积含量测定工作流”新建应用,并评估模型,详情请见部署服务。 由于部署服务涉及ModelArts功能,需消耗资源,要确保账户未欠费。 操作步骤 在“服务部
中都会包含此识别区的字段,且位置固定不变,因此模型可以通过识别区找到需要识别内容的位置。 前提条件 已在文字识别套件控制台选择“通用单模板工作流”新建应用,并框选参照字段,详情请见框选参照字段。 操作步骤 图1 框选识别区 在“应用开发>框选识别区”页面,通过单击左上方操作图标,调整模板图片到合适大小。
中都会包含此识别区的字段,且位置固定不变,因此模型可以通过识别区找到需要识别内容的位置。 前提条件 已在文字识别套件控制台选择“多模板分类工作流”新建应用,并框选参照字段,详情请见框选参照字段。 操作步骤 图1 多模板框选识别区 在“应用开发>框选参照字段”页面上方或者“选择模板
准备数据 在使用多语种文本分类工作流开发应用之前,您需要提前准备用于模型训练的数据,上传至OBS服务中。 设计分类标签 首先需要确定好文本分类的标签,即希望识别出文本的一种结果。例如分类用户对商品的评论,则可以以“positive”、“neutral”、“negative”等作为
议每个分类标签准备100个以上的数据。 针对未标注数据,将待标注的内容放在一个文本文件内,通用文本分类工作流仅支持中文文本内容的分类,其他语种的文本分类请使用多语种文本分类工作流。 针对已标注数据,文本分类的标注对象和标签在一个文本文件内,标注对象与标签之间,采用Tab键分隔,多个标签之间采用英文逗号分隔。
选择训练数据后,基于已标注的训练数据,选择预训练模型、配置参数,用于训练文本分类模型。 前提条件 已在自然语言处理套件控制台选择“通用文本分类工作流”新建应用,并选择训练数据集,详情请见选择数据。 训练模型 图1 模型训练 在“模型训练”页面,勾选模型训练所使用的“预训练模型”,并配置训练参数,开始训练模型。
一些常用的指标,如精准率、召回率、F1值等,能帮助您有效的评估,最终获得一个满意的模型。 前提条件 已在自然语言处理套件控制台选择“通用文本分类工作流”新建应用,并训练模型,详情请见训练模型。 整体评估 在“模型评估”页面,您可以针对当前版本的模型进行整体评估。 “整体评估”左侧显示当前模型的版本、标签数量、验证集数量。
应用用于识别热轧钢板表面图片中的缺陷类型,也可以直接调用对应的API和SDK识别。 前提条件 已在视觉套件控制台选择“热轧钢板表面缺陷检测工作流”新建应用,并评估模型,详情请见评估模型。 由于部署服务涉及ModelArts功能,需消耗资源,要确保账户未欠费。 操作步骤 在“服务部
已在自然语言处理套件控制台选择“多语种文本分类工作流”新建应用,详情请见新建应用。 已准备数据并上传至OBS,详情请见准备数据。 进入应用开发页面 方式一:首次进入 基于预置工作流新建应用后,直接进入“应用开发”v1版本页面。 方式二:新建应用后进入 登录“ModelArts Pro>自然语言处理套件”控制台。
淆时,可以使用自动参照字段来简化模板制作过程,否则建议手动框选,详细步骤请参见操作步骤。 前提条件 已在文字识别套件控制台选择“通用单模板工作流”新建应用,并对上传的模板图片进行预处理,详情请见定义预处理。 操作步骤 图1 框选参照字段 在“应用开发>框选参照字段”页面,通过单击
选择训练数据后,基于已标注的训练数据,选择预训练模型、配置参数,用于训练文本分类模型。 前提条件 已在自然语言处理套件控制台选择“多语种文本分类工作流”新建应用,并选择训练数据集,详情请见选择数据。 训练模型 图1 模型训练 在“模型训练”页面,勾选模型训练所使用的“预训练模型”,并配置训练参数,开始训练模型。