检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
和校验结果不断扩充数据和调优。 因此ModelArts Pro提供版本更新的功能,首次版本为v1,然后v2、v3......以此类推。可以通过调整训练数据和算法,多次训练,获得更好的模型效果。 每修改一次,更新成一个版本,不同的作业版本之间,能快速进行对比,获得对比结果。 前提条件
和校验结果不断扩充数据和调优。 因此ModelArts Pro提供版本更新的功能,首次版本为v1,然后v2、v3......以此类推。可以通过调整训练数据和算法,多次训练,获得更好的模型效果。 每修改一次,更新成一个版本,不同的作业版本之间,能快速进行对比,获得对比结果。 前提条件
这就需要在图片模板中框选识别区。 识别区指图片中待识别的文字位置。所有需要识别的图片中都会包含此识别区的字段,且位置固定不变,因此模型可以通过识别区找到需要识别内容的位置。 前提条件 已在文字识别套件控制台选择“多模板分类工作流”新建应用,并框选参照字段,详情请见框选参照字段。 操作步骤
在工业智能体使用预置工作流开发应用之前,需要新建应用,填写应用基本信息、选择工作流。 前提条件 使用工业智能体之前请先参考帐号注册注册华为帐号并开通华为云。 保证华为云帐号不欠费。在工业智能体控制台开发应用时,会占用OBS资源,需要收取一定费用,收费规则请参见对象存储服务OBS。 操作步骤 在工业智能体控制台界面
评估应用 确定模板图片的参照字段和识别区后,需要对模板图片进行评估和考察。您可以通过上传测试图片,在线评估模板的识别情况,保证能正确识别同样模板下其他图片中的识别区文字。 前提条件 已在文字识别套件控制台选择“通用单模板工作流”新建应用,并完成框选识别区步骤,详情请见框选识别区。
管理数据集版本 数据标注完成后,您可以发布成多个版本对数据集进行管理。针对已发布生产的数据集版本,您可以通过查看数据集演进过程、设置当前版本、删除版本等操作,对数据集进行管理。数据集版本的相关说明,请参见关于数据集版本。 发布为新版本的说明,请参见发布数据集。 进入数据集版本管理页面
评估应用 训练模板分类模型后,需要对模板分类器和模板图片进行评估和考察。您可以通过上传测试图片,在线评估模板分类情况和模板的文字识别情况,保证能在多个模板情况下正确分类测试图片的模板,并且能正确识别测试图片中的识别区文字。 前提条件 已在文字识别套件控制台选择“多模板分类工作流”
定义预处理 使用通用单模板工作流上传模板图片后,需要对模板图片进行预处理,通过旋转、裁剪、降噪等操作。图片预处理的目的是保留图片的关键内容,去掉冗余部分,保持图片内容清晰可见,保证模型识别的准确性。 前提条件 已在文字识别套件控制台选择“通用单模板工作流”新建应用,并上传模板图片,详情请见上传模板图片。
定义预处理 使用多模板分类工作流上传模板图片后,需要对模板图片进行预处理,通过旋转、裁剪、降噪等操作。图片预处理的目的是保留图片的关键内容,去掉冗余部分,保持图片内容清晰可见,保证模型识别的准确性。 前提条件 已在文字识别套件控制台选择“多模板分类工作流”新建应用,并上传模板图片,详情请见上传模板图片。
程相同,因此本章节以通用文本分类工作流为例,介绍如何使用自然语言处理套件中的文本分类工作流开发应用,通过上传训练数据、训练模型,将生成的模型部署为在线服务。部署完成后,用户可通过在线服务分类文本内容。 首先,请仔细阅读准备工作罗列的要求,提前完成准备工作。使用通用文本分类工作流开发应用的步骤如下所示:
创建桶方法 控制台 通过控制台创建桶 OBS Browser+ 通过OBS Browser+创建桶 obsutil 通过obsutil创建桶 SDK 使用SDK创建桶,具体参考各语言开发指南的创建桶章节 API 通过API创建桶 上传对象 桶创建成功后,您可以通过以下多种方式将文件
使用预置工作流开发应用流程 视觉套件提供了预置工作流,您可以通过预置的工作流,自主上传训练数据,构建和升级高精度识别模型。 图1 使用预置工作流开发应用 表1 使用预置工作流开发应用流程 流程 说明 详细指导 选择视觉套件 根据您的实际使用需求选择视觉套件。您也可以通过查看工作流定位所需使用的套件。 在ModelArts
通用文本分类工作流 根据工作流指引,开发文本分类服务,通过上传训练数据,训练生成文本预测分类模型,自主更新和调整模型精度,实现高精度的文本预测分类。 通用文本分类工作流 多语种文本分类工作流 根据工作流指引,开发非中文语种的文本分类服务,通过上传训练数据,训练生成文本预测分类模型,自主更
及持续迭代。 选择预置工作流 单模板工作流 通过工作流指引构建文字识别模板,识别单个板式图片中的文字,快速实现文档、票证等场景的文字识别。详情请见使用单模板工作流开发应用。 多模板工作流 通过工作流指引支持自定义多个文字识别模板,通过模型训练,自动识别图片所属模板,从而支持从大量
odelArts Pro支持通过开发新版本、对比不同版本的效果等功能对不同的应用版本进行管理。 已发布北京四区域 自然语言处理套件-更新应用版本 视觉套件-更新应用版本 HiLens套件-更新应用版本 OBS 2.0支持应用监控 针对已创建的应用,通过查看应用的基本信息、在线测试
义设置。 您可以将任意一个版本设置为当前目录,即表示数据集列表中进入的数据集详情,为此版本的数据及标注信息。 针对每一个数据集版本,您可以通过“存储路径”参数,获得此版本对应的Manifest文件格式的数据集。可用于导入数据或难例筛选操作。 表格数据集暂不支持切换版本。 发布数据集
自动识别结构化信息与提取签名盖章区域,有助快速审核。 自然语言处理套件 通用文本分类场景。 智能问答 通过中文分词、短文本相似度、命名实体识别等自然语言处理相关技术,计算两个问题对的相似度,可解决问答、对话、语料挖掘、知识库构建等问题。 内容推荐 通过文本分类预测模型,精确匹配出语义相似的内容,快速构建内容推荐场景。
工作流流程 在“ModelArts Pro>文字识别套件”控制台选择“通用单模板分类工作流”新建应用,详细操作请见新建应用。您可以创建单模板服务,通过模板训练文字识别模型,实现单模板图像的文字信息结构化提取。 图1 创建单模板流程 表1 创建单模板流程说明 流程 说明 详细指导 上传模板图片
Kit注册到Huawei HiLens平台,连接端侧与云侧。 注册HiLens Kit 选择HiLens套件 根据您的实际使用需求选择HiLens套件。您也可以通过查看工作流定位所需使用的套件。 在ModelArts Pro控制台界面,单击“HiLens套件”卡片的“进入套件”,进入HiLens套件控制台。