检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
准备数据 在使用云状识别工作流开发应用之前,您需要提前准备用于模型训练的数据,上传至OBS服务中。 设计云状标签 首先需要考虑好云状标签,即希望识别出云状的一种结果。例如可以以“cumulus”(积云)、“stratus”(层云)、“cumulonimbus”(积雨云)等分别作为云状的种类。
Pro控制台查看应用详情,包括应用开发的配置信息和应用资产。 前提条件 已在文字识别套件控制台选择预置工作流新建应用,详情请见新建应用。 进入应用详情页 登录ModelArts Pro管理控制台,单击“文字识别”套件卡片的“进入套件”。 进入文字识别套件控制台。 在左侧导航栏选择“应用开发>工作台”。 默认进入“我的应用”页签。
帐号为IAM用户授予文字识别服务(Optical Character Recognition,简称OCR)操作权限权,详细操作请见给IAM用户授权。 操作步骤 在ModelArts Pro控制台界面,单击“文字识别”套件卡片的“进入套件”。 进入文字识别套件控制台。 图1 进入套件
单击框选操作图标,单击待识别文字的左上角,移动鼠标框选识别区,使得矩形框覆盖待识别的文字。 识别区是对应字段内容所在区域。在框选时,建议尽量扩大识别区的框选范围使其覆盖对应字段内容可能出现的区域,防止在不同图片识别时出现漏字。 本样例框选的识别区如图10所示。 图10 框选识别区 在右侧“框
一个满意的模型。 前提条件 已在视觉套件控制台选择“刹车盘识别工作流”新建应用,并训练模型,详情请见训练模型。 评估模型 在“模型评估”页面,您可以针对当前版本的模型进行模型评估,查看评估参数对比和详细评估,也可以模拟在线测试。 图1 评估模型 模型评估 “模型评估”下侧显示当前模型的版本、验证集数量。
取值为最后识别结果。 例如: “字段类型名称”:“城市” “字段属性”:“自定义字典” “取值范围”:“Shenzhen”、“Beijing”、“Xi'an” 在识别“字段类型”为“城市”的文字时,从“Shenzhen”、“Beijing”、“Xi'an”中找出与待识别文字最相似的取值,作为识别结果。
行业套件介绍 文字识别套件基于丰富的文字识别算法和行业知识积累,帮助客户快速构建满足不同业务场景需求的文字识别服务,实现多种版式图像的文字信息结构化提取。 文字识别套件的介绍请参见产品介绍。 预置工作流 文字识别套件当前提供了单模板工作流和多模板工作流,自主构建文字识别模板,识别模板图片中
选择数据 在使用刹车盘识别工作流开发应用时,您需要选择训练数据集,后续训练模型操作是基于您选择的训练数据集。 训练数据集可以选择创建一个新的数据集,也可以选择导入基于刹车盘识别工作流创建的其他应用中已创建的数据集。 新建训练数据集 导入数据集 前提条件 刹车盘识别工作流支持将服务一键
一步”。 进入“应用开发>框选识别区”页面。 步骤6:框选识别区 在“应用开发>框选识别区”页面,通过单击左上方操作图标,调整当前模板图片到合适大小。 单击框选操作图标,单击待识别文字的左上角,移动鼠标框选识别区,使得矩形框覆盖待识别的文字。 识别区是对应字段内容所在区域。在框选
选择数据 在使用云状识别工作流开发应用时,您需要选择训练数据集,后续训练模型操作是基于您选择的训练数据集。 训练数据集可以选择创建一个新的数据集,也可以选择导入基于云状识别工作流创建的其他应用中已创建的数据集。 新建训练数据集 导入数据集 前提条件 云状识别工作流支持将服务一键部
准备数据 在使用刹车盘识别工作流开发应用之前,您需要提前准备用于模型训练的数据,上传至OBS服务中。 设计刹车盘标签 首先需要考虑好刹车盘的标签类型,即希望识别出图片中刹车盘的一种结果。例如可以以“ventilation”(通风)、“physical”(实体)等分别作为刹车盘的类别。
评估应用 通过上传测试图片,在线评估模板分类情况和模板的文字识别情况,保证能在多个模板情况下正确分类测试图片的模板,并且能正确识别测试图片中的识别区文字。 评估应用 部署服务 模板图片评估后,可以部署模板至文字识别开发套件中,开发属于自己的文字识别应用,此应用用于识别自己所上传的多模板样式的图片。
工作流简介 功能介绍 支持构建文字识别模板,识别单个板式图片中的文字,提供高精度的文字识别模型,保证结构化信息提取精度。 适用场景 用户认证识别 识别证件中关键信息,节省人工录入,提升效率,降低用户实名认证成本,准确快速便捷。 快递单自动填写 识别图片中联系人信息并自动填写快递单,减少人工输入。
别数据量较低,会影响模型整体的识别效果。 选择适当的学习率和训练轮次。 通过详细评估中的错误识别示例,有针对性地扩充训练数据。 后续操作 模型训练完成后,单击“下一步”,进入应用开发的“模型评估”步骤,详细操作指引请参见评估模型。 父主题: 云状识别工作流
通用单模板工作流 工作流介绍 上传模板图片 定义预处理 框选参照字段 框选识别区 评估应用 部署服务 自定义字段类型 编辑应用 删除应用 父主题: 文字识别套件
多模板分类工作流 工作流介绍 上传模板图片 定义预处理 框选参照字段 框选识别区 训练分类器 评估应用 部署服务 编辑应用 自定义字段类型 删除应用 父主题: 文字识别套件
在文字识别过程中,套件会检查所识别图片与模板图片是否为同一种模板,并将识别图片校正后再提取结构化信息,支持图片平移、旋转与拉伸变换。 为了检查并校正待识别的图片,这就需要在模板图片中指定参照字段。通过参照字段的文字内容来判断是否属于同一种模板,通过参照字段的位置来校正待识别图片。
零售商品识别工作流 工作流介绍 准备数据 选择数据 创建SKU 自动标注数据 训练模型 评估模型 部署服务 父主题: 视觉套件
准备数据 在使用零售商品识别工作流开发应用之前,您需要提前准备用于模型训练的数据,上传至OBS服务中。 设计商品标签 首先需要考虑好商品标签,即希望识别出商品的一种结果。例如识别蛋糕店蛋糕的种类,则可以以“cream_cake”、“fruit_cake”、“cheese_cake
确定模板图片的参照字段和识别区后,多模板分类工作流在模板数量较多,或版式相似度较高的情况下,建议针对不同的模板上传对应的训练集数据,用于训练模板分类模型,使服务能够精准地分类多个模板图片,然后对多个模板图片进行文字识别和结构化提取。 前提条件 已在文字识别套件控制台选择“多模板分