检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
的文字,提供高精度的文字识别模型,保证结构化信息提取精度。 通用单模板工作流 通过构建文字识别模板,识别单个板式图片中的文字,提供高精度的文字识别模型,保证结构化信息提取精度。 多模板分类工作流 支持用户自定义多个文字识别模板,通过模型训练,自动识别图片所需使用的模板,从而支持从大量不同板式图像中提取结构化信息。
如果导入位置为OBS,用户需具备此OBS路径的读取权限。 只支持JPG、JPEG、PNG、BMP格式的图片。 针对已标注数据,云状识别工作流仅支持一张图片识别单个标签,支持如下两种数据格式。 相同标签的图片放在一个目录里,并且目录名字即为标签名。当存在多层目录时,则以最后一层目录为标签名。 示
部署服务 评估模板应用后,就可以部署模板应用至文字识别开发套件中,开发属于自己的文字识别应用,此应用用于识别自己所上传的模板样式的图片。 前提条件 已在文字识别套件控制台选择“通用单模板工作流”新建应用,并完成评估模板步骤,详情请见评估应用。 操作步骤 在“应用开发>部署”页面完
文字识别套件 文字识别套件使用简介 使用单模板工作流开发应用 使用多模板工作流开发应用
文字识别套件 行业套件介绍 新建应用 通用单模板工作流 多模板分类工作流 调用API和SDK 查看应用详情 删除应用
中。 单击“SKU单品图”右侧的“上传图片”,在本地选择图片,可选择多个图片。 说明: 文件放置方式请按照“单品文件夹/单品图”或者“父文件夹/单品文件夹/单品图”的组织方式,选择单品文件夹或者父文件夹,平台将自动生成单品。 每个单品的图片必须大于20张。 一次上传文件大小不能超过10M。
”等分别作为一个蛋糕的种类。零售商品识别工作流可以识别出单张图片中的多个商品。 数据集要求 文件名规范,不能有中文,不能有+、空格、制表符。 保证图片质量:不能有损坏的图片;目前支持的格式包括JPG、JPEG、PNG、BMP。 为了保证模型的预测准确度,训练样本跟真实使用场景尽量相似。
取。 图6 修改代码文件(修改前) 图7 修改代码文件(修改后) 调用自定义OCR SDK。 在示例代码“img_path”中输入需要识别的图片,并执行代码。 API调用 本章节以postman为例介绍如何调用API,建议使用SDK。 使用API调用时,因为需要使用Token进行
部署服务 评估模型后,就可以部署服务,开发属于自己的零售商品分类应用,此应用用于识别自己所上传的商品图片,也可以直接调用对应的API和SDK识别。 前提条件 已在视觉套件控制台选择“零售商品识别工作流”新建应用,并评估模型,详情请见评估模型。 由于部署服务涉及ModelArts功能,需消耗资源,要确保账户未欠费。
模型,并将生成的模型部署为在线服务。部署完成后,用户可通过在线服务识别出图片中的所有蛋糕以及图片中每个蛋糕的类别,也可以直接调用API和SDK识别。 首先,请仔细阅读罗列的要求,提前完成准备工作。使用零售商品识别工作流开发应用的步骤如下所示: 步骤1:准备数据 步骤2:新建应用 步骤3:选择数据
通用单模板工作流 工作流介绍 上传模板图片 定义预处理 框选参照字段 框选识别区 评估应用 部署服务 自定义字段类型 编辑应用 删除应用 父主题: 文字识别套件
多模板分类工作流 工作流介绍 上传模板图片 定义预处理 框选参照字段 框选识别区 训练分类器 评估应用 部署服务 编辑应用 自定义字段类型 删除应用 父主题: 文字识别套件
Pro控制台查看应用详情,包括应用开发的配置信息和应用资产。 前提条件 已在文字识别套件控制台选择预置工作流新建应用,详情请见新建应用。 进入应用详情页 登录ModelArts Pro管理控制台,单击“文字识别”套件卡片的“进入套件”。 进入文字识别套件控制台。 在左侧导航栏选择“应用开发>工作台”。 默认进入“我的应用”页签。
取值为最后识别结果。 例如: “字段类型名称”:“城市” “字段属性”:“自定义字典” “取值范围”:“Shenzhen”、“Beijing”、“Xi'an” 在识别“字段类型”为“城市”的文字时,从“Shenzhen”、“Beijing”、“Xi'an”中找出与待识别文字最相似的取值,作为识别结果。
删除应用 如果已创建的应用不再使用,您可以删除应用释放资源。 操作步骤 登录ModelArts Pro管理控制台,单击“文字识别”套件卡片的“进入套件”。 进入文字识别套件控制台。 在左侧导航栏选择“应用开发>工作台”。 默认进入“我的应用”页签。 在“我的应用”页签下,选择已创建的应用,单击操作列的“删除”。
图2 模板列表 进入“应用开发”页面,您可以依次修改“上传模板图片”、“定义预处理”、“框选参照字段”、“框选识别区”、“评估”步骤的信息,重新部署模板。操作指引如下: 上传模板图片 定义预处理 框选参照字段 框选识别区 评估应用 部署服务 父主题: 通用单模板工作流
编辑模板 进入“应用开发”页面,您可以依次修改“上传模板图片”、“定义预处理”、“框选参照字段”、“框选识别区”、“训练分类器”、“评估”步骤的信息,重新部署模板。操作指引如下: 上传模板图片 定义预处理 框选参照字段 框选识别区 训练分类器 评估应用 部署服务 父主题: 多模板分类工作流
至OBS服务中。 设计车牌标签 首先需要考虑好车牌的标签类型,即希望识别出图片中车牌的一种结果。例如“plate”。 数据集要求 文件名规范,不能有中文,不能有+、空格、制表符。 保证图片质量:不能有损坏的图片;目前支持的格式包括JPG、JPEG、PNG、BMP。 不要把明显不同的多个任务数据放在同一个数据集内。
帐号为IAM用户授予文字识别服务(Optical Character Recognition,简称OCR)操作权限权,详细操作请见给IAM用户授权。 操作步骤 在ModelArts Pro控制台界面,单击“文字识别”套件卡片的“进入套件”。 进入文字识别套件控制台。 图1 进入套件
首先使用的数据需要考虑好分类的标签类型,即希望识别出图片中的一种结果。例如对天气现象图片进行分类时,标签可以以“snow”(雪)、“rainy”(雨)等作为分类的类别。 数据集要求 文件名规范,不能有中文,不能含有空格、制表符及除中划线下划线外的特殊符号。 保证图片质量:不能有损坏的图片;目前支持的格式包括JPG、JPEG、PNG、BMP。