检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
训练分类器 确定模板图片的参照字段和识别区后,多模板分类工作流在模板数量较多,或版式相似度较高的情况下,建议针对不同的模板上传对应的训练集数据,用于训练模板分类模型,使服务能够精准地分类多个模板图片,然后对多个模板图片进行文字识别和结构化提取。 前提条件 已在文字识别套件控制台选择“
部署服务 评估模板应用后,就可以部署多模板应用至文字识别开发套件中,开发属于自己的文字识别应用,此应用用于识别自己所上传的图片属于哪种模板以及识别图片中的文字。 前提条件 已在文字识别套件控制台选择“多模板分类工作流”新建应用,并完成评估模板步骤,详情请见评估应用。 操作步骤 在
通用单模板工作流 工作流介绍 上传模板图片 定义预处理 框选参照字段 框选识别区 评估应用 部署服务 自定义字段类型 编辑应用 删除应用 父主题: 文字识别套件
多模板分类工作流 工作流介绍 上传模板图片 定义预处理 框选参照字段 框选识别区 训练分类器 评估应用 部署服务 编辑应用 自定义字段类型 删除应用 父主题: 文字识别套件
在使用多模板工作流开发应用之前,需要上传模板图片,明确以哪些图片作为模板训练文字识别模型。 上传模板图片 定义预处理 上传模板图片后,需要对模板图片进行预处理,保留图片的关键内容,去掉冗余部分,保持图片内容清晰可见,保证模型识别的准确性。 定义预处理 框选参照字段 在图片模板中框选参照字段,用于矫正图片的方向,进
删除应用 如果已创建的模板应用不再使用,您可以删除模板释放资源。 操作步骤 登录“ModelArts Pro>文字识别套件”控制台。 默认进入“应用开发>工作台”页面。 在“我的应用”页签下,选择应用并单击“操作”列的“查看”。 进入“应用资产”页面。 图1 进入应用资产 在“模
删除应用 如果已创建的模板应用不再使用,您可以删除模板释放资源。 操作步骤 登录“ModelArts Pro>文字识别套件”控制台。 默认进入“应用开发>工作台”页面。 在“我的应用”页签下,选择应用并单击“操作”列的“查看”。 进入“应用资产”页面。 图1 进入应用资产 在“模
使用通用单模板工作流上传模板图片后,需要对模板图片进行预处理,通过旋转、裁剪、降噪等操作。图片预处理的目的是保留图片的关键内容,去掉冗余部分,保持图片内容清晰可见,保证模型识别的准确性。 前提条件 已在文字识别套件控制台选择“通用单模板工作流”新建应用,并上传模板图片,详情请见上传模板图片。 定义预处理
使用多模板分类工作流上传模板图片后,需要对模板图片进行预处理,通过旋转、裁剪、降噪等操作。图片预处理的目的是保留图片的关键内容,去掉冗余部分,保持图片内容清晰可见,保证模型识别的准确性。 前提条件 已在文字识别套件控制台选择“多模板分类工作流”新建应用,并上传模板图片,详情请见上传模板图片。 定义预处理
图2 模板列表 进入“应用开发”页面,您可以依次修改“上传模板图片”、“定义预处理”、“框选参照字段”、“框选识别区”、“评估”步骤的信息,重新部署模板。操作指引如下: 上传模板图片 定义预处理 框选参照字段 框选识别区 评估应用 部署服务 父主题: 通用单模板工作流
编辑模板 进入“应用开发”页面,您可以依次修改“上传模板图片”、“定义预处理”、“框选参照字段”、“框选识别区”、“训练分类器”、“评估”步骤的信息,重新部署模板。操作指引如下: 上传模板图片 定义预处理 框选参照字段 框选识别区 训练分类器 评估应用 部署服务 父主题: 多模板分类工作流
部署服务 评估模板应用后,就可以部署模板应用至文字识别开发套件中,开发属于自己的文字识别应用,此应用用于识别自己所上传的模板样式的图片。 前提条件 已在文字识别套件控制台选择“通用单模板工作流”新建应用,并完成评估模板步骤,详情请见评估应用。 操作步骤 在“应用开发>部署”页面完
option["template_id"]="xxx" template_id的值可以在自定义OCR部署发布后获取。 图6 修改代码文件(修改前) 图7 修改代码文件(修改后) 调用自定义OCR SDK。 在示例代码“img_path”中输入需要识别的图片,并执行代码。 API调用 本章节以postman为例介绍如何调用API,建议使用SDK。
取值为最后识别结果。 例如: “字段类型名称”:“城市” “字段属性”:“自定义字典” “取值范围”:“Shenzhen”、“Beijing”、“Xi'an” 在识别“字段类型”为“城市”的文字时,从“Shenzhen”、“Beijing”、“Xi'an”中找出与待识别文字最相似的取值,作为识别结果。
调用文字识别套件API,报错ModelArts.4204服务未开通怎么办? 问题现象 子账号在使用自定义OCR(ModelArts Pro文字识别套件)生成的api时,出现如下报错。表示用户,没有OCR权限或没有开通ModelArts Pro服务。 "ModelArts.4204"、"Request
目前ModelArts Pro开放了文字识别套件、自然语言处理套件、视觉套件和HiLens套件,其中,文字识别套件、自然语言处理套件和视觉套件已商用,HiLens条件处于公测阶段。各个套件的计费项和计费模式如下: 文字识别套件 自然语言处理套件 视觉套件 HiLens套件 文字识别套件 计费项 按API调用次数按需计费。
目前ModelArts Pro开放了文字识别套件、自然语言处理套件、视觉套件和HiLens套件,其中,文字识别套件、自然语言处理套件和视觉套件已商用,HiLens条件处于公测阶段。各个套件的计费项和计费模式如下: 文字识别套件 自然语言处理套件 视觉套件 HiLens套件 文字识别套件 计费项 按API调用次数按需计费。
建议使用矩形标注框标注图片。如果标注框坐标超过图片,将无法识别该图片为已标注图片。 物体检测的标注文件需要满足PASCAL VOC格式。 更多详情请见准备数据。 云状识别工作流 文件名规范,不能有中文,不能有+、空格、制表符。 保证图片质量,不能有损坏的图片。目前支持的格式包括JPG、JPEG、PNG、BMP。
当前ModelArts Pro开放的预置套件有文字识别套件、自然语言处理套件和视觉套件。 应用场景 特定行业下希望解决特定问题的场景。 文字识别套件 用户认证识别 识别证件中关键信息,节省人工录入,提升效率,降低用户实名认证成本,准确快速便捷。 快递单自动填写 识别图片中联系人信息并自动填写快递单,减少人工输入。
申请行业套件 目前ModelArts Pro已开通自然语言处理套件、视觉套件、文字识别套件、HiLens套件,其中文字识别套件和自然语言处理套件已商用,可直接进入套件使用,视觉套件和HiLens处于公测阶段,首次使用套件需要申请套件开通公测权限。 申请套件 针对处于公测阶段的套件,需要申请套件开通公测权限。