检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
您也可以使用在线的图片转base64工具。 使用时,需要将代码的d:\demo.jpg替换为实际图片路径。
产品介绍 在线体验 图说ECS 立即使用 成长地图 由浅入深,带您玩转OCR 01 了解 了解华为云文字识别服务的产品介绍、应用场景、使用限制,有助于更好的使用文字识别服务。
您可以通过在线体验,体验接口的识别效果。 对于固定板式的图片,如果当前接口不满足您的业务需求,可以使用ModelArts Pro服务提供的文字识别套件,零代码搭建出专属的API,详细操作请参见视频指导。
图1 创建多模板流程 表1 创建多模板流程说明 流程 说明 详细指导 上传模板图片 在使用多模板工作流开发应用之前,需要上传模板图片,明确以哪些图片作为模板训练文字识别模型。
图1 APIE在线调试 父主题: 如何调用API
调用API或SDK 在线调试 本地调用
后续操作 根据所选的预置工作流开发应用。 通用单模板工作流 多模板分类工作流 父主题: 自定义OCR
本地调用 本章节以通用表格识别为例,介绍如何使用OCR Python SDK在本地进行开发。 该接口可以识别表格图片中的文字内容,并将识别结果以JSON格式返回给用户。
在客户使用OCR能力,进行二次开发时,可以尽可能的通过页面可视化提醒等方式,引导使用者尽量拍摄符合人眼易于识别的图片,以保障数据质量、同时提升识别准确率。
在“应用开发>模板总览”页面,选择“模板”,单击操作列的“删除”,弹出“确认删除”对话框,单击“确认”,删除模板。 父主题: 多模板分类工作流
您也可以单击“应用开发”,切换至“应用开发”页面,查看应用开发配置。 图1 进入应用资产 查看应用资产 在“应用资产”页面下,可以查看当前应用的资产信息。 使用预置工作流开发应用,“应用资产”可查看“模板列表”和“自定义字段类型”。
进入应用开发页面 登录“文字识别>自定义OCR”控制台。 默认进入“应用开发>工作台”页面。 在“我的应用”页签下,选择应用并单击“操作”列的“查看”。 进入“应用资产”页面。 图1 进入应用资产 单击“创建分类器”。 进入“应用开发”页面,开始开发应用。
在“应用开发>框选识别区”页面单击框选操作图标,单击待识别文字的左上角,移动鼠标框选识别区。 在右侧“框选识别区”中的“字段类型”下拉框中,单击“创建新字段类型”。 弹出“创建字段类型”对话框。 填写字段类型信息。
进入应用开发页面 进入“文字识别控制台>自定义OCR”页面。 默认进入“应用开发>工作台”页面。 在“我的应用”页签下,选择应用并单击“操作”列的“查看”。 进入“应用资产”页面。 单击“创建模板”。 进入“应用开发”页面,开始开发应用。
操作步骤 图1 框选识别区 在“应用开发>框选识别区”页面,通过单击左上方操作图标,调整模板图片到合适大小。 单击框选操作图标,单击待识别文字的左上角,移动鼠标框选识别区,使得矩形框覆盖待识别的文字。 框选识别区应尽量扩大识别区范围,使所框选识别区覆盖字段值可能出现的区域。
定义预处理 在“应用开发>定义预处理”页面上方或者“选择模板”下拉框中选择模板,对每个模板图片进行预处理。 图1 多模板定义预处理 在右侧“选择预处理逻辑”区域勾选对应操作,当前仅支持“自动旋转”操作,系统自动旋转文字方向不正确的图片,保持图片中的文字方向正确。
操作步骤 图1 多模板框选识别区 在“应用开发>框选参照字段”页面上方或者“选择模板”下拉框中选择模板,对每个模板图片进行预处理。 单击左上方操作图标,调整当前模板图片到合适大小。 单击框选操作图标,单击待识别文字的左上角,移动鼠标框选识别区,使得矩形框覆盖待识别的文字。
定义预处理 在“应用开发>定义预处理”页面,您可以选择“预处理”逻辑快速处理图片,也可以按左上角操作指标调整图片。 图1 定义预处理 右侧“选择预处理逻辑”区域勾选对应操作,当前仅支持“自动旋转”操作,系统自动旋转文字方向不正确的图片,保持图片中的文字方向水平。
您可以通过在线转码工具,浏览器,使用Python中的base64.b64encode函数等方法,获取图片的base64编码。 url 传入图片的url路径。
图1 使用预置工作流开发应用 表1 使用工作流开发应用流程 流程 说明 详细指导 自定义OCR 根据您的实际使用需求选择自定义OCR。您可以通过查看产品文档选择所需使用的工作流。 在“文字识别”控制台界面,单击左侧菜单“自定义OCR”,进入自定义OCR应用页面。