检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
本地调用 本章节以通用表格识别为例,介绍如何使用OCR Python SDK在本地进行开发。 该接口可以识别表格图片中的文字内容,并将识别结果以JSON格式返回给用户。返回结果包含两类:纯文本区(text)和表格区(table),并返回表格结构(row, column)和文本信息。
删除应用 如果已创建的模板应用不再使用,您可以删除模板释放资源。 操作步骤 登录“文字识别>自定义OCR”控制台。 默认进入“应用开发>工作台”页面。 在“我的应用”页签下,选择应用并单击“操作”列的“查看”。 进入“应用资产”页面。 图1 进入应用资产 在“分类器列表”页签,选择多模板名称,单击操作列的“删除”。
删除应用 如果已创建的模板应用不再使用,您可以删除模板释放资源。 操作步骤 登录“文字识别>自定义OCR”控制台。 默认进入“应用开发>工作台”页面。 在“我的应用”页签下,选择应用并单击“操作”列的“查看”。 进入“应用资产”页面。 图1 进入应用资产 在“模板列表”页签,选择模板名称,单击操作列的“删除”。
忘记AK和SK,该如何查找 每个访问密钥仅能下载一次,为了账号安全性,建议您定期更换并妥善保存访问密钥。 如果您的访问密钥AK/SK已丢失,建议您先创建新的访问密钥AK/SK,并使用新的访问密钥AK/SK替换正在使用的应用程序等的访问密钥AK/SK之后,确认无其他业务影响,再将丢失的访问密
企业项目管理 应用场景简介 创建企业项目 企业项目财务管理
权限管理 权限管理 创建用户组与IAM用户 为IAM用户分配权限 IAM用户登录并验证权限 OCR自定义策略
自定义OCR 自定义OCR介绍 创建应用 通用单模板工作流 多模板分类工作流 字段类型 查看应用详情 常见问题
含此识别区的字段,且位置固定不变,因此模型可以通过识别区找到需要识别内容的位置。 前提条件 已在自定义OCR控制台选择“多模板分类工作流”创建应用,并框选参照字段,详情请见框选参照字段。 操作步骤 图1 多模板框选识别区 在“应用开发>框选参照字段”页面上方或者“选择模板”下拉框中选择模板,对每个模板图片进行预处理。
是保留图片的关键内容,去掉冗余部分,保持图片内容清晰可见,保证模型识别的准确性。 前提条件 已在自定义OCR控制台选择“多模板分类工作流”创建应用,并上传模板图片,详情请见上传模板图片。 定义预处理 在“应用开发>定义预处理”页面上方或者“选择模板”下拉框中选择模板,对每个模板图片进行预处理。
什么情况下可以使用自定义模板? 如何选取参照字段? 识别结果容易漏字或多识别出内容怎么办? 识别字符出现错误如何优化? 自定义模板OCR取消开通后,是否会将之前创建好的模板删除? 父主题: 自定义OCR
是保留图片的关键内容,去掉冗余部分,保持图片内容清晰可见,保证模型识别的准确性。 前提条件 已在自定义OCR控制台选择“通用单模板工作流”创建应用,并上传模板图片,详情请见上传模板图片。 定义预处理 在“应用开发>定义预处理”页面,您可以选择“预处理”逻辑快速处理图片,也可以按左上角操作指标调整图片。
get_trans(doc, page, min_side=0, max_side=0, rotate=0.0): """ 创建scale对象 """ region = doc[page].rect scale = 1
式的发票图片作为模板,配置文字识别模型就能识别并提取同格式发票上的关键字段。 前提条件 已在“自定义OCR”控制台选择“通用单模板工作流”创建应用,详情请见6.2新建应用。 提前准备待识别的图片,图片要求请见图片要求。 图片要求 保证图片质量:不能有损坏的图片;目前支持的格式包括JPG、JPEG、PNG、BMP。
Python SDK 本章节介绍新版Python SDK,您可以参考本章节进行快速集成开发。 准备工作 注册华为账号并开通华为云,并完成实名认证,账号不能处于欠费或冻结状态。 已具备开发环境,支持Python3及以上版本。 登录“我的凭证 > 访问密钥”页面,依据界面操作指引获取Access
当返回状态码为2xx(如200/201)时,表示调用成功并进行扣费。 OCR服务通过套餐包计费方式,来降低调用成本,从绝大部分客户的使用来看,客户上传错误样本导致计费的占比非常非常小,几乎可忽略不计。 在客户使用OCR能力,进行二次开发时,可以尽可能的通过页面可视化提醒等方式,引
支持图像任意角度的水平旋转。 目前不支持复杂背景(如户外自然场景、防伪水印等)和文字扭曲图像的文字识别。 数据传入方式 使用OCR API或SDK时,数据主要通过以下两种方法传入。 image 传入图片的base64编码。 您可以通过在线转码工具,浏览器,使用Python中的base64
试框选更多参照字段(框选办法参照框选参照字段),如果新增参照字段后仍有问题,请检查识别图片与模板图片是否为同一个版式,如果为新版式,请考虑创建新模板或使用多模板分类工作流。 情形3:多模板识别工作流出错,大部分字段为空或错误。 解决办法:先检查分类结果是否正确(返回结果中的tem
如果您需要调用对象存储服务(OBS)中的数据,请在开通服务页面进行服务授权。 图2 OBS服务授权 OCR服务开通后,可在控制台进行关闭。开通服务时,计费规则默认为“按需计费”。只有调用成功才会计费,其中返回的2xx状态码表示调用成功,调用失败不计费,详细的计费价格及规则请参见计费说明。
欠费说明 用户在使用云服务时,账户的可用额度小于待结算的账单,即被判定为账户欠费。欠费后,可能会影响云服务资源的正常运行,请及时充值。 欠费原因 用户购买服务套餐包的区域与实际调用区域不一致。 免费试用区域与实际调用区域不一致。 购买的服务与实际调用的服务类型不一致。 购买的套餐
Interface,应用程序编程接口)的方式提供给用户,用户通过实时访问和调用API获取推理结果,帮助用户自动采集关键数据,打造智能化业务系统,提升业务效率。调用API时,需要用户网络可以访问公网。 您可以使用本文档提供文字识别服务API的描述、语法、参数说明及样例等内容,进行相关操作,例如文字识别包含的通用