检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
者通过委托授权获取。 初始化客户端(二选一) 指定region方式(推荐) // 增加region依赖 import com.huaweicloud.sdk.ocr.v1.region.OcrRegion; // 初始化客户端认证信息,使用当前客户端初始化方式可不填 projectId/domainId
格转换为Microsoft Excel对应的base64编码,可用Python函数 base64.b64decode解码后保存为.xlsx文件。 父主题: 产品咨询类
企业项目ID。OCR支持通过企业项目管理(EPS)对不同用户组和用户的资源使用,进行分账。 获取方法:进入“企业项目管理”页面,单击企业项目名称,在企业项目详情页获取Enterprise-Project-Id(企业项目ID)。 企业项目创建步骤请参见用户指南。 说明: 创建企业项目后,在传参时,有以下三类场景。
删除应用 如果已创建的模板应用不再使用,您可以删除模板释放资源。 操作步骤 登录“文字识别>自定义OCR”控制台。 默认进入“应用开发>工作台”页面。 在“我的应用”页签下,选择应用并单击“操作”列的“查看”。 进入“应用资产”页面。 图1 进入应用资产 在“分类器列表”页签,选择多模板名称,单击操作列的“删除”。
企业项目ID。OCR支持通过企业项目管理(EPS)对不同用户组和用户的资源使用,进行分账。 获取方法:进入“企业项目管理”页面,单击企业项目名称,在企业项目详情页获取Enterprise-Project-Id(企业项目ID)。 企业项目创建步骤请参见用户指南。 说明: 创建企业项目后,在传参时,有以下三类场景。
删除应用 如果已创建的模板应用不再使用,您可以删除模板释放资源。 操作步骤 登录“文字识别>自定义OCR”控制台。 默认进入“应用开发>工作台”页面。 在“我的应用”页签下,选择应用并单击“操作”列的“查看”。 进入“应用资产”页面。 图1 进入应用资产 在“模板列表”页签,选择模板名称,单击操作列的“删除”。
默认字段类型 当前可选择的默认字段类型包括“日期”、“小写金额”、“大写金额”、“数字”、“数字和英文”、“编号”、“性别”。选择特定的字段类型后,将会按照指定的字段类型对字符串处理后再输出。比如,未激活任何字段类型时的输出为“发证日期:2021年09月12日”,为了精准提取日期
“日”/“” 在识别字段类型为出生日期的文字“2020年1月1日出生”时,首先不做预过滤,然后提取关键字符“2020年1月1日”,最后做后处理,最终提取内容为“2020.1.1”。 提取 对经过“预处理”的文字进行关键字符提取。 在输入框中填写查找关键字符的正则表达式。 不填写时,默认提取全部字段。
V1版本APIs切换至V2版指导 华为云文字识别OCR服务计划于2023/03/30 00:00下线退市V1版本APIs接口服务。届时V1版本的OCR接口将不可用,此次接口版本的升级涉及文字识别OCR服务所有的API接口,如能未及时进行版本切换,则无法使用产品服务。 接口转换过程
框选识别区 在文字识别过程中,需要确定图片中识别的文字位置,这就需要在图片模板中框选识别区。 识别区指图片中待识别的文字位置。所有需要识别的图片中都会包含此识别区的字段,且位置固定不变,因此模型可以通过识别区找到需要识别内容的位置。 前提条件 已在自定义OCR控制台选择“通用单模
框选识别区 在文字识别过程中,需要确定图片中识别的文字位置,这就需要在图片模板中框选识别区。 识别区指图片中待识别的文字位置。所有需要识别的图片中都会包含此识别区的字段,且位置固定不变,因此模型可以通过识别区找到需要识别内容的位置。 前提条件 已在自定义OCR控制台选择“多模板分
模板总览 预览分类器下面所有模板的状态,如果有模板的识别区未设置,则无法进行后续的评估。 前提条件 已在自定义OCR控制台选择“多模板分类工作流”创建应用,并框选添加的多个模板的识别区,详情请见框选识别区。 删除模板 如果已创建的模板应用不再使用,您可以删除模板释放资源。 在“应
如何选取参照字段? 参照字段是在所有图片中,文字位置和内容均不发生变化的文字。 参照字段有两个作用: 在单模板应用中,用于矫正识别图片,从而找准识别字段; 在多模板应用中,参照字段的内容和位置将作为相应模板的分类特征。 在框选参照字段时,首先要确保所框选的文字位置和内容都固定不变
OCR以开放API(Application Programming Interface,应用程序编程接口)的方式提供给用户,用户使用Python、Java等编程语言调用OCR服务API将图片识别成文字,帮助用户自动采集关键数据,打造智能化业务系统,提升业务效率,API获取详情请参考《API参考》。 OC
Character Recognition,简称OCR)以开放API的方式提供给用户,用户使用Python、Java等编程语言调用OCR服务API将图片、扫描件或PDF、OFD文档中的打印字符识别成可编辑的文本格式,帮助用户自动采集关键数据,打造智能化业务系统,提升业务效率。 产品介绍 在线体验
识别文档中的手写文字信息,并将识别的结构化结果返回给用户。 网络图片识别 自动识别网络图片内的所有文字及其对应位置信息,如果图片包含联系人信息,也支持联系人信息的提取,同时可供进一步的数据挖掘后处理操作。 印章识别 检测和识别合同文件或常用票据中的印章,并可擦除和提取图片中的印章,通
识别字符出现错误如何优化? 不同的错误情形需要具体分析: 情形1:大部分文字识别正确,部分形近符号的识别错误。 解决办法:产品提供了预置字段类型可以对结果进行处理,同时也提供了自定义(正则)类型、字典类型,用于纠正识别结果中的错误,适用范围详见字段类型。此外,您也可以在调用程序中
什么情况下可以使用自定义模板? 自定义模板是一款用于提取卡证、票据和文档图片中自定义区域信息的文字识别产品。当您要识别的证件或票据种类不在华为云OCR API支持之中,并且识别图片的版式固定,则可以使用本产品提取自定义版式、自定义区域的文字信息。比如,目前华为云尚未推出毕业证书识
相关内容。 2018-05-10 新增 银行卡识别服务的demo用例 一维码识别服务的demo用例 二维码识别服务的demo用例 车牌识别服务的demo用例 机动车销售发票识别的demo用例 通用文字识别的demo用例 2017-12-30 第一次正式发布。
自定义模板OCR取消开通后,是否会将之前创建好的模板删除? 自定义模板OCR取消开通后,模板不会被删除,后期如果需要再次使用可以开通后继续使用即可。 父主题: 常见问题