检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
进行检测和识别,并返回每个卡证、票据的类别及结构化数据。 应用场景 智能分类识别服务应用在身份认证、财务报销等多种场景,使用方便,有效提升数据录入效率。 场景一:卡证、发票混合识别 场景二:相同类型发票识别 场景三:不同类型发票识别 识别类型 卡证类 目前支持的卡证类包含:身份证
填写字段类型信息。 图1 创建字段类型 “字段类型名称”:填写待创建的字段类型名称,如识别身份证照片,可新增字段类型“出生日期”。 “字段属性”:选择字段属性,可选择“自定义正则提取”和“自定义字典”,然后按表1填写相关信息。 表1 字段属性参数说明 字段属性 参数 参数说明 举例
默认字段类型 当前可选择的默认字段类型包括“日期”、“小写金额”、“大写金额”、“数字”、“数字和英文”、“编号”、“性别”。选择特定的字段类型后,将会按照指定的字段类型对字符串处理后再输出。比如,未激活任何字段类型时的输出为“发证日期:2021年09月12日”,为了精准提取日期
AutoClassificationResult 参数 参数类型 描述 status status object 指示各对应票证的识别状态。 content Object 对应票证具体结构化识别的结果。具体每个票证类别的响应参数请参考各API接口文档。 说明: 车船票识别响应参数 通用机打发票识别响应参数 网约车行程单识别响应参数
字段类型 在“框选识别区”页面,可以给每个字段指定字段类型来提高识别准确率,或是将文字识别结果处理成业务需要的格式。勾选字段类型后,后台会对文字识别结果进行相应的处理后再输出。每个识别区可选择多个字段类型,多个字段类型会按照勾选顺序执行。自定义OCR控制台提供了默认字段类型和自定义字段类型两种功能。
回对应PDF页的结果。 响应参数 根据识别的结果,可能有不同的HTTP响应状态码(status code)。例如,200表示API调用成功,400表示调用失败,详细的状态码和响应参数说明如下。 状态码: 200 表4 响应Body参数 参数 参数类型 描述 result VatInvoiceResult
如何修改返回结果的response类型 使用使用python调用OCR API获取response中的具体内容时,如果需要对返回结果的response类型进行修改。可以使用 to_dict()、to_str() 进行格式转换,to_dict()是转换为json格式,to_str()
资源。 区域(Region):从地理位置和网络时延维度划分,同一个Region内共享弹性计算、块存储、对象存储、VPC网络、弹性公网IP、镜像等公共服务。Region分为通用Region和专属Region,通用Region指面向公共租户提供通用云服务的Region;专属Regio
不同区域是否有时延 区域(Region):从地理位置和网络时延维度划分,同一个Region内共享弹性计算、块存储、对象存储、VPC网络、弹性公网IP、镜像等公共服务。 一般情况下,建议就近选择靠近您或者您的目标用户的区域,这样可以减少网络时延,提高访问速度。 不过,在基础设施、BGP网络品质
"error_code":"APIG.0106",表示需要检查API配置的前后端参数是否合理。 API的前端参数配置了校验规则,调用时没有满足,则会产生此报错。 您可以尝试以下解决方法: 检查参数的必填项是否填写完整。 检查参数规则是否正确,例如参数值必须填写为数字等。 父主题: 错误码类
OCR支持通过企业项目管理(EPS)对不同用户组和用户的资源使用进行分账。 详情请参考API接口文档里的Enterprise-Project-Id参数。 父主题: 计费FAQ
不同的错误情形需要具体分析: 情形1:大部分文字识别正确,部分形近符号的识别错误。 解决办法:产品提供了预置字段类型可以对结果进行处理,同时也提供了自定义(正则)类型、字典类型,用于纠正识别结果中的错误,适用范围详见字段类型。此外,您也可以在调用程序中使用字符串替换、正则抽取等规则来修正识别结果。 情形2:
document-recognizer 表1 路径参数 参数 是否必选 参数类型 描述 project_id 是 String 项目ID,您可以从获取项目ID中获取。 请求参数 表2 请求Header参数 参数 是否必选 参数类型 描述 X-Auth-Token 是 String
储、对象存储、VPC网络、弹性公网IP、镜像等公共服务。一般情况下,建议就近选择靠近您或者您的目标用户的区域,这样可以减少网络时延,提高访问速度。对于OCR服务,不同的区域之间资源包不互通,请根据您的实际需求慎重选择。 表1 接口说明 类别 API 说明 智能文档解析 智能文档解析
通用表格识别是否支持导出为excel格式 通用表格识别支持将表格内容转换成可编辑的Excel格式,传入参数return_excel为true时,将返回的表格转换为Microsoft Excel对应的base64编码,可用Python函数 base64.b64decode解码后保存为
0104图像质量差。 响应参数 根据识别的结果,可能有不同的HTTP响应状态码(status code)。例如,200表示API调用成功,400表示调用失败,详细的状态码和响应参数说明如下。 状态码: 200 表4 响应Body参数 参数 参数类型 描述 result MvsInvoiceResult
信息。 区域(Region) 从地理位置和网络时延维度划分,同一个Region内共享弹性计算、块存储、对象存储、VPC网络、弹性公网IP、镜像等公共服务。Region分为通用Region和专属Region,通用Region指面向公共租户提供通用云服务的Region;专属Regio
url中不能存在中文字符,若存在,中文需要进行utf8编码。 响应参数 根据识别的结果,可能有不同的HTTP响应状态码(status code)。例如,200表示API调用成功,400表示调用失败,详细的状态码和响应参数说明如下。 状态码: 200 表4 响应Body参数 参数 参数类型 描述 result Array
在使用单模板工作流开发应用之前,必须确保需要识别的图片都属于同一类型的模板。同一类模板的图片,它们有相同的版面排布,且要识别的文字类型和位置均要求固定。如果您的图片具有多种模板,请考虑使用“多模板工作流”。 确认模板类型后,要准备一张文字清晰的图作为模板图片,模板图中要包含业务需要
P、GIF、TIFF、WEBP、PCX、ICO、PSD格式的图片以及PDF文档,PDF只支持单页识别,可通过pdf_page_number参数指定页码。 图像各边的像素大小在15px到8192px之间。 图像中识别区域有效占比超过80%,保证所有文字及其边缘包含在图像内。 支持图像任意角度的水平旋转。