检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
需使用的工作流。 在“文字识别”控制台界面,单击左侧菜单“自定义OCR”,进入自定义OCR应用页面。 创建应用 基于已选择的工作流创建应用,填写应用基本信息、选择工作流。 创建应用 开发应用 通用单模板工作流 根据工作流指引,创建单模板服务,通过模板训练文字识别模型,实现单模板图像的文字信息结构化提取。
自定义OCR 自定义OCR介绍 创建应用 通用单模板工作流 多模板分类工作流 字段类型 查看应用详情 常见问题
通用单模板工作流 工作流介绍 上传模板图片 定义预处理 框选参照字段 框选识别区 评估 调用指南 编辑应用 删除应用 父主题: 自定义OCR
多模板分类工作流 工作流介绍 上传模板图片 定义预处理 框选参照字段 框选识别区 模板总览 评估 调用指南 编辑应用 删除应用 父主题: 自定义OCR
“通用单模板工作流”创建应用,详细操作请见6.2 新建应用。您可以创建单模板服务,通过模板配置文字识别模型,实现单模板图像的文字信息结构化提取。 图1 创建单模板流程 表1 创建单模板流程说明 流程 说明 详细指导 上传模板图片 在使用单模板工作流开发应用之前,需要上传模板图片,
模板分类工作流”创建应用,详细操作请见创建应用。您可以创建多模板服务,通过多模板训练模板分类模型和文字识别模型,实现多模板图像的文字信息结构化提取。 图1 创建多模板流程 表1 创建多模板流程说明 流程 说明 详细指导 上传模板图片 在使用多模板工作流开发应用之前,需要上传模板图
ThailandIdcardRequestBody{ ReturnIdcardType: &returnIdcardTypeThailandIdcardRequestBody, ReturnPortraitLocation: &returnPortraitLocationThailandIdcardRequestBody
double_side:行驶证双页信息 如果参数值为空或无该参数,系统默认识别主页,建议填写,准确率更高。 return_issuing_authority 否 Boolean 是否返回发证机关的开关,可选值包括: true:返回发证机关 false:不返回发证机关 如果无该参数,系统默认不返回发证机关。如果输入参
ntials) \ .with_endpoint(endpoint) \ .build() endpoint是华为云各服务应用区域和各服务的终端节点,详情请查看 地区和终端节点 。 发送请求并查看响应 # 以调用通用表格识别接口 RecognizeGeneralTable
企业项目管理 应用场景简介 创建企业项目 企业项目财务管理
前华为云尚未推出毕业证书识别API,则可以利用自定义模板打造出毕业证书识别接口,提取毕业证上的文字信息。 自定义模板支持识别单模板应用或是多模板应用,单模板仅支持一种版式,多模板支持识别多种版式。 单模板的前提: 识别图片需与模板图片版式相同,具体而言,图片中要存在文字内容和位置均固定不变的文字(参照字段)。
详细步骤请参见操作步骤。 前提条件 已在“自定义OCR控制台”选择“通用单模板工作流”创建应用,并对上传的模板图片进行预处理,详情请见定义预处理。 操作步骤 图1 框选参照字段 在“应用开发>框选参照字段”页面,通过单击左上方操作图标,调整模板图片到合适大小。 单击框选操作图标
通用表格识别是否支持导出为excel格式 通用表格识别支持将表格内容转换成可编辑的Excel格式,传入参数return_excel为true时,将返回的表格转换为Microsoft Excel对应的base64编码,可用Python函数 base64.b64decode解码后保存为
发票号码、入口、出口、收费金额、收费员、车辆类型、日期、时间等主要信息。 发票验真 提供10种增值税发票的信息核验并返回票面的全部信息,可应用于发票核验及费控报销场景。 机动车销售发票 自动识别机动车销售发票和二手车销售发票图片内的文本内容,并自动分辨两种类型返回结构化字段信息,
详细步骤请参见操作步骤。 前提条件 已在自定义OCR控制台选择“多模板分类工作流”创建应用,并对上传的模板图片进行预处理,详情请见定义预处理。 操作步骤 图1 多模板框选参照字段 在“应用开发>框选参照字段”页面上方或者“选择模板”下拉框中选择模板,对每个模板图片进行预处理。
&detectReproduceIdCardRequestBody, ReturnTextLocation: &returnTextLocationIdCardRequestBody, ReturnVerification: &returnVerificationIdCardRequestBody
信息的文档图像进行键值对提取、表格识别与版面分析并返回相关信息。不限制版式情况,可支持多种证件、票据和规范行业文档,适用于各类行业场景。 应用场景 金融:银行回单、转账存单、理财信息截图等。 政务:身份证、结婚证、居住证、各类企业资质证照。 医疗:化验单、报告单、药品说明书等。 物流海关:货运单、配送单等。
作。 印章识别 检测和识别合同文件或常用票据中的印章,并可擦除和提取图片中的印章,通过JSON格式返回印章检测、识别、擦除和提取的结果。 应用场景 纸质文件电子化 自动识别结构化信息与提取签名盖章区域,有助快速审核。 快递单自动填写 识别图片中联系人信息并自动填写快递单,减少人工输入。
preRotate(rotate) return trans def page2pix(self, doc, page, trans): """ 根据给定的参数,解析当前页作为图片数据 """ return doc[page].getPixmap(matrix=trans
save_root = save_root @staticmethod def open_pdf(file): return fitz.open(file) @staticmethod def get_trans(doc, page, min_side=0