检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
识别表格图片中的文字内容,并将识别的结果以JSON格式返回给用户。返回结果将图片区域(words_region)划分为两类:纯文本区(text)和表格区(table),并返回表格结构(row, column)和文本信息。该接口的使用限制请参见约束与限制,详细使用指导请参见OCR服务使用简介章节。 图1 通用表格示例图
build() endpoint是华为云各服务应用区域和各服务的终端节点,详情请查看 地区和终端节点 。 发送请求并查看响应 # 以调用通用表格识别接口 RecognizeGeneralTable 为例 request = RecognizeGeneralTableRequest() request
OBS提供的url,使用OBS数据需要进行授权。包括对服务授权、临时授权、匿名公开授权,详情参见配置OBS访问权限。 说明: 接口响应时间依赖于图片的下载时间,如果图片下载时间过长,会返回接口调用失败。 请保证被检测图片所在的存储服务稳定可靠,推荐使用OBS服务存储图片数据。 url中不能存在中文字符,若存在,中文需要进行utf8编码。
本章节以通用表格识别为例,介绍如何使用OCR Python SDK在本地进行开发。 该接口可以识别表格图片中的文字内容,并将识别结果以JSON格式返回给用户。返回结果包含两类:纯文本区(text)和表格区(table),并返回表格结构(row, column)和文本信息。 前提条件 注册华为账号并开通华为云,并完成
”中找出与待识别文字最相似的取值,作为识别结果。 自定义正则提取 预过滤 对初始的待识别文字进行预处理。 左边输入框填写待识别文字中被替换字符的正则表达式。 右边输入框填写所替换的新字符。 不填写时,默认不做预处理。 如果需要多次预处理,可单击,填写新增的预处理规则。 例如: “字段类型名称”:“出生日期”
OBS提供的url,使用OBS数据需要进行授权。包括对服务授权、临时授权、匿名公开授权,详情参见配置OBS访问权限。 说明: 接口响应时间依赖于图片的下载时间,如果图片下载时间过长,会返回接口调用失败。 请保证被检测图片所在的存储服务稳定可靠,推荐使用OBS服务存储图片数据。 url中不能存在中文字符,若存在,中文需要进行utf8编码。
FinancialStatementWordsRegionList 参数 参数类型 描述 type String 区域属性:文本或表格。 words_block_count Float 检测到的文字块数目。对文本区,文字块以文本字段为单位;对表格区,文字块以单元格内所有字段为单位。 table_location A
OCR服务可以识别文本格式文件吗 增值税发票识别API支持使用pdf、ofd文件进行识别。其他API不能直接识别word、pdf、excel等文件,可将此类文件转换为图片进行识别。pdf转图片识别示例请参见识别结果后处理。 父主题: 产品咨询类
OCR输入数据,包括图像(PNG、JPG 、JPEG和 BMP等)和文档(PDF 和 TIFF等)。 OCR结果,包括从客户图像和文档中提取的文本及其位置以及置信度等。 OCR通过多种数据保护手段和特性,保障客户在使用OCR服务时数据安全。 表1 OCR的数据保护手段和特性 数据保护手段
将图片、扫描件或PDF、OFD文档中的打印字符进行检测识别成可编辑的文本格式,以JSON格式返回识别结果。 OCR以开放API(Application Programming Interface,应用程序编程接口)的方式提供给用户,用户使用Python、Java等编程语言调用OC
“上传图片”:单击“上传图片”区域,或鼠标直接拖拽图片至“上传图片”区域,上传本地一张图片作为模板,用于业务场景的文字结构化识别。 “修改模板名称”:单击图片右侧的,在弹出的输入框中输入新的模板名称,单击“确认”。 “删除模板”:单击图片右侧“删除”,在弹出的确认删除对话框中单击“确认”。 “语种”:单击图片右侧“语
OBS提供的url,使用OBS数据需要进行授权。包括对服务授权、临时授权、匿名公开授权,详情参见配置OBS访问权限。 说明: 接口响应时间依赖于图片的下载时间,如果图片下载时间过长,会返回接口调用失败。 请保证被检测图片所在的存储服务稳定可靠,推荐使用OBS服务存储图片数据。 url中不能存在中文字符,若存在,中文需要进行utf8编码。
支持对图片中的所有表格文字信息进行识别和提取,可识别常规表格及合并单元格表格中的中英文和部分繁体字。能够返回文本块坐标及单元格坐标信息,方便用户进行版式的二次处理以及提高人工校验效率。 该接口可应用于信息登记表识别场景,对个人信息、商品信息、公示内容等纸质信息登记表进行识别,快速实现表格内
"vaccination_status" : "x 2已接种新冠疫苗", "pcr_test_result" : "", "pcr_test_organization" : "", "pcr_test_time" : "", "pcr_sampling_time" :
Explorer中修改接口参数,即可自动生成对应的代码示例。同时,可在集成开发环境CloudIDE中完成代码的构建、调试、运行等操作。 图1 API Explorer 与API的对应关系 文字识别接口与API对应关系请参见表2。 表2 接口与API对应关系表 接口 API 智能文档解析
您可以使用本文档提供文字识别服务API的描述、语法、参数说明及样例等内容,进行相关操作,例如文字识别包含的通用类、证件类和票据类等具体接口使用说明。不同区域所部署的接口不同,详情请参见终端节点;接口所支持的全部操作请参见2 API概览。 在调用文字识别API之前,请确保已经充分了解文字识别相关概念。 OC
字段对应。 调用网络图片API成功后,在“JSON返回结果”中,可见result字段,该字段包含了图片中的文字块数目、文字块排列顺序、具体文本内容、所在位置、置信度等信息。 result字段仅在API调用成功后返回。 words_block_count表示文字块识别结果,本示例中
Recognition,简称OCR)指将图片、扫描件或PDF、OFD文档中的打印字符进行检测识别成可编辑的文本格式。 OCR以开放API(Application Programming Interface,应用程序编程接口)的方式提供给用户,用户使用Python、Java等编程语言调用OCR服务API将
参数类型 描述 name String 姓名。 sampling_time String 核酸检测采样时间。 test_time String 核酸检测结果更新时间。 test_result String 核酸检测结果,可选值包括: "positive",阳性 "negative",阴性
错误码 调用接口出错后,将不会返回结果数据。调用方可根据每个接口对应的错误码来定位错误原因。当调用出错时,HTTPS请求返回一个 4xx 或 5xx 的 HTTPS状态码。返回的消息体中是具体的错误代码及错误信息。在调用方找不到错误原因时,可以联系华为云客服技术支持,并提供错误码,以便尽快帮您解决问题。