检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
OCR服务能否实时处理视频流中的文字 通用表格识别是否支持导出为excel格式 使用OCR服务是否必须使用华为云存储图片 OCR服务可以识别文本格式文件吗 接口返回时间较长,如何提高响应速度 OCR服务是否支持二维码识别 OCR服务是否支持离线使用 OCR服务一次可以识别多张身份证吗
、投保人与被投保人姓名,性别,出生日期,证件类型、证件号等。可用于保险报销和信息录入场景。 财务报表 识别财报内有线表格、无线表格以及其他文本信息,结合版式分类,科目抽取、公式校验等功能,协助进一步实现财报数据精准分析,可支持资产负债表、利润表和现金流量表。 父主题: 功能介绍
行驶证识别服务支持新能源车牌号码识别。 商用 - 2 通用表格识别功能优化 通用表格识别服务精度优化,新增入参 return_text_location,支持文本和单元格的坐标返回。 商用 - 3 网络图片识别功能优化 网络图片识别服务性能提升1倍。 商用 - 4 价格更新 OCR线上服务降价50%。
月等信息;表格还原指的是对文档中表格区域进行结构化识别并还原表格样式;版面分析指的是定位和识别文档的关键结构化信息,比如标题、页眉、印章、文本区域等等。欢迎前往体验馆免费体验https://console.huaweicloud.com/ocr/?region=cn-north-4#/ocr/sandbox
SealWordsBlockList objects 印章文本块列表。 表7 SealWordsBlockList 参数 参数类型 描述 words String 印章文本块。 words_confidence Float 印章文本块的置信度。 状态码: 400 表8 响应Body参数
月等信息;表格还原指的是对文档中表格区域进行结构化识别并还原表格样式;版面分析指的是定位和识别文档的关键结构化信息,比如标题、页眉、印章、文本区域等等。欢迎前往体验馆免费体验。 智能文档解析的价格? 欢迎前往价格计算器查看。 业务迁移过程发现的识别问题该如何解决? 您可通过客户经
issue_date String 发证日期。 issuing_authority String 发证机关。 text_location Object 文本框在原图位置。输出左上、右上、右下、左下四个点坐标。 当“return_text_location”设置为“true”时才返回。 表7 VehicleLicenseback
修订记录 发布日期 修订说明 2021-08-30 SDK迭代更新,提供Java、Python、Node.js、PHP、C++、Go、.NET版本,历史SDK下线,停止维护。 2021-03-12 新增 PHP SDK C++ SDK CSharp SDK 2020-04-30 修改
识别结果容易漏字或多识别出内容怎么办? 识别结果是根据识别区来进行提取的,识别区的位置和大小均会影响识别结果。 若结果漏字,可能是由于识别区太小导致的,需在相应模板的"框选识别区"页面,把漏字的识别区调大一些。 若多识别出文字,可能是识别区太大,将周边无关的文字也框进来了,需将识别区改小一点。
网络图片识别 功能介绍 识别网络图片中的文字内容,并以JSON格式返回识别的结构化结果。支持横向、竖向、艺术字识别,支持字体分类和长图检测。 该接口的使用限制请参见约束与限制,详细使用指导请参见OCR服务使用简介章节。 图1 网络图片示例图 约束与限制 支持中英文及部分中文繁体字。
words_block_count Integer 该键值对中所包含的文本框数量。 words_block_list Array of SmartDocumentRecognizerKVWordsBlock objects 文本框识别结果列表。 表10 SmartDocumentRecognizerKVWordsBlock
智能分类识别 功能介绍 自动分类识别17+种票证,支持指定票证的结构化识别和印章检测,并以JSON格式返回识别的结构化结果。 接口以列表形式返回图片上要识别票证的位置坐标、结构化识别的内容以及对应的类别。该接口支持的票证类型请见表1,该接口的使用限制请参见约束与限制,详细使用指导请参见OCR服务使用简介章节。
服务韧性 OCR提供三级可靠性架构,通过AZ之间容灾、AZ内实例冗余、实例健康检测等技术方案,保障服务的可靠性。 父主题: 安全
段,该字段包含valid_number、valid_birth和valid_sex的校验信息。 text_location Object 文本框在原图位置。输出左上、右上、右下、左下四个点坐标。 仅return_text_location设置为true时才返回。 portrait_location
如何选取参照字段? 参照字段是在所有图片中,文字位置和内容均不发生变化的文字。 参照字段有两个作用: 在单模板应用中,用于矫正识别图片,从而找准识别字段; 在多模板应用中,参照字段的内容和位置将作为相应模板的分类特征。 在框选参照字段时,首先要确保所框选的文字位置和内容都固定不变
身份证识别可以判断身份证真假么 不支持判断身份证的真假,该服务可以识别身份证图片中的文字内容,并将识别的结果以json格式返回给用户。 父主题: 产品咨询类
return_text_location 否 Boolean 默认为false,如果传参为true,则返回text_location字段表示文本框在原图位置。 page_num 否 Integer 页码,默认为1,返回第一页结果。如果传参不大于PDF页数,则返回对应PDF页的结果。
定义预处理 使用多模板分类工作流上传模板图片后,需要对模板图片进行预处理,通过旋转、裁剪等操作。图片预处理的目的是保留图片的关键内容,去掉冗余部分,保持图片内容清晰可见,保证模型识别的准确性。 前提条件 已在自定义OCR控制台选择“多模板分类工作流”创建应用,并上传模板图片,详情请见上传模板图片。
定义预处理 使用通用单模板工作流上传模板图片后,需要对模板图片进行预处理,通过旋转、裁剪、降噪等操作。图片预处理的目的是保留图片的关键内容,去掉冗余部分,保持图片内容清晰可见,保证模型识别的准确性。 前提条件 已在自定义OCR控制台选择“通用单模板工作流”创建应用,并上传模板图片,详情请见上传模板图片。
如何修改返回结果的response类型 使用使用python调用OCR API获取response中的具体内容时,如果需要对返回结果的response类型进行修改。可以使用 to_dict()、to_str() 进行格式转换,to_dict()是转换为json格式,to_str()