检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
成长地图 | 华为云 医疗智能体 医疗智能体(EIHealth)基于华为云AI和大数据技术优势,为基因组分析、药物研发、临床研究三个领域提供专业AI研发平台。
智能分类 功能介绍 智能分类识别服务可以一次性对同张图片中的多个卡证、票据进行检测和识别,并返回每个卡证、票据的类别及结构化数据。 应用场景 智能分类识别服务应用在身份认证、财务报销等多种场景,使用方便,有效提升数据录入效率。
银行卡 - 智能分类服务只对识别成功的票证进行计费,识别失败的票证不计费。
医疗:化验单、报告单、药品说明书等。 物流海关:货运单、配送单等。 其他:成绩单、商超小票、支付凭证、账单等。 优势 简单智能 无需训练直接调用,自动输出结构化信息,简单高效。 多版式 不受版式数量影响,支持多版式卡证、票据,适用场景广泛。
智能文档解析 功能介绍 对证件、票据、表单等多版式文档进行文字识别、版面分析、键值对提取以及表格识别等任务,并以json格式返回识别的结构化结果。 约束与限制 支持中英文及部分中文繁体字。
什么是医疗智能体 医疗智能体(EIHealth)平台是基于华为云AI和大数据技术优势,为基因组分析、药物研发和临床研究三个领域提供的专业AI研发平台。平台提供大量相关模型、算法及数据资源,是一站式的医疗研发平台。
欢迎使用医疗智能体服务 医疗智能体(EIHealth)平台是基于华为云AI和大数据技术优势,为基因组分析、药物研发和临床研究三个领域提供的专业AI研发平台。
票据类 OCR 票据类OCR(Receipt OCR),支持增值税发票、机动车销售发票、医疗发票等各种发票和表单图片上有效信息的自动识别和结构化提取。
医疗保险 自动识别医疗单据药品明细、年龄、性别等关键字段并录入系统,结合身份证、银行卡OCR,快速完成保险理赔业务。 父主题: 功能介绍
该接口的应用场景广泛,可应用于远程身份认证、政务审批、个税办理、医疗挂号、电信开户、酒店入住办理等场景,降低人工录入成本,提升业务效率。
如果图片中包含多张卡证票据,请调用智能分类识别服务。 约束与限制 只支持识别PNG、JPG、JPEG、BMP、TIFF格式的图片。 图像各边的像素大小在15到8192px之间。 支持图像中不动产证任意角度的水平旋转。 能处理反光、暗光等干扰的图片但影响识别精度。
图1 驾驶证示例图 图2 电子驾驶证示例图 如果图片中包含多张卡证票据,请调用智能分类识别服务。 约束与限制 只支持中国大陆驾驶证纸质版本及交管12123提供的电子驾驶证版本识别。 只支持识别PNG、JPG、JPEG、BMP、TIFF格式图片。
OCR是否支持事业单位和社会团体营业执照识别 OCR服务无事业单位和社会团体营业执照识别单独的API,建议使用智能文档解析API调试。 父主题: 产品咨询类
推荐您根据自己的业务情况使用智能文档解析产品,详细介绍可查看智能文档解析。
图1 车辆通行费发票示例图 如果图片中包含多张卡证票据,请调用智能分类识别服务。 约束与限制 支持识别PNG、JPG、JPEG、BMP、TIFF格式的图片。 图像各边的像素大小在15px到4096px之间。 图像中发票区域有效占比超过25%。
图1 行驶证示例图 如果图片中包含多张卡证票据,请调用智能分类识别服务。 约束与限制 只支持中国大陆行驶证的识别。 只支持识别PNG、JPG、JPEG、BMP、TIFF格式图片。 图像各边的像素大小在100px到8192px之间。
图1 出租车发票示例图 如果图片中包含多张卡证票据,请调用智能分类识别服务。 约束与限制 只支持识别PNG、JPG、JPEG、BMP、TIFF格式的图片。 图像各边的像素大小在15px到4096px之间。 图像中发票区域有效占比超过25%,保证整张发票内容及其边缘包含在图像内。
图1 火车票示例图 如果图片中包含多张卡证票据,请调用智能分类识别服务。 约束与限制 只支持识别PNG、JPG、JPEG、BMP、TIFF格式图片。 图像各边的像素大小在15px到8192px之间。 图像中火车票区域有效占比超过25%。 支持图像中火车票任意角度的水平旋转。
表1 接口说明 类别 API 说明 智能文档解析 智能文档解析 对证件、票据、表单等任意版式文档进行键值对提取、文字识别、以及表格识别等任务,实现进阶高效的自动化结构化返回。 通用类 通用表格识别 识别表格图片上的文字内容,并返回识别的结构化结果。
配置OBS访问权限 EI企业智能服务对于图片、语音等多媒体文件支持直接使用OBS服务的数据处理方式,以减少服务使用成本,降低服务的响应时长,提升服务使用的体验。 考虑到数据的安全,当对服务进行授权后,才可以使用授权方式的URL(https://<bucket-name>.
图1 为IAM用户开通智能分类识别 图2 开通状态 原因分析 上述操作是主账号或被授予所有权限(OCR FullAccess)的IAM子账号(用户1)为某个IAM(用户2)用户单独开通智能分类识别,并不是为当前账号开通服务,所以当前界面的开通状态不会变。
如何选购合适的API 文字识别服务(OCR)提供四种类型的API:通用类、证件类、票据类、智能分类。 除此之外,您也可以使用ModelArts Pro服务提供的“文字识别套件”零代码搭建出专属的文字识别系统。 通用类 通用表格识别:提取表格内的文字和所在行列位置信息。
选择对应的服务(如:“智能分类识别”),单击“查看监控数据”,进入云监控控制台查看服务调用成功和失败的次数等具体信息。 父主题: API使用类