文字语音识别教程,免费OCR试用
华为云文字识别产品列表
华为云文字识别产品列表
-
通用类OCR(General OCR):
●通用类OCR支持表格、文档、网络图片、健康码、核酸检测记录等任意格式图片上文字信息的自动化识别,自适应分析各种版面和表格,快速实现各种文档电子化
-
证件类OCR(Card OCR):
●证件类OCR支持身份证、驾驶证、行驶证、护照等证件图片上有效信息的自动识别和关键字段结构化提取
-
票据类OCR(Receipt OCR):
●票据类OCR支持增值税发票、机动车销售发票、火车票、出租车发票等各种发票以及发票验真,支持图片及PDF、OFD文档上有效信息的自动识别和结构化提取。
-
行业类文字识别(Domain OCR):
●行业类文字识别支持物流面单、医疗化验单据等多种行业特定类型图片的结构化信息提取和识别,助力行业自动化效率提升
-
文字识别功能与试用:
●文字识别(Optical Character Recognition,OCR)是指对图像文件的打印字符进行检测识别,将图像中的文字转换成可编辑的文本格式。OCR通过API提供服务能力,用户需要通过编程来处理识别结果。
●在开通OCR前,请先使用OCR体验馆体验服务功能。该方式无需编程,只需在网页端上传图片,即可体验识别效果。
●开通OCR后,默认按API调用次数进行收费。API使用指导请参见使用流程简介。
文字语音识别使用必看文档
-
文字识别(Optical Character Recognition,简称OCR)是指将图片、扫描件或PDF、OFD文档中的打印字符进行检测识别成可编辑的文本格式,以JSON格式返回识别结果。
文字识别(Optical Character Recognition,简称OCR)是指将图片、扫描件或PDF、OFD文档中的打印字符进行检测识别成可编辑的文本格式,以JSON格式返回识别结果。
-
通用表格识别:提取表格内的文字和所在行列位置信息,适应不同格式的表格。同时也识别表格外部的文字区域。用于各种单据和报表的电子化,恢复结构化信息。
通用表格识别提取表格内的文字和所在行列位置信息,适应不同格式的表格。同时也识别表格外部的文字区域。用于各种单据和报表的电子化,恢复结构化信息。
-
智能分类识别服务可以一次性对同张图片中的多个卡证、票据识别,并返回每个卡证、票据的类别及结构化数据。智能分类识别服务应用在身份认证、财务报销等多种场景。
智能分类识别服务可以一次性对同张图片中的多个卡证、票据识别,并返回每个卡证、票据的类别及结构化数据。智能分类识别服务应用在身份认证、财务报销等多种场景。
-
自动识别身份证上的全部信息,支持身份证正反面识别,一次扫描即可识别身份证号码、姓名、地址等信息,在暗光、倾斜、过曝光、阴影等异常条件下均可准确识别身份证信息。
自动识别身份证上的全部信息,支持身份证正反面识别,一次扫描即可识别身份证号码、姓名、地址等信息,在暗光、倾斜、过曝光、阴影等异常条件下均可准确识别身份证信息。
-
通过对增值税发票图片预处理、表格提取、文字提取、文字识别、结构化信息输出等一系列技术化手段,快速将增值税发票上的文字信息识别出来,节省大量的人工录入成本。
通过对增值税发票图片预处理、表格提取、文字提取、文字识别、结构化信息输出等一系列技术化手段,快速将增值税发票上的文字信息识别出来,节省大量的人工录入成本。
-
文字识别提供两种计费模式:按需计费,套餐包计费。按需计费:默认计费方式,指按照API调用次数收费,按次进行结算。套餐包计费:相比“按需计费”具有更大折扣。
文字识别提供两种计费模式:按需计费,套餐包计费。按需计费:默认计费方式,指按照API调用次数收费,按次进行结算。套餐包计费:相比“按需计费”具有更大折扣。
-
语音交互服务是一种人机交互方式,用户通过实时访问和调用API获取语音交互结果。例如用户通过语音识别功能,将口述音频或者语音文件识别成可编辑的文本
语音交互服务是一种人机交互方式,用户通过实时访问和调用API获取语音交互结果。例如用户通过语音识别功能,将口述音频或者语音文件识别成可编辑的文本
-
实时语音识别服务,用户通过实时访问和调用API获取实时语音识别结果,支持的语言包含中文普通话、方言,方言当前支持四川话、粤语和上海话。
实时语音识别服务,用户通过实时访问和调用API获取实时语音识别结果,支持的语言包含中文普通话、方言,方言当前支持四川话、粤语和上海话。
-
如果您是业务开发者,没有代码编写基础,您可以使用该方式体验语音交互服务的一句话识别和语音合成功能。该方式只能用于体验,不能用于开发。
如果您是业务开发者,没有代码编写基础,您可以使用该方式体验语音交互服务的一句话识别和语音合成功能。该方式只能用于体验,不能用于开发。
文字语音识别操作指导教程
文字识别 OCR使用API
文字识别OCR使用SDK