-
通用类ocr
成可编辑的Excel格式 通用文字识别 识别图片上的文字信息,支持扫描文件、电子文档、书籍、票据和表单等多种场景的文字识别 网络图片识别 识别网络图片中的文字信息,支持印刷体、艺术字、竖行文本等文字识别 智能分类识别 检测定位图片上指定要识别的票证的文字信息 手写文字识别 识别图片中的手写文字信息
-
ocr概览页
文字识别 OCR 文字识别 OCR 文字识别(Optical Character Recognition,简称OCR)提供在线文字识别服务,将图片、扫描件或PDF、OFD文档中的文字识别成可编辑的文本。支持通用类识别、证件类识别、票据类识别、行业类识别和智能文档解析,具备高精度、高性能的全文识别和高阶结构化识别能力。
-
证件类 OCR
对银行卡的卡号、有效期、发卡行信息进行结构化识别 道路运输证识别 识别道路运输证首页中的文字信息,并将识别的结构化结果返回给用户 车牌识别 支持车牌号码关键信息识别 名片识别 支持名片关键信息识别 VIN码识别 支持VIN码识别 道路运输从业资格证识别 识别道路运输从业资格证上的关键文字信息,并返回识别的结构化结果
-
票据类 OCR
别、姓名等 定额发票识别 支持对定额发票中的发票代码、发票号码、金额信息、发票地址等信息的结构化识别 车辆通行费发票识别 支持对车辆通行费发票中的关键文字信息的结构化识别 飞机行程单识别 支持对飞机行程单中全字段的信息结构化识别 发票验真 支持9种增值税发票的信息核验,支持返回票面的全部信息
-
录音文件识别
支持全国30+带口音的普通话识别,识别效果好 热词可定制 可快速定制领域模型和热词 流量少 端侧可配置过滤模型,效率高,省流量 会议记录 会议记录 对会议记录的音频文件,进行快速的识别,转化成文字,方便进行会议记录 优势 多种输入源支持 支持单双声道以及采样率8k、16k的语音识别 高效便捷
-
行业类 OCR
行业类(Domain OCR),支持物流电子面单识别、保险单识别、财务报表识别等多种行业特定类型图片的结构化信息提取和识别,助力行业自动化效率提升。 行业类(Domain OCR),支持物流电子面单识别、保险单识别、财务报表识别等多种行业特定类型图片的结构化信息提取和识别,助力行业自动化效率提升。 立即抢购
-
定制模板 OCR
AR发票识别竞赛世界第一 有“OCR领域奥斯卡”之称的ICDAR 2019公布国际票据扫描件文字识别和信息提取(SROIE)大赛结果。华为云与华中科技大学(以下简称“华中大”)组成的智能创新联合实验室团队,在大赛最重要的“发票文本的端到端识别任务”(包含票据文本定位和识别两个关键步骤)中,以96
-
名人识别
含的影视明星及网红人物 立即使用 总览 使用指南 论坛 智能客服 功能描述 明星人物识别 可识别图像中包含的明星人物信息 可识别图像中包含的明星人物信息 网红人物识别 可识别图像中包含的网红人物信息 可识别图像中包含的网红人物信息 产品优势 识别准确 基于华为自研的深度图像识别审核模型,识别准确率高
-
图像识别
包含图像和视频类标签、名人识别、图像主体识别、图像描述、翻拍识别等功能,快速迭代满足多行业场景需要。新上线针对传媒行业的媒资图像标签,准确识别自然图片中数百种场景、上万种通用物体及其属性。 应用场景 场景分析 媒资内容和广告推荐 图库管理 智能相册 场景分析 准确识别图像场景元
-
视频标签
、人物识别、语音识别、文字识别等多维度分析,形成层次化的分类标签。 视频标签(简称VCT),基于深度学习对视频进行场景分类、人物识别、语音识别、文字识别等多维度分析,形成层次化的分类标签。 服务咨询 智能客服 产品优势 识别准确 采用标签排序学习算法与卷积神经网络算法,识别精度高,支持实时识别与检测
-
人证核身 IVS
身份证照片,使用华为云文字识别服务识别证件内容(如姓名、身份证号等),及人脸识别服务确认操作者为证件主人,并对接公安部权威数据库进行实名认证。 人证核身证件版(二要素) 使用用户的姓名和身份证号码二要素进行匹配核验 适用于仅需实名认证身份证信息,无需人像识别的核验场景用户上传本人
-
人证核身 IVS-入门
IVS入门 将用户本人与身份证信息关联起来,应用人脸识别与文字识别等技术,对接权威数据库,支持基于二要素(姓名、身份证)认证或三要素(人脸、姓名、身份证)认证,实现对身份真实性的精准核验 将用户本人与身份证信息关联起来,应用人脸识别与文字识别等技术,对接权威数据库,支持基于二要素(姓名、
-
内容审核-图像
不良场景检测 准确识别抽烟、赌博、手术等容易引人反感的图像 广告检测 可识别图像中的文字广告、二维码、水印等有推广意图的广告图像 应用场景 视频直播 在线商城 网站论坛 视频直播 视频直播 在互动直播场景中,成千上万个房间并发直播,人工审核直播内容几乎不可能。基于图像检测能力,可对
-
内容审核-文本
暴恐场景检测 识别文本中的暴恐血腥、恐怖事件等内容 识别文本中的暴恐血腥、恐怖事件等内容 涉黄低俗检测 识别文本中不合规范的涉黄、低俗内容 识别文本中不合规范的涉黄、低俗内容 辱骂语句检测 识别文本中包含有辱骂内容的垃圾文本 识别文本中包含有辱骂内容的垃圾文本 垃圾广告检测 识别文本中含有推广或者售卖意向的广告内容
-
人脸识别服务FRS
可快速检测图像中是否有人脸,并返回所有人脸位置 可快速检测图像中是否有人脸,并返回所有人脸位置 人脸比对 对比两张图像中的人脸信息,分析面部特征,判断是否为同一人 对比两张图像中的人脸信息,分析面部特征,判断是否为同一人 人脸搜索 搜索图库并返回与输入人脸最相似的N张人脸图像 搜索
-
图像标签
可以识别“风景”、“历史”等概念标签 识别速度快 单张图像识别速度低至0.1秒 建议搭配使用 对象存储服务 OBS 内容和广告推荐 识别图像中的场景或物品,将识别的标签融入推荐系统,实现个性化准确推送 优势 识别准确 有效识别多个标签,识别更准确 概念识别 标签中包含互联网热词 识别速度快 单张图像识别速度低至0
-
一句话识别
各种场景下的语音搜索,比如地图导航、网页搜索等 优势 识别准确 语音识别准确率高 速度快 语音识别效率高,速度快 语音短消息 通过语音发送或者接收短消息时,将音频消息转文字,提升阅读效率和交互体验 优势 识别准确 识别准确率高 游戏娱乐 将游戏娱乐中的语音聊天转成文字消息,提升用户阅读效率和交互体验
-
实时语音识别
文以及数字的混合识别 支持在中文句子识别中可夹带英文字母、数字等,从而实现中、英文以及数字的混合识别 语言支持 支持中文普通话,含带方言口音的普通话、方言(四川话、上海话、粤语)识别 支持中文普通话,含带方言口音的普通话、方言(四川话、上海话、粤语)识别 即时输出识别结果 连续识
-
图引擎服务 GES
析。 依赖识别和变更影响分析 识别IT资产间的依赖关系;当资产发生变更时,帮助您分析变更对周边依赖资产的影响。这有助于降低变更带来的风险并提高整体运维效率。 知识图谱应用 知识图谱应用 基于图引擎服务的知识图谱,融合各种异构异质数据,可以支持更大的规模以及更高的性能 能帮助您 存储海量知识
-
语音合成
帮助客户减少人力成本,节省业务支出 个性化调整 可以根据业务场景的需求自定义的调整发音人的语速、音量和音高,以达到最契合场景的状态 可以根据业务场景的需求自定义的调整发音人的语速、音量和音高,以达到最契合场景的状态 如您对语音交互服务仍有疑问,请点击右侧按钮,技术专家将为您提供专业解决方案→