灵云全智能能力平台(HCS版)-
版本: V10.0 | 交付方式: License |
适用于: Linux | 上架日期: 2022-11-18 02:19:40 |
l 规则质检
l 事件抽取
3.5 图像识别
OCR (Optical Character Recognition,光学字符识别)能力服务,主要提供了对文档以及各种类型证照进行识别的服务。灵云 OCR 技术基于最新的深度学习模型,相比于传统的OCR识别服务,识别率大幅领先,对于模糊、污损、粘连等情况适应性更好。目前模版识别引擎采用了半固定模板区域搜索的模式,对于版式不固定的目标具有更强的鲁棒性,对于遮挡、反光、阴影的容忍度更强,极大降低了因各种外界因素导致识别失败的可能性。支持对各类票据、证件、合同、表单等识别对象进行模板的定制开发,可以实现指定条目文字内容的结构化输出,也可以实现指定条目的各种盖章及手写签字、日期的结构化识别。
灵云OCR服务支持多语种的识别:
中文:包括简繁体汉字
少数民族语言:维语,藏文,彝文,朝文,蒙文
英文,哈萨克文
3.6 机器翻译
MT(Machine Translation,机器翻译)能力服务,主要提供了将一种语言的文本翻译为另一种语言的功能。灵云机器翻译服务,采用深度神经网络算法,翻译效果得到很大提升,中英互译、汉维互译质量已达业内领先。灵云机器翻译服务支持多个语种对之间的翻译,目前包括:
汉语、英语互译
汉语、法语互译
汉语、俄语互译
汉语、日语互译
汉语、韩语互译
汉语、德语互译
汉语、西班牙语互译
汉语、阿拉伯语互译
汉语、维语互译
汉语、藏语互译
3.7声纹辨别能力服务
声纹辨别能力服务(VPR, VoicePrint Recognition)是基于生物特征识别技术(如声纹、指纹、掌纹和虹膜等)的身份校验和鉴别,从而确定说活人是否为本人或集群中的某个人。
VPR 引擎支持不同的使用模式:
文本无关:在这种方式下,用户可以说任意的话来进行注册和识别。由于是任意的,因此要求用来注册和识别的语音相对较长。一般注册需要 30s,识别需要 20s。
文本相关:通常用户说 3 遍固定短语(例如“芝麻开门”),然后识别时也说此固定短语。由于识别范围限制在固定的短语上,因此识别能更加准确。
随机数字串:通常用户说几遍 6-8 位数字串进行注册,在识别时也说 6-8位数字串。由于识别范围限制在数字里面,因此模型可以更加具有针对性,而由于数字串是随机的,又可以在一定程度上避免重放攻击。 在数字串的使用模式下,可以训练针对性的数字模型,区别于在文本无关或文本相关模式下使用的文本模型。