语音交互服务清单及功能对比

活动规则

活动对象:华为云电销客户及渠道伙伴客户可参与消费满送活动,其他客户参与前请咨询客户经理

活动时间: 2020年8月12日-2020年9月11日

活动期间,华为云用户通过活动页面购买云服务,或使用上云礼包优惠券在华为云官网新购云服务,累计新购实付付费金额达到一定额度,可兑换相应的实物礼品。活动优惠券可在本活动页面中“上云礼包”等方式获取,在华为云官网直接购买(未使用年中云钜惠活动优惠券)或参与其他活动的订单付费金额不计入统计范围内;

活动对象:华为云电销客户及渠道伙伴客户可参与消费满送活动,其他客户参与前请咨询客户经理

活动对象:华为云电销客户及渠道伙伴客户可参与消费满送活动,其他客户参与前请咨询客户经理

活动时间: 2020年8月12日-2020年9月11日

活动期间,华为云用户通过活动页面购买云服务,或使用上云礼包优惠券在华为云官网新购云服务,累计新购实付付费金额达到一定额度,可兑换相应的实物礼品。活动优惠券可在本活动页面中“上云礼包”等方式获取,在华为云官网直接购买(未使用年中云钜惠活动优惠券)或参与其他活动的订单付费金额不计入统计范围内;

活动对象:华为云电销客户及渠道伙伴客户可参与消费满送活动,其他客户参与前请咨询客户经理

活动对象:华为云电销客户及渠道伙伴客户可参与消费满送活动,其他客户参与前请咨询客户经理

活动时间: 2020年8月12日-2020年9月11日

活动期间,华为云用户通过活动页面购买云服务,或使用上云礼包优惠券在华为云官网新购云服务,累计新购实付付费金额达到一定额度,可兑换相应的实物礼品。活动优惠券可在本活动页面中“上云礼包”等方式获取,在华为云官网直接购买(未使用年中云钜惠活动优惠券)或参与其他活动的订单付费金额不计入统计范围内;

活动对象:华为云电销客户及渠道伙伴客户可参与消费满送活动,其他客户参与前请咨询客户经理

服务

时效性

功能

适用场景

支持语言

实时语音识别

实时

可将不限时长的音频流实时识别为文字,识别结果自动断句,标记每句话的开始和结束时间。

直播实时字幕、现场会议实时记录、演讲实时转写等。

中文普通话,带方言口音的普通话和方言(四川话、粤语和上海话)。

一句话识别

实时

可以实现1分钟以内音频到文字的转换。

语音消息转文字、语音搜索、人机交互等场景。

中文普通话,带方言口音的普通话和方言(四川话、粤语和上海话)。

录音文件识别

非实时

可以将音频文件(5小时以内)转换成文本。支持多种音频格式。

呼叫中心语音质检、会议语音资料转写等场景。

中文普通话。

语音合成

实时

将文本信息实时转化为近似的真人发声,多语言多音色语音在线合成。支持客户的个性化语音定制化需求。

适用于智能客服、有声阅读、语音导航等场景。

中文普通话。

语音交互服务的典型应用场景

直播实时字幕

将视频直播或现场直播中的音频实时转为字幕,为观众提供更高效的观会体验。同时支持即时输出结果,并可根据上下文语言模型自动校正,方便对内容进行监控

会议实时记录

将视频或电话会议中的音频实时转为文字,可实时校核、修改及检索转写会议内容,提高会议效率

语音搜索

搜索内容直接以语音的方式输入,让搜索更加高效。支持各种场景下的语音搜索,比如地图导航、网页搜索等

人机交互

通过语音唤醒、语音识别服务,对终端设备发送语音命令,对设备进行实时操作,提升人机交互体验

游戏娱乐边玩边聊

将游戏娱乐中的语音聊天转成文字消息,一边游戏一边实时聊天,提升用户阅读效率和交互体验

语音客服质检

识别客服、客户的语音,将语音转换为文本。进一步通过文本检索,检查有没有违规、敏感词、电话号码等信息

有声读物

将书籍、杂志、新闻的文本内容转换成逼真的人声发音,充分解放人们的眼睛,在搭乘地铁、开车、健身等场景下获取信息、享受乐趣

智能客服

在客服系统场景中,通过语音合成服务将客服回访内容转换成人声,直接使用语音和客户交流,提升用户体验,节省人工成本

华为云语音交互产品的特色优势

  • 识别准确率高

    采用最新一代语音识别技术,基于DNN(深层神经网络)技术,大大提高了抗噪性能,使识别准确率显著提升

    采用最新一代语音识别技术,基于DNN(深层神经网络)技术,大大提高了抗噪性能,使识别准确率显著提升

  • 识别速度快

    把语言模型,词典和声学模型统一集成为一个大的神经网络,同时在工程上进行了大量的优化,大幅提升解码速度,使识别速度在业内处领先地位

    把语言模型,词典和声学模型统一集成为一个大的神经网络,同时在工程上进行了大量的优化,大幅提升解码速度,使识别速度在业内处领先地位

  • 多种识别模式

    支持多种实时语音转写模式,如流式一句话、连续和单句模式,灵活适应不同应用场景

    支持多种实时语音转写模式,如流式一句话、连续和单句模式,灵活适应不同应用场景

  • 支持热词

    针对专业词汇,支持上传至热词表,增加专业词汇的识别准确率

    针对专业词汇,支持上传至热词表,增加专业词汇的识别准确率

  • 定制化服务

    可定制特定垂直领域的语言层模型,识别更多专有词汇和行业术语,进一步提高识别准确率

    可定制特定垂直领域的语言层模型,识别更多专有词汇和行业术语,进一步提高识别准确率

  • 前沿技术

    使用工业界成熟的算法,结合学术界最新研究成果,为企业提供独特竞争力优势

    使用工业界成熟的算法,结合学术界最新研究成果,为企业提供独特竞争力优势

即刻体验华为云语音交互服务

只需几步,即可创建您的首个语音识别实例。 

如您对语音交互服务有疑问,请联系我们,技术专家将为您提供专业解决方案

获取方案