检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
未实名认证
已实名认证
一句话识别服务可以实现1分钟以内音频到文字的转换。对于用户上传的二进制音频格式数据,系统经过处理,生成语音对应的文字,支持的语言包含中文普通话、方言。产品优势• 高识别率:基于深度学习技术,对特定领域场景的语音识别进行优化,识别率达到业界领先。• 前沿技术:使用工业界成熟的算法,结合学术界最新研究成果,为企业提供独特竞争力优势。• 支持热词:针对专业词汇,支持上传至热词表,增加专业词汇的识别准确率。• 可定制化:针对客户的特定场景需求,定制垂直领域的语音识别模型,识别效果更精确。
一句话识别服务可以实现1分钟以内音频到文字的转换。对于用户上传的二进制音频格式数据,系统经过处理,生成语音对应的文字,支持的语言包含中文普通话、方言。
产品优势
• 高识别率:基于深度学习技术,对特定领域场景的语音识别进行优化,识别率达到业界领先。
• 前沿技术:使用工业界成熟的算法,结合学术界最新研究成果,为企业提供独特竞争力优势。
• 支持热词:针对专业词汇,支持上传至热词表,增加专业词汇的识别准确率。
• 可定制化:针对客户的特定场景需求,定制垂直领域的语音识别模型,识别效果更精确。
效果出众
使用深度学习技术,语音识别准确率高,在业界具有一定的技术优势
稳定可靠
成功应用于各类场景,基于华为等企业客户的长期实践,经受过复杂场景考验
简单易用
提供RESTful规范API接口,并提供服务SDK,方便客户使用与集成;帮助客户减少人力成本,节省业务支出
语音识别
实时将语音转换成文字,一次性上传整个音频,能快速返回识别结果。
语言支持
支持中文普通话、带方言口音的普通话以及方言,方言当前支持四川话、粤语和上海话识别。
多语音格式支持
支持11种输入语音格式,包含ulaw、alaw、pcm、mpx、wav等
识别准备 响应高效
通过语音发送或者接收短消息时,将音频消息转文字,提升阅读效率和交互体验
搜索内容直接以语音的方式输入,让搜索更加高效。支持各种场景下的语音搜索,比如地图导航、网页搜索等
将游戏娱乐中的语音聊天转成文字消息,提升用户阅读效率和交互体验
▶ 录音文件识别、语音合成支持中文普通话。
▶ 一句话识别和实时语音识别支持中文普通话,带方言口音的普通话和方言(四川话、粤语和上海话)。
暂时不支持离线使用。
语音服务收费是按照调用接口的次数或者时长来计算费用,详细收费明细请参见价格计算器。
▶支持两种计费方式:
(1)按需计费,默认计费方式为“按需计费”。
(2)折扣套餐包方式,是用户可以购买套餐包,扣费时调用次数会先在套餐包内进行抵扣,抵扣完后的剩余调用量默认转回按需计费方式。
▶ 问题现象
调用录音文件识别接口,识别的结果出现两条完全一致的结果。
▶ 解决方案
由于声道设置的原因,单身道的音频按照双声道处理了。
在请求中将参数“channel”的值修改成“MONO”或者直接去掉请求参数中的“channel”项。
▶ 查看套餐包余量
1. 登录控制台。
2. 点击右上角的“资源”按钮,进入资源中心界面。
3. 选择左边菜单的“我的套餐”,选择购买的套餐包,即可查看套餐包使用量。
▶ 查看接口调用量
1.登录控制台。
2.选择左侧导航栏中的“服务监控”。查看API总调用量、调用成功量、调用失败量。
一句话识别和录音文件识别以及实时语音识别均可实现语音转文字,一句话识别支持aac格式,录音文件识别和实时语音识别不支持aac格式。
▶ 问题描述
如何查看当前服务是否免费,属于公测阶段还是商用阶段?
1.登录华为云,单击右上角的“控制台”,进入“管理控制台”界面。
2.在左侧服务列表中选择“EI企业智能 > 语音交互服务”。
3.在语音交互服务主页,单击左侧导航栏子服务名称(如“一句话识别”),查看该服务是否已商用。
• 当服务处于公测阶段,可以免费使用该服务,但是使用前需要先申请公测。
• 当服务处于商用阶段,不需要开通服务,可以直接调用,使用该服务需要付费,计费方式详细请参考语音交互价格计算器。
一句话识别ASR服务本身无权限限制,用户不需要额外添加任何权限,即可对ASR服务执行操作。
但是如下场景除外:
当用户需要使用录音文件识别功能时,需要用户具有主帐号或者Security Administrator的权限。
因为录音文件保存在用户的OBS(Object Storage Service,对象存储服务)桶中。考虑到数据的安全,语音交互服务无法直接获取到用户数据,需要用户授权录音文件引擎读取用户OBS桶权限,只有主帐号或者有Security Administrator权限的子帐号才可以授权。
说明:主帐号:即在使用语音交互服务前注册的帐号,该帐号具有管理员权限,可执行所有操作。
一句话识别ASR服务不支持IAM细粒度划分策略,IAM账号与主账号具备相同的操作权限。
您可以使用IAM的用户管理功能,给员工或应用程序创建IAM用户,可避免分享自己的帐号密码。详细创建步骤请参见创建IAM用户。
不是,只有录音文件识别需要使用OBS服务,语音交互服务对用户存储在OBS的数据,具有只读权限,没有修改和删除的权限。所以用户是否删除上传至OBS服务的数据,需要用户根据自己的obs桶的使用情况或者容量大小确认,并在OBS服务上执行。