检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
如何收费 语音服务收费是按照调用接口的次数或者时长来计算费用,详细收费明细请参见价格计算器。 支持两种计费方式: 按需计费,默认计费方式为“按需计费”。 折扣套餐包方式,是用户可以购买套餐包,扣费时调用次数会先在套餐包内进行抵扣,抵扣完后的剩余调用量默认转回按需计费方式。 父主题:
严重错误响应 功能介绍 严重错误,通常指流程无法继续的情况。出现严重错误响应时,流程不再继续,服务器端会主动断连。 响应消息 表1 响应参数 名称 参数类型 说明 resp_type String 响应类型。参数值为FATAL_ERROR,表示此次合成发生不可恢复的错误。 trace_id
本章节提供了通过Java SDK调用一句话识别服务的样例,帮助用户快速了解如何使用Java SDK调用华为云SIS服务。具体操作如下所示: 步骤1:配置环境 步骤2:修改配置信息 步骤3:调用一句话识别 准备工作 注册华为帐号并开通华为云,并完成实名认证,帐号不能处于欠费或冻结状态。
如何申请公测 当前语音交互服务在中国区已全部商用,不需要申请,直接可以调用,调用会收费,计费方式详细请参考语音交互价格计算器。调用的详细操作请参考使用实时语音识别 。 登录华为云,单击右上角的“控制台”,进入“管理控制台”界面。 在左侧服务列表中选择“EI企业智能 > 语音交互服务”。
结束识别请求响应 服务器端收到“结束识别”请求时或语音识别过程中发生错误,服务端会向客户端推送如下响应消息,以json字符串形式放置在text message中。 响应消息 表1 响应参数 参数名 参数类型 说明 resp_type String 响应类型。参数值为END,表示结束识别响应。
严重错误响应 严重错误,通常指流程无法继续的情况。比如当出现客户端分片音频间隔超时(例如20s)。 出现严重错误响应时,流程不再继续,服务器端会主动断连。 响应消息 表1 响应参数 参数名 参数类型 说明 resp_type String 响应类型。参数值为FATAL_ERROR,表示开始识别响应。
calc ak sk signature fail:signature expired报错 调用API时,出现Incorrect IAM authentication information: calc ak sk signature fail:signature expired报错。表示的是AK、SK凭证过期。
调用语音交互的API显示auth failed 问题现象 校验失败服务端通常是使用不正确的Token进行访问,可能产生的原因有多种。 解决方案 检查用户账号是否正常。 当用户账号存在未实名认证、未充值或者属于冻结状态。您可登录账号,在用户检查是否实名认证,是否有余额(以上信息在用户Console均可以查到)。
计费项 一句话识别、语音合成按调用次数计费;实时语音识别、录音文件识别按音频时长计费;录音文件识别极速版按照“音频时长×需要识别的音频声道数“计费,时长计算精确到秒。 按音频时长计费的,累加每次调用的音频时长。 按调用次数计费的,返回失败的调用不计入次数。 调用热词接口,不单独计费。 计费模式
事件响应 服务器端检测到某些事件时,会给出如下响应消息,以json字符串形式放置在text message中。 响应消息 表1 响应参数 参数名 参数类型 说明 resp_type String 响应类型。参数值为EVENT,表示开始识别响应。 trace_id String 服
Service ,简称SIS)。 语音交互服务(Speech Interaction Service,简称SIS)是一种人机交互方式,用户通过实时访问和调用API获取语音交互结果。支持用户通过语音识别功能,将口述音频、普通话或者带有一定方言的语音文件识别成可编辑的文本,同时也支持通过语音合成功
使用SIS服务,无需显性执行开通操作,注册华为账号并开通华为云后,账户未欠费,即可调用SIS服务,调用成功后即认为已开通调用接口。此时计费方式为按需计费,不使用不计费。若用户从未调用过SIS服务接口,账户欠费则会被拦截,无法调用。 您也可以在控制台购买套餐包,套餐包费用为一次性支付,支付成功后即
result 是 SASRResult 调用成功表示识别结果,调用失败时无此字段。请参考表5。 表5 SASRResult 参数名 是否必选 参数类型 说明 text 是 String 调用成功表示识别出的内容。 score 是 Float 调用成功表示识别出的置信度,取值范围:0~1。
只要建立连接成功,发送音频,服务开始识别,则本次调用计费生效。如果用户发送错误end请求或者持续20s未发送音频而产生了报错,该次调用依然认为生效。如果连接成功后未发送音频直接断开,或者请求字段不正确而产生异常,则认为本次调用无效,不会纳入计费次数。 图1 客户端和服务端交互流程
在某些错误情况下可能没有此令牌字符串。 result 是 Object 调用成功表示识别结果,调用失败时无此字段。请参考表5。 表5 Result 参数名 是否必选 参数类型 说明 text 是 String 调用成功表示识别出的内容。 score 是 Float 调用成功表示识别出的置信度,取值范围:0~1。
尽量避免配置单音节的英文单词,避免误召回,如:MAY/TEE等。 调用热词表 一句话识别、录音文件识别、实时语音识别API均支持调用热词表,调用时,需传vocabulary_id参数(热词id)。 热词id可以通过控制台,或调用查询热词表信息接口获取。 图2 热词id 热词3.0 热词3
如何调用REST API 构造请求 认证鉴权 返回结果
如何调用WebSocket API 前提条件 在调用实时语音识别的Websocket接口之前,您需要完成Token认证,详细操作指导请参见认证鉴权。 接口使用介绍 实时语音识别接口使用Websocket协议承载,客户端与服务端交流流程如图1所示。 分为三个主要步骤: WebSocket握手。
音人,每100字计一次。精品发音人每50字计一次。 响应参数 Python SDK响应结果为byte数组,保存合成音频数据。详见代码示例。调用失败处理方法请参见错误码。 代码示例 如下示例仅供参考,最新代码请前往SDK(websocket)章节获取并运行。 # -*- coding:
响应Body参数 参数 参数类型 描述 error_code String 调用失败时的错误码。 调用成功时无此字段。 error_msg String 调用失败时的错误信息。 调用成功时无此字段。 请求示例 “endpoint”即调用API的请求地址,不同服务不同区域的“endpoint”不同,具体请参见终端节点。