检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
为什么会出现识别结果非常差的情况 问题现象 调用语音识别接口,识别结果同真实结果差别很大,或者服务端报音频格式错误。 解决方案 检查音频采样率是否符合。 对于裸音频,可采用toolsoft Audio player等工具进行试听,通过设置不同的采样率,播放正常的即为音频正常采样率。
在欧洲地区有业务的用户,可以选择“欧洲-巴黎”区域。 云服务之间的关系 如果多个云服务一起搭配使用,需要注意: 不同区域的弹性云服务器、关系型数据库、对象存储服务内网不互通。 不同区域的弹性云服务器不支持跨区域部署在同一负载均衡器下。 资源的价格 不同区域的资源价格可能有差异,请参见华为云服务价格详情。
语音合成 支持“华北-北京四”、“华东-上海一”区域。 当前服务仅支持北京和上海区域,后续会陆续上线其他区域。 华北-北京四,推荐的区域,支持一句话识别、录音文件识别、实时语音识别和语音合成和热词等接口。 华东-上海一,推荐的区域,支持一句话识别、录音文件识别、实时语音识别、语音合成和热词等接口。
状态码: 400 表8 响应Body参数 参数 参数类型 描述 error_code String 调用失败时的错误码。 调用成功时无此字段。 error_msg String 调用失败时的错误信息。 调用成功时无此字段。 请求示例 “endpoint”即调用API的请求地址,不同服务
表1 实时语音识别接口说明 接口类型 说明 实时语音识别接口 华为云提供的Websocket接口,主要用于实时语音识别。音频分片传输,服务器端可以返回中间临时转写结果,在最后返回最终转写结果。 表2 一句话识别接口说明 接口类型 说明 一句话识别 一句话识别接口,用于短语音的同
如何修改发音人 修改代码中property的取值即可,支持的发音人如表1和表2所示。 POST https://{endpoint}/v1/{project_id}/tts Request Header: Content-Type: application/json X-Auth-Token:
from the server报错 调用API时,出现There was a bad response from the server报错。表示无法正常连接到SIS服务。 请先检查您的华为云账号是否已经进行了实名认证。 如果您的网络环境异常也会引发该报错,请确保您的网络连接正常,可以访
调用SIS服务,调用成功后即认为已开通调用接口。此时计费方式为按需计费,不使用不计费。若用户从未调用过SIS服务接口,账户欠费则会被拦截,无法调用。 您也可以在控制台购买套餐包,套餐包费用为一次性支付,支付成功后即刻生效或自定义指定时间生效。套餐包到期、套餐额度使用完,会自动转为按需计费。
所有含英文的热词均需大写,如:Eiffel铁塔(正确示例为:EIFFEL铁塔)。 所有数字均用相应的汉字表示,不能使用阿拉伯数字 ,如:12345服务热线(正确示例为:一二三四五服务热线)。 热词内容仅包含英文和中文,不能包含标点符号、特殊字符,如:。,?.*等。 尽量避免配置单音节的英文单词,避免误召回,如:MAY/TEE等。
SIS.0203 部分热词太长或非法。 请根据错误信息,修改不合法的热词。 SIS.0204 热词表参数名已存在。 请修改热词表名称。 SIS.0205 语言不支持。 请修改热词表语言。 SIS.0206 保存热词失败。 请联系技术支持工程师。 SIS.0207 热词内容损坏。
语音合成能不能支持返回立体音(双声道)格式的音频 语音合成接口当前仅支持单声道,不支持返回立体音(双声道)格式的音频。 父主题: API使用类
续期的套餐包将无法使用,充值后,续期的套餐包可正常使用。 无法开通服务。 热词接口计费说明 热词接口由于不计费,所以一般欠费场景下可以继续调用热词的增删改查接口。 当出现全局冻结,例如公安冻结,违规冻结,大规模欠费导致的全局冻结,此时所有接口均不可用,热词接口也无法使用。 欠费案例
trace_id 是 String 服务内部的令牌,可用于在日志中追溯具体流程,调用失败无此字段。 在某些错误情况下可能没有此令牌字符串。 result 是 Result object 调用成功表示识别结果,调用失败时无此字段。 表8 Result 参数 是否必选 参数类型 描述 text
开始语音合成请求 功能介绍 客户端与语音合成引擎建立Websocket连接后,可以发送开始语音合成请求进行语音合成。如果客户端基于该Websocket连接发送多次合成请求,需在每次请求重新建立websocket连接,一次连接只能处理一次合成请求。 请求消息 表1 参数说明 名称 参数类型
在语音交互服务主页,单击左侧导航栏子服务名称(如“一句话识别”)进入管理控制台。 单击“申请公测”,进行服务公测申请。 审核通过后,若服务无法使用,请注销账户后重新登录,即可开始使用。 如需同时申请多个服务,选择相应服务后,单击“批量申请公测”。 公测审批当前是人工审批,一般需要等待1~2天,如遇节假日顺延。
trace_id可用于在日志中追溯具体流程,调用失败无此字段。 在某些错误情况下可能没有此令牌字符串。 audio_duration 是 Integer 音频时长,单位毫秒。 flash_result 是 Array of FlashResult objects 调用成功表示识别结果,调用失败时无此字段。 表8
volume Integer 否 音量。 取值范围:0~100 默认值:50 响应参数 响应类为RttsDataResponse,详见表5。调用失败处理方法请参见错误码。 表5 RttsDataResponse 参数名 是否必选 参数类型 说明 data 是 Array of Byte
每100字计一次。精品发音人每50字计一次。 响应参数 Python SDK响应结果为byte数组,保存合成音频数据。详见代码示例。调用失败处理方法请参见错误码。 代码示例 如下示例仅供参考,最新代码请前往SDK(websocket)章节获取并运行。 # -*- coding:
选择保存到本地的路径,需要具体到音频文件,如D:/test.wav。 响应参数 Python SDK响应结果为Json格式,详见表4。调用失败处理方法请参见错误码。 表4 响应结果 参数名称 是否必选 参数类型 描述 result 是 Object 调用成功时为合成语音内容,请参考表5。
正确的嵌套应该如下列代码示例所示,错误的嵌套也能获取Token,但无法访问服务。 使用AK/SK方式访问,检查AK和SK是否填写正确。 检查“project_id”是否填写正确。“project_id”可参考获取项目ID。 如果无法确定原因和解决问题,请联系技术服务人员。 auth_data