检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
创建热词响应 参数名称 是否必选 参数类型 描述 vocabulary_id 是 String 调用成功则返回热词表ID。 代码示例 如下示例仅供参考,最新代码请前往SDK(websocket)章节获取并运行。 # -*- coding: utf-8 -*- from huaweicloud_sis
互功能。 如果您是业务开发者,没有代码编写基础,您可以使用该方式体验语音交互服务的一句话识别和语音合成功能。该方式只能用于体验,不能用于开发。 通过可视化工具(如curl、Postman)发送请求调用SIS服务API。 如果您是开发初学者,有代码编写基础,对HTTP请求与编程基础
start_time 否 Integer 起始时间 end_time 否 Integer 结束时间 word 否 String 分词 代码示例 如下示例仅供参考,最新代码请前往SDK(websocket)章节获取并运行。 # -*- coding: utf-8 -*- from huaweicloud_sis
参数类型 说明 data 是 String 合成后生成的语音数据,以Base64编码格式返回。用户如需生成音频,需要将Base64编码解码成byte数组,再保存为wav音频。 示例代码 如下示例仅供参考,最新代码请前往SDK(websocket)章节获取并运行。 /* * Copyright
start_time 否 Integer 起始时间 end_time 否 Integer 结束时间 word 否 String 分词 代码示例 如下示例仅供参考,最新代码请前往SDK(websocket)章节获取并运行。 # -*- coding: utf-8 -*- from huaweicloud_sis
data 否 String 语音数据,以Base64编码格式返回。 用户如需生成音频,需要将Base64编码解码成byte数组,再保存为音频,音频格式同“audio_format”参数设置的值,默认为wav格式。 语音合成代码示例请参考SDK,SDK已对Base64转音频过程进行封装,可以直接获取音频文件。
“endpoint”即调用API的请求地址,不同服务不同区域的“endpoint”不同,具体请参见终端节点。 Python3语言请求代码示例 # -*- coding: utf-8 -*- # 此demo仅供测试使用,强烈建议使用sdk。需提前安装websocket-client
I凭证界面获取。 text 待合成的文本。 path 合成后音频保存路径。 详细接口参数介绍请参见API参考、SDK参考。 图1 代码示例 运行代码示例,获取识别结果。 父主题: 调用API或SDK
start_time 否 Integer 起始时间 end_time 否 Integer 结束时间 word 否 String 分词 示例代码 如下示例仅供参考,最新代码请前往SDK(websocket)章节获取并运行。 import com.huawei.sis.bean.AuthInfo;
“endpoint”即调用API的请求地址,不同服务不同区域的“endpoint”不同,具体请参见终端节点。 Python3语言请求代码示例 # -*- coding: utf-8 -*- # 此demo仅供测试使用,强烈建议使用sdk。需提前安装websocket-client
SIS.0304报错 问题现象 客户端长时间没有发送语音,服务端超过20s没有收到语音,就会报这个错误。 解决方案 1. 检查代码是否存在发送音频后睡眠过多时间。 2. 检查是否发送end请求,是否关闭客户端。超过20s没有发送数据同时也没有断开连接,就会报该错误。在使用完毕后一定要记得断开与服务端连接。
start_time 否 Integer 起始时间 end_time 否 Integer 结束时间 word 否 String 分词 代码示例 如下示例仅供参考,最新代码请前往SDK(websocket)章节获取并运行。 # -*- coding: utf-8 -*- from huaweicloud_sis
start_time 否 Integer 起始时间 end_time 否 Integer 结束时间 word 否 String 分词 示例代码 如下示例仅供参考,最新代码请前往SDK(websocket)章节获取并运行。 import com.huawei.sis.bean.AuthInfo;
aw16k8bit、ulaw8k8bit、alaw16k8bit、alaw8k8bit、WAV(支持pcm/ulaw/alaw/adpcm编码格式)、MP3、M4A、ogg-speex、ogg-opus、AMR等多种格式,详见API参考文档中的“audio_format取值范围”。
调用语音交互的API超时怎么处理(connect timeout) 问题现象 超时通常是由于网络不通造成的,需要对网络环境和代码进行具体分析。 解决方案 检查网络是否正常。 确保网络正常连接互联网,正常访问华为云官网,成功获取Token等。如果使用代理,需要保证代理可用性。 检查url是否存在错误。
录音文件识别支持的音频格式 audioformat取值 说明 auto 自动判断,系统会自动判断并支持WAV(内部支持pcm/ulaw/alaw/adpcm编码格式)、MP3、M4A、ogg-speex、ogg-opus、AMR、wma等格式,相应的文件后缀名为.wav, .mp3, .m4a,
调用语音交互的API超时怎么处理(connect timeout) 为什么服务端返回OBS链接不可用(data url is unreachable) 语音合成的base64编码如何使用 录音文件识别多久可以返回结果 语音合成能不能支持返回立体音(双声道)格式的音频 如何解决“The silence time is
aac格式音频。目前仅支持单通道的音频。 wav 带wav封装头的格式,从封装头中自动确定格式,目前仅支持8k/16k采样率、单通道、pcm, alaw, ulaw三种编码格式。 amr AMR窄带(8k) 压缩录音数据。目前仅支持单通道的音频。 amrwb AMR 宽带(16k) 压缩录音数据。目前仅支持单通道的音频。
message,每个分片建议在50ms~1000ms之间,建议在需要实时反馈的情况下100ms,不需要实时反馈的情况下500ms。实时语音识别代码示例请参考SDK文档。 当前SIS服务对于8k音频的分片大小限制为[160, 32768]字节, 16k音频的分片大小限制为[320, 65536]字节
start_time 否 Integer 起始时间 end_time 否 Integer 结束时间 word 否 String 分词 代码示例 如下示例仅供参考,最新代码请前往SDK(websocket)章节获取并运行。 import com.huawei.sis.bean.SisConfig;