-
实时语音识别 - 语音交互服务 SIS
实时语音识别 前提条件 确保已按照配置Java环境配置完毕。 确保已存在待识别的音频文件。如果需要请在下载的SDK压缩包中获取示例音频。 初始化Client 初始化RasrClient,其参数包括AuthInfo、RasrListener、SisConfig。
-
热词管理 - 语音交互服务 SIS
热词管理 前提条件 确保已按照配置Python环境配置完毕,Python SDK仅支持Python3。 初始化Client 初始化HotWordClient,详见表 HotWordClient初始化参数。
-
一句话识别Websocket接口 - 语音交互服务 SIS
一句话识别Websocket接口 前提条件 确保已按照配置Python环境配置完毕,Python SDK仅支持Python3。 确保已存在待识别的音频文件。如果需要请在下载的SDK压缩包中获取示例音频。 该功能为1.70及以上版本SDK新增功能,使用前请检查并更新SDK版本。
-
开始识别 - 语音交互服务 SIS
通过Websocket协议,客户端发送开始识别请求,用于配置实时语音识别的配置信息。 请求消息 表1 参数说明 参数名 是否必选 参数类型 说明 command 是 String 表示客户端发送开始识别请求,参数值需设置为START。 config 是 Object 配置信息。
-
一句话识别(websocket版) - 语音交互服务 SIS
一句话识别(websocket版) 前提条件 确保已经按照配置好Android开发环境。
-
实时语音识别连续模式 - 语音交互服务 SIS
实时语音识别连续模式 前提条件 确保已经按照配置好Android开发环境。
-
实时语音识别连续模式 - 语音交互服务 SIS
实时语音识别连续模式 前提条件 确保已经按照配置好iOS开发环境。 初始化Client 初始化RASRClient,参数为AuthInfo和RASRConfig。
-
准备环境 - 语音交互服务 SIS
准备环境 配置Java环境 配置Python环境 配置Android 环境 配置CPP环境(Windows) 配置CPP环境(Linux)
-
使用HTML5 Websocket API发送websocket请求如何携带token - 语音交互服务 SIS
Websocket API发送websocket请求如何携带token 浏览器 WebSocket API 是 HTML5 提供的一种在 TCP 连接上进行全双工通讯协议的 API, 但 WebSocket API 不支持设置 Headers,如需设置 Headers, 建议通过 Nginx 配置反向代理设置
-
语音合成(webSocket版) - 语音交互服务 SIS
语音合成(webSocket版) 前提条件 确保已经按照配置好Android开发环境。 初始化Client 初始化RttsClient,其中参数包含AuthInfo和SisHttpConfig和RttsResponseListener。
-
一句话识别 - 语音交互服务 SIS
一句话识别 前提条件 确保已经按照配置好iOS开发环境。 已经保存好1分钟内音频文件,建议使用16k16bit进行录音并保存为wav格式。 初始化Client 初始化SASRClient,参数为AuthInfo,详见表1。
-
实时语音识别工作流程 - 语音交互服务 SIS
开始阶段需要发送开始指令,包含采样率,音频格式,是否返回中间结果等配置信息。服务端会返回一个开始响应。 发送音频阶段客户端会分片发送音频数据,服务会返回识别结果或者其他事件,如音频超时,静音部分过长等。 音频发送结束后,客户端会发送结束请求,服务端会返回end响应。
-
附录 - 语音交互服务 SIS
附录 示例音频 获取项目ID 获取账号ID 获取AK/SK 公共请求参数 公共响应参数 状态码 错误码 配置OBS访问权限
-
获取SDK - 语音交互服务 SIS
当前自研SDK仅java和python提供企业项目配置入口,在代码示例中配置,其他语言暂未支持。
-
获取录音文件识别结果 - 语音交互服务 SIS
在识别配置中emotion为true时存在。 speed 否 Float 语速信息,单位是每秒字数。 在识别配置中speed为true时存在。
-
websocket接口 - 语音交互服务 SIS
包括存在不识别的配置串,或者配置串值的范围不合法。
-
什么是区域与可用区 - 语音交互服务 SIS
不过,在基础设施、BGP网络品质、资源的操作与配置等方面,中国大陆各个区域间区别不大,如果您或者您的目标用户在中国大陆,可以不用考虑不同区域造成的网络时延问题。 在除中国大陆以外的亚太地区有业务的用户,可以选择“中国-香港”、“亚太-曼谷”或“亚太-新加坡”区域。
-
错误码 - 语音交互服务 SIS
权限配置方法请参见配置OBS访问权限。 SIS.30004 下载热词文件失败。 请检查热词是否存在。 SIS.30006 音频解码失败。 请检查音频格式是否正常,音频是否是空文件。 SIS.30007 转写引擎加载热词失败。 请检查热词是否存在。
-
本地调用 - 语音交互服务 SIS
region 部署区域,如:cn-north-4。具体请参考终端节点。 project_id 项目ID,同region一一对应,登录API凭证界面获取。 text 待合成的文本。 path 合成后音频保存路径。 详细接口参数介绍请参见API参考、SDK参考。
-
获取项目ID - 语音交互服务 SIS
响应示例如下,例如,语音交互服务部署的区域为“cn-north-4”,响应消息体中查找“name”为“cn-north-4”,其中projects下的“id”即为项目ID。