-
实时语音识别 - 语音交互服务 SIS
private String path = ""; // 本地音频路径,如D:/test.wav, 也可将音频文件、音频流转换为byte数组后进行传送。 private String audioFormat = ""; // 音频格式,如pcm16k16bit
-
如何申请公测 - 语音交互服务 SIS
如何申请公测 当前语音交互服务在中国区已全部商用,不需要申请,直接可以调用,调用会收费,计费方式详细请参考语音交互价格计算器。调用的详细操作请参考使用实时语音识别 。 登录华为云,单击右上角的“控制台”,进入“管理控制台”界面。 在左侧服务列表中选择“EI企业智能 > 语音交互服务”。
-
API使用类 - 语音交互服务 SIS
如何查看接口调用量 为什么WebSocket一直连接不成功 为什么会出现识别结果非常差的情况 如何使用Websocket调用实时语音识别 有哪些途径可以使用语音交互的API 返回状态正常,但识别结果为空 Token消息体中user name,domain name和project name分别指的是什么
-
配置CPP环境(Linux) - 语音交互服务 SIS
依赖库。 如果您在系统中已安装其中一些库,如openssl等,构建的时候可以选择跳过。如 cmake .. -DOPENSSL=OFF , 跳过对openssl安装。如果所有依赖库之前已安装在系统中,则可以全部跳过。cmake .. -DWEBSOCKETPP=OFF -DJSONCPP=OFF
-
实时语音识别单句模式 - 语音交互服务 SIS
(data) => { if (data instanceof Buffer) { // 将Buffer转换为UTF-8编码的字符串 const messageString = data.toString('utf8');
-
实时语音识别连续模式 - 语音交互服务 SIS
(data) => { if (data instanceof Buffer) { // 将Buffer转换为UTF-8编码的字符串 const messageString = data.toString('utf8');
-
语音交互服务需要申请什么权限 - 语音交互服务 SIS
接获取到用户数据,需要用户授权录音文件引擎读取用户OBS桶权限,只有主账号或者有Security Administrator权限的子账号才可以授权。 主账号:即在使用语音交互服务前注册的账号,该账号具有管理员权限,可执行所有操作。 父主题: 权限类
-
调用说明 - 语音交互服务 SIS
者时长来计算费用,具体计费价格参见语音交互价格计算器。 支持两种计费方式: 按需计费,默认计费方式为“按需计费”。 折扣套餐包方式,是用户可以购买套餐包,扣费时调用次数会先在套餐包内进行抵扣,抵扣完后的剩余调用量默认转回按需计费方式。 父主题: 使用前必读
-
创建企业项目 - 语音交互服务 SIS
开通企业项目后,企业项目内的用户在调用SIS API时,只有在请求Header参数中传入Enterprise-Project-Id(企业项目ID)后,才支持按不同企业项目进行财务统计。传参方式详见API文档。 进入项目管理的“企业项目管理”页面,单击企业项目名称,在企业项目详情页获取Enterpr
-
热词管理 - 语音交互服务 SIS
hot_word_example(): """ 1. 热词使用包含创建、更新、查询、删除等,一个用户可以创建多个热词表,一个热词表可以包含多个热词。一个vocabulary_id对应一个热词表。 2. 目前支持一个用户最多创建10个热词表,一个热词表最多包含10000个热词。
-
websocket接口 - 语音交互服务 SIS
错误码请参见错误码。 发送音频数据 在收到“开始识别”的响应之后,可以开始发送音频数据。为节省流量,音频以二进制数据帧形式(binary message)的方式发送。 音频数据将分片发送,也即在获得一定量音频数据的同时就可以发送一个binary message,每个分片建议在50ms~
-
热词管理 - 语音交互服务 SIS
return config; } /** * 1. 热词使用包含创建、更新、查询、删除等,一个用户可以创建多个热词表,一个热词表可以包含多个热词。一个vocabularyId对应一个热词表。 * 2. 目前支持一个用户最多创建10个热词表,一个热词表最多包含10000个热词。
-
配置OBS访问权限 - 语音交互服务 SIS
进入语音交互服务,单击“服务授权”,选择确认对象存储服务授权。 主账号或者有Security Administrator权限的子账号才可以创建委托。 上传音频 在OBS“桶列表”页,单击创建的OBS桶。 图2 进入OBS桶 进入“对象”页面,将音频数据上传至OBS桶中。 图3
-
事件响应 - 语音交互服务 SIS
_END、EXCEEDED_SILCENCE事件。 在实时语音识别单句模式下: 返回VOICE_START事件,表示检测到语音,此时IVR可以做打断。 返回VOICE_END事件后,表示一句话结束,后续的音频将被忽略,不会再进行识别。 只会返回最多一组VOICE_START和VOICE_END事件。
-
录音文件识别 - 语音交互服务 SIS
参数名称 是否必选 参数类型 描述 dataUrl 是 String 存放录音文件地址: 推荐使用华为云OBS:授权配置请参见OBS配置。 您也可以把录音文件放在自行搭建服务器上,提供下载文件的地址。URL不能使用IP地址,只能使用域名,请尽量避免中文。 audioFormat 是 String
-
实时语音识别连续模式 - 语音交互服务 SIS
热词表id,不使用则不填写。 创建热词表请参考《API参考》中创建热词表章节。 interimResults 否 String 是否输出中间结果,可以为yes或no。默认为no,表示不输出中间结果。 响应参数 结果响应类为RASRResponse,详见表2。调用失败处理方法请参见错误码。
-
录音文件识别 - 语音交互服务 SIS
参数名称 是否必选 参数类型 描述 data_url 是 String 存放录音文件地址: 推荐使用华为云OBS:授权配置请参见OBS配置。 您也可以把录音文件放在自行搭建服务器上,提供下载文件的地址。URL不能使用IP地址,只能使用域名,请尽量避免中文 audio_format 是 String
-
语音合成 - 语音交互服务 SIS
可选择不保存到本地。需具体到文件,如D:/test.wav /** * 用于语音合成参数设置,例如发声人、音高、语速、音量、采样率、连接超时。所有参数均可以不设置,采用默认。 * * @param request 语音合成请求 */ private void setPar
-
开始识别 - 语音交互服务 SIS
句的识别。 取值范围:[1, 60]的整数,单位为s,默认为30s。 interim_results 否 String 是否输出中间结果,可以为yes或no。默认为no,表示不输出中间结果。 vocabulary_id 否 String 热词表id,不使用热词则不填写。 创建热词表信息请参考创建热词表。
-
一句话识别(websocket版) - 语音交互服务 SIS
sasrWsRequest.setConfig(config); return sasrWsRequest; } /** * 按钮按下之后事件 * * @throws SisException */ private void actionDown() throws