搜索_华为云

为什么服务端返回OBS链接不可用（data url is unreachable） - 语音交互服务 SIS

问题现象服务后台无法访问用户提供的音频的OBS链接。即无法获取用户需要识别的音频文件。解决方案检查用户是否授权服务访问OBS。检查存放音频的OBS的Region和服务的Region是否为同一区域，只有同一区域的OBS才能正常访问。检查音频的OBS URI是否正确。父主题：

帮助中心 > 语音交互服务 SIS > 常见问题 > API使用类
语音识别是强制绑定使用OBS进行录音文件存储吗 - 语音交互服务 SIS

语音识别是强制绑定使用OBS进行录音文件存储吗不是，只有录音文件识别需要使用OBS服务，语音交互服务对用户存储在OBS的数据，具有只读权限，没有修改和删除的权限。所以用户是否删除上传至OBS服务的数据，需要用户根据自己的obs桶的使用情况或者容量大小确认，并在OBS服务上执行。父主题：权限类

 帮助中心 > 语音交互服务 SIS > 常见问题 > 权限类
SIS.0535报错 - 语音交互服务 SIS
SIS.0535报错 - 语音交互服务 SIS

format is invalid!" 解决方案确保设置的audio_format格式的值是合法，即设置的格式是表1中的格式。确保待识别音频的格式和接口参数中设置的audio_format参数格式一致。表1 录音文件识别支持的音频格式 audioformat取值说明 auto

帮助中心 > 语音交互服务 SIS > 常见问题 > 错误码类
实时语音识别单句模式 - 语音交互服务 SIS

单句模式自动检测一句话的结束，因此适合于需要与您的系统进行交互的场景，例如外呼、控制口令等场景。实时语音识别引擎的单句识别模式，和连续识别模式类似，也会进行语音的端点检测，如果检测到静音，将直接丢弃，检测到语音才会馈入核心进行实际的解码工作，如果检测到一段语音的结束点，就会将当前这一段的识别结

 帮助中心 > 语音交互服务 SIS > API参考 > 实时语音识别接口 > Websocket握手请求
为什么录音文件识别出现重复转写结果 - 语音交互服务 SIS

为什么录音文件识别出现重复转写结果问题现象调用录音文件识别接口，识别的结果出现两条完全一致的结果。解决方案由于声道设置的原因，单声道的音频按照双声道处理了。在请求中将参数“channel”的值修改成“MONO”或者直接去掉请求参数中的“channel”项。父主题： API使用类

 帮助中心 > 语音交互服务 SIS > 常见问题 > API使用类
监控安全风险 - 语音交互服务 SIS

SIS提供基于云监控服务CES的监控能力，帮助用户监控账号下的SIS服务API，执行自动实时监控、告警和通知操作。用户可以实时掌握API所产生的调用成功次数、调用失败次数等信息。关于SIS支持的监控指标，以及如何创建监控告警规则等内容，请参见语音交互服务的监控指标。同时，SIS控

 帮助中心 > 语音交互服务 SIS > 产品介绍 > 安全
如何修改发音人 - 语音交互服务 SIS

如何修改发音人修改代码中property的取值即可，支持的发音人如表1和表2所示。 POST https://{endpoint}/v1/{project_id}/tts Request Header: Content-Type: application/json X-Auth-Token:

帮助中心 > 语音交互服务 SIS > 常见问题 > API使用类
SSML标记语言介绍 - 语音交互服务 SIS

Language）标记语言的功能、标签使用及示例。概述 SSML 是一种基于 XML 的语音合成标记语言。使用 SSML 可以更加准确、具体的定义合成音频的效果，包括控制断句分词方式、发音、速度、停顿、声调和音量等特征。相比文本输入进行合成，有更好的操作灵活性。华为云语音合成服务的SSML实现，基于W3C的语音合成标记语言版本1

帮助中心 > 语音交互服务 SIS > API参考 > 语音合成接口
构造请求 - 语音交互服务 SIS
构造请求 - 语音交互服务 SIS

resource-path 资源路径，即API访问路径。从具体API的URI模块获取，例如“一句话识别”API的resource-path为的“/v1/{project_id}/asr/short-audio”。其中“project_id”需要替换成用户的项目ID，可参考获取项目ID。 query-string

帮助中心 > 语音交互服务 SIS > API参考 > 如何调用REST API
配置热词表（可选） - 语音交互服务 SIS

用于提升热词召回率，主要应用于以下场景。所配置的关键词与常见词发音一样，导致热词不能百分百生效。如雇工 vs 故宫。由于故宫更加常见，所以可能存在即使配置了雇工这个热词，也无法召回的情况。所配置的关键词含有生僻字，如葳蕤，霜蟾。这些生僻字出现的概率较低，所以在热词搜索过程中，可能不生效。所配置的关键词较常见，与其他高频词容易混淆（误召回），如述职

 帮助中心 > 语音交互服务 SIS > 用户指南
APIG.0101报错 - 语音交互服务 SIS

0101报错访问的API不存在或尚未在环境中发布。The API does not exist or has not been published in the environment. 请检查API的URL是否拼写正确，例如，URL中是否缺少project_id。检查URI中的endp

帮助中心 > 语音交互服务 SIS > 常见问题 > 错误码类
发送音频数据 - 语音交互服务 SIS

建议在需要实时反馈的情况下100ms，不需要实时反馈的情况下500ms。实时语音识别代码示例请参考SDK文档。当前SIS服务对于8k音频的分片大小限制为[160, 32768]字节, 16k音频的分片大小限制为[320, 65536]字节, 分片大小超出上限或低于下限会报错。

帮助中心 > 语音交互服务 SIS > API参考 > 实时语音识别接口 > 实时语音识别请求
使用流程简介 - 语音交互服务 SIS

使用流程简介用户通过调用SIS服务提供的API或SDK，进行语音转文本或语音合成任务，返回的结果需要您通过编码对接到业务系统中。图1 使用流程

 帮助中心 > 语音交互服务 SIS > 用户指南
结束识别 - 语音交互服务 SIS
结束识别 - 语音交互服务 SIS

结束识别功能介绍对于识别中的对话，需要在Websocket上发送“结束识别”的请求来取消或结束识别。 "结束识别"请求使用文本类型的数据帧(text message)发送，命令和参数以json字符串的形式提供。请求消息表1 参数说明参数名是否必选参数类型说明 command

帮助中心 > 语音交互服务 SIS > API参考 > 实时语音识别接口 > 实时语音识别请求
实时语音识别连续模式 - 语音交互服务 SIS

账户创建企业项目后，在传参时，有以下三类场景。携带正确的ID，正常使用SIS服务，账单归到企业ID对应的企业项目中。携带错误的ID，正常使用SIS服务，账单的企业项目会被分类为“default”。不携带ID，正常使用SIS服务，账单的企业项目会被分类为“default”。请求示例（伪码）

帮助中心 > 语音交互服务 SIS > API参考 > 实时语音识别接口 > Websocket握手请求
如何解决“The silence time is too long, and the audio will not be recognized”报错 - 语音交互服务 SIS

实时语音识别的初始静默时间过长无法识别。解决方案方法一：将参数设置中静默时间的参数vad_head 的值设置大一些，详细请参见API参考的实时语音识别的请求参数。方法二：处理音频文件，将识别文件初始的静默音频剪切掉。父主题： API使用类

 帮助中心 > 语音交互服务 SIS > 常见问题 > API使用类
创建企业项目 - 语音交互服务 SIS

FullAccess权限的用户。企业账号可申请开通企业项目。账号需要进行企业实名认证。如果企业账号注册成为华为云合作伙伴，将无法进入企业项目管理页面。图1 操作流程创建企业项目登录控制台，单击界面右上方的“企业 > 项目管理”。屏幕分辨率低的情况下单击页面右上方的“更多 > 企业

 帮助中心 > 语音交互服务 SIS > 用户指南 > 企业项目管理
Token消息体中user name，domain name和project name分别指的是什么 - 语音交互服务 SIS

name指用户名称，domain name指用户所属的账号名称。如果是账号获取token，账号的user name和domain name相同。如果是IAM用户获取token（账号可以创建多个IAM用户），user name和domain name不相同，user name为实际的用户名称。 project

帮助中心 > 语音交互服务 SIS > 常见问题 > API使用类
开始识别请求响应 - 语音交互服务 SIS

开始识别请求响应由于WebSocket是全双工的，因此响应就是从服务器端发送给客户端的消息，但也并不是所有的请求信息都有一条对应的响应。服务器端收到“开始识别”请求时，会给出如下响应消息，以json字符串形式放置在text message中。响应消息表1 响应参数参数名参数类型

 帮助中心 > 语音交互服务 SIS > API参考 > 实时语音识别接口 > 实时语音识别响应
SIS.0032报错 - 语音交互服务 SIS
SIS.0032报错 - 语音交互服务 SIS

mp3格式音频。目前仅支持单通道的音频。 aac aac格式音频。目前仅支持单通道的音频。 wav 带wav封装头的格式，从封装头中自动确定格式，目前仅支持8k/16k采样率、单通道、pcm, alaw, ulaw三种编码格式。 amr AMR窄带(8k) 压缩录音数据。目前仅支持单通道的音频。 amrwb

帮助中心 > 语音交互服务 SIS > 常见问题 > 错误码类

总条数： 171

上一页
1
...
4
5
6
...
9
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

为什么服务端返回OBS链接不可用（data url is unreachable） - 语音交互服务 SIS

语音识别是强制绑定使用OBS进行录音文件存储吗 - 语音交互服务 SIS

SIS.0535报错 - 语音交互服务 SIS

实时语音识别单句模式 - 语音交互服务 SIS

为什么录音文件识别出现重复转写结果 - 语音交互服务 SIS

监控安全风险 - 语音交互服务 SIS

如何修改发音人 - 语音交互服务 SIS

SSML标记语言介绍 - 语音交互服务 SIS

构造请求 - 语音交互服务 SIS

配置热词表（可选） - 语音交互服务 SIS

APIG.0101报错 - 语音交互服务 SIS

发送音频数据 - 语音交互服务 SIS

使用流程简介 - 语音交互服务 SIS

结束识别 - 语音交互服务 SIS

实时语音识别连续模式 - 语音交互服务 SIS

如何解决“The silence time is too long, and the audio will not be recognized”报错 - 语音交互服务 SIS

创建企业项目 - 语音交互服务 SIS

Token消息体中user name，domain name和project name分别指的是什么 - 语音交互服务 SIS

开始识别请求响应 - 语音交互服务 SIS

SIS.0032报错 - 语音交互服务 SIS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线