搜索_华为云

为什么录音文件识别出现重复转写结果 - 语音交互服务 SIS

为什么录音文件识别出现重复转写结果问题现象调用录音文件识别接口，识别的结果出现两条完全一致的结果。解决方案由于声道设置的原因，单声道的音频按照双声道处理了。在请求中将参数“channel”的值修改成“MONO”或者直接去掉请求参数中的“channel”项。父主题： API使用类

 帮助中心 > 语音交互服务 SIS > 常见问题 > API使用类
如何修改发音人 - 语音交互服务 SIS

如何修改发音人修改代码中property的取值即可，支持的发音人如表1和表2所示。 POST https://{endpoint}/v1/{project_id}/tts Request Header: Content-Type: application/json X-Auth-Token:

帮助中心 > 语音交互服务 SIS > 常见问题 > API使用类
配置OBS访问权限 - 语音交互服务 SIS

、高可靠、低成本的数据存储能力，可供用户存储任意类型和大小的数据。 EI企业智能服务对于图片、语音等多媒体文件支持直接使用华为云OBS服务的数据处理方式，以减少服务使用成本，降低服务的响应时长，提升服务使用的体验。语音交互服务优先推荐使用同一region下OBS的音频链接作为传入音频的URL。

帮助中心 > 语音交互服务 SIS > API参考 > 附录
应用场景 - 语音交互服务 SIS
应用场景 - 语音交互服务 SIS

体验。智能教育集成语音合成的教育系统可以实现中文标准朗读及带读，应用于课堂和学生自学，提升教学效率。直播实时字幕将视频直播或现场直播中的音频实时转为字幕，为观众提供更高效的观会体验，方便对直播内容进行监控。会议实时记录将视频或电话会议中的音频实时转为文字，可实时校核、修改及检索转写会议内容，提高会议效率。

帮助中心 > 语音交互服务 SIS > 产品介绍
语音合成 - 语音交互服务 SIS
语音合成 - 语音交互服务 SIS

语音合成，是一种将文本转换成逼真语音的服务。用户通过实时访问和调用API获取语音合成结果，将用户输入的文字合成为音频。通过音色选择、自定义音量、语速，为企业和个人提供个性化的发音服务。该接口的使用限制请参见约束与限制，详细使用指导请参见SIS服务使用简介章节。 SIS服务控制台提供了语音合成的在线使用页面，用户无需编程即可使用服务功能。

帮助中心 > 语音交互服务 SIS > API参考 > 语音合成接口
功能介绍 - 语音交互服务 SIS
功能介绍 - 语音交互服务 SIS

一句话识别可以实现1分钟以内音频到文字的转换。对于用户上传的二进制音频格式数据，系统经过处理，生成语音对应的文字，支持的语言包含中文普通话、方言以及英语。方言当前支持四川话、粤语和上海话。产品优势高识别率基于深度学习技术，对特定领域场景的语音识别进行优化，识别率达到业界领先。

帮助中心 > 语音交互服务 SIS > 产品介绍
There was a bad response from the server报错 - 语音交互服务 SIS

from the server报错。表示无法正常连接到SIS服务。请先检查您的华为云账号是否已经进行了实名认证。如果您的网络环境异常也会引发该报错，请确保您的网络连接正常，可以访问SIS服务。如果使用的是局域网或内部网络，请确保可以正常访问公网。网络环境如果正常，请检查代码示

 帮助中心 > 语音交互服务 SIS > 常见问题 > 错误码类
使用流程简介 - 语音交互服务 SIS

使用流程简介用户通过调用SIS服务提供的API或SDK，进行语音转文本或语音合成任务，返回的结果需要您通过编码对接到业务系统中。图1 使用流程

 帮助中心 > 语音交互服务 SIS > 用户指南
如何通过主账号创建一个子账号 - 语音交互服务 SIS

如何通过主账号创建一个子账号语音交互服务服务不支持IAM细粒度划分策略，IAM账号与主账号具备相同的操作权限。您可以使用IAM的用户管理功能，给员工或应用程序创建IAM用户，可避免分享自己的账号密码。详细创建步骤请参见创建IAM用户。父主题：权限类

 帮助中心 > 语音交互服务 SIS > 常见问题 > 权限类
接口说明 - 语音交互服务 SIS
接口说明 - 语音交互服务 SIS

模式”、“实时语音识别单句模式”三种模式。三种模式的握手请求wss-URI不同，基于Websocket承载的实时语音识别请求和响应的消息格式相同。开发者可以使用java、python、c++等开发语言支持Websocket的对应软件包或库接口，与实时语音识别引擎握手连接，并发

 帮助中心 > 语音交互服务 SIS > API参考 > 实时语音识别接口
发送音频数据 - 语音交互服务 SIS

建议在需要实时反馈的情况下100ms，不需要实时反馈的情况下500ms。实时语音识别代码示例请参考SDK文档。当前SIS服务对于8k音频的分片大小限制为[160, 32768]字节, 16k音频的分片大小限制为[320, 65536]字节, 分片大小超出上限或低于下限会报错。

帮助中心 > 语音交互服务 SIS > API参考 > 实时语音识别接口 > 实时语音识别请求
创建企业项目 - 语音交互服务 SIS

FullAccess权限的用户。企业账号可申请开通企业项目。账号需要进行企业实名认证。如果企业账号注册成为华为云合作伙伴，将无法进入企业项目管理页面。图1 操作流程创建企业项目登录控制台，单击界面右上方的“企业 > 项目管理”。屏幕分辨率低的情况下单击页面右上方的“更多 > 企业

 帮助中心 > 语音交互服务 SIS > 用户指南 > 企业项目管理
SDK（websocket） - 语音交互服务 SIS

下载SDK包语音交互SDK软件包获取请参见表下载SDK包。示例音频参见示例音频。当您使用过旧版本的Java SDK时，需要注意旧版本的SDK依赖的jar包与新版本SDK的jar包有无冲突。新版本SDK升级日志为log4j2，同时java-sdk-core升级到3.0.12版本。

帮助中心 > 语音交互服务 SIS > SDK参考
Token消息体中user name，domain name和project name分别指的是什么 - 语音交互服务 SIS

name指用户名称，domain name指用户所属的账号名称。如果是账号获取token，账号的user name和domain name相同。如果是IAM用户获取token（账号可以创建多个IAM用户），user name和domain name不相同，user name为实际的用户名称。 project

帮助中心 > 语音交互服务 SIS > 常见问题 > API使用类
Token与Project ID不匹配报错 - 语音交互服务 SIS

wrong or project_id doesn't match the token报错。检查获取Token过程中，请求url中的区域信息与获取token请求体中的project name是否匹配。父主题：错误码类

 帮助中心 > 语音交互服务 SIS > 常见问题 > 错误码类
SIS.0032报错 - 语音交互服务 SIS
SIS.0032报错 - 语音交互服务 SIS

mp3格式音频。目前仅支持单通道的音频。 aac aac格式音频。目前仅支持单通道的音频。 wav 带wav封装头的格式，从封装头中自动确定格式，目前仅支持8k/16k采样率、单通道、pcm, alaw, ulaw三种编码格式。 amr AMR窄带(8k) 压缩录音数据。目前仅支持单通道的音频。 amrwb

帮助中心 > 语音交互服务 SIS > 常见问题 > 错误码类
实时语音识别连续模式 - 语音交互服务 SIS

账户创建企业项目后，在传参时，有以下三类场景。携带正确的ID，正常使用SIS服务，账单归到企业ID对应的企业项目中。携带错误的ID，正常使用SIS服务，账单的企业项目会被分类为“default”。不携带ID，正常使用SIS服务，账单的企业项目会被分类为“default”。请求示例（伪码）

帮助中心 > 语音交互服务 SIS > API参考 > 实时语音识别接口 > Websocket握手请求
错误码 - 语音交互服务 SIS
错误码 - 语音交互服务 SIS

invalid报错，请使用存放在OBS的音频文件路径，并确保OBS的region要和请求服务的region保持一致。 SIS.0535 录音文件识请求的文件类型不支持。确保设置的audio_format格式的值是合法。录音文件识别支持的音频格式如表7所示。确保待识别音频的格式和接口参数中设置的audio_format参数格式一致。

帮助中心 > 语音交互服务 SIS > API参考 > 附录
开始识别请求响应 - 语音交互服务 SIS

开始识别请求响应由于WebSocket是全双工的，因此响应就是从服务器端发送给客户端的消息，但也并不是所有的请求信息都有一条对应的响应。服务器端收到“开始识别”请求时，会给出如下响应消息，以json字符串形式放置在text message中。响应消息表1 响应参数参数名参数类型

 帮助中心 > 语音交互服务 SIS > API参考 > 实时语音识别接口 > 实时语音识别响应
结束识别 - 语音交互服务 SIS
结束识别 - 语音交互服务 SIS

结束识别功能介绍对于识别中的对话，需要在Websocket上发送“结束识别”的请求来取消或结束识别。 "结束识别"请求使用文本类型的数据帧(text message)发送，命令和参数以json字符串的形式提供。请求消息表1 参数说明参数名是否必选参数类型说明 command

帮助中心 > 语音交互服务 SIS > API参考 > 实时语音识别接口 > 实时语音识别请求

总条数： 168

上一页
1
...
4
5
6
...
9
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

为什么录音文件识别出现重复转写结果 - 语音交互服务 SIS

如何修改发音人 - 语音交互服务 SIS

配置OBS访问权限 - 语音交互服务 SIS

应用场景 - 语音交互服务 SIS

语音合成 - 语音交互服务 SIS

功能介绍 - 语音交互服务 SIS

There was a bad response from the server报错 - 语音交互服务 SIS

使用流程简介 - 语音交互服务 SIS

如何通过主账号创建一个子账号 - 语音交互服务 SIS

接口说明 - 语音交互服务 SIS

发送音频数据 - 语音交互服务 SIS

创建企业项目 - 语音交互服务 SIS

SDK（websocket） - 语音交互服务 SIS

Token消息体中user name，domain name和project name分别指的是什么 - 语音交互服务 SIS

Token与Project ID不匹配报错 - 语音交互服务 SIS

SIS.0032报错 - 语音交互服务 SIS

实时语音识别连续模式 - 语音交互服务 SIS

错误码 - 语音交互服务 SIS

开始识别请求响应 - 语音交互服务 SIS

结束识别 - 语音交互服务 SIS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线