检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
创建热词表信息请参考创建热词表。 need_word_info 否 String 表示是否在识别结果中输出分词结果信息,取值为“yes”和“no”,默认为“no”。 first_channel_only 否 String 表示是否在识别中只识别首个声道的音频数据,取值为“yes”和“no”,默认为“no”。
创建热词表信息请参考创建热词表。 need_word_info 否 String 表示是否在识别结果中输出分词结果信息,取值为“yes”和“no”,默认为“no”。 first_channel_only 否 String 表示是否在识别中只识别首个声道的音频数据,取值为“yes”和“no”,默认为“no”。
欠费后套餐包能否继续使用 1. 若账户欠费前从未调用过API, 例如从未调用过一句话识别,欠费后即会被拦截,即使套餐包有余量未消耗。 2. 若账户欠费前已调用API,欠费后可正常调用,扣减套餐包余量。 3. 若账户已被华为云账户中心冻结,则无法调用,即使套餐包有余量未消耗。 父主题:
语音交互服务需要申请什么权限 语音交互服务本身无权限限制,用户不需要额外添加任何权限,即可对语音交互服务执行操作。 但是如下场景除外: 当用户需要使用录音文件识别功能时,需要用户具有主账号或者Security Administrator的权限。 因为录音文件保存在用户的OBS(Object Storage
填写待合成文字。 在text中输入待合成的文本,其中config参数为合成音频的音色、语速、格式等设置项,可使用默认值。 单击“调试”按钮,获取识别结果。 父主题: 调用API或SDK
见表2。 表1 REST API功能 接口 功能 API URI 一句话识别接口 一句话识别 POST /v1/{project_id}/asr/short-audio 录音文件识别接 录音文件识别接口 识别接口:POST /v1/{project_id}/asr/transcriber/jobs
text 待合成的文本。 path 合成后音频保存路径。 详细接口参数介绍请参见API参考、SDK参考。 图1 代码示例 运行代码示例,获取识别结果。 父主题: 调用API或SDK
有上述数据所有权及控制权,您应自行对上述数据来源和获取的合法性负责,华为云受托处理您的数据,以实现本服务功能或目的: (1)将语音音频数据识别转换成文本。 (2)将文本数据合成语音。 您的上述数据将在中华人民共和国境内处理,处理完后立即删除,华为云不会保存以上数据。 SIS通过多
为什么会出现识别结果非常差的情况 如何使用Websocket调用实时语音识别 有哪些途径可以使用语音交互的API 返回状态正常,但识别结果为空 Token消息体中user name,domain name和project name分别指的是什么 如何调整并发 为什么录音文件识别出现重复转写结果
节: 一句话识别 录音文件识别 实时语音识别 2020-04-21 新增: 热词管理章节 2019-11-29 新增: Python SDK章节 2019-11-18 整改SDK手册 2019-09-25 新增: 语音合成章节 2019-08-06 新增: 语音识别章节 修改: Runtime
Java SDK 一句话识别Http接口 一句话识别Websocket接口 录音文件识别 实时语音识别 语音合成 热词管理 实时语音合成 录音文件极速版
Python SDK 一句话识别Http接口 一句话识别Websocket接口 录音文件识别 实时语音识别 语音合成 热词管理 实时语音合成 录音文件极速版
约束与限制 实时语音识别 一句话识别 录音文件识别 语音合成 录音文件识别极速版
Android SDK 一句话识别(http版) 一句话识别(websocket版) 实时语音识别连续模式 语音合成(http版) 语音合成(webSocket版)
检查是否发送end请求,是否关闭客户端。 SIS.0305 语音识别异常。 请重试,或联系技术支持工程师。 SIS.0306 语音识别异常。 请重试,或联系技术支持工程师。 SIS.0307 语音识别异常。 请重试,或联系技术支持工程师。 SIS.0309 实时语音识别音频时长超过最大值。 请注意音频的时长
iOS SDK 一句话识别 实时语音识别连续模式
CPP SDK(Windows) 使用实时语音识别 使用实时语音合成
CPP SDK(Linux) 使用实时语音识别 使用实时语音合成
响应消息体通常以结构化格式返回,与响应消息头中Content-type对应,传递除响应消息头之外的内容。 对于一句话识别接口,返回如下消息体。格式请具体参考一句话识别响应消息部分。 { "trace_id": "567e8537-a89c-13c3-a882-826321939651"
权限类 语音交互服务需要申请什么权限 如何通过主账号创建一个子账号 语音识别是强制绑定使用OBS进行录音文件存储吗