检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
property取值 描述 chinese_8k_common 支持采样率为8k的中文普通话语音识别。 chinese_16k_conversation 支持采样率为16k的会议场景的中文普通话语音识别。 响应参数 响应类为FlashLasrResponse, 详见表6。调用失败处理方法请参见错误码。
问题现象 服务后台无法访问用户提供的音频的OBS链接。即无法获取用户需要识别的音频文件。 解决方案 检查用户是否授权服务访问OBS。 检查存放音频的OBS的Region和服务的Region是否为同一区域,只有同一区域的OBS才能正常访问。 检查音频的OBS URI是否正确。 父主题:
property取值 描述 chinese_8k_common 支持采样率为8k的中文普通话语音识别。 chinese_16k_conversation 支持采样率为16k的会议场景的中文普通话语音识别。 响应参数 响应类为FlashLasrResponse, 详见表6。调用失败处理方法请参见错误码。
登录后,“X-Auth-Token”和“project_id”参数会自动填充,无需填写。 填写待合成文字。 在text中输入待合成的文本,其中config参数为合成音频的音色、语速、格式等设置项,可使用默认值。 单击“调试”按钮,获取识别结果。 父主题: 调用API或SDK
但是如下场景除外: 当用户需要使用录音文件识别功能时,需要用户具有主账号或者Security Administrator的权限。 因为录音文件保存在用户的OBS(Object Storage Service,对象存储服务)桶中。考虑到数据的安全,语音交互服务无法直接获取到用户数据,
语音合成,是一种将文本转换成逼真语音的服务。用户通过实时访问和调用API获取语音合成结果,将用户输入的文字合成为音频。通过音色选择、自定义音量、语速,为企业和个人提供个性化的发音服务。该接口的使用限制请参见约束与限制,详细使用指导请参见SIS服务使用简介章节。 SIS服务控制台提供了语音合成的在线使用页面,用户无需编程即可使用服务功能。
欠费后套餐包能否继续使用 1. 若账户欠费前从未调用过API, 例如从未调用过一句话识别,欠费后即会被拦截,即使套餐包有余量未消耗。 2. 若账户欠费前已调用API,欠费后可正常调用,扣减套餐包余量。 3. 若账户已被华为云账户中心冻结,则无法调用,即使套餐包有余量未消耗。 父主题:
为什么会出现识别结果非常差的情况 如何使用Websocket调用实时语音识别 有哪些途径可以使用语音交互的API 返回状态正常,但识别结果为空 Token消息体中user name,domain name和project name分别指的是什么 如何调整并发 为什么录音文件识别出现重复转写结果
见表2。 表1 REST API功能 接口 功能 API URI 一句话识别接口 一句话识别 POST /v1/{project_id}/asr/short-audio 录音文件识别接 录音文件识别接口 识别接口:POST /v1/{project_id}/asr/transcriber/jobs
获取录音文件识别结果API支持返回提交音频的时长。 CPP SDK上线。 2022-06-08 新增: 实时语音合成支持温柔女声、朝气男声精品发音人。 2022-05-31 新增: 语音合成新增朝气男声发音人。 2022-02-15 新增: 录音文件识别输入参数兼容公网访问的url。
invalid报错,请使用存放在OBS的音频文件路径,并确保OBS的region要和请求服务的region保持一致。 SIS.0535 录音文件识请求的文件类型不支持。 确保设置的audio_format格式的值是合法。录音文件识别支持的音频格式如表7所示。 确保待识别音频的格式和接口参数中设置的audio_format参数格式一致。
region,如cn-north-4 text = '' # 待合成的文本 path = '' # 待合成的音频保存路径,如test.pcm class MyCallback(RttsCallBack): """ 回调类,用户需要在对应方法中实现自己的逻辑,其中on_response必须重写 """
import java.util.List; /** * 热词demo * * 热词可在一句话识别、录音文件识别、实时语音识别使用。例如将地名和人名作为热词,则语音可以准确识别出人名和地名。 * Copyright 2021 Huawei Technologies Co.,Ltd
目前支持一个用户最多创建10个热词表,一个热词表最多包含10000个热词。 3. 热词可在一句话识别、录音文件识别、实时语音识别使用。例如将地名和人名作为热词,则语音可以准确识别出人名和地名。 :return: 无 """ # 初始化客户端 config
Java SDK 一句话识别Http接口 一句话识别Websocket接口 录音文件识别 实时语音识别 语音合成 热词管理 实时语音合成 录音文件极速版
Python SDK 一句话识别Http接口 一句话识别Websocket接口 录音文件识别 实时语音识别 语音合成 热词管理 实时语音合成 录音文件极速版
约束与限制 实时语音识别 一句话识别 录音文件识别 语音合成 录音文件识别极速版
Android SDK 一句话识别(http版) 一句话识别(websocket版) 实时语音识别连续模式 语音合成(http版) 语音合成(webSocket版)
返回结果 状态码 请求发送以后,您会收到响应,包含状态码、响应消息头和消息体。 状态码是一组从1xx到5xx的数字代码,状态码表示了请求响应的状态,完整的状态码列表请参见状态码。 对于SIS服务接口,如果调用后返回状态码为“200”,则表示请求成功。 响应消息头 对应请求消息头,