检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
其他发音人支持长度不大于500字符的文本。
property 是 String 属性字符串,language_sampleRate_domain, 如chinese_16k_general,参见《API参考》中开始识别章节。
<say-as> 描述:将文本解释为特定的类型内容,或者控制英文单词逐个字符拼写。
model_property 否 String 特征字符串,{language}_{speaker}_{domain},默认chinese_xiaoyan_common。具体信息请参见《API参考》中语音合成章节。
输入文本内容包含非法字符。 SIS.0504 录音文件识别极速版待识别音频无效。 请检查音频文件大小是否满足要求。 SIS.0506 找不到代理错误。 请检查网络是否有设置代理。 请在控制台检查OBS是否已授权。 SIS.0507 录音文件识别极速版输入参数无效。
请求参数 请求类为RunTtsRequest,其中包含参数类PostCustomTTSReq,该类包含两个参数text(待合成文本)和TtsConfig,详见TtsConfig。
默认为true,表示会进行话者分离,识别结果中会包含role项(角色)。 如果diarization为false,那么结果中不会出现role项。 说明: 本表中的参数对audio_format格式中采样率为8k和16k的音频有效。
支持中文、英文、中英文,文本不长于500个字符。 支持合成采样率8kHz、16kHz。 父主题: 约束与限制
音频采样率要与属性字符串的采样率要匹配。
表3 AsrCustomShortRequest 参数名称 是否必选 参数类型 描述 data 是 String 本地音频文件经过Base64编码后的字符串,音频文件时长不超过1min。
data 是 String 本地音频文件经过Base64编码后的字符串,音频文件时长小于60s。 表3 Config 参数名称 是否必选 参数类型 描述 audioFormat 是 String 音频格式,具体信息请参见《API参考》中一句话识别章节。
* * @param request request请求,包含各种参数 */ private void setParameters(SasrWebsocketRequest request) { // 1.
音频采样率要与属性字符串的采样率要匹配。
表3 请求参数 参数名称 是否必选 参数说明 Data 必选 本地音频文件经过Base64编码后的字符串。 AudioFormat 必选 音频格式。 Property 必选 属性字符串,语言_采样率_模型,如chinese_8k_common。
* * @param request request请求,包含各种参数 */ private void setParameters(RasrRequest request) { // 1.
obs_bucket_name字符长度区间为[3,64),需要进行urlencode编码。 OBS桶区域需要与接口的地址区域一致。
服务器端收到“开始识别”请求时,会给出如下响应消息,以json字符串形式放置在text message中。 表8 响应参数 参数名 参数类型 说明 resp_type String 响应类型。参数值为START,表示开始识别响应。
其中1个汉字、1个英文字母或1个标点均算作1个字符,具体费用请参考价格计算器。 普通发音人:取值范围请参考表 普通发音人property取值范围。
text String 是 待合成的文本,文本长度限制小于500字符。 config Object 否 配置信息。请参考表 config数据结构。
如下图所示,文件包含了租户名(User Name),AK(Access Key Id),SK(Secret Access Key)。 图1 credential.csv文件内容 AK/SK生成步骤: 登录管理控制台。 单击右上角的用户名,在下拉列表中单击“我的凭证”。