检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
父主题: 语音合成管理
父主题: 语音合成管理
语音合成管理 创建TTS试听任务 获取TTS试听文件
文本驱动SSML定义 MetaStudio语音驱动采用语音合成标记语言(SSML,Speech Synthesis Markup Language)来控制数字人的行为,包括动作、情绪以及TTS语音合成的多音字、停顿等。 SSML基础定义可参考语音合成标记语言版本 1.0。
示例3:语音合成管理 语音合成管理示例代码,请参考MetaStudio数字人语音合成管理。 父主题: 应用示例
支持购买下述套餐: 语音合成体验套餐 语音合成小型套餐 语音合成中型套餐 语音合成大型套餐 上述套餐购买完成后,所有预置的第三方声音均可使用。每个第三方声音的费用均不同,详见语音合成界面下方的声音价格表。
XIMALAYA:喜马拉雅TTS HUAWEI_EI:华为云EI TTS MOBVOI:出门问问 TTS AUDIOX:逻辑智能 TTS SINOVOICE:捷通华声 TTS DATABAKER:标贝 TTS AISPEECH:思必驰 TTS 表11 PPTAssetMeta 参数
取值范围: 90-240 默认取值: 140 provider String 第三方TTS供应商类型。 XIMALAYA:喜马拉雅TTS HUAWEI_EI:EI TTS MOBVOI:出门问问TTS language String 语言类型。默认值CN。 CN:中文。
XIMALAYA:喜马拉雅TTS HUAWEI_EI:华为云EI TTS MOBVOI:出门问问 TTS AUDIOX:逻辑智能 TTS SINOVOICE:捷通华声 TTS DATABAKER:标贝 TTS AISPEECH:思必驰 TTS 表11 PPTAssetMeta 参数
默认TEXT TEXT: 文本驱动,即通过TTS合成语音 AUDIO: 语音驱动 默认取值: TEXT text 否 String HTML格式的台词,可包含动作。最多2048个字符。
XIMALAYA:喜马拉雅TTS HUAWEI_EI:华为云EI TTS MOBVOI:出门问问 TTS AUDIOX:逻辑智能 TTS SINOVOICE:捷通华声 TTS DATABAKER:标贝 TTS AISPEECH:思必驰 TTS 表12 PPTAssetMeta 参数
取值范围: 90-240 默认取值: 140 provider String 第三方TTS供应商类型。 XIMALAYA:喜马拉雅TTS HUAWEI_EI:EI TTS MOBVOI:出门问问TTS language String 语言类型。默认值CN。 CN:中文。
XIMALAYA:喜马拉雅TTS HUAWEI_EI:华为云EI TTS MOBVOI:出门问问 TTS AUDIOX:逻辑智能 TTS SINOVOICE:捷通华声 TTS DATABAKER:标贝 TTS AISPEECH:思必驰 TTS 表14 PPTAssetMeta 参数
创建TTS试听任务 5次/秒 3次/秒 3次/秒 获取TTS试听文件 20次/秒 10次/秒 10次/秒 3D数字人风格管理 查询数字人风格列表 20次/秒 10次/秒 - 3D数字人风格化照片建模 创建照片建模任务 2次/秒 2次/秒 - 照片建模任务列表查询 20次/秒 10
创建TTS试听任务 5次/秒 3次/秒 3次/秒 获取TTS试听文件 20次/秒 10次/秒 10次/秒 3D数字人风格管理 查询数字人风格列表 20次/秒 10次/秒 - 3D数字人风格化照片建模 创建照片建模任务 2次/秒 2次/秒 - 照片建模任务列表查询 20次/秒 10
获取语音驱动数据 功能介绍 该接口用于获取生成的数字人驱动数据,包括语音、表情、动作等。 调用方法 请参见如何调用API。 URI GET /v1/{project_id}/ttsa-jobs/{job_id} 表1 路径参数 参数 是否必选 参数类型 描述 project_id
获取语音驱动表情数据 功能介绍 该接口用于获取生成的数字人表情驱动数据 调用方法 请参见如何调用API。 URI GET /v1/{project_id}/fas-jobs/{job_id} 表1 路径参数 参数 是否必选 参数类型 描述 project_id 是 String 租户项目
获取语音驱动任务列表 功能介绍 该接口用于查询驱动数字人表情、动作及语音的任务列表。 调用方法 请参见如何调用API。 URI GET /v1/{project_id}/ttsa-jobs 表1 路径参数 参数 是否必选 参数类型 描述 project_id 是 String 项目
创建语音驱动表情动画任务 功能介绍 该接口用于创建驱动数字人表情的任务。 调用方法 请参见如何调用API。 URI POST /v1/{project_id}/ttsa/fas 表1 路径参数 参数 是否必选 参数类型 描述 project_id 是 String 租户项目ID 请求参数
500 MSS.45001000 未定义的内部错误 服务内部错误 请联系技术支持 500 MSS.45001001 tts任务请求失败 tts文本转音频请求失败 请联系技术支持 500 MSS.45001002 长时间没有joiner观看 rtc 房间加入失败 请联系技术支持 500