检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
数字人支持TTS和ASR吗? 已支持TTS(文本转语音),详见创建TTS异步任务。MetaStudio不提供ASR(语音转文本),用户如有ASR需求,可以查看语音交互服务或其他ASR服务。 父主题: 数字人
语音合成管理 创建TTS试听任务 获取TTS试听文件 创建TTS异步任务 获取TTS异步任务 设置TTS租户级自定义读法配置 获取TTS租户级自定义读法配置 删除TTS租户级自定义读法配置 修改TTS租户级自定义读法配置 语音同步合成WebSocket接口
第三方用户ID。不允许输入中文。 表3 请求Body参数 参数 是否必选 参数类型 描述 text 是 String 待合成文本。 tts_text 否 String 发送给tts的待合成文本。 emotion 是 String 音色ID,获取方式详见获取音色ID。 speed 否 Integer
获取TTS试听文件 功能介绍 该接口用于获取TTS试听文件下载链接,返回List中包含当前已生产的试听文件。 调用方法 请参见如何调用API。 URI GET /v1/{project_id}/ttsc/audition-file/{job_id} 表1 路径参数 参数 是否必选
第三方用户ID。不允许输入中文。 表3 请求Body参数 参数 是否必选 参数类型 描述 text 是 String 待合成文本 tts_text 否 String 发送给tts的待合成文本 voice_asset_id 是 String 音色ID,获取方式详见获取音色ID。 speed 否 Integer
示例4:语音合成管理 语音合成管理示例代码,请参考MetaStudio数字人语音合成管理。 父主题: 应用示例
对话框中,勾选同意协议。单击“确定”,开通按需计费。开通后的效果如图1所示。 如需使用第三方声音进行语音合成,请购买出门问问声音套餐。 图1 声音合成 功能介绍 该接口用于TTS流式合成音频,用于文本转化为语音,并实时返回合成的音频数据。 调用方法 构造请求 请求URL:wss://metastudio-api
获取TTS异步任务 功能介绍 该接口用于获取TTS音频文件下载链接。 调用方法 请参见如何调用API。 URI GET /v1/{project_id}/ttsc/async-jobs/{job_id} 表1 路径参数 参数 是否必选 参数类型 描述 project_id 是 String
获取TTS租户级自定义读法配置 功能介绍 该接口用于获取TTS租户级自定义读法配置。 调用方法 请参见如何调用API。 URI GET /v1/{project_id}/ttsc/vocabulary-configs 表1 路径参数 参数 是否必选 参数类型 描述 project_id
设置TTS租户级自定义读法配置 功能介绍 该接口用于设置TTS租户级自定义读法配置。 调用方法 请参见如何调用API。 URI POST /v1/{project_id}/ttsc/vocabulary-configs 表1 路径参数 参数 是否必选 参数类型 描述 project_id
修改TTS租户级自定义读法配置 功能介绍 该接口用于修改TTS租户级自定义读法配置。 调用方法 请参见如何调用API。 URI PUT /v1/{project_id}/ttsc/vocabulary-configs/{vocabulary_id} 表1 路径参数 参数 是否必选
删除TTS租户级自定义读法配置 功能介绍 该接口用于删除TTS租户级自定义读法配置。 调用方法 请参见如何调用API。 URI DELETE /v1/{project_id}/ttsc/vocabulary-configs 表1 路径参数 参数 是否必选 参数类型 描述 project_id
文本驱动SSML定义 MetaStudio语音驱动采用语音合成标记语言(SSML,Speech Synthesis Markup Language)来控制数字人的行为,包括动作、情绪以及TTS语音合成的多音字、停顿等。 SSML基础定义可参考语音合成标记语言版本 1.0。MetaStudio
问提供的第三方声音。 访问云商店语音合成商品页面,进入云商店商品“语音合成”的购买页面。 用户可以在界面下方查看商品详情,确定要购买的商品规格。 支持购买下述套餐: 语音合成体验套餐 语音合成小型套餐 语音合成中型套餐 语音合成大型套餐 上述套餐购买完成后,所有预置的第三方声音均
如何查看已购声音套餐明细? 访问云商店买家中心,进入“已购买的服务”界面,可以看到已购买的语音合成套餐信息。 父主题: 计费咨询
00/百万字,可以在MetaStudio服务概览页面的“声音合成”卡片中查看,如图1所示。 图1 声音合成计费项 第三方声音的计费标准,详见云商店语音合成商品页面的价格表。 父主题: 计费咨询
发音人名称 性别 TTS版本 风格 语言 变更方式 云海 男 TTS V7 营销 中文 新增 云佳 女 TTS V7 客服 中文 新增 云辉 男 TTS V7 直播 中文 新增 云英 女 TTS V9 直播 中文 新增 云薇 女 TTS V9 直播 中文 新增 云溪 女 TTS V9 客服
数字人支持换脸吗? 数字人支持换衣服吗? 数字人支持添加动作吗? 数字人说话是文本驱动还是语音驱动? 数字人支持提供语义理解知识库吗? 数字人支持TTS和ASR吗?
修改时间 修改说明 2024-12-30 第十四次正式发布 本次变更如下: 语音合成管理接口组,新增接口:设置TTS租户级自定义读法配置、获取TTS租户级自定义读法配置、删除TTS租户级自定义读法配置、修改TTS租户级自定义读法配置。 2024-12-05 第十三次正式发布 本次变更如下:
10次/秒 10次/秒 语音合成管理 创建TTS试听任务 5次/秒 3次/秒 3次/秒 获取TTS试听文件 20次/秒 10次/秒 10次/秒 创建TTS异步任务 5次/秒 3次/秒 3次/秒 获取TTS异步任务 20次/秒 10次/秒 10次/秒 设置TTS租户级自定义读法配置 10次/秒