检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
语音文件和文本文件逐句上传:每次上传一句语料的语音文件和文本文件,再调用“确认在线录音结果”接口确认语音和文本内容是否一致。确认成功后再上传和确认下一句。 文件上传后,调用“提交语音训练任务”接口,启动审核和训练。 调用方法 请参见如何调用API。 URI POST /v1/{project_
出门问问的数字人平台对接至智能交互服务,开发者基于SDK完成web界面开发,操作请参考创建智能交互数字人(奇妙问)。 开发者自己提供LLM或者大模型,调用智能交互的文本驱动数字人能力。智能交互服务不感知用户自己的LLM或者大模型,只提供API接口和Web SDK。操作请参考创建智能交互数字人(二次开发场景)。
开通按需计费。 如需使用第三方声音进行语音合成,请购买出门问问声音套餐,操作请参考《用户指南》的“购买出门问问声音套餐”章节。 调用方法 请参见如何调用API。 URI POST /v1/{project_id}/ttsc/async-jobs 表1 路径参数 参数 是否必选 参数类型
如需使用第三方声音进行语音合成,请购买出门问问声音套餐。 图1 声音合成 功能介绍 该接口用于TTS流式合成音频,用于文本转化为语音,并实时返回合成的音频数据。 调用方法 构造请求 请求URL:wss://metastudio-api.{region}.myhuaweicloud.com:443/v1/
保证类似的突发声音越少越好。 我可能没有小蜜蜂或其他专业麦克风设备,能否直接使用相机内置麦克风录制? 大部分相机内置麦克风的声音录制效果也能满足要求。MetaStudio对声音清晰度可以有适度妥协,但请务必保证底噪不能太大,且不能有其他人声出现,尤其是被拍摄模特正在说话时。 模特形象
自定义声音生成后,会自动展示在MetaStudio控制台声音列表中,可用于分身数字人视频制作、视频直播或智能交互等场景中。 通过MetaStudio的API调用自定义声音。 父主题: 声音制作
very good. 属性 表2 属性说明 属性名称 属性类型 属性值 是否必选 描述 ph String 拼音或音素 是 输入汉语拼音时,声调用1、2、3、4来表示,5表示轻声。 CMU词典音素。 举例1:天气的ph取值为“tian1 qi4”。 举例2:weather的ph取值为“ˈweəðə(r)”。
左下角展示用户已购买资源的剩余量。 照片数字人视频制作 左下角展示用户已购买资源的剩余量。 声音合成 这里的声音合成,仅针对使用声音API调用,通过MetaStudio控制台声音制作方式生成的声音,来合成音频的费用。 如需使用此功能,需单击“去开通”,在弹出的“开通按需计费服务提
用户发送心跳请求消息 用户与数字人对话超时断连 会话任务结束 用户请求建立WebSocket连接 用户请求建立WebSocket连接时,会调用接口智能交互驱动WebSocket接口创建与MetaStudio智能交互服务之间的Websocket连接。 连接建立成功后,MetaStu