检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
语音文件和文本文件逐句上传:每次上传一句语料的语音文件和文本文件,再调用“确认在线录音结果”接口确认语音和文本内容是否一致。确认成功后再上传和确认下一句。 文件上传后,调用“提交语音训练任务”接口,启动审核和训练。 调用方法 请参见如何调用API。 URI POST /v1/{project_id}/voice-
选择“使用系统回复”或者“自定义”。如果选择“自定义”,需要输入自定义的回复内容;如果选择“使用系统回复”,均已预置回复内容,不支持编辑和修改。 图12 人设信息配置页面 人设信息设置完成后,单击界面右上方的“构建”。界面提示“构建成功”,说明人设新增完成。 回到“我的应用 >
约束限制: 该字段无需填写。 取值范围: 字符长度0-1024位。 默认取值: 不涉及。 dh_id String 参数解释: 数字人ID。对应形象和音色组合。 约束限制: 该字段暂未启用,无需填写。 取值范围: 字符长度0-64位。 默认取值: 不涉及。 model_asset_id String
TEMP:临时直播间,直播任务结束后自动清理直播间。 TEMPLATE:直播间模板。 template_own_type 否 String 按照自己拥有的和别人分享以及公共的模板进行查询 OWNED 自己拥有且暂未共享的 SHARED_TO_OHTERS 分享给别人的 SHARED_FROM_OHTERS
该字段无需填写。 取值范围: 字符长度0-1024位。 默认取值: 不涉及。 dh_id 否 String 参数解释: 数字人ID。对应形象和音色组合。 约束限制: 该字段暂未启用,无需填写。 取值范围: 字符长度0-64位。 默认取值: 不涉及。 model_asset_id 否
含MAIN、COVER和OTHER 资产类型为PPT时,包含MAIN、COVER、PAGE和OTHER 资产类型为HUMAN_MODEL时,包含MAIN、COVER和OTHER 资产类型为VOICE_MODEL时,包含MAIN、SAMPLE(样例音频文件)和OTHER 资产类型为
分身数字人训练任务标签。 model_version 否 String 分身数字人模型版本。默认是V3.2版本模型。 V3.2:V3.2版本模型 说明: V3和V2版本已废弃不用 取值范围: 0-64 默认取值: V3.2 is_flexus 否 Boolean 是否是基础版的形象训练 默认取值: false
该字段无需填写。 取值范围: 字符长度0-1024位。 默认取值: 不涉及。 dh_id 否 String 参数解释: 数字人ID。对应形象和音色组合。 约束限制: 该字段暂未启用,无需填写。 取值范围: 字符长度0-64位。 默认取值: 不涉及。 model_asset_id 否
件。 语音文件为一段WAV格式的长音频文件,仅支持将语音文件打包成zip压缩格式上传。 文件上传后,调用“提交语音训练任务”接口,启动审核和训练。 调用方法 请参见如何调用API。 URI POST /v1/{project_id}/voice-training-manage/user/advance-jobs
objects 图层配置。 表12 TextConfig 参数 参数类型 描述 text String 参数解释: 台词脚本。支持两种模式,纯文本模式和标签模式。 纯文本模式:使用方法,如“大家好,我是人工智大家,是个虚拟主播”。 标签模式:SSML标签的详细定义请参考文本驱动SSML定义。
objects 图层配置。 表13 TextConfig 参数 参数类型 描述 text String 参数解释: 台词脚本。支持两种模式,纯文本模式和标签模式。 纯文本模式:使用方法,如“大家好,我是人工智大家,是个虚拟主播”。 标签模式:SSML标签的详细定义请参考文本驱动SSML定义。
默认取值: 不涉及。 表12 TextConfig 参数 参数类型 描述 text String 参数解释: 台词脚本。支持两种模式,纯文本模式和标签模式。 纯文本模式:使用方法,如“大家好,我是人工智大家,是个虚拟主播”。 标签模式:SSML标签的详细定义请参考文本驱动SSML定义。
图层配置。 表8 TextConfig 参数 是否必选 参数类型 描述 text 是 String 参数解释: 台词脚本。支持两种模式,纯文本模式和标签模式。 纯文本模式:使用方法,如“大家好,我是人工智大家,是个虚拟主播”。 标签模式:SSML标签的详细定义请参考文本驱动SSML定义。
图层配置。 表11 TextConfig 参数 是否必选 参数类型 描述 text 是 String 参数解释: 台词脚本。支持两种模式,纯文本模式和标签模式。 纯文本模式:使用方法,如“大家好,我是人工智大家,是个虚拟主播”。 标签模式:SSML标签的详细定义请参考文本驱动SSML定义。
图层配置。 表11 TextConfig 参数 是否必选 参数类型 描述 text 是 String 参数解释: 台词脚本。支持两种模式,纯文本模式和标签模式。 纯文本模式:使用方法,如“大家好,我是人工智大家,是个虚拟主播”。 标签模式:SSML标签的详细定义请参考文本驱动SSML定义。
分身数字人训练任务标签。 model_version String 分身数字人模型版本。默认是V3.2版本模型。 V3.2:V3.2版本模型 说明: V3和V2版本已废弃不用 取值范围: 0-64 默认取值: V3.2 matting_type String 抠图类型。默认是AI。 AI:AI抠图
(忽略大小写)为wav,mp3,m4a,主文件大小不超过100M 幻灯片资产:资产类型为PPT,主文件格式(忽略大小写)为ppt、pptx和pdf,主文件大小不超过100M 调用方法 请参见如何调用API。 URI POST /v1/{project_id}/digital-assets
图层配置。 表9 TextConfig 参数 是否必选 参数类型 描述 text 是 String 参数解释: 台词脚本。支持两种模式,纯文本模式和标签模式。 纯文本模式:使用方法,如“大家好,我是人工智大家,是个虚拟主播”。 标签模式:SSML标签的详细定义请参考文本驱动SSML定义。
分身数字人训练任务标签。 model_version String 分身数字人模型版本。默认是V3.2版本模型。 V3.2:V3.2版本模型 说明: V3和V2版本已废弃不用 取值范围: 0-64 默认取值: V3.2 matting_type String 抠图类型。默认是AI。 AI:AI抠图
/v1/{project_id}/digital-human-chat/knowledge/intent-question 创建知识库意图和问法 智能交互数字人知识库问法管理 表20 智能交互数字人知识库问法管理接口 接口 说明 POST /v1/{project_id}/dig