检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
background_type=IMAGE时需要填写。 取值范围: 字符长度1-2048位 默认取值: 不涉及。 background_color_config 否 String 参数解释: 纯色背景的RGB颜色值。 约束限制: background_type=COLOR时需要填写。 取值范围: 字符长度0-16位
400 MSS.20020016 压缩包内需要包含的wav及txt文件数量不符合要求 压缩包内需要包含的wav及txt文件数量不符合要求 按照要求重新上传语料 400 MSS.20020017 压缩包内需要包含的wav文件数量不符合要求 压缩包内需要包含的wav文件数量不符合要求 按要求重新上传语料
音量不能过小、过大、或忽大忽小,甚至削波爆音。峰值RMS在-9左右,无削波。 停顿断句 在标点或适当断句处自然停顿,需轻声换气。 当录制一个长音频文件时,每句之间需要有2~3秒的停顿。 重音位置 重音位置要合理,避免错误的重音。 阅读发音 按顺序读,确保音字一致。避免漏字多字、发音错误、阅读不流畅等问题。如有这些问题,需重新录制。
1-1000 默认取值: 1 is_background_replacement 否 Boolean 分身数字人是否需要背景替换。需要背景替换的分身数字人训练视频需要绿幕拍摄。 默认取值: true batch_name 否 String 分身数字人训练任务的批次名称。 tags 否
从下拉框中选择“删除”,删除当前文件。 从下拉框中选择“批量删除”,勾选所有需要删除的文件。单击界面右下角的“删除”,删除选中的所有文件。 文件上传成功后的操作如下所示: 在PPT页签的文件列表区域,单击上传成功的文件,弹出如图4所示的对话框。 图4 插入页面 勾选需要插入的页面或直接全选所有界面,单击“复制当前
background_type=IMAGE时需要填写。 取值范围: 字符长度1-2048位 默认取值: 不涉及。 background_color_config 否 String 参数解释: 纯色背景的RGB颜色值。 约束限制: background_type=COLOR时需要填写。 取值范围: 字符长度0-16位
相对于内容的开始时间。 约束限制: 预留字段。当前只需要填sequence_no即可。 默认取值: 不涉及。 取值范围: 0-2592000 end_time 否 Float 参数解释: 结束时间。 单位秒。 相对于内容的结束时间。 约束限制: 预留字段。当前只需要填sequence_no即可。 默认取值:
第三方用户ID。不允许输入中文。 表3 请求Body参数 参数 是否必选 参数类型 描述 voice_asset_id 是 String 音色模型ID。需要使用MetaStudio的数字资产管理相关接口从资产库查出。 script_type 否 String 脚本类型,即视频制作的驱动方式。默认TEXT
introduction_type String 自我介绍驱动方式。 TEXT: 文本驱动,即通过TTS合成语音 AUDIO: 语音驱动,需要在资产库中先上传语音资产 默认取值: TEXT introduction_text String 自我介绍文本,用于驱动数字人口型。 voice_asset_id
图片简介:图片的基本介绍,方便了解和使用。 风格:关键词标签,方便用户搜索此类型的资产。 基本信息:图片的用途。 图3 上传图片 单击“图片上传”区域,从本地选择需要上传的图片资产。 单击界面右上方的“保存”,在弹出的“资产保存成功”对话框中,单击“知道了”。 资产保存成功后,返回到“我的创作 > 资源
SIS:语音交互服务(SIS)调用 请求参数 表3 请求Header参数 参数 是否必选 参数类型 描述 X-Auth-Token 是 String 用户Token。需要获取全局级Token(将scope设置为domain) 通过调用IAM服务获取用户Token接口获取(响应消息头中X-Subject-Token的值)。
SIS:语音交互服务(SIS)调用 请求参数 表2 请求Header参数 参数 是否必选 参数类型 描述 X-Auth-Token 是 String 用户Token。需要获取全局级Token(将scope设置为domain) 通过调用IAM服务获取用户Token接口获取(响应消息头中X-Subject-Token的值)。
相对于内容的开始时间。 约束限制: 预留字段。当前只需要填sequence_no即可。 默认取值: 不涉及。 取值范围: 0-2592000 end_time 否 Float 参数解释: 结束时间。 单位秒。 相对于内容的结束时间。 约束限制: 预留字段。当前只需要填sequence_no即可。 默认取值:
对应请求消息头,响应同样也有消息头,如“Content-type”。 对于管理员创建IAM用户接口,返回如图1所示的消息头,其中“X-Subject-Token”就是需要获取的用户Token。有了Token之后,您就可以使用Token认证调用其他API。 建议在配置文件或者环境变量中密文存放,使用时解密,确保安全。
SIS:语音交互服务(SIS)调用 请求参数 表2 请求Header参数 参数 是否必选 参数类型 描述 X-Auth-Token 是 String 用户Token。需要获取全局级Token(将scope设置为domain) 通过调用IAM服务获取用户Token接口获取(响应消息头中X-Subject-Token的值)。
background_type=IMAGE时需要填写。 取值范围: 字符长度1-2048位 默认取值: 不涉及。 background_color_config 否 String 参数解释: 纯色背景的RGB颜色值。 约束限制: background_type=COLOR时需要填写。 取值范围: 字符长度0-16位
background_type=IMAGE时需要填写。 取值范围: 字符长度1-2048位 默认取值: 不涉及。 background_color_config String 参数解释: 纯色背景的RGB颜色值。 约束限制: background_type=COLOR时需要填写。 取值范围: 字符长度0-16位
background_type=IMAGE时需要填写。 取值范围: 字符长度1-2048位 默认取值: 不涉及。 background_color_config String 参数解释: 纯色背景的RGB颜色值。 约束限制: background_type=COLOR时需要填写。 取值范围: 字符长度0-16位
标签模式使用SSML(Speech Synthesis Markup Language)标记语言。 需要使用的标签,如下所示: <speak>:此标签为所有文本的根节点。一切需要调用SSML标签的文本,都要包含在<speak> </speak>标记对中。 <emotion>:情感
rojectId)联系华为云技术工程师为您配置相关账号的白名单。 使用API调用声音的限制说明 用户使用视频直播或智能交互接口调用音色时,需要先确认能否在MetaStudio控制台的视频直播间编辑界面或智能交互对话设置页面,选到当前音色。 如果界面正常展示且可以选择此音色使用,说