检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
LIVE_2D:分身数字人视频直播 VIDEO_2D:分身数字人视频制作 CHAT_2D:分身数字人智能交互 BUSINESS_CARD_2D:分身数字人名片 PICTURE_2D:照片数字人视频 MODELING_3D:3D照片建模 VDS_3D:3D视觉驱动 TTSA_3D:3D语音驱动
显示时长规则为,若携带reply_texts、reply_audios,则与播放语音内容时长保持一致。若未携带,则与匹配的关键词语音内容时长保持一致。
表11 ShootScriptDetail 参数 参数类型 描述 script_type String 参数解释: 脚本类型,即视频制作的驱动方式 约束限制: 不涉及 取值范围 TEXT: 文本驱动,即通过TTS合成语音 AUDIO: 语音驱动 默认取值: TEXT text_config
显示时长规则为,若携带reply_texts、reply_audios,则与播放语音内容时长保持一致。若未携带,则与匹配的关键词语音内容时长保持一致。
表10 ShootScript 参数 是否必选 参数类型 描述 script_type 否 String 参数解释: 脚本类型,即视频制作的驱动方式 约束限制: 不涉及 取值范围 TEXT: 文本驱动,即通过TTS合成语音 AUDIO: 语音驱动 默认取值: TEXT text_config
音频驱动:从本地上传音频文件,作为视频的语音。音频驱动方式,仅支持中文普通话的场景下能开启字幕。 还可以设置音频的音量,和调整画布的横竖屏展示。 4 视频场景区域 如果一个视频包含多场景,可以新增场景依次制作,顺序播放。
取值范围: 90-240 默认取值: 140 表9 VoiceConfigRsp 参数 参数类型 描述 voice_asset_id String 语音合成特征字符串 speed Integer 语速。默认值100,最小值50,最大值200。
SDK资源不存在 语音唤醒SDK资源不存在 确保语音唤醒SDK资源在OBS桶中存在且信息正确 400 MSS.47010203 当前会话无充足的语音唤醒通道资源 当前会话无充足的语音唤醒通道资源 确保有足够的语音唤醒通道资源 400 MSS.47010204 操作系统参数类型非法
显示时长规则为,若携带reply_texts、reply_audios,则与播放语音内容时长保持一致。若未携带,则与匹配的关键词语音内容时长保持一致。
表10 ShootScript 参数 是否必选 参数类型 描述 script_type 否 String 参数解释: 脚本类型,即视频制作的驱动方式 约束限制: 不涉及 取值范围 TEXT: 文本驱动,即通过TTS合成语音 AUDIO: 语音驱动 默认取值: TEXT text_config
尾静音时长 云端对音频进行VAD检测,发现一句话末尾的静音时长超过500ms,会结束语音识别。建议该值大于500ms。 图2 获取访问权限 单击“确定”,创建应用,创建效果如图3所示。 可单击“修改”,修改配置。
尾静音时长 云端对音频进行VAD检测,发现一句话末尾的静音时长超过500ms,会结束语音识别。建议该值大于500ms。 单击“确定”,创建应用,创建效果如图2所示。 可单击“修改”,修改配置。 图2 创建应用 (可选)单击“对话配置”页签,配置对话,详细操作请参考对话配置。
显示时长规则为,若携带reply_texts、reply_audios,则与播放语音内容时长保持一致。若未携带,则与匹配的关键词语音内容时长保持一致。
路数 live_periodic_ncj_2d_model - 智能交互基础版 路 chat_basic_ncj_2d_model - 智能交互专业版 路 chat_advanced_ncj_2d_model 当前未启用 3D数字人 照片建模 个 modeling_count - 语音驱动
LIVE_2D:分身数字人视频直播 VIDEO_2D:分身数字人视频制作 CHAT_2D:分身数字人智能交互 BUSINESS_CARD_2D:分身数字人名片 PICTURE_2D:照片数字人视频 MODELING_3D:3D照片建模 VDS_3D:3D视觉驱动 TTSA_3D:3D语音驱动
每个单场景如果包含语音合成标记语言SSML标签,文字数量需小于128K。 音频驱动 每个单场景上传音频的大小不超过100M。 视频格式 插入的视频素材支持的格式为:MP4、M4V、MKV、MOV、FLV、3GP、WMV、AVI和WEBM。
显示时长规则为,若携带reply_texts、reply_audios,则与播放语音内容时长保持一致。若未携带,则与匹配的关键词语音内容时长保持一致。
操作前准备 用户创建声音制作任务前,需要参考操作步骤准备如下内容: 使用“语料上传”方式上传语音文件前,需参考声音制作页面的“录音指导”,提前录制好音频。 声音授权签署文件,如授权书所示。 操作步骤 登录MetaStudio控制台。
表11 ShootScript 参数 参数类型 描述 script_type String 参数解释: 脚本类型,即视频制作的驱动方式 约束限制: 不涉及 取值范围 TEXT: 文本驱动,即通过TTS合成语音 AUDIO: 语音驱动 默认取值: TEXT text_config TextConfig
如有软件问题,可以提交工单处理,并提供形象制作任务ID和重训练原因。产品会对实际情况进行核实,并对满足条件的进行处理。 父主题: 计费咨询