检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
参数解释: 图片显示时长,单位s。 显示时长规则为,若携带reply_texts、reply_audios,则与播放语音内容时长保持一致。若未携带,则与匹配的关键词语音内容时长保持一致。 取值范围: 0-3600 默认取值: 0 表15 SmartVideoLayerConfig 参数
参数配置说明,如下所示: 情景模式名称:必须配置为“English”。 保持“语音语义”不变。 图22 新增情景模式 单击“确定”,English情景模式新增成功。 界面参数配置说明,如下所示: 语音识别:从下拉框中选择“通用-英文-进场”。 自然语言模型:保持默认值“星火交互认知大模型”。
TextLayerConfig 参数 是否必选 参数类型 描述 text_context 否 String 参数解释: 文字图层的文本,内容需做Base64编码。 示例:若想添加文字水印“测试文字水印”,那么text_context的值为:5rWL6K+V5paH5a2X5rC05Y2w 约束限制:
如果是多音字可设置正确的发音,还可以选择不同的声音,试听生成的音频效果。支持开启字幕展示功能。 音频驱动:从本地上传音频文件,作为视频的语音。音频驱动方式,仅支持中文普通话的场景下能开启字幕。 还可以设置音频的音量,和调整画布的横竖屏展示。 4 视频场景区域 如果一个视频包含多场景,可以新增场景依次制作,顺序播放。
model_infos ModelInfo object 数字人模型信息 voice_config VoiceConfig object 语音配置参数。 说明: *此参数将被废弃,请使用voice_config_list。 concurrency Integer 参数解释: 并发路数。
照片建模 个 按需 hws.resource.type.metastudio.modeling.stylizedphoto.number - 语音驱动 分钟 按需 hws.resource.type.metastudio.modeling.audiodriving.duration -
定制声音时,从平台下载的授权书中有明确说明,定制音色需授权给公司使用。 操作前准备 用户创建声音制作任务前,需要参考操作步骤准备如下内容: 使用“语料上传”方式上传语音文件前,需参考声音制作页面的“录音指导”,提前录制好音频。 声音授权签署文件,如授权书所示。 操作步骤 登录MetaStudio控制台。
剧本封面下载url。 script_type String 脚本类型,即视频制作的驱动方式。默认TEXT TEXT: 文本驱动,即通过TTS合成语音 AUDIO: 语音驱动 text String 台词脚本。 create_time String 创建时间,格式遵循:RFC 3339 如"2021-01-10T08:43:17Z"。
BUSINESS_CARD_2D:分身数字人名片 PICTURE_2D:照片数字人视频 MODELING_3D:3D照片建模 VDS_3D:3D视觉驱动 TTSA_3D:3D语音驱动 FLEXUS_2D:FLEXUS版本资源 请求参数 表3 请求Header参数 参数 是否必选 参数类型 描述 X-Auth-Token
可。注意要保证脸部和身体没有出现明显的阴影。在灯光设备有限的情况下,优先打亮被拍摄主体,之后再去对绿幕进行补光。 收音 我们会使用视频中的语音和您口型变化的对应关系来训练口型驱动效果,训练结果还会经过专家的技术审核。 因此在收音这方面,我们建议: 保证视频音画同步。 确保环境安静
表3 请求Body参数 参数 是否必选 参数类型 描述 hot_words_type 是 String 热词类型。 说明: SIS:使用的语音识别服务为SIS时选此类型 robot_id 是 String 应用ID。 sis_hot_words 是 CreateSisHotWords
表3 请求Body参数 参数 是否必选 参数类型 描述 hot_words_type 是 String 热词类型。 说明: SIS:使用的语音识别服务为SIS时选此类型 sis_hot_words 是 UpdateSisHotWords object sis类型热词 表4 UpdateSisHotWords
资产名称。 约束限制: 不涉及。 取值范围: 只能使用中英文字符,字符长度0-256位。 默认取值: 不涉及。 asset_description 否 String 参数解释: 资产描述。 约束限制: 不涉及。 取值范围: 只能使用中英文字符,字符长度0-4096位。 默认取值: 不涉及。
资产名称。 约束限制: 不涉及。 取值范围: 只能使用中英文字符,字符长度0-256位。 默认取值: 不涉及。 asset_description 否 String 参数解释: 资产描述。 约束限制: 不涉及。 取值范围: 只能使用中英文字符,字符长度0-4096位。 默认取值: 不涉及。
单击“下一步”,进入“文档清洗”页面,如图5所示。 参数配置说明,如表1所示。 图5 文档清洗 表1 参数说明 参数 说明 分段设置 选择文字分段的方式。 包含如下选项: 自动分段:自动对文档进行分段处理。单击“自动分段”,“分段预览”区域会展示自动分段后的文本效果。 手动分段:
object 视频输出配置。 voice_config_list Array of SmartChatVoiceConfig objects 语音配置参数列表。 chat_video_type String 智能交互对话端配置。 COMPUTER: 电脑端 MOBILE: 手机端 HUB:
在段落的某个位置,插入换气或者停顿时间,也支持自定义停顿时长。 多音字 选中文字,设置多音字的正确读音。 全局语速 设置全局语速,取值范围[0.5X,2X]。设置为0.5X时,声音放慢至0.5倍速播放;设置为2X时,声音加速至2倍速播放。 助播 选中一段文字,设置为助播来播报这段内容。 全局声音(主播) 主
单”页面,搜索查看声音合成的详细账单。 3D数字人 照片建模 左下角展示用户已购买资源的剩余量。单击图标,可以查看剩余量详情的列表数据。 语音驱动 左下角展示用户已购买资源的剩余量。单击图标,可以查看剩余量详情的列表数据。 视觉驱动 左下角展示用户已购买资源的剩余量。 资产管理 资产管理
object 视频输出配置。 voice_config_list Array of SmartChatVoiceConfig objects 语音配置参数列表。 chat_state Integer 数字人智能交互对话的状态。 0: 等待建链 1: 等待关闭链路 2: 建链成功 3:
Query参数 参数 是否必选 参数类型 描述 role_type 否 String 委托授权类型 CBS:对话机器人服务(CBS)访客 SIS:语音交互服务(SIS)调用 请求参数 表3 请求Header参数 参数 是否必选 参数类型 描述 X-Auth-Token 是 String