检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
插入,在两个音频文件,或者文本句末添加。 PLAY_NOW : 立即插入,收到指令后,立即播放,无需等待句末。 默认取值: PLAY_NOW 表8 SmartLayerConfig 参数 是否必选 参数类型 描述 layer_type 是 String 图层类型。 IMAGE: 素材图片图层 VIDEO:
请注意:视频中PPT每页播放的时间如果与对应音频的时长不匹配,需要将完整的PPT视频按页切割成独立的子视频,一一上传至视频制作界面,按场景依次添加使用。添加后的视频支持仅播放一次,或者循环播放,直至音频播报结束。 父主题: 视频制作
参数类型 描述 background_type String 参数解释: 背景类型。 约束限制: 不涉及。 取值范围: IMAGE:图片背景,指定图片用作分身数字人背景。 COLOR:纯色背景,指定颜色RGB值作为分身数字人背景。 默认取值: 不涉及 background_config
参数类型 描述 background_type 是 String 参数解释: 背景类型。 约束限制: 不涉及。 取值范围: IMAGE:图片背景,指定图片用作分身数字人背景。 COLOR:纯色背景,指定颜色RGB值作为分身数字人背景。 默认取值: 不涉及 background_config
数字人支持添加动作吗? 需要数字人模型训练时使用的形象采集视频包含动作编排,才可以添加动作,详见动作编排定制采集指南。 目前仅视频制作支持数字人插入动作,如图1所示。在数字人卡片上有标识,说明当前数字人支持添加动作。 添加动作时需要注意,动作生效需要有足够的音频时间,如果音频太短,数字人可能来不及做动作。
String 参数解释: 台词脚本。支持两种模式,纯文本模式和标签模式。 纯文本模式:使用方法,如“大家好,我是人工智大家,是个虚拟主播”。 标签模式:SSML标签的详细定义请参考文本驱动SSML定义。 约束限制: 不含SSML标签字符数最长10000个字符。 取值范围: 字符长度0-131072位。
说明 商品名称 商品名称。 描述 商品描述。 类别 商品类别。设置以后,自动成为商品的标签,方便搜索商品。 支持多选,支持添加新类别。 产品素材 合成商品的素材。 包括如下内容: 贴图:从本地选择图片。 视频:从本地选择视频文件。 文本:手工输入文本内容。 音频:从本地选择音频文件。
创建角色 支持在奇妙问平台创建角色,并配置已上传的外部知识库和问答库给大模型学习使用,让角色的问答信息更丰富。 创建智能交互数字人中的“第三方应用”选择“奇妙问”时,才需要执行本节操作。 用户使用奇妙问前,需要联系奇妙问的客户经理注册开通服务。 客户经理的联系方式,可以在云商店语音合成商品页面查看,如图1所示。
如何实时切换智能交互的语言和声音? 智能交互对话项目支持同时添加中文和英文语言,以实现智能交互页面中英文界面的实时切换。 详细配置说明,如下所示: 登录MetaStudio控制台,单击“智能交互”。 如果是展厅场景,需要切换到“华北-北京四”区域。因为展厅的配置,均在“华北-北京四”区域。
45000012 图片数量超限 用户上传前景图片数量超过限制,目前是100张 要求用户减少图片数量 400 MSS.45000013 图片格式错误 用户上传的图片格式不支持 要求用户修改图片格式 400 MSS.45000014 图片解析失败 用户上传前景图片中有无法解析的图片 要求用户替换有问题的图片
本节介绍REST API请求的组成,并以调用IAM服务的管理员创建IAM用户来说明如何调用API,该API获取用户的Token,Token可以用于调用其他API时鉴权。 您还可以通过这个视频教程了解如何构造请求调用API:https://bbs.huaweicloud.com/videos/102987。
需提前准备一张正面清晰且无遮挡的数字人形象照片,并满足如下要求: 图片格式:png、jpg、jpeg、webp。 单击“查看示范”,查看正确示范和错误示范。 界面操作如下所示: 单击“头像区域”,从本地选择分身数字人头像图片。 在弹出的“头像调整”对话框中,可以调整图片大小和图片位置。 单击“确认”,头像上传完成。
插入,在两个音频文件,或者文本句末添加。 PLAY_NOW : 立即插入,收到指令后,立即播放,无需等待句末。 默认取值: PLAY_NOW 表11 SmartLayerConfig 参数 参数类型 描述 layer_type String 图层类型。 IMAGE: 素材图片图层 VIDEO: 素材视频图层
Headers:添加Content-Type,本案例取值为image/png;添加Content-MD5,取值与2中file_md5的值一致。 Content-Type常见取值,如下所示: image/gif:gif图片格式 image/jpeg:jpg或jpeg图片格式 image/png:png图片格式
插入,在两个音频文件,或者文本句末添加。 PLAY_NOW : 立即插入,收到指令后,立即播放,无需等待句末。 默认取值: PLAY_NOW 表8 SmartLayerConfig 参数 是否必选 参数类型 描述 layer_type 是 String 图层类型。 IMAGE: 素材图片图层 VIDEO:
如何接收并激活声音和分身模型资产? 管理员或其他租户如果推送声音或分身模型资产给当前租户,当前租户需在7天内完成接收和激活操作。如果超过7天未操作,需要管理员或其他用户重新推送资产给当前租户。 声音和分身模型资产的接收、激活操作均相同,下面以分身模型资产的接收、激活操作为例演示。
X-Auth-Token: ABCDEFJ.... 您还可以通过这个视频教程了解如何使用Token认证:https://bbs.huaweicloud.com/videos/101333。 父主题: 如何调用API
如何调用API 构造请求 认证鉴权 返回结果
智能交互:通过智能交互的方式回复用户问题,相当于提供了一个第三方语言模型去答复用户问题。 素材绑定(可选) 从本地选择图片或视频上传。当直播间命中当前互动内容进行答复时,同时会在直播画面展示这里上传的图片或视频。 单击“保存”,一条互动规则新增完成。 用户可以根据实际情况,为当前互动库增加更多的互动规则,或者增加更多的互动库。
原子动作中文名称。 action_name_en 否 String 原子动作英文名称。 action_tag 是 String 原子动作标签。 catalog 否 String 原子动作标签。 recommended_value 否 Integer 推荐等级。 取值范围: 0-100 is_selected