检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
以实现智能交互页面中英文界面的实时切换。 详细配置说明,如下所示: 登录MetaStudio控制台,单击“智能交互”。 如果是展厅场景,需要切换到“华北-北京四”区域。因为展厅的配置,均在“华北-北京四”区域。 在界面右侧,选择“对话配置”页签,如图1所示。 配置说明如下所示,其他配置请参见智能交互。
互动内容。 图5 开播页面 即兴直播 无需设置剧本,直接开播,界面如图6所示。开播后数字人保持静默,需要发送互动内容或者通过真人接管,驱动数字人说话。 图6 即兴直播 如果还需要制作多场景,可以单击直播画面预览窗口右侧“场景1”小窗口下方的“+”图标,新增场景,并参考前一个场景,
自我介绍驱动方式。 TEXT: 文本驱动,即通过TTS合成语音。文本驱动需要填写introduction_text和voice_asset_id参数。 AUDIO: 语音驱动,需要在资产库中先上传语音资产。语音驱动需要填写introduction_audio_asset_id参数。 默认取值:
自我介绍驱动方式。 TEXT: 文本驱动,即通过TTS合成语音。文本驱动需要填写introduction_text和voice_asset_id参数。 AUDIO: 语音驱动,需要在资产库中先上传语音资产。语音驱动需要填写introduction_audio_asset_id参数。 默认取值:
人证校验时识别不到人脸,确保身份证照片无反光导致的内容或人像不清晰。 确保视频中的人脸清晰且与提交身份证中的人像保持一致。 视频方向可能不对,竖屏横拍的素材需要旋转,确保被拍摄对象为竖向。 视频为非主流编码格式,可能是相机拍摄的视频采用了厂商的特定编码。需确保视频素材能通过Windows系统自带的
进行操作演示。 注意事项 管理员或其他租户如果推送声音或分身模型资产给当前租户,当前租户需在7天内完成接收和激活操作。如果超过7天未操作,需要管理员或其他租户重新推送资产给当前租户。 操作步骤 登录MetaStudio控制台。 在左侧导航栏中,单击“我的创作”。 选择“资源”页签,如图1所示。
文本驱动:通过输入文本,选择声音的方式,生成播报内容。不能超过2000字。 单击声音图标,会弹出声音对话框,可以选择需要使用的声音。 无标注的系统声音,均为免费声音,可直接选用。 标注有“第三方”的声音,需要购买激活后才能使用,操作请参考购买出门问问声音套餐。 请填写名片信息 姓名 必填项,数字人姓名。
单击“定制数字人”,可以定制自己需要的数字人形象。 用户自定义的Flexus分身数字人,也会展示在这里。Flexus分身数字人左上角会有标识。 背景:背景图片列表,可本地导入图片。支持透明背景、纯色背景或导入图片。 PPT:PPT文件列表,需要用户从本地导入后使用。 贴图:各类
如需使用“出门问问声音制作”方式自定义声音,并用于视频制作,需要参考下述内容进行操作。出门问问自定义声音暂不支持用于智能交互和视频直播。其支持的语言类型,如第三方声音支持的语言类型所示。 购买出门问问小语种克隆套餐包:如果用户需要使用“出门问问声音制作”方式自定义生成声音,需要在云商店购买出门问问小语种克隆套餐包。
output_urls 否 Array of strings 参数解释: RTMP视频推流第三方直播平台地址。 说明: 直播过程中刷新地址,需要调用COMMAND命令REFRESH_OUTPUT_URL。 约束限制: 不涉及 取值范围: 当前仅支持一条RTMP出流地址。 默认取值:
et链接。 须知: 参数返回的地址默认无wss://前缀,实际使用时,需要补齐前缀。示例:如果返回字段内容为metastudio-api.cn-north-4.myhuaweicloud.com:443,则需要拼接为wss://metastudio-api.cn-north-4.myhuaweicloud
动作视频上传分片数。 取值范围: 1-1000 is_background_replacement 否 Boolean 分身数字人是否需要背景替换。需要背景替换的分身数字人训练视频需要绿幕拍摄。 batch_name 否 String 分身数字人训练任务的批次名称。 tags 否 Array of strings
1-1000 默认取值: 1 is_background_replacement 否 Boolean 分身数字人是否需要背景替换。需要背景替换的分身数字人训练视频需要绿幕拍摄。 默认取值: true batch_name 否 String 分身数字人训练任务的批次名称。 tags 否
background_type=IMAGE时需要填写。 取值范围: 字符长度1-2048位 默认取值: 不涉及。 background_color_config 否 String 参数解释: 纯色背景的RGB颜色值。 约束限制: background_type=COLOR时需要填写。 取值范围: 字符长度0-16位
et链接。 须知: 参数返回的地址默认无wss://前缀,实际使用时,需要补齐前缀。示例:如果返回字段内容为metastudio-api.cn-north-4.myhuaweicloud.com:443,则需要拼接为wss://metastudio-api.cn-north-4.myhuaweicloud
background_type=IMAGE时需要填写。 取值范围: 字符长度1-2048位 默认取值: 不涉及。 background_color_config String 参数解释: 纯色背景的RGB颜色值。 约束限制: background_type=COLOR时需要填写。 取值范围: 字符长度0-16位
background_type=IMAGE时需要填写。 取值范围: 字符长度1-2048位 默认取值: 不涉及。 background_color_config 否 String 参数解释: 纯色背景的RGB颜色值。 约束限制: background_type=COLOR时需要填写。 取值范围: 字符长度0-16位
说明 平台名称 第三方直播平台名称。 密钥 MetaStudio访问第三方平台的鉴权密钥。 商品api地址 商品的API地址和直播回调地址,需要至少配置一项。 直播回调地址 单击“确定”,第三方平台新增成功。 新增的第三方平台,以卡片的形式展示在当前界面。 支持对第三方平台执行如下操作:
查看浏览器配置 用ffmpeg检查视频的编码是否是H265(HEVC),输入命令:ffmpeg -i 视频文件名。 图3 检查视频是否是hevc编码 需要先安装ffmpeg,安装方法如下。 ffmpeg下载地址:https://github.com/BtbN/FFmpeg-Builds/releases。
标签模式使用SSML(Speech Synthesis Markup Language)标记语言。 需要使用的标签,如下所示: <speak>:此标签为所有文本的根节点。一切需要调用SSML标签的文本,都要包含在<speak> </speak>标记对中。 <emotion>:情感