检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
图4 定制任务详情 审核通过后,任务状态变更为“算法训练中”,如图所示。 数字人定制任务审核通过后,启动算法训练,会在3个工作日内训练完成并生成数字人。 图5 数字人定制任务 等待数字人模型训练完成后,任务状态变更为“算法训练完成”,如图6所示。
背景替换 分身数字人是否支持更换背景。 包含如下选项,请根据实际情况选择: 抠除拍摄背景:制作分身数字人视频时,可以更换背景。 保留拍摄背景:分身数字人使用拍摄时的原背景,不支持更换背景。 身份认证及授权数据上传 联系方式 请输入有效的11位手机号码。
超过50页PPT仅转换50页 转换的图片无法保证完全还原,需要自行确认。 取值范围: true: 自动解析 false: 无需解析 默认取值: false ppt_analysis_status 否 String 参数解释: PPT解析状态。
切换互动内容播报的声音。默认为主播声音,可切换为助播声音。 单击快捷图标,选择预置的互动内容发送播报。 请输入互动内容,回车发送内容 手工输入互动内容,发送成功后,主播或助播进行互动内容插播。插播结束后,继续播报原有内容。 真人接管 单击“真人接管”,开启真人接管功能。
智能交互 如何实时切换智能交互的语言和声音? 智能交互支持富媒体吗? 如何自定义域名方式访问智能交互页面? 智能交互业务媒体流如何应对防火墙限制?
语音文件和文本文件逐句上传:每次上传一句语料的语音文件和文本文件,再调用“确认在线录音结果”接口确认语音和文本内容是否一致。确认成功后再上传和确认下一句。 文件上传后,调用“提交语音训练任务”接口,启动审核和训练。 调用方法 请参见如何调用API。
智能交互驱动流程 流程图示例 用户与数字人进行智能交互的流程图示例,如下所示,对应流程的详细说明,如流程图总体说明所示。 智能交互非流式驱动流程图,如图1所示。 智能交互流式驱动流程图,如图2所示。 智能交互驱动打断对话流程图,如图3所示。 智能交互驱动停止对话流程图,如图4所示。
语音文件和文本文件逐句上传:每次上传一句语料的语音文件和文本文件,再调用“确认在线录音结果”接口确认语音和文本内容是否一致。确认成功后再上传和确认下一句。 文件上传后,调用“提交语音训练任务”接口,启动审核和训练。 调用方法 请参见如何调用API。
如何实时切换智能交互的语言和声音? 如何接收并激活声音和分身模型资产? 父主题: 附录
超过50页PPT仅转换50页 转换的图片无法保证完全还原,需要自行确认。 取值范围: true: 自动解析 false: 无需解析 默认取值: false ppt_analysis_status String 参数解释: PPT解析状态。
视频直播素材操作详情 视频直播界面支持添加角色、背景、贴图、视频、商品、文本等视频直播素材。本节提供各类素材的详细操作过程。 角色 角色界面详情,如图1所示。 图1 角色界面 角色界面说明,如表1所示。 表1 界面元素说明 界面元素 说明 定制数字人 单击“定制数字人”,跳转至形象制作页面
当前选择的语言不支持语音识别,请切换语言后重新尝试。 MSS.47010144 Switch to text mode and try again. 当前非文本模式,请切换至文本对话模式后再尝试 MSS.47010145 Input exceeds the limit.
上传资产 支持从本地上传资产,包括:模型、PPT、动画、素材、视频、场景、图片、音乐。资产上传的操作均相同,下面以上传图片为例进行演示。 操作步骤 登录MetaStudio控制台。 在左侧导航栏中,单击“我的创作”。 选择“资源”页签,如图1所示。 图1 资源页面 单击界面右上角的
2.0.0 2024-04-17 Web SDK:HwICSUiSDK-2.0.0.zip 23ab33712d94f2940c147e8a65d8e18e0f3d3ceff8c513c4a4b9d5c03cac46db 重要变更,见•重要变更:1.4.2.1-create新增参数
切换互动内容播报的声音。默认为主播声音,可切换为助播声音。 单击快捷图标,选择预置的互动内容发送播报。 请输入互动内容,回车发送内容 手工输入互动内容,发送成功后,主播或助播进行互动内容插播。插播结束后,继续播报原有内容。 真人接管 单击“真人接管”,开启真人接管功能。
jobInfoChange 交互任务信息变更事件。 speakingStart 数字人开始讲话事件。 speakingStop 数字人结束讲话事件。 speechRecognized ASR对提问进行语音识别后输出为文本的事件。
视频制作限制 Flexus数字人采用实景拍摄,视频制作时不支持切换背景。 Flexus分身数字人左上角会有标识。未带有标识的数字人均为标准版形象。 需注意Flexus视频制作和标准版视频制作分开计费,从各自的套餐包中扣除费用。
直播控制RTSA Command命令说明 直播控制RTSA Command命令详细说明,如下所示: 数字人直播状态变化图 RTSA Command定义 数字人直播状态变化图 数字人直播状态变化流程图,如图1所示。 图1 直播状态变化流程图 流程图说明,如下所示: PREPROCESSING
当状态变更为“系统审核完成”,自动启动算法训练。如果系统存在多个算法训练任务,可能会存在排队和延迟的现象,请耐心等待。 父主题: 声音制作
视频制作素材操作详情 视频制作界面支持添加角色、背景、PPT、贴图、视频、音乐、文本等视频制作素材。本节提供各类素材的详细操作过程。 角色 角色界面详情,如图1所示。 图1 角色界面 角色界面说明,如表1所示。 表1 界面元素说明 界面元素 说明 定制数字人 单击“定制数字人”,跳转至形象制作页面