检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
事件通知(EventMap) 本节介绍Web SDK的EventMap事件。 表1 通知列表 接口 描述 error 错误事件。 enterSleep 数字人自动休眠事件。 jobInfoChange 交互任务信息变更事件。 speakingStart 数字人开始讲话事件。 speakingStop
如何在MetaStudio控制台呈现PPT的动画效果? 支持在视频制作界面,导入本地PPT作为视频素材使用。如果PPT中有动画、动效,不支持在MetaStudio控制台展示,建议将PPT导出为视频后,再在导入本地视频的位置导入视频,进行视频制作。 PPT转视频的操作方法,如下所示:
值包含前一条通知的内容。例如:第一条通知的text值为“你吃”,第二条新识别了“饭了么”,则第二条text值为“你吃饭了么”。 semanticRecognized的流式返回是分段式返回。后一条通知中的text字段值与前一条通知的内容是上下衔接关系。例如:第一条通知的text为“
客户声音制作案例 单击声音样例.zip,下载如表1所示的音频文件。 mos分是从音色相似度、情感表达效果和声音音质方面,进行整体效果综合评分的结果。 表1 音频文件 版本 类别 原音文件 合成音文件 版本差异 适用场景 基础版声音制作 女声 基础版媒体1.wav 基础版媒体2.wav
最低配置 CPU i5及以上版本。 内存 8G以上。 硬盘 128G及以上。 操作系统 Windows或Android系统。 麦克风 需要有麦克风,且要保障1米以内的拾音效果。 扬声器 需要有扬声器。 触摸屏 需要有触摸屏。 带宽 4M以上。 由于浏览器的安全策略限制,仅支持通过
如需使用华为云MetaStudio服务定制分身数字人形象,需要参考拍摄真人视频,完成分身数字人形象的采集工作。 请注意,分身数字人形象的制作效果与拍摄录制的内容效果有较大关联,为了后续能够体验到更好的数字人应用效果,我们建议您详细阅读每一节内容,并严格按照各章节内容为标准进行拍摄。 下面是数字人拍摄视频标准概览内容,详细的说明,请参考具体的章节。
表1中导入的图片使用SDK默认方式时,在智能交互页面的展示效果,如图1所示。 图1 SDK默认方式展示效果 富媒体展示效果(自定义方式) 用户与数字人进行智能交互的页面,默认为用户需要自定义富媒体的展示效果,即用户自定义UI界面展示。 通过注册事件通知semanticRecognized获取回复
不能超过32字符。 职称 必填项,数字人职称。 右侧界面的预览效果就是数字人名片的实际生成效果,请输入适量的字符,以确保正常的展示效果。 公司 必填项,数字人公司。 内容较多时,最多支持在名片中分2行展示,超出2行后,默认不展示。为保证名片的效果展示,请保持合理的输入长度。 联系电话 必填项,数字人联系电话,请输入有效的联系方式。
SDK,操作请参考智能交互SDK。 在Web SDK的create接口入参eventListeners中,监听jobInfoChange事件通知,用于获取任务ID。 建立用户与数字人对话的WebSocket连接,用来实现对话功能。操作请参考智能交互驱动。 图2 创建应用 表1 创建应用
播报内容生成后,单击右侧的“试听”,可以试听播报效果。 语音上传:本地录制音频后上传。音频格式需要为WAV或MP3格式,音频大小不超过20MB,时长不超过5分钟。 在线录音:在线录制音频。录音时长不能超过5分钟,为保证音频生成的效果,请保持录音环境安静无噪音。支持试听录制生成的语音。
态,都会决定数字人最终呈现时的姿态和动作。因此,我们希望模特在拍摄时尽可能保持自然,按照平时说话和表达的习惯进行录制。 为保证数字人的训练效果,请按照我们提供的流程进行录制,请根据实际需求评估录制流程: 不需要交互:15-30秒静默 + 4-5分钟演讲。 需要交互:15秒静默 +
(可选)创建对话,操作请参考对话。 单击界面右上角的“发布”,发布数字人智能交互对话。 发布成功后,自动跳转至与数字人智能互动页面,可以体验与数字人互动的效果。也可以复制数字人互动页面的网址,分享给其他用户使用。 获取数字人互动页面URL的方式还有:进入“我的创作 > 智能交互 > 对话项目”页
根据以往的录制经验,小于3秒的短暂闯入声音不会对最终训练效果产生明显影响。您只需保证类似的突发声音越少越好。 我可能没有小蜜蜂或其他专业麦克风设备,能否直接使用相机内置麦克风录制? 大部分相机内置麦克风的声音录制效果也能满足要求。MetaStudio对声音清晰度可以有适度妥协
灯光布置 布置灯光 合适的灯光环境将大幅提升模特拍摄效果,所以我们提出如下建议: 使用3~4台专业的摄影灯来打光,包括:主光、辅助光、产品光(用于拍摄桌面产品)、背景光和(可选)轮廓光,具体布光方式如图1所示。 录制过程中,需要保证光线不发生显著变化。 确保背景绿幕均匀且明亮,避免有阴影或明暗不均。
(可选)创建对话,操作请参考对话。 单击界面右上角的“发布”,发布数字人智能交互对话。 发布成功后,自动跳转至与数字人智能互动页面,可以体验与数字人互动的效果。也可以复制数字人互动页面的网址,分享给其他用户使用。 获取数字人互动页面URL的方式还有:进入“我的创作 > 智能交互 > 对话项目”页
(可选)创建对话,操作请参考对话。 单击界面右上角的“发布”,发布数字人智能交互对话。 发布成功后,自动跳转至与数字人智能互动页面,可以体验与数字人互动的效果。也可以复制数字人互动页面的网址,分享给其他用户使用。 获取数字人互动页面URL的方式还有:进入“我的创作 > 智能交互 > 对话项目”页
避免头部大幅度转动或者摆动,避免嘴巴被遮挡,可能造成口型异常。 视频中需保证仅出现录制者及其声音。如果出现其他人物形象或声音,将会影响口型生成效果和声音克隆效果。 避免动作幅度过大超出画面;避免相机距离人过远;建议人脸在画面中的占比超过1/5。 15秒静默状态时,需正视镜头,面带微笑,嘴巴闭合,保持静默。
表2 浏览器适配详情 操作系统类型 浏览器类型 浏览器版本 Windows Chrome浏览器 91+ Edge浏览器 80+ Android 移动版Chrome浏览器 91+ Ios 移动版Safari浏览器 17.3+ Mac Safari浏览器 15.6+ 表3 透明背景支持情况
teAudio,unmuteRemoteAudio。 新增通知speakingStart,speakingStop,speechRecognized,semanticRecognized。 jobInfoChange通知新增isReady参数,用来直接判断任务是否准备好。 2024-04-17
接口参考 主入口(HwICSUiSdk) 事件通知(EventMap) 错误码(ICSError) 授权浏览器麦克风的访问权限 父主题: Web SDK