检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
如何呈现PPT的动画效果? 在视频制作界面导入的PPT,不支持展示动画、视频、动图等动态元素。如需展示动态效果,需将PPT导出为视频后,再上传至MetaStudio控制台使用。 PPT转视频的操作如下所示: 本地打开PPT文件,在左上方的导航栏中,选择“文件 > 导出”。 选择创
最低配置 CPU i5及以上版本。 内存 8G以上。 硬盘 128G及以上。 操作系统 Windows或Android系统。 麦克风 需要有麦克风,且要保障1米以内的拾音效果。 扬声器 需要有扬声器。 触摸屏 需要有触摸屏。 带宽 4M以上。 由于浏览器的安全策略限制,仅支持通过
合成视频二次剪辑后,数字人口型效果变差? 需要检查二次剪辑软件的视频帧率。因为数字人合成视频的帧率为25,如果用户使用软件的帧率为30,需要插帧至数字人视频中,才能达到30,这样就导致插帧后的口型对不上了。所以用户对视频进行二次剪辑时,帧率必须设置为25的整数倍,才不会影响数字人的口型效果。 父主题:
如果数字人形象采集时,面向镜头有行走、倒退或抛接物体等行为,建议数字人视频输出时长不超过2分钟,否则可能会因为MetaStudio动作循环逻辑,导致视频效果不佳。 父主题: 声音和形象制作
浏览器使用限制,请参见表1。 表1 浏览器适配详情 操作系统类型 浏览器类型 浏览器版本 Windows Chrome浏览器 91+ Edge浏览器 91+ Android 移动版Chrome浏览器 91+ iOS 移动版Safari浏览器 17.3+ Mac Safari浏览器 16.5+ 预制唤醒能力
客户声音制作案例 单击声音样例.zip,下载如表1所示的音频文件。 mos分是从音色相似度、情感表达效果和声音音质方面,进行整体效果综合评分的结果。 表1 音频文件 版本 类别 原音文件 合成音文件 版本差异 适用场景 基础版声音制作 女声 基础版媒体1.wav 基础版媒体2.wav
拍摄真人视频 您好!欢迎使用华为云数字人服务,本指南将协助您完成分身数字人形象的采集工作。 请注意,分身数字人形象制作的效果与您的录制效果有较大关联,为了获取更好的数字人效果,我们建议您使用以下标准进行拍摄。 以下是数字人拍摄标准概览,但是我们也建议您详细阅读每一块具体内容: 拍摄规格
形象制作和声音制作支持退订吗? 形象制作和声音制作均为一次性计费产品,不支持退订,用户购买前需谨慎评估。 如果是软件问题导致模型效果不理想,可提交工单申请退订产品。产品经理会对实际情况进行核实,对满足条件的发起特殊退订操作。 父主题: 计费咨询
不能超过32字符。 职称 必填项,数字人职称。 右侧界面的预览效果就是数字人名片的实际生成效果,请输入适量的字符,以确保正常的展示效果。 公司 必填项,数字人公司。 内容较多时,最多支持在名片中分2行展示,超出2行后,默认不展示。为保证名片的效果展示,请保持合理的输入长度。 联系电话 必填项,数字人联系电话,请输入有效的联系方式。
表2 浏览器适配详情 操作系统类型 浏览器类型 浏览器版本 Windows Chrome浏览器 91+ Edge浏览器 80+ Android 移动版Chrome浏览器 91+ iOS 移动版Safari浏览器 17.3+ Mac Safari浏览器 15.6+ 表3 透明背景支持情况
真人声音录制 客户录制真人音频,上传至MetaStudio进行AI训练,即可得到和真人音色1:1复刻的声音模型。 声音模型可实现文本转语音,应用于数字人视频制作、直播、交互问答等场景中。不同版本录制规格如下: 基础版:整段录制生成一个WAV或MP3格式音频,总时长3~10分钟,建议5分钟。
创建智能交互数字人(SDK场景) 介绍如何在MetaStudio平台创建智能交互数字人,实现用户和数字人对话。相应的场景说明,请参考场景说明。 操作步骤 登录MetaStudio控制台,单击“智能交互”。 在智能交互编辑页面,依次设置角色和背景。 查看界面右侧的“互动问答”页签,如图1所示。
创建智能交互数字人 介绍如何在MetaStudio平台创建智能交互数字人,实现用户和数字人交互对话。相应的场景说明,请参考场景说明。 前提条件 已在AIUI开放平台新增配置完成应用。 操作步骤 登录MetaStudio控制台,单击“智能交互”。 在智能交互编辑页面,依次设置角色和背景。
创建智能交互数字人 介绍如何在MetaStudio平台创建智能交互数字人,实现用户和数字人交互对话。相应的场景说明,请参考场景说明。 前提条件 已在奇妙问新增配置完成角色。 操作步骤 登录MetaStudio控制台,单击“智能交互”。 在智能交互编辑页面,依次设置角色和背景。 查
播报内容生成后,单击右侧的“试听”,可以试听播报效果。 语音上传:本地录制音频后上传。音频格式需要为WAV或MP3格式,音频大小不超过20MB,时长不超过5分钟。 在线录音:在线录制音频。录音时长不能超过5分钟,为保证音频生成的效果,请保持录音环境安静无噪音。支持试听录制生成的语音。
创建智能交互数字人 介绍如何在MetaStudio平台创建智能交互数字人,实现用户和数字人对话。相应的场景说明,请参考场景说明。 操作步骤 登录MetaStudio控制台,单击“智能交互”。 在智能交互编辑页面,依次设置角色和背景。 查看界面右侧的“互动问答”页签,如图1所示。 参数配置说明,如表1所示。
s中,监听事件jobInfoChange的通知,以获取任务ID。 建立WebSocket连接,实现用户与数字人对话,详见智能交互驱动。 图2 操作流程图 单击“确定”,创建应用,创建效果如图3所示。 可单击“修改”,修改配置。 图3 互动问答 (可选)单击“对话配置”页签,配置对话,详细操作请参考对话配置。
创建智能交互数字人 介绍如何在MetaStudio平台创建智能交互数字人,实现用户和数字人交互对话。相应的场景说明,请参考场景说明。 操作步骤 登录MetaStudio控制台,单击“智能交互”。 在智能交互编辑页面,依次设置角色和背景。 查看界面右侧的“互动问答”页签,如图1所示。
避免头部大幅度转动或者摆动,避免嘴巴被遮挡,可能造成口型异常。 视频中需保证仅出现录制者及其声音。如果出现其他人物形象或声音,将会影响口型生成效果和声音克隆效果。 避免动作幅度过大超出画面;避免相机距离人过远;建议人脸在画面中的占比超过1/5。 15秒静默状态时,需正视镜头,面带微笑,嘴巴闭合,保持静默。
详细操作为:单击“声音合成”卡片中的“去开通”,在弹出的“开通按需计费服务提示”对话框中,勾选同意协议。单击“确定”,开通按需计费。开通后的效果如图1所示。 如需使用第三方声音进行语音合成,请购买出门问问声音套餐。 图1 声音合成 功能介绍 该接口用于TTS流式合成音频,用于文本转化为语音,并实时返回合成的音频数据。