检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
背景:背景图片列表,可本地导入图片。支持透明背景、纯色背景或导入图片。 PPT:PPT文件列表,需要用户从本地导入后使用。 贴图:各类贴图列表,可本地导入素材。支持在当前画面基础上,增加贴图,丰富视频画面。 视频:各类无声音视频列表,可本地导入视频文件。支持添加为背景视频。 音乐:各类音
第三方平台开播指南 视频直播支持对接淘宝、抖音、拼多多等第三方平台进行直播,相关操作请提交工单或联系客户经理获取。 常见问题 第三方直播平台直播画面不清晰怎么办? 第三方平台直播画面突然中断是怎么回事? 父主题: 附录
拍摄流程 支持手机或相机拍摄,需1080P或更高分辨率。 录制时长为2分钟,包含15秒静默转态和1分45秒的演讲过程。 允许使用中文、英文录制。 录制全程眼睛需注视镜头,周围环境保持安静,脸部光照明亮且均匀。 拍摄完成后不要剪辑,整个视频一起上传至MetaStudio控制台。 注意事项
注意:MetaStudio服务目前仅支持读取docx(包含图文)、txt和md格式,其他格式暂不支持。 docx格式说明:可以没有标题和分级标题, 如需添加标题和分级标题,请使用word标准格式,如图5和图6所示。 txt格式说明:文档内容当前仅支持纯文本,一行对应一条知识。 星火大
如果用户需要查看已生成的照片数字人视频,可参考本节操作。 操作步骤 登录MetaStudio控制台。 在左侧导航栏中,单击“我的创作”。 选择“视频”页签,如图1所示。 在“视频”页面,可以看到已生成的视频列表,以卡片形式排列展示。 支持对视频进行如下操作: 单击播放图标,播放照片数字人视频。 单击,在弹出
语音识别:从下拉框中选择“通用-英文-进场”。 自然语言模型:保持默认值“AIUI通用语义模型”。 管理技能配置:English情景模式下,不支持开启系统预置技能,仅支持开启自定义技能,相应操作请参考配置应用需要的技能。 (可选)开启闲聊技能:可选能力,操作请参考(可选)开启闲聊功能。 模拟测试:操作请参考模拟测试。
景。 一、基本要求 您的产品及服务需要尊重用户隐私,遵守国家的数据保护法律和法规。禁止参与任何干扰、干涉、损害、未授权访问任何终端设备、服务器、网络的活动。 1. 隐私政策要求 您需根据法律要求以自身名义发布隐私政策,并就个人信息的处理行为获取用户同意或取得其他合法性基础。隐私政策的要求包括不限于如下:
直播任务管理 用户创建的直播间会以列表的形式,展示在分身视频直播首页面的“直播任务管理”页签中。支持通过直播任务进入直播间,修改直播内容后,重新开播。 操作步骤 登录MetaStudio控制台。 在“工作台”界面,单击“分身视频直播”下方的“开始创建”,进入分身数字人直播首页面。 单击“直播
激活资源 目前支持购买的资源类型,如表1所示。 需激活“一次性计费”产品后使用,必须在一年内激活,否则无法再激活使用。从激活日期开始计算,产品有效期为一年。 按需套餐包和包年/包月产品,可直接使用,无需激活。必须在有效期内使用完成,超出有效期后,自动失效。 表1 资源类型 服务类型
创建高级版语音训练任务 功能介绍 用户创建语音训练高级版任务,该接口会返回一个obs上传地址,用于上传语音文件。 语音文件为一段WAV格式的长音频文件,仅支持将语音文件打包成zip压缩格式上传。 文件上传后,调用“提交语音训练任务”接口,启动审核和训练。 调用方法 请参见如何调用API。 URI
登录MetaStudio控制台。 在左侧导航栏中,单击“任务中心”。 选择“分身名片”页签,如图1所示。 在“分身名片”页面,可以查看全部任务,包括生成中、生成成功和生成失败的任务。 在下方的名片列表中,可以查看名片详情,包括名片封面、名称、任务ID、提交时间、生成时间、状态等信息。 支持对名片进行如下操作:
配置特殊词表 支持全局设置多音字或者别名,设置完成后,所有视频草稿自动生效。 操作步骤 登录MetaStudio控制台。 在左侧导航栏中,单击“我的创作”。 选择“声音”页签,单击界面右侧的“特殊词表”,进入如图1所示的界面。 图1 特殊词表 单击“新建词表”,界面新增一行特殊词,如图2所示。
登录MetaStudio控制台。 在左侧导航栏中,单击“任务中心”。 选择“照片数字人”页签,如图1所示。 在“照片数字人”页面,可以查看全部生成的视频,包括生成中、生成成功和生成失败的任务。 在下方的视频列表中,可以查看视频详情,包括视频封面、名称、任务ID、生成时间、状态。 支持对视频进行如下操作:
现在拍下二号链接的宝宝,都会额外再送出泡发河粉一个,再送三个响铃卷! 这几个赠品单去购买都要花上十多块的价格才能够买得到。 但是今天在咱们直播间拍下来就直接送给大家, 赠品库存有限,咱先到先得! 这波赠品库存仅剩最后几单,全凭手速,手快有手慢无! 你再犹豫你再纠结,就被拍完、就被抢完了哈!
如果用户需要查看已生成的分身数字人名片,可参考本节操作。 操作步骤 登录MetaStudio控制台。 在左侧导航栏中,单击“我的创作”。 选择“分身名片”页签,如图1所示。 在“分身名片”页面,可以看到已生成的名片列表,以卡片形式排列展示。 支持对名片进行如下操作: 单击,查看分身数字人的语音表达形态。 单击“
9ffa2c6c", } } 用户发送中断对话的消息 文本驱动数字人讲话过程中,支持使用INTERRUPT_CHAT命令,中断数字人与用户的对话。对话被打断后,数字人将停止说话,并发送下一次对话的START_CHAT消息给用户。 详细交互流程如下所示: 用户发送中断对话的消息。
制作照片数字人视频 支持上传正面清晰的人像照片,生成会说话的照片数字人视频。 操作限制 照片数字人视频制作限制,如照片数字人限制所示。 操作步骤 登录MetaStudio控制台。 在“工作台”界面,单击“照片数字人”,进入照片数字人制作页面,如图1所示。 界面左侧展示配置项,右侧展示预览效果。配置操作,请参考表1。
创建基础版语音训练任务 功能介绍 用户创建语音训练基础版任务,该接口会返回一个obs上传地址,用于上传语音文件。 支持2种方式上传语音文件: 语音文件和文本文件打包成zip上传:语音文件已经切分成20个wav文件,每个语音文件对应一个txt文本文件,所有文件打包成zip文件。语音文件命名规则:0
MetaStudio支持的系统策略请参见MetaStudio系统策略。若您需要对除MetaStudio之外的其它服务授权,IAM支持服务的所有策略请参见系统权限。 示例流程 图1 给用户授权MetaStudio权限流程 创建用户组并授权 在IAM控制台创建用户组,并授予Met
声音制作 MetaStudio支持自定义生成声音。 操作前准备 用户创建声音制作任务前,需要参考操作步骤准备如下内容: 参考真人声音录制,提前录制一个WAV或MP3格式的长音频文件,每句之间需要有2~3秒的停顿。语料推荐使用文案样例(基础版)。 声音授权签署文件。 操作步骤 登录MetaStudio控制台。