云服务器内容精选
-
操作步骤 登录MetaStudio控制台,如图1所示。 图1 控制台页面 资源购买入口有两个,用户可以选择其中一种方式进行购买。 单击“购买资源”,进入“购买MetaStudio服务”页面,如图2所示。 单击服务列表中,具体产品分类右侧的“购买”,进入“购买MetaStudio服务”页面,如图2所示。 “产品分类”中高亮展示的是SP用户可购买的资源包类型,置灰展示的是未对SP用户开放的资源包类型。 图2 购买页面 SP用户根据实际情况,选择需要的产品分类、计费模式和购买数量,单击“去购买”。 进入“规格详情”页面,如图3所示。 图3 规格详情 阅读并勾选“我已阅读并同意《MetaStudio服务使用声明》《华为云隐私政策声明》”后,单击“去支付”。 进入订单生成页面,如图4所示。 图4 订单生成页面 查看云服务订单,并选择付款方式,单击“确认付款”。 订单支付成功后,返回如图5所示的页面,说明资源购买成功。 图5 订单支付成功
-
操作步骤 访问云商店 语音合成 商品页面,进入云商店的“语音合成”商品购买页面。 用户可以在界面下方查看商品详情,确定要购买的商品规格。 图1 云商店 选择“语音合成体验套餐”,单击“立即购买”,进入购买页面。 下面以购买“语音合成体验套餐”为例,进行操作说明。 图2 订单确认页面 阅读并勾选所有协议和相关授权,单击“去支付”,进入订单支付页面。 图3 订单支付页面 按照界面提示,选择您的付款方式,完成支付即可。 订单支付成功后,进入如图4所示的界面。 图4 订单支付成功
-
操作步骤 登录MetaStudio控制台。 单击“分身形象制作”下方的“开始创建”,进入分身形象制作页面。 界面左侧是定制分身数字人的数据上传界面。 界面右侧上方,展示分身数字人定制流程。下方展示训练视频拍摄指导和样例视频,包括:拍摄前准备、拍摄中操作和拍摄后处理,有效指导用户拍摄生成一段完整可用的训练视频,用于训练生成分身数字人。 图1 定制数字人形象 上传分身数字人训练数据。 界面操作详情,如表1所示。 表1 界面操作说明 区域 参数 说明 分身数字人训练数据上传 角色名称 输入分身数字人的角色名称。 示例:云笙。 训练视频 支持提供如下2类视频,训练生成数字人形象。 分身数字人:从本地上传已录制好,且符合拍摄要求的真人人像视频。 录制的视频要求4K,时长建议5~6分钟,分辨率≥1080P,宽高比16:9(横屏)或9:16(竖屏),建议优先使用竖屏拍摄。支持MP4、MOV格式的视频。 训练生成的分身数字人形象与真人形象完全相同,如图2所示。 虚拟数字人:从本地上传3分钟以上的虚拟形象动作和说话视频。 视频时长建议3分钟以上,分辨率≥1080P(4K最佳),宽高比16:9(横屏)或9:16(竖屏),建议优先提供竖屏视频。支持MP4、MOV格式的视频。 视频中的虚拟数字人形象,是基于真人风格化后的形象,如图2所示。需客户自己准备形象,并生成其动作和说话视频。 背景替换 分身数字人是否支持更换背景。 包含如下选项,请根据实际情况选择: 抠除拍摄背景:制作分身数字人视频时,可以更换背景。 保留拍摄背景:分身数字人使用拍摄时的原背景,不支持更换背景。 视频封面(可选) 视频封面。支持jpg、jpeg和png格式。 身份认证及授权数据上传 联系方式 请输入有效的11位手机号码。 身份证照片 需要分别上传身份证人像面和国徽面的照片。 单击“点击上传人像面”,从本地选择身份证人像面照片上传。 单击“点击上传国徽面”,从本地选择身份证国徽面照片上传。 形象授权 上传形象授权书。 操作如下所示: 单击“授权书模板”,将授权书模板下载本地。 打印授权书,由身份证本人完成签署操作。 扫描文件生成pdf文件,或拍摄文件生成jpg、png格式的图片。 单击“点击上传授权书”,从本地选择pdf、jpg或png格式的授权书上传。 授权书内容,可参考授权书。 图2 数字人说明 单击“提交制作”。 数据上传完成后,界面提示“制作任务提交成功!”,如图3所示。 数字人定制任务提交成功后,需要等待1天左右的时间审核。任务审核通过后,才能进行算法训练操作。 图3 制作任务提交成功 用户可以单击“查看制作任务列表”,进入分身数字人定制任务列表页面。 单击任务所在行的“查看详情”,进入“定制任务详情”页面。 查看分身数字人定制任务审核进展。当前状态为“系统审核中”,需要等待服务管理员审核通过后,状态变更为“待算法训练”。 如果数字人定制任务被驳回,需要查看驳回原因,并重新按照要求录制视频并上传。 操作步骤详情如下所示: 在服务主界面,单击左侧导航栏中的“任务中心”。 查看“分身数字人”页签的数字人定制任务列表,找到被驳回的数字人定制任务。 任务状态为“审核未通过”。 单击任务右侧的“查看原因”,在弹出的“审核未通过”对话框中,查看审核未通过的原因。 按照规范重新录制或提供符合规范的视频。 单击任务右侧的“更换视频”,上传更新后的视频。 数字人定制任务重新进入审核流程。
-
更新凭证 访问我的声音凭证页面,可以看到已激活的accessKey和secretKey信息。 图4 声音凭证 单击右侧的“编辑”,在弹出“修改序列号”对话框中,输入使用其他华为云账号购买的语音合成套餐用户凭证,如图5所示。 用户凭证的查询方式,如获取accessKey和secretKey所示。 图5 更新凭证 单击“确认修改”,界面提示“修改成功”。 修改成功后,自动生效,无需重新激活第三方声音。
-
操作步骤 登录MetaStudio控制台。 在“工作台”界面,单击“分身视频制作”下方的“开始创建”。 进入视频制作界面,界面详情如视频制作界面说明-图1所示。操作说明如下所示: 视频素材区域,除了系统预置素材外,角色还可以自定义新增分身数字人,背景、PPT、贴图、视频和音乐还可以从本地导入使用。 从视频素材区域添加到画布区域中的PPT、贴图、视频和数字人支持进行图层管理,如:上移一层、下移一层、置顶、置底、应用到全局、删除等。还支持设置大小,拖动位置。 可以单击画布区域右下方的图标,切换视频画面比例为横屏“16:9”或竖屏“9:16”。 画布制作完成后,再制作语音。 支持下述2种方式生成语音。每个场景仅支持选择一种音频生成方式。 文本驱动 在文本输入框中,输入文本内容,以生成音频,如图1所示。 文本示例:今天是9月26日,星期二,天气晴朗,欢迎大家到访。我们精心布置了现场,室内摆放了各类植物和鲜花,场地宽敞明亮,足够大家在室内共同交流和活动。 图1 文本驱动 文本内容的操作说明如表1所示。 表1 操作说明 操作 说明 插入停顿 将鼠标放在需要停顿的文字右侧,单击“插入停顿”。在弹出的提示框中,选择“换气”或者停顿的时间。 连读 选中需要连读的文本内容,单击“连读”。 多音字 选中文本中的多音字,单击“多音字”,在弹出的提示框中,选择正确的发音或者自定义发音。 别名 选中需要通过别名播报的文本内容 ,单击“别名”,设置为实际播报的内容。 数字英文 示例数字“1024”的读法如下所示: 数字:一零二四 数值:一千零二十四 日期:十月二十四 电话:幺零二四 示例英文“API”的读法如下所示: 字母:API 单词:api 音标 选中英文单词,输入合适的音标。 局部语速 选中需要变速播报的文本,设置局部语速。 取值范围[0.5x,2x],含义如下所示: 0.5x:0.5倍速播报,即减速播报。 2x:2倍速播报,即加速播报。 全局语速 设置全局语速。 取值范围[0.5x,2x],含义如下所示: 0.5x:0.5倍速播报,即减速播报。 2x:2倍速播报,即加速播报。 音色设置 单击音色名称,在弹出的声音对话框中,选择需要的声音。 无标注的系统声音,均为免费声音,可直接选用。 标注有“第三方”的声音,需要购买激活后才能使用,操作请参考(可选)购买第三方声音。 试听 单击“试听”,试听语音效果。 图标 单击图标,放大展示“文本驱动”页签,提升用户操作体验。 单击“确定”,可关闭页面。 图标 调整视频播报的音量。 图标 单击图标可开启字幕展示,并可在画布左侧设置字幕的字体、大小和位置等。 “音频驱动”方式目前仅支持中文普通话的场景开启字幕。 图标 展示当前视频的宽高比。 图标 第一次单击可折叠“文本驱动/视频驱动”,第二次单击后恢复展示。 音频驱动 需从本地上传已录制好的音频。音频文件格式需要为WAV、MP3或M4A,大小不能超过100M。 可单击“导入”上传音频,也可以直接拖拽本地音频文件至提示区域中,完成上传。单击左侧的图标,可试听音频效果。如果音频效果不佳,可以单击“导入”,覆盖更新音频。 图2 音频驱动 音频制作完成后,可单击“音量”,调整音频的音量。 上述操作全部完成后,第一个场景的视频内容已制作完成。 如果还需要制作更多场景,可单击“场景”区域的“+”图标,新增场景。制作过程参考第一个场景即可。 如果视频内容是分享PPT,可在“PPT”页签,先从本地导入PPT,再插入需要分享的PPT页。每页PPT会对应生成一个场景,依次设置完成所有场景即可。 所有场景设置完成后,单击界面右上角的“合成视频”,弹出“合成设置”对话框。 参数设置说明如下所示: 分辨率:根据实际情况,选择视频的分辨率。 导出为:输入导出文件的名称。 画质增强:开启后将提升视频清晰度,合成时间相应变长。请根据实际情况确定是否开启。 单击“确定”,弹出“视频制作任务中心”对话框。 可查看视频合成任务的进度,直至合成成功。 单击“合成成功”状态右侧的图标,进入视频详情页面,如图3所示。 单击“预览”,可以看到合成的视频。预览过程中,可全屏播放,或下载视频到本地。 图3 视频详情 如果用户对合成的视频不满意,可以参考下述步骤,进行二次制作,重新合成。 在左侧导航栏中,选择“工作台”。 在“最近项目”区域,选择“视频项目”页签后,右侧页签选择“视频草稿”,查看视频草稿列表,如图4所示。 图4 视频项目 将鼠标移至卡片的文字描述区域,单击“编辑视频”,如图5所示。 进入 视频编辑 界面,更新视频内容,重新合成视频。 图5 我的视频
-
直播间界面 视频直播 制作界面如图2所示。各区域详细说明,如表1所示。 图2 视频直播制作界面 表1 界面说明 区域 说明 ① 素材区域,包括如下内容: 模板:视频直播模板,“模板”页签仅管理员可见。 角色:数字人形象列表,可选择需要使用的数字人形象,支持自定义。 背景:背景图片列表,支持本地导入。可选择需要使用的背景图。 贴图:各类贴图列表,支持本地导入。支持在当前画面基础上,增加贴图,丰富视频画面。 视频:无声音视频素材列表,支持本地导入,支持MOV、MP4、M4V、MKV、FLV、3GP、WMV和AVI格式的视频文件。支持添加为背景视频。 商品:商品列表。需要自定义创建商品,一个商品可以同时包含贴图、视频、文本和音频内容。 文本:文本模板列表,可选择一个文本模板,在视频直播画面上添加文本。 ② 直播画面预览窗口,用于预览视频直播静态画面效果。 ③ 直播剧本由多个场景构成,每个场景由多个段落组成。 支持新增、复制场景,并为每个场景设置对应的数字人形象、背景、声音等内容。 支持新增、复制段落,或使用txt格式文本导入剧本,平台自动解析输入内容。 您可根据需求选择下述一种剧本驱动的方式: 剧本驱动 支持下述三种方式任选其一: 文本驱动:输入文本,通过文本驱动数字人说话。 音频驱动:上传音频,通过音频驱动数字人说话。 即兴直播:无需设置剧本,直接开播。开播后数字人是不说话的,需要发送互动内容,或者开启真人接管,驱动数字人说话。 互动设置:支持弹幕、用户入场 、点赞和送礼设置。 直播配置:支持开播设置、输出设置、风控设置和更多设置。 ④ 左侧为当前视频直播的名称,支持自定义设置。 中间区域,从左往右依次为直播间名称编辑图标、操作回退图标、操作恢复图标和屏幕布局图标,默认为“9:16”。 右侧依次为下述内容: :保存图标,图标右侧自动展示最近一次的保存时间。 :清空图标,单击可以一次性清空直播间所有内容。
-
视频直播首页面 分身视频直播首页面,如图1所示。各个页签的说明,如下所示: 直播管理:使用数字人创建直播间。操作请参考视频直播。 互动管理:支持新增互动库,及其相应的互动规则。互动库可以直接在直播间中导入使用。操作请参考互动管理。 商品管理:支持新增商品。商品会自动展示在直播间的“商品”页签中,供直播间添加使用。操作请参考商品管理。 直播任务管理:用户创建的直播间列表。支持通过直播间任务进入直播间,修改直播间内容后,重新开播。操作请参考直播任务管理。 图1 首页面
-
操作步骤 登录MetaStudio控制台,如图1所示。 如果SP用户已为当前租户分配了可用的资源,租户无需再从服务列表中购买资源了。 图1 控制台页面 在左侧导航栏中,选择“资源管理”,进入“资源管理”页面,如图2所示。 用户可以看到每种资源,已分配的资源总量、可用剩余量、创建时间和到期时间。 图2 资源管理 在左侧导航栏中,选择“服务概览”,回到MetaStudio控制台主页面。 单击“前往MetaStudio”,进入MetaStudio工作台,可以参考用户指南手册,进行相关操作了。
-
操作步骤 登录MetaStudio控制台,如图1所示。 图1 控制台页面 在左侧导航栏中,选择“租户管理”,进入“租户列表”页面。 单击“关联租户”,进入“关联租户”页面,如图2所示。 参数说明如下所示: 租户id:请输入项目ID,获取方式如获取项目ID所示。租户的项目ID必须与SP用户申请成为SP用户时,提供的项目ID所在Region保持一致。 租户名称:输入自定义租户名称,方便SP用户识别租户身份即可。 图2 关联租户 单击“创建”,租户创建完成,如图3所示。 图3 租户列表 如需取消关联,可单击右侧的“取消关联”,在弹出的“取消关联租户提示”对话框中,单击“确定”。 租户取消成功后,租户未使用的资源将被收回。
-
操作步骤 登录MetaStudio控制台。 在“工作台”界面,单击“分身视频直播”下方的“开始创建”,进入分身数字人直播首页面。 单击“互动管理”,进入如图1所示的页面。 图1 互动管理页面 在左侧“互动库”区域,单击下方的“新增互动库”,上方新增一条横线,如图2所示。 输入互动库的名称。支持对互动库执行如下操作。 单击互动库右侧的,从下拉框中选择“重命名”,修改互动库名称。 单击互动库右侧的,从下拉框中选择“复制”,复制当前互动库,生成一个新互动库。 单击互动库右侧的,从下拉框中选择“删除”,删除当前互动库。 图2 互动库 选中左侧的互动库,单击界面右侧的“新建”,弹出“新建互动”对话框,如图3所示。 可以给当前互动库,新增1条互动规则。参数配置说明,如表1所示。 图3 互动规则 表1 互动规则配置说明 参数 说明 类型 互动类型。 包含如下选项: 弹幕 用户入场 点赞 送礼 互动名称 互动名称。 触发方式 触发关键词,多个关键词用“|”分割,示例“链接|型号|优惠”。 服务扫描弹幕的时候,如果扫描到此关键词,自动回复当前互动内容。 回复方式 选择主播或助播进行回复,具体回复内容支持通过下述方式设置。 文本:通过文本方式设置回复内容,最多可增加5条回复。直播间开播后按照触发次数,从前往后依次命中答复,每次仅回复一条文本内容。 示例:关于产品的链接、型号和优惠等问题,请看界面上方的说明,按照说明操作,就可以详细了解了。 音频:从本地上传一个音频文件,支持MP4、WAV和M4A格式。当命中此规则后,使用此音频进行回复。 智能交互:通过智能交互的方式回复用户问题,相当于提供了一个第三方语言模型去答复用户问题。 素材绑定(可选) 从本地选择图片或视频上传。当直播间命中当前互动内容进行答复时,同时会在直播画面展示这里上传的图片或视频。 单击“保存”,一条互动规则新增完成。 用户可以根据实际情况,为当前互动库增加更多的互动规则,或者增加更多的互动库。 支持对互动规则执行下述操作: 单击互动规则右侧的“编辑”,在弹出的“互动编辑”对话框中修改互动规则。 单击互动规则右侧的“复制”,复制当前互动规则,生成一条新的互动规则。 单击互动规则右侧的“删除”,删除当前互动规则。
-
视频制作界面说明 用户启动制作视频时,可以先了解下视频制作界面详情。 视频制作界面如图1所示。各区域详细说明,如表1所示。 用户使用数字人形象创作的视频,都会自动保存在MetaStudio控制台首页“最近项目”区域的“我的视频”页签中。用户可以根据实际情况,进行二次创作。 图1 视频制作界面 表1 界面说明 序号 区 域名 称 说明 1 视频素材区域 设置视频的场景,包括如下内容: 模板:系统预置视频模板列表。支持基于系统预置模板,一键快速制作数字人视频。 注意:只有管理员可以自定义新增模板。 角色:自动展示系统预置的分身数字人列表,用户可以直接使用已有的数字人去创作生成视频。如果预置的数字人不满足用户需求,单击“定制数字人”,可以定制自己需要的数字人形象。 背景:背景图片列表,可本地导入图片。支持更换背景图。 PPT:PPT文件列表,需要用户从本地导入后使用。 贴图:各类贴图列表,可本地导入素材。支持在当前画面基础上,增加贴图,丰富视频画面。 视频:各类无声音视频列表,可本地导入视频文件。支持添加为背景视频。 音乐:各类音乐列表,可本地导入音频文件。支持添加为背景音乐。 文本:用于在画布中添加文本。 2 画面布局区域 视频画面制作区域,可以制作和预览视频画面。 3 音频制作区域 音频制作区域,可选择下述1种方式生成音频。 文本驱动:通过输入文本的方式生成音频。文本支持插入停顿、调整语速,如果是多音字可设置正确的发音,还可以选择不同的声音,试听生成的音频效果。支持开启字幕展示功能。 音频驱动:从本地上传音频文件,作为视频的语音。音频驱动方式,仅支持中文普通话的场景下能开启字幕。 还可以设置音频的音量,和调整画布的横竖屏展示。 4 视频场景区域 如果一个视频包含多场景,可以新增场景依次制作,顺序播放。 5 文件设置区域 从左往右依次为: 单击文件名称右侧的图标,可自定义视频草稿的名称。 单击图标,保存视频制作任务。 单击图标,弹出“视频制作任务中心”对话框,可以看到视频制作任务列表,并查看当前视频的合成进展。 单击“合成视频”,合成数字人视频。 父主题: 视频制作
-
操作步骤 登录MetaStudio控制台。 单击“声音制作”下方的“开始创建”,进入声音制作页面。 界面左侧是声音制作页面,右侧为声音制作流程。声音制作录制教程,可以帮助用户快速制作声音。 图1 定制声音 配置声音制作参数。 界面操作详情,如表1所示。 表1 界面操作说明 区域 说明 请选择声音制作服务 系统提供如下声音制作服务,请选择一种声音制作服务。 基础版声音制作:仅需20条语料。音频格式为WAV文件。音频时长为3~10分钟,建议5分钟。 进阶版声音制作:仅需100条语料。音频格式为WAV文件。音频时长10~30分钟,建议15分钟。 高品质声音制作:需要500条语料。音频格式为WAV文件。音频时长1小时以上,建议1小时。仅支持录制成长音频,每句之间需要有2~3秒的停顿。 每种声音制作服务后面都会展示剩余次数,需要保证剩余次数充足。 其中,进阶版和高品质声音制作需要更多语料,训练时长更长,声音效果更佳。 请完善声音信息 输入声音名称。 示例:欢快女声。 请选择声音性别 声音的性别,如下所示: 男生 女生 原始输入语言 声音的原始输入语言,包含如下选项: 中文 英文 选择声音标签 声音的标签,包含如下选项: 新闻 营销 针对上述标签,MetaStudio服务预置了相应的文案内容,如文案样例(基础版)、文案样例(进阶版)和文案样例(高品质)所示。如果按句录制方式(仅基础版和进阶版支持),且使用预置文案,必须选对标签。 请制作声音 制作声音的方式为: 语料上传:界面提供录音指导,需要按照指导,基础版录制20句音频,进阶版录制100句音频,高品质声音制作需要录制500句以上的音频。音频仅支持wav格式。建议整段录制生成一个长音频文件,直接上传,无需压缩,无需携带文案txt文件。 在线录音:需要用户在线录制,先单击“开始环境检测”。首次录制界面会弹出提示,需要允许使用您的麦克风。当界面显示“录制环境合格”时,单击下方的“开始录音”。界面会弹出提示,开始录音后,将不能更改前面设置的基础信息,单击“确定”。单击“开始录音”,启动录制。根据界面提示,录制20条或100条合格的语料音频即可。 高品质声音制作,不支持在线录音方式。 如果选择“语料上传”的方式,且未使用服务预置文案,声音标签仅作为标签,来区分声音使用场景;如果选择“在线录音”的方式,服务会根据声音标签,生成其对应格式的音频文件,界面不展示音频文件格式,用户可不关注。 声音授权 单击“授权书模板”,下载授权书模板后打印。用户手写相关信息后,重新生成签署后的pdf文件,或者拍摄成jpg或png格式的图片后上传。 授权书内容,可参考授权书。 单击“提交制作”。 弹出“资源消耗提示”对话框。提示用户目前声音制作服务剩余数量,本次将消耗1个资源。 如果用户确认无误,单击“确认提交”。 声音制作任务提交成功后,界面提示“制作任务提交成功”,如图2所示。 声音制作任务提交成功后,需要等待1天左右的时间审核。任务审核通过后,启动声音制作。 图2 制作任务提交成功 用户可以单击“查看制作任务列表”,查看声音制作任务审核进展。 当状态变更为“系统审核完成”,自动启动算法训练。如果系统存在多个算法训练任务,可能会存在排队和延迟的现象,请耐心等待。
-
操作步骤 登录MetaStudio控制台,如图1所示。 图1 控制台页面 在左侧导航栏中,选择“租户管理”,进入“租户列表”页面,如图2所示。 图2 租户列表 单击租户名称右侧的“分配”,弹出“分配资源”对话框,如图3所示。 用户需要参考表1进行配置,如果需要分配多种资源类型,可单击右侧的图标,新增资源行。 图3 分配资源 表1 参数说明 参数 说明 请选择资源类型 从下拉框中选择已购买的资源类型。 示例:分身数字人形象制作。 请选择资源实例 从下拉框中选择已购买的资源实例。 示例:分身数字人形象制作 - 2023-11-14。 请选择资源数量 设置资源数量,不能超过所选资源实例包含的个数。 示例:5。 请选择日期 选择当前租户使用已分配资源的有效截止日期,超出此日期后,资源自动释放回资源包中。SP用户可再次分配给租户使用。 单击“确定”。在“租户列表”页面,查看分配效果,如图4所示。 以506租户的“分身形象制作(个)”列为例,“5 / 5”中第一个5说明当前资源实例分配了5个分身形象制作资源给当前租户;第二个5的含义为当前租户还剩余5个分身形象制作资源可用。 图4 租户列表 如需收回当前租户的资源,可单击租户右侧的“查看详情”,进入“租户详情”页面,如图5所示。 在下方的“资源列表”中,可以找到已分配的“分身数字人形象制作”资源。 图5 租户详情 单击资源右侧的“回收”,弹出“回收资源”对话框,如图6所示。 可以看到资源名称、可回收量、分配时间和到期时间。 图6 回收资源 根据实际情况,设置本次需要回收的数量(示例:2),单击“确定”。界面右上角提示“回收成功”,租户未使用的这些资源将被收回。 在“租户详情”页面的“资源列表”中可以看到,“分身数字人形象制作”的总量和可用量均从5降至3了。 图7 租户详情
-
示例流程 图1 给用户授权MetaStudio权限流程 创建用户组并授权 在 IAM 控制台创建用户组,并授予MetaStudio管理员权限“MetaStudio FullAccess”。 创建用户并加入用户组 在IAM控制台创建用户,并将其加入1中创建的用户组。 用户登录并验证权限 新创建的用户登录控制台,验证MetaStudio FullAccess的管理员权限。 在“服务列表”中选择数字内容生产线,进入服务主界面,单击“分身形象制作”,并参考形象制作,制作分身数字人。如果制作成功,说明“MetaStudio FullAccess”已生效。
-
操作步骤 登录MetaStudio控制台。 在“工作台”界面,单击“分身视频直播”下方的“开始创建”。 进入分身数字人直播首页面,如图1所示。 图1 分身视频直播首页面 在“直播管理”页签,单击“创建直播间”,进入视频直播制作界面。 界面详情如视频直播界面说明所示,对应操作说明如下所示: 在左侧的素材区域,除了系统预置的视频素材外,角色还可以自定义定制数字人;背景、贴图、视频还支持从本地导入使用;商品可以自主创建;文本可自主输入文字内容。 从素材区域添加到预览窗口中的贴图、视频和数字人支持进行图层管理,如:上移一层、下移一层、置顶、置底、应用到全局、删除等操作。还支持设置大小,拖动位置。 视频直播画面创作完成后,请根据实际情况,选择下述一种直播剧本驱动方式。 “剧本驱动”包含3种方式: 文本驱动 需要通过文本驱动数字人说话。支持下述2种方式,增加文本内容。 直接在各个场景的段落框中输入文本内容。可单击图标,新增更多的段落。 单击右上方的“导入”,从本地导入不少于200字的txt文件。如果多个段落,可通过换行来实现,平台会自动解析输入内容。 手工输入文本示例,如下所示: 请注意,当前仅为效果演示,实际需要满足单场景不少于200字,单段落不多于2000字的要求。 段落1.1:大家好,今天欢迎来到会议室,我们今天讨论的主题是:如何更好的学习和工作。 段落1.2:我们每个人都有自己的学习和工作,难免会遇到一些问题。当我们遇到问题的时候,应该如何解决的呢? 图2 文本驱动 文本内容的操作说明如表1所示。 表1 操作说明 操作 说明 插入停顿 在段落的某个位置,插入换气或者停顿时间。 多音字 选中文字,设置多音字的正确读音。 全局语速 设置全局语速,取值范围[0.5X,2X]。设置为0.5X时,声音放慢至0.5倍速播放;设置为2X时,声音加速至2倍速播放。 助播 选中一段文字,设置为助播来播报这段内容。 全局声音(主播) 主播全局声音,适用于直播间所有场景。如果单场景有单独设置声音,优先使用单场景的声音播报。 有默认声音,用户也可以根据实际情况选择其他声音。 如果需要使用标注“第三方”的系统声音,请参考(可选)购买第三方声音进行操作。 全局声音(助播) 助播全局声音,适用于直播间所有场景。单场景不支持单独设置助播声音。 开播后的效果,如图3所示。如需进行互动,可单击图标,切换到助播声音。输入并发送互动内容,主播暂停播报,并使用助播声音插播发送成功的互动内容。 导入 支持从本地导入文本文件,解析生成段落内容。 导入文件需满足: 支持txt格式,且字数不低于200字。 文本内容根据换行,自动解析为段落。 试听 单击“试听”,可以试听当前直播间剧本。 默认使用全局主播声音播报,如果单场景有单独设置声音,优先使用单场景的声音播报。单独标注助播的内容,会使用全局助播的声音进行播报。 也可以单击段落区域的试听图标,试听当前段落。 场景操作 支持对场景,执行下述操作: :修改场景名称,默认值为“场景1” :设置当前场景播报的声音,直播时会优先使用此声音播报当前场景内容。 :复制当前场景,新增一个相同场景。 :删除当前场景。 :调整场景的位置。 :为当前场景新增1个空白段落。 段落操作 支持对段落,执行下述操作: :修改段落名称,默认值为“段落1.1”。 :试听当前段落的播报效果。 :复制当前段落,新增一个相同段落。 :删除段落。 :调整段落在场景中的位置。 :新增1个空白段落。 图3 开播界面 音频驱动 单击“上传音频”,从本地上传已录制好的音频,如图4所示。 每个音频不能超过100M,支持WAV、M4A和MP3格式,每个场景的音频总时长不能低于1分钟。 开播后会直接播放音频,声音是音频原有声音。用户也可以设置主播和助播的声音,用于开播后,使用主播或助播声音,播报发送的互动内容。 图4 音频驱动 音频上传完成后,单击“试听”,可试听音频。 开播后可单击如图5所示的图标,切换到全局主播或助播的声音,发送互动内容成功后,播报互动内容。 图5 开播页面 即兴直播 无需设置剧本,直接开播,界面如图6所示。开播后数字人保持静默,需要发送互动内容或者通过真人接管,驱动数字人说话。 图6 即兴直播 如果还需要制作多场景,可以单击直播画面预览窗口右侧“场景1”小窗口下方的“+”图标,新增场景,并参考前一个场景,设置生成下一个场景的画面布局和剧本内容。 图7 直播间界面 所有场景的画面布局和剧本设置完成后,单击界面右侧的“互动设置”页签,如图8所示。 互动设置包含4类设置:弹幕、用户入场、点赞和送礼。支持直接导入互动管理中设置好的互动库,也支持在当前直播间逐条设置互动规则。所有类型总计可添加100个互动规则。 这4类互动设置新增互动规则的操作基本相同,下面以弹幕为例,进行操作说明。 图8 互动设置 单击图8中的“添加规则”,展示如图9所示的界面。 界面下方新增1个规则设置。 先设置用户弹幕触发规则的关键词,如果有多个,请以“|”分隔,示例“链接|型号|优惠”。即服务扫描弹幕的时候,如果扫描到此关键词,自动回复当前规则内容。 在下方选择主播或助播回复用户问题,回复内容支持通过下述2种方式设置。 文本:通过文本方式设置回复内容,最多可增加5条回复。直播间开播后按照触发次数,从前往后依次命中答复,每次仅回复一条文本内容。 示例:关于产品的链接、型号和优惠等问题,请看界面上方的说明,按照说明操作,就可以详细了解了。 音频:从本地上传一个音频文件,支持MP4、WAV和M4A格式。当命中此规则后,使用此音频进行回复。 智能交互:通过智能交互的方式回复用户问题,相当于提供了一个第三方语言模型去答复用户问题。 回复问题的时候,支持同时在直播画面中展示图片或者视频信息,以加强回复效果。图片和视频的添加和设置方式完全相同,下面以图片为例,进行操作说明。 单击下方的“+”区域框,从本地选择图片或视频,添加到“+”区域框中。 添加成功后,区域框展示图片缩略图,如所示。 将鼠标放在区域框中,区域框变化为形式。 单击“预览”,图片被添加到直播画面预览窗口中,可根据实际情况拖动图片的展示位置或者调整图片大小。 图9 弹幕设置 单击“新增”,可参考6.a,添加更多的弹幕回复规则。 等所有弹幕规则增加完成后,支持单击“新增兜底”,新增新增一条兜底规则,设置方式与6.a相同。 其含义为:用户问题如果未匹配到已有规则,可触发兜底回复,仅支持设置1条兜底回复。 支持对已有规则,执行下述操作: 批量管理:支持批量设置所选规则使用的场景,或批量删除所选规则。 弹幕回显:开启“弹幕回显”后,在直播画面中可以看到一条文本信息:正在回复[用户名称]:[弹幕内容]。 全部启用:可以直接“全部启用”所有规则。 :设置单规则使用的场景。 :启用或关闭当前规则。 :删除规则。 单击界面右侧的“直播配置”页签,如图10所示。 直播配置说明,如表2所示。 图10 我的视频 表2 直播配置 区域 参数 说明 开播设置 选择开播方式(二选一) 请根据实际情况,选择一种开播方式,并按照界面提示进行操作。 输出设置 直播画面 选择直播画面的清晰度。 包含如下选项: 流畅 高清 超清 默认值:高清。 播放次数 设置直播循环播放的次数,或“无限循环”。 默认播放1次。 直播窗口 直播窗口展示尺寸,不同方案均可调整为竖向。 包含如下选项: 竖屏 全屏:推荐用全屏,捕获的画面更大,需在直播伴侣中旋转使用。 默认为“竖屏”。 风控设置 须知: 仅“播放次数”选择“无限循环”时展示风控设置相关的配置。 主播轮换 如果直播间有多个场景,支持开启主播轮换,最多支持选择5个主播,实现主播随着场景的变化进行更换。 须知: 前面操作过程中,各个场景均已设置了相应的主播,即原主播。如果这里开启了“主播轮换”,且选择了形象,即备主播,那么直播时,每个场景会随机选择原主播或备主播进行播放。所以直播画面的主播不一定是这里设置的备主播。 随机播放 如果开启随机播放,支持设置“随机规则”,包含如下选项: 按场景随机:视频直播过程中,随机选取任一场景进行播放,且确保场景不重复播放。场景中的段落仍按顺序播放。 按段落随机:视频直播过程中,场景播放顺序不变,场景内的段落进行随机播放,且确保段落不重复播放。 场景和段落都随机:视频直播过程中,随机选取任一场景中的任一段落播放,且确保所有场景及其所有段落均不重复播放。 更多设置 事件回调地址 可在直播中返回场景、段落事件的字段,适用于接口调用或客户二次开发使用的场景。 直播间ID 无需设置,当前直播间保存后自动展示。 上述操作完成后,需要单击界面右上角的图标,保存直播内容。 单击界面右下方的“准备开播”,准备开播。 即兴直播方式,无需执行本步骤的下述子步骤。 弹出“风险提示”对话框,如图11所示。 用户需要参照风险提示项,逐一核查并优化直播内容。 图11 风险提示 用户可以等直播风险消除后再开播,也可以直接选择“承担风险开播”后,等待直播启动。 直播启动成功后,直播画面预览窗口中,会展示直播启动的进度。 开播后的效果如图12所示。界面右下方的操作说明,如表3所示。 图12 开播页面 表3 界面说明 界面元素 说明 00:01:20 直播计时,当前已直播1分20秒。 切换互动内容播报的声音。默认为主播声音,可切换为助播声音。 单击快捷图标,选择预置的互动内容发送播报。 请输入互动内容,回车发送内容 手工输入互动内容,发送成功后,主播或助播进行互动内容插播。插播结束后,继续播报原有内容。 真人接管 单击“真人接管”,开启真人接管功能。数字人停止发声,仅保留动作,改由真人发声。 真人发声结束后,单击“取消真人接管”,关闭真人接管功能,继续播报原有内容。 暂停 单击“暂停”,暂停播报。 单击“继续”,可恢复播报。 停止 单击“停止”,关闭当前直播。
更多精彩内容
CDN加速
GaussDB
文字转换成语音
免费的服务器
如何创建网站
域名网站购买
私有云桌面
云主机哪个好
域名怎么备案
手机云电脑
SSL证书申请
云点播服务器
免费OCR是什么
电脑云桌面
域名备案怎么弄
语音转文字
文字图片识别
云桌面是什么
网址安全检测
网站建设搭建
国外CDN加速
SSL免费证书申请
短信批量发送
图片OCR识别
云数据库MySQL
个人域名购买
录音转文字
扫描图片识别文字
OCR图片识别
行驶证识别
虚拟电话号码
电话呼叫中心软件
怎么制作一个网站
Email注册网站
华为VNC
图像文字识别
企业网站制作
个人网站搭建
华为云计算
免费租用云托管
云桌面云服务器
ocr文字识别免费版
HTTPS证书申请
图片文字识别转换
国外域名注册商
使用免费虚拟主机
云电脑主机多少钱
鲲鹏云手机
短信验证码平台
OCR图片文字识别
SSL证书是什么
申请企业邮箱步骤
免费的企业用邮箱
云免流搭建教程
域名价格