检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
ShootScript(); shootScriptShootScripts.withScriptType(ShootScript.ScriptTypeEnum.fromValue("TEXT")) .withTextConfig(textConfigShootScript)
单击“上传音频”,从本地上传已录制好的音频,如图4所示。 每个音频不能超过100M,支持WAV、M4A和MP3格式,每个场景的音频总时长不能低于1分钟。 开播后会直接播放音频,声音是音频原有声音。用户也可以设置主播和助播的声音,用于开播后,使用主播或助播声音,播报发送的互动内容。 图4 音频驱动
表2 请求Header参数 参数 是否必选 参数类型 描述 X-Auth-Token 否 String 用户Token。使用Token鉴权方式时必选。 通过调用IAM服务获取用户Token接口获取。 响应消息头中X-Subject-Token的值。 Authorization 否 String
需要申请开通智能交互权限后,才可以使用分身数字人智能交互功能。 智能交互对硬件设备的最低配置要求,如智能交互使用限制所示。 与数字人智能交互的界面,对浏览器的要求,如智能交互使用限制所示。 父主题: 智能交互
说明 类型 互动类型,选择“弹幕”。 互动名称(可选) 互动名称,示例:欢迎进入直播间。 触发方式 当前互动触发的方式,请根据实际情况设置。 回复方式 选择“文本回复”,输入文本内容,当满足触发方式时,数字人会阅读文本内容。 素材绑定(可选) 从本地选择图片或视频上传。当直播间命中
训练视频 从本地上传已录制好,且符合拍摄要求的真人实景视频,训练生成Flexus数字人形象和Flexus声音。 录制的视频时长1~5分钟,建议2分钟,分辨率需≥1080P(4K最佳),宽高比16:9(横屏)或9:16(竖屏),建议优先使用竖屏拍摄。支持MP4、MOV格式的视频,推荐MP4格式。
codec 否 String 参数解释: 图片编码格式。 约束限制: 用户无需填写,系统自行提取。 取值范围: 字符长度0-32位。 默认取值: 不涉及。 width 否 Integer 参数解释: 图片宽度。 约束限制: 用户无需填写,系统自行提取。 默认取值: 不涉及。 取值范围:
分身数字人视频制作 按需计费 16元/分钟 10元/分钟 按需预付费套餐包(分身数字人视频制作60分钟套餐包) 768元/个 480元/个 按需预付费套餐包(分身数字人视频制作600分钟套餐包) 5760元/个 3600元/个 按需预付费套餐包(分身数字人视频制作6000分钟套餐包) 38400元/个
基础版媒体2.wav 支持手机录制20条语料音频(5分钟),1-3天制作,快速获得类真人音色,mos分3.8。 短视频制作 进阶版声音制作 女声 进阶版媒体1.wav 进阶版媒体2.wav 支持手机录制100条语料音频(15分钟),1-3天制作,获得高还原度音色,mos分4.0。
形象制作 MetaStudio服务支持自定义生成分身数字人。 操作前准备 用户创建分身数字人定制任务前,需要参考操作步骤准备如下内容: 5~6分钟绿幕拍摄视频。 注意:如果制作分身形象的时候,选择保留拍摄背景,则需要准备实景背景拍摄视频。 身份证正反面照片。 形象授权签署文件,如授权书所示。
拉框中选择允许弹出窗口。 图1 直播间开播 单击“完成”,会新增弹出如图2和图3所示的2个浏览器窗口。 MetaStudio控制台超过10分钟不操作,默认会退出登录,导致第三方直播平台的直播画面也中断。需要确保图3的窗口始终是打开的,直播过程中一定不能关闭,这样第三方直播平台的直播才能顺利完成。
拉框中选择允许弹出窗口。 图1 直播间开播 单击“完成”,会新增弹出如图2和图3所示的2个浏览器窗口。 MetaStudio控制台超过10分钟不操作,默认会退出登录,导致第三方直播平台的直播画面也中断。需要确保图3的窗口始终是打开的,直播过程中一定不能关闭,这样第三方直播平台的直播才能顺利完成。
如果合成视频的费用使用按需预付费套餐包抵扣,额度使用完后,转按需付费。 须知: 平台合成的视频按秒记录时长,套餐包以分钟记录时长。所以合成视频的总时长会从秒转化为分钟,保留小数点后两位,末位四舍五入。 视频制作生成的视频即使因内容违规被冻结,依然会收取制作费用。 按需计费 按需预付费套餐包
格式。 解决方法 单击webm2mov,将视频格式转换小工具webm2mov_20240814.rar下载至本地。 下载过程大约耗时3~5分钟,请耐心等待。 如果用户需要自定义工具,可以获取其源码。 本地解压工具包,得到ffmpeg目录和运行文件webm2mov.exe。 双击webm2mov
codec String 参数解释: 图片编码格式。 约束限制: 用户无需填写,系统自行提取。 取值范围: 字符长度0-32位。 默认取值: 不涉及。 width Integer 参数解释: 图片宽度。 约束限制: 用户无需填写,系统自行提取。 默认取值: 不涉及。 取值范围: 0-8196
duration60 有效期3个月 说明: 已废弃 视频制作60分钟套餐包 分钟 一次性 hws.resource.type.metastudio.modeling.avatarvideo.time60 有效期1年 视频制作600分钟套餐包 分钟 一次性 hws.resource.type.metastudio
描述 time_window 否 Integer 参数解释: 处理抑制时长。单位秒。 -1:表示整场直播仅触发一次。 0:表示无抑制,每次都触发。 其他值n:表示n秒内仅触发一次。 约束限制: 不涉及 默认取值: 不涉及 取值范围: -1-7200 reply_mode 否 String
参数类型 描述 time_window Integer 参数解释: 处理抑制时长。单位秒。 -1:表示整场直播仅触发一次。 0:表示无抑制,每次都触发。 其他值n:表示n秒内仅触发一次。 约束限制: 不涉及 默认取值: 不涉及 取值范围: -1-7200 reply_mode String
智能交互业务媒体流如何应对防火墙限制? 分身数字人智能交互业务使用SparkRTC方式收流,其信令和媒体访问方式为“IP+端口”或“域名+端口”,您的防火墙需要配置SparkRTC端口和域名的白名单,请参考直播业务媒体流如何应对防火墙限制?。 父主题: 智能交互
直播业务媒体流如何应对防火墙限制? 分身数字人直播业务使用SparkRTC方式收流,其信令和媒体访问方式为“IP+端口”或“域名+端口”,防火墙需要放开如下限制: 解除所有IP访问的限制。 在客户端防火墙配置SparkRTC端口和域名白名单。 配置SparkRTC端口的防火墙白名单,如表1所示。