检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
CAPTURE: 直播助手,将摄像头获取视频流推送到RTC房间 ANIMATION: VDS服务,从RTC房间拉视频流生成动作数据 RENDER: 渲染服务,将动作数据渲染成数字人动画 PLAYER: 普通观看方,可选择原始视频流或者数字人动画视频流观看 INFERENCE_USER:
video_config SmartVideoLayerConfig object 素材视频图层配置。 text_config SmartTextLayerConfig object 素材视频图层配置。 表12 LayerPositionConfig 参数 参数类型 描述 dx Integer
CAPTURE: 直播助手,将摄像头获取视频流推送到RTC房间 ANIMATION: VDS服务,从RTC房间拉视频流生成动作数据 RENDER: 渲染服务,将动作数据渲染成数字人动画 PLAYER: 普通观看方,可选择原始视频流或者数字人动画视频流观看 INFERENCE_USER:
口始终是打开的,直播过程中一定不能关闭,这样第三方直播平台的直播才能顺利完成。 图2 直播窗口 图3 确保直播过程不中断的窗口 父主题: 视频直播
asset_id String 输出视频资产ID。 asset_name String 输出视频资产名称。 cover_url String 视频封面URL。 preview_video_url String 预览视频下载URL。URL有效期24小时。 说明: 分身数字人视频制作不支持预览。 表8
设备不一致导致。 检查方法如下所示: 检查OBS桌面音频设备 检查Windows系统的声音输出设备 检查OBS桌面音频设备 本地打开OBS视频采集工具。 在界面下方,选择“混音器”。 图1 OBS工具 单击“桌面音频”区域的图标,在弹出的下拉框中,选择“属性”,弹出桌面音频属性设置对话框,如图2所示。
创建第三方直播平台 功能介绍 该接口用于创建第三方直播平台。 调用方法 请参见如何调用API。 URI POST /v1/{project_id}/live-platforms/platforms 表1 路径参数 参数 是否必选 参数类型 描述 project_id 是 String
查询直播平台列表 功能介绍 该接口用于查询直播平台列表。 调用方法 请参见如何调用API。 URI GET /v1/{project_id}/live-platforms/platforms 表1 路径参数 参数 是否必选 参数类型 描述 project_id 是 String 项目ID,获取方法请参考获取项目ID。
删除第三方直播平台信息 功能介绍 该接口用于删除第三方直播平台信息。 调用方法 请参见如何调用API。 URI DELETE /v1/{project_id}/live-platforms/platforms/{platform_id} 表1 路径参数 参数 是否必选 参数类型 描述
查询第三方直播平台信息 功能介绍 该接口用于查询第三方直播平台信息。 调用方法 请参见如何调用API。 URI GET /v1/{project_id}/live-platforms/platforms/{platform_id} 表1 路径参数 参数 是否必选 参数类型 描述 project_id
更新第三方直播平台信息 功能介绍 该接口用于更新第三方直播平台信息。 调用方法 请参见如何调用API。 URI PUT /v1/{project_id}/live-platforms/platforms/{platform_id} 表1 路径参数 参数 是否必选 参数类型 描述 project_id
查询第三方直播平台商品列表 功能介绍 该接口用于查询第三方直播平台商品列表。 调用方法 请参见如何调用API。 URI GET /v1/{project_id}/live-platforms/products 表1 路径参数 参数 是否必选 参数类型 描述 project_id 是
在下方的视频列表中,可以查看视频详情,包括视频封面、名称、任务ID、生成时间、状态。 支持对视频进行如下操作: 单击“查看”,进入“我的创作 > 视频”页面,可以查看视频详情,如查看视频所示。 单击“下载”,将视频下载至本地查看。下载后的文件为mp4格式。 图1 照片数字人视频生成任务 父主题: 照片数字人
选择“声音”,找到已生成的声音,单击声音卡片中的头像,即可试听声音效果。 用户还可以执行如下操作: 单击“视频制作”,基于已有声音,进行视频制作,操作请参考视频制作。 单击“视频直播”,基于已有声音,制作视频直播,操作请参考视频直播。 图1 声音 父主题: 声音制作
音频来合成数字人视频的一种技术。 其基本情况包括: 输入数据:真人视频、音频。 算法原理:通过深度学习算法来学习真人视频,生成驱动该真人形象的数字人模型。通过该模型输入音频,合成数字人视频。 输出结果:数字人视频。 应用领域:分身数字人驱动算法可以应用于真人视频自动生成,包括新闻
购买第三方声音使用。 为数字人配音。 视频制作 使用数字人形象,设置画布、音频,合成视频。 适用于各类培训、宣讲、知识分享等场景。 视频直播 使用数字人形象,设置画布、剧本、互动和开播配置,生成直播视频。 可在合作的第三方平台进行数字人视频直播,如淘宝、拼多多、抖音等。 智能交互
服务支持的字体 MetaStudio制作视频添加的字幕,视频画面中的文本信息都涉及字体。目前MetaStudio服务支持的字体及语言类型如表1所示。 表1 服务支持的字体说明 字体名称 支持的语言类型 Adelle_Sans_Global Adelle_Sans_Global_Bold
图片:JPG、PNG、BMP、GIF、SVG。 视频:MP4。 导入富媒体操作 支持通过问答库导入富媒体。以奇妙问知识库为例,参考新增知识库,补充富媒体知识,示例如表1所示。 如果使用服务提供SDK默认样式,受限于浏览器的CSP策略,导入图片、视频链接的域名,需提交工单添加至白名单。 表1
示例:云笙。 训练视频 从本地上传已录制好,且符合拍摄要求的人像视频。 录制的视频要求4K,时长建议5~6分钟,分辨率≥1080P,宽高比16:9(横屏)或9:16(竖屏),建议优先使用竖屏拍摄。支持MP4、MOV格式的视频。 背景替换 选择“抠除拍摄背景”,制作分身数字人视频时,可以替换背景。
照片数字人限制 照片数字人视频制作限制说明,如表1所示。 表1 照片数字人视频制作限制 照片数字人视频制作配置 限制 人像照片 制作照片数字人的人像照片拍摄要求,如下所示: 真人正面照,不支持动漫卡通形象;面部占比50%以上,侧脸俯仰角度不超过15度。 五官清晰无遮挡,目视前方。