检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
直播控制HTTP Command命令说明 分身数字人直播过程中,支持通过HTTP API的方式人工接管直播。人工接管以后,支持通过下述方式驱动数字人说话: 文本驱动方式:对应Command命令为“INSERT_PLAY_SCRIPT”,即插入表演脚本,用于互动回复。数字人不变时,
必填项,数字人公司。 内容较多时,最多支持在名片中分2行展示,超出2行后,默认不展示。为保证名片的效果展示,请保持合理的输入长度。 联系电话 必填项,数字人联系电话,请输入有效的联系方式。 公司地址 必填项,数字人公司地址。 内容较多时,最多支持在名片中分2行展示,超出2行后,默认
智能交互第三方LLM回调接口 功能介绍 MetaStudio智能交互服务支持开发者自定义数字人大脑(即第三方LLM)。当用户与数字人对话时,将触发调用该接口,由该接口返回问题对应的答案文本内容。 签名计算方法 第三方LLM自定义接口,使用HMACSHA256签名模式,需要在URL
申请成为SP用户 MetaStudio支持SP模式,此模式对大客户开放,用于分销场景。SP用户支持购买大颗粒度资源包,并分配资源给关联租户使用。 使用限制 SP用户仅对大客户开放申请和使用。 SP用户不支持自己使用购买的资源包。 SP用户不支持访问MetaStudio控制台,进行控制台操作。
频制作界面或视频直播界面查看。如果预置声音仍无法满足用户需求,可使用自研模型自定义生成声音。 操作限制 MetaStudio不支持个人用户定制声音,仅支持企业用户。 定制声音时,从平台下载的授权书中有明确说明,定制音色需授权给公司使用。 操作前准备 用户创建声音制作任务前,需要参考操作步骤准备如下内容:
插入的视频素材,要求如下所示: 分辨率最大支持1080P。 帧率小于等于30fps。 编码为AV1、VP8、VP9、H264或H265格式。 VP8、VP9编码仅WEBM视频支持。 WEBM视频如果为AV1编码格式,不支持合成视频。 AV1、H265编码格式目前支持Chrome浏览器,不支持Edge浏览器。
视频文件的URL。 约束限制: 仅直播支持外部URL,其他业务通过资产库查询获取,不支持外部URL。 取值范围: 字符长度1-2048位。 默认取值: 不涉及。 video_cover_url 否 String 参数解释: 视频封面文件的URL。 约束限制: 仅直播支持外部URL,其他业务通过资产库查询获取,不支持外部URL。
如果使用按需预付费套餐包或包年/包月计费方式,支持在用完前续费。如需续费,请进入续费管理页面,完成续费操作。如果未能续费成功,那么产生的费用会从账户余额中扣除。 如果使用一次性计费,不支持续费,需要在MetaStudio控制台再次购买相同的资源包。 退订 包年/包月套餐包支持退订。 按需预付费套餐包、一次性计费不支持退订。
搜索商品。 支持多选,支持添加新类别。 产品素材 合成商品的素材。 包括如下内容: 贴图:从本地选择图片。 视频:从本地选择视频文件。 文本:手工输入文本内容。 音频:从本地选择音频文件。 单击“创建”,界面提示“创建成功”。 在“商品管理”页面,新增一行商品。 支持对商品执行如下操作:
动接收”和“是否自动激活”,则对应资产转移任务的状态为“已接收”,否则为“待接收”。 支持资产任务执行下述操作: 查看:单击任务右侧的“查看”,查看转移任务详情。 取消转移:未接收的资产,支持单击转移任务右侧的“取消转移”,收回资产。 图3 转移任务管理 父主题: 资产管理
视频文件的URL。 约束限制: 仅直播支持外部URL,其他业务通过资产库查询获取,不支持外部URL。 取值范围: 字符长度1-2048位。 默认取值: 不涉及。 video_cover_url 否 String 参数解释: 视频封面文件的URL。 约束限制: 仅直播支持外部URL,其他业务通过资产库查询获取,不支持外部URL。
互动管理 分身视频直播首页面的“互动管理”页签,支持新增互动库,及其相应的互动规则。互动库可以直接在直播间中导入使用。 操作步骤 登录MetaStudio控制台。 在“工作台”界面,单击“分身视频直播”下方的“开始创建”,进入分身数字人直播首页面。 单击“互动管理”,进入如图1所示的页面。
这些插入的视频可以正常播放和展示。 视频要求如下所示: 分辨率最大支持1080P。 帧率小于等于30fps。 编码为AV1、H264或H265格式。 AV1、H265编码格式目前支持Chrome浏览器,不支持Edge浏览器。 视频采样格式为YUV420。 视频素材总大小小于1GB。
上传资产 支持从本地上传资产,包括:模型、PPT、动画、素材、视频、场景、图片、音乐。资产上传的操作均相同,下面以上传图片为例进行演示。 操作步骤 登录MetaStudio控制台。 在左侧导航栏中,单击“我的创作”。 选择“资源”页签,如图1所示。 图1 资源页面 单击界面右上角
语音同步合成WebSocket接口 前提条件 本接口目前仅支持“华北-北京四”和“华东-上海一”区域使用,且必须提交工单申请开通后才能使用。 使用本接口前,需要在MetaStudio控制台服务概览页面,开通“声音合成”的按需计费。 详细操作为:单击“声音合成”卡片中的“去开通”,
视频文件的URL。 约束限制: 仅直播支持外部URL,其他业务通过资产库查询获取,不支持外部URL。 取值范围: 字符长度1-2048位。 默认取值: 不涉及。 video_cover_url 否 String 参数解释: 视频封面文件的URL。 约束限制: 仅直播支持外部URL,其他业务通过资产库查询获取,不支持外部URL。
用竖屏拍摄。支持MP4、MOV格式的视频。 训练生成的分身数字人形象与真人形象完全相同。 背景替换 分身数字人是否支持更换背景。 包含如下选项,请根据实际情况选择: 抠除拍摄背景:制作分身数字人视频时,可以更换背景。 保留拍摄背景:分身数字人使用拍摄时的原背景,不支持更换背景。 身份认证及授权数据上传
角色:数字人形象列表,可选择需要使用的数字人形象,支持自定义。 背景:背景图片列表,支持本地导入。可选择需要使用的背景图。 贴图:各类贴图列表,支持本地导入。支持在当前画面基础上,增加贴图,丰富视频画面。 视频:无声音视频素材列表,支持本地导入,支持MOV、MP4、M4V、MKV、FLV、
视频宽度。单位:像素。 约束限制: clip_mode=RESIZE时,当前支持1920x1080、1080x1920、1280x720、720x1280、3840x2160、2160x3840六种分辨率。4K分辨率视频需要分身数字人模型支持4K的情况下才能使用。 clip_mode=CROP,裁剪后视频,(dx
X-App-UserId 否 String 第三方用户ID。不允许输入中文。 表3 请求Body参数 参数 是否必选 参数类型 描述 type 是 String 支持配置的自定义读法类型。当前读法类型会映射为SSML标签,详见文本驱动SSML定义。 包含如下选项: CHINESE_G2P:拼音 PHONETIC_SYMBOL:音标