检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
分身形象和声音制作的处理方式相同,均需根据实际情况进行处理。下面以形象制作为例,进行说明。 如果当前分身形象制作的素材质量不佳,管理员会通过用户提交训练任务时输入的手机号联系用户。用户可以在管理员驳回任务后重新提交训练视频,进行数字人形象训练。形象制作任务制作完成前,形象制作资源一直处于占用状态,并未真正扣除。
SDK概述 数字人智能交互SDK是基于数字内容生产线服务提供的能力进行封装,以简化用户的开发工作。用户直接调用智能交互Web SDK提供的接口,即可实现使用数字人智能交互业务能力的目的。 智能交互提供了如下主流平台SDK供开发者使用。 表1 客户端SDK 客户端 集成SDK 接口参考
为什么会欠费? 除用户在资源购买页面,付费购买的资源外,用户还需查看如图1所示的服务概览页面。查看是否有计费项开通了按需计费,在计费项卡片右上角会有已开通按需计费的提示。超出套餐包的资源会自动走按需计费。 图1 服务概览页面 父主题: 计费咨询
合成视频二次剪辑后,数字人口型效果变差? 需要检查二次剪辑软件的视频帧率。因为数字人合成视频的帧率为25,如果用户使用软件的帧率为30,需要插帧至数字人视频中,才能达到30,这样就导致插帧后的口型对不上了。所以用户对视频进行二次剪辑时,帧率必须设置为25的整数倍,才不会影响数字人的口型效果。 父主题:
上传的PPT支持编辑吗? 不支持在视频制作界面对PPT进行编辑,如局部内容放大或高亮显示等。需用户直接在本地编辑好后,上传控制台使用。 父主题: 视频制作
第三方平台的直播画面不清晰怎么办? 如果用户在第三方直播平台的直播画面不清晰,需排查是否是下述原因导致: 电脑是否有独立显卡。 OBS视频采集工具的基础分辨率配置是否与输出分辨率一致。 检查独立显卡 用户使用的第三方直播平台所在电脑,必须装有独立显卡。 检查OBS视频分辨率配置
声音和形象模型支持在其他平台使用吗? 用户在MetaStudio制作的模型,仅支持在本服务内使用。 声音和数字人模型文件不支持导出和下载,且声音和数字人模型不是通用模型,不与第三方服务兼容。 父主题: 声音和形象制作
上传图片时提示像素超标怎么办? 图片像素不是文件大小,如果用户仅修改图片大小,控制台还会继续提示像素超标。 上传图片的长宽需要至少满足下述一个条件: (width <= 2160) & (height <= 3840) (width <= 3840) &(height <= 2160)
视频制作 MetaStudio服务支持制作数字人视频。 操作步骤 登录MetaStudio控制台。 在“工作台”界面,单击“分身视频制作”下方的“开始创建”。 进入视频制作界面,界面详情如图1所示。 图1 视频制作界面 在画布区域,设置角色、背景、贴图、视频等内容。 详细操作请参见视频制作素材操作详情。
声音制作限制 限制项 说明 用户限制 MetaStudio不支持个人用户定制声音,仅支持企业用户。 定制声音时,从平台下载的授权书中有明确说明,定制音色需授权给公司使用。 使用限制 制作好的声音模型不支持下载或导出至本地。 声音模型不是通用模型,不与第三方服务兼容。用户在MetaStudio制作的模型,仅支持在本服务内使用。
限制项 说明 用户限制 MetaStudio不支持个人用户定制形象,仅支持企业用户。 定制分身形象时,从平台下载的授权书中有明确说明,定制分身形象需授权给公司使用。 使用限制 制作好的数字人模型不支持下载或导出至本地。 数字人模型不是通用模型,不与第三方服务兼容。用户在MetaSt
智能交互第三方LLM回调接口 功能介绍 MetaStudio智能交互服务支持开发者自定义数字人大脑(即第三方LLM)。当用户与数字人对话时,将触发调用该接口,由该接口返回问题对应的答案文本内容。 签名计算方法 第三方LLM自定义接口,使用HMACSHA256签名模式,需要在URL
API使用限制 使用API调用声音的限制说明 用户使用视频直播或智能交互接口调用音色时,需要先确认能否在MetaStudio控制台的视频直播间编辑界面或智能交互对话设置页面,选到当前音色。 如果界面正常展示且可以选择此音色使用,说明接口可以正常调用此音色,否则接口无法调用。 API流控
第三方平台的直播画面没有声音怎么办? 如果用户在第三方直播平台的直播画面没有声音,需排查是否是OBS工具设置的桌面音频设备与Windows系统的声音输出设备不一致导致。 检查方法如下所示: 检查OBS桌面音频设备 检查Windows系统的声音输出设备 检查OBS桌面音频设备 本地打开OBS视频采集工具。
智能交互SDK安装包里为什么有图片资源? SDK里面包含图片资源,是因为智能交互的动效、背景可能需要图片资源才能展示更好的效果。所以智能交互Web SDK为了方便用户集成使用,会同时包含UI相关资源。 speechRecognized和semanticRecognized通知的流式返回有什么差异? 差异如下所示:
使用。若您有任何疑问,可直接联系客户经理或提交工单给我们。 请您及时关注MetaStudio服务最新动向,并及时做出业务调整。衷心感谢各位用户对本产品的信赖与支持!
产品价格调整完成后,新购买的客户可直接使用新价格下单。已有下单用户,需联系客户经理或提交工单给我们处理。 请您及时关注新的计费价格及余额变动,并及时做出业务调整。若您有任何疑问,可直接联系客户经理或提交工单给我们。衷心感谢各位用户对本产品的信赖与支持!
数字内容生产线服务目前只支持“华北-北京四”和“亚太-新加坡”区域。 预置模特使用限制 MetaStudio控制台预置模特的有效使用期为3年,在2027年的年中前用户可以放心使用。 具体下线时间请关注MetaStudio服务,会提前3个月在现网开放下线公告。 父主题: 使用限制
制作音视频内容。 视频直播:使用系统预置或自定义的数字人形象、声音,制作音视频直播内容。 智能交互:对接第三方大脑,通过数字人交互的方式与用户进行问答。 父主题: 声音和形象制作
startUserSpeak 用户开始提问。 × √ stopChat 结束对话。 × √ stopSpeak 停止说话(注:接口已重命名为stopUserSpeak,请直接切换至新接口)。 × √ stopUserSpeak 用户停止提问(注:此处只是停止ASR接收用户语音,对话仍处于激活态)。