检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
请求Body参数 参数 是否必选 参数类型 描述 voice_asset_id 是 String 音色模型ID。需要使用MetaStudio的数字资产管理相关接口从资产库查出。 script_type 否 String 脚本类型,即视频制作的驱动方式。默认TEXT TEXT: 文本驱动,即通过TTS合成语音
附录 状态码 错误码 获取项目ID 获取账号ID 直播控制HTTP Command命令说明 直播控制RTSA Command命令说明 文本驱动SSML定义 系统资产标签定义 服务支持的字体 资源类型 使用Java代码生成文件内容的MD5值 获取音色ID
SP用户仅对大客户开放申请和使用。 功能范围 SP用户仅支持购买大颗粒度资源包,并分配资源给关联租户使用。 SP用户不支持访问MetaStudio控制台,进行控制台操作。 资源使用限制 SP用户购买形象制作时,不会赠送视频制作时长。 如果用户先购买资源,再申请成为SP用户,那么每个形象制作资源
制作名片 用户可以为分身数字人制作形象名片,且支持试听和查看数字人语音表达效果。 操作步骤 登录MetaStudio控制台。 在“工作台”界面,单击“分身数字人名片制作”,弹出“请选择您要使用的名片模板”对话框,如图1所示。 服务提供了名片模板,用户可以基于模板制作名片。 图1 选择名片模板
使用“语料上传”方式上传语音文件前,需参考声音制作页面的“录音指导”,提前录制好音频。 声音授权签署文件,如授权书所示。 操作步骤 登录MetaStudio控制台。 单击“声音制作”下方的“开始创建”,进入声音制作页面。 界面左侧是声音制作页面,右侧为声音制作流程。声音制作录制教程,可以帮助用户快速制作声音。
男性模特确保面部没有较长零散的胡须。 模特表现 拍摄过程中模特的手部动作、面部表情及各方面的状态,都会决定数字人最终呈现时的姿态和动作。因此,我们希望模特在拍摄时尽可能保持自然,按照平时说话和表达的习惯进行录制。 为保证数字人的训练效果,请按照我们提供的流程进行录制,请根据实际需求评估录制流程: 不需要交互:15-30秒静默
涉黄、涉赌、涉毒、涉诈、侵权内容 盗版游戏/软件/盗版视频 P2P类金融诈骗信息 彩票类信息 违规医院和药品类信息 无法正常访问或内容不含有任何实质信息 可第一时间拨打华为云电话、提交工单,或者直接在举报中心举报违规内容。我们收到用户反馈后,会立即响应处理,共同维护合法合规的安全环境。
涉黄、涉赌、涉毒、涉诈、侵权内容 盗版游戏/软件/盗版视频 P2P类金融诈骗信息 彩票类信息 违规医院和药品类信息 无法正常访问或内容不含有任何实质信息 可第一时间拨打华为云电话、提交工单,或者直接在举报中心举报违规内容。我们收到用户反馈后,会立即响应处理,共同维护合法合规的安全环境。
)。当用户与数字人对话时,将触发调用该接口,由该接口返回问题对应的答案文本内容。 签名计算方法 第三方LLM自定义接口,使用HMACSHA256签名模式,需要在URL中追加参数“secret”和“time_stamp”。 取值方式为:secret=hmac_sha256(URI(llm_url)
3D数字人视频驱动 创建视频驱动任务 查询视频驱动任务列表 查询视频驱动任务详情 停止视频驱动任务 控制数字人驱动 父主题: 3D数字人
视频制作 无法保存剧本怎么办? 视频合成失败如何处理? 如何将WEBM视频转成MOV格式? PPT如何转为PDF文件? 如何在MetaStudio控制台呈现PPT的动画效果?
MetaStudio不支持个人用户定制声音,仅支持企业用户。 定制声音时,从平台下载的授权书中有明确说明,定制音色需授权给公司使用。 克隆声音不支持视频直播和智能交互。 操作前准备 用户创建声音制作任务前,需要参考操作步骤准备完成如下内容: “语料上传”方式制作声音时,需要参考声音制作页面的“录音指导”录制音频。
获取音色ID 获取音色ID的操作方法如下所示: 登录MetaStudio控制台。 在左侧导航栏中,选择“我的创作”。 选择“资源”页签,单击“声音”页签。 单击需要使用的声音卡片,进入“声音详情”界面。 这里的“资产编号”即语音同步合成WebSocket接口需要使用的音色ID。 图1
查看声音 声音制作任务算法训练完成后,可以查看声音。 操作步骤 登录MetaStudio控制台。 在左侧导航栏中,单击“任务中心”。 选择“声音制作”,确认声音制作任务已训练完成。 在左侧导航栏中,单击“我的创作”。 选择“声音”,找到已生成的声音,单击声音卡片中的头像,即可试听声音效果。
查看视频 如果用户需要查看已生成的照片数字人视频,可参考本节操作。 操作步骤 登录MetaStudio控制台。 在左侧导航栏中,单击“我的创作”。 选择“视频”页签,如图1所示。 在“视频”页面,可以看到已生成的视频列表,以卡片形式排列展示。 支持对视频进行如下操作: 单击播放图标,播放照片数字人视频。
查看名片 如果用户需要查看已生成的分身数字人名片,可参考本节操作。 操作步骤 登录MetaStudio控制台。 在左侧导航栏中,单击“我的创作”。 选择“分身名片”页签,如图1所示。 在“分身名片”页面,可以看到已生成的名片列表,以卡片形式排列展示。 支持对名片进行如下操作: 单击,查看分身数字人的语音表达形态。
输入命令行ffmpeg后可以显示版本号,说明安装成功。 解决方法 通过剪映或者ffmpeg可以将H265(HEVC)视频的格式转码为H264,再上传至MetaStudio控制台,进行形象制作。 以ffmpeg为例,输入命令行:ffmpeg -i 视频文件名 -c:v libx264 output.mp4。示例:
支持上传正面清晰的人像照片,生成会说话的照片数字人视频。 操作限制 照片数字人视频制作限制,如照片数字人限制所示。 操作步骤 登录MetaStudio控制台。 在“工作台”界面,单击“照片数字人”,进入照片数字人制作页面,如图1所示。 界面左侧展示配置项,右侧展示预览效果。配置操作,请参考表1。
SDK概述 华为云提供了MetaStudio服务端SDK,您可以直接集成服务端SDK来调用MetaStudio的相关API,从而实现对MetaStudio服务的快速操作。 在线生成SDK代码 API Explorer能根据需要动态生成SDK代码功能,降低您使用SDK的难度,推荐使用。
轻量规格 购买简单,一次下单即可完成形象、声音和视频制作资源的购买。针对额外需求,支持客户选择不同档位套餐包进行充值。 极简体验 简化拍摄制作,使用一段2分钟的视频和1分钟的音频即可复刻自己的真人形象和声音,全程手机录制无需专业相机和专业绿幕环境。 高性价比 不到千元即可完成形象、声音定制,性价比超越业界。