检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
心等待。 提示“声音账户余额不足,请充值后重新合成视频” 说明用户第三方声音的已购套餐额度已用尽,需再次购买,详细操作请参见购买出门问问声音套餐。 查看已购套餐余额的操作如下所示: 登录MetaStudio控制台。 在左侧导航栏中,选择“我的创作”。 选择“声音 > 已购”,单击
参数解释: 声音资产类型。 约束限制: 不涉及。 取值范围: COMMON:通用情感模型 CLONE:语音克隆模型 默认取值: CLONE sex 否 String 参数解释: 声音性别。 约束限制: 不涉及。 取值范围: UNKNOW:未知性别声音 MALE:男性声音 FEMALE:女性声音
计费模式 分身数字人 分身数字人形象制作 一次性计费 分身数字人视频制作 按需计费 按需套餐包 一次性计费 声音制作 分身数字人声音制作基础版 分身数字人声音制作进阶版 分身数字人声音制作高级版 一次性计费 分身数字人视频直播 按需计费 包年/包月 分身数字人视频直播行业版 按需计费 包年/包月
稿二:数字人形象采集指南 大家好,今天我很高兴能来到这里进行数字人形象和声音的采集。接下来,我将和大家一起复盘一下数字人的形象拍摄要求。 第一步,我们需要在拍摄前检查自己的穿着,在绿幕的拍摄环境下,不能穿绿色或者透明的衣服、也不要穿含有密集条纹的衣服。我们需要确保面部没有零散的发
标识。 背景:背景图片列表,可本地导入图片。支持透明背景、纯色背景或导入图片。 PPT:PPT文件列表,需要用户从本地导入后使用。 贴图:各类贴图列表,可本地导入素材。支持在当前画面基础上,增加贴图,丰富视频画面。 视频:各类无声音视频列表,可本地导入视频文件。支持添加为背景视频。
直播管理:使用数字人创建直播间。操作请参考视频直播。 互动管理:支持新增互动库,及其相应的互动规则。互动库可以直接在直播间中导入使用。操作请参考互动管理。 商品管理:支持新增商品。商品会自动展示在直播间的“商品”页签中,供直播间添加使用。操作请参考商品管理。 直播任务管理:用户
统预置音色ID。 登录MetaStudio控制台。 在左侧导航栏中,选择“我的创作”。 选择“资源”页签,单击“声音”页签。 单击需要使用的声音卡片,进入“声音详情”界面。 这里的“资产编号”即语音同步合成WebSocket接口需要使用的音色ID。 图1 声音详情界面 在控制台查询音色ID(方式二)
左下角展示用户已购买资源的剩余量。 声音合成 这里的声音合成,仅针对使用声音API调用,通过MetaStudio控制台声音制作方式生成的声音,来合成音频的费用。 如需使用此功能,需单击“去开通”,在弹出的“开通按需计费服务提示”对话框中,勾选同意协议。单击“确定”,开通按需计费。 如需查看声音合成的使用量
包年/包月 资产管理 资产管理 按资产管理的规格(资产存储空间)进行计费。 需注意: 首次购买或创建资产时,免费赠送5G存储空间。 下述场景,使用资产空间不会计费: 用户上传的分身数字人模型、3D数字人模型和声音。 平台生成的分身数字人模型、3D数字人模型和声音。 平台合成的视频
服务端SDK文档 SDK概述 02 使用 MetaStudio提供分身数字人形象定制、声音定制、视频制作、视频直播、智能交互等功能。 定制分身数字人形象 拍摄真人视频 定制形象 定制分身数字人声音 声音录制 定制声音 分身数字人视频制作 界面说明 视频制作 分身数字人视频直播 界面说明 视频直播
Flexus视频制作:必须使用Flexus形象,声音使用不受限制。 按视频制作时长计费,计费项为“Flexus分身数字人视频制作”,详见计费说明。 系统声音和Flexus声音免费使用。第三方声音的计费方式,详见购买出门问问套餐包。 标准版视频制作:必须使用标准版形象,声音不支持使用Flexus声音。 按视频制作时
参数解释: 声音资产类型。 约束限制: 不涉及。 取值范围: COMMON:通用情感模型 CLONE:语音克隆模型 默认取值: CLONE sex 否 String 参数解释: 声音性别。 约束限制: 不涉及。 取值范围: UNKNOW:未知性别声音 MALE:男性声音 FEMALE:女性声音
参数解释: 声音资产类型。 约束限制: 不涉及。 取值范围: COMMON:通用情感模型 CLONE:语音克隆模型 默认取值: CLONE sex String 参数解释: 声音性别。 约束限制: 不涉及。 取值范围: UNKNOW:未知性别声音 MALE:男性声音 FEMALE:女性声音
参数解释: 声音资产类型。 约束限制: 不涉及。 取值范围: COMMON:通用情感模型 CLONE:语音克隆模型 默认取值: CLONE sex String 参数解释: 声音性别。 约束限制: 不涉及。 取值范围: UNKNOW:未知性别声音 MALE:男性声音 FEMALE:女性声音
job_tag 是 String 任务标签,为Flexus版声音的配置。 ECOMMERCE: 电商 NEWS: 新闻 MARKETING: 营销 sex 是 String 语音性别,是男性声音还是女性声音,为Flexus版声音的配置。 FEMALE: 女性 MALE: 男性 默认取值:
制台。 注意事项 避免头部大幅度转动或者摆动,避免嘴巴被遮挡,可能造成口型异常。 视频中需保证仅出现录制者及其声音。如果出现其他人物形象或声音,将会影响口型生成效果和声音克隆效果。 避免动作幅度过大超出画面;避免相机距离人过远;建议人脸在画面中的占比超过1/5。 15秒静默状态时
华为云MetaStudio分身数字人声音制作算法 表2 声音制作算法 算法项 描述 算法名称 华为云MetaStudio分身数字人声音制作算法 备案编号 网信算备520111252474601240079号 算法基本原理 分身数字人声音制作算法是指使用深度学习算法生成数字人声音模型,再使用该模型通过输入文字生成数字人语音的一种技术。
business 否 String 业务类型。可填多个,用","分隔。 VOICE_CLONE:声音制作 SYNTHETICS_SOUND:声音合成 ASSET_MANAGER:资产管理 MODELING_2D:形象制作 LIVE_2D:分身数字人视频直播 VIDEO_2D:分身数字人视频制作
应用示例 示例1:上传资产 示例2:分身形象制作管理 示例3:声音制作任务管理 示例4:语音合成管理 示例5:视频制作 示例6:视频制作剧本管理 示例7:视频直播 示例8:视频直播对接实时音视频客户端SDK 示例9:资产管理 示例10:数字人名片制作 示例11:智能交互
分身视频直播首页面的“商品管理”页签,支持新增商品。商品会自动展示在直播间的“商品”页签中,作为视频直播的素材。 登录MetaStudio控制台。 在“工作台”界面,单击“分身视频直播”下方的“开始创建”,进入分身数字人直播首页面。 单击“商品管理”,进入如图1所示的页面。 图1 商品管理页面 单