检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
照片数字人视频制作支持开通或关闭按需计费。 声音合成 这里的声音合成,仅针对使用声音API调用,通过MetaStudio控制台声音制作方式生成的声音,来合成音频的费用。 声音合成支持开通或关闭按需计费。 如需查看声音合成的使用量,单击左下角的“已使用量”,跳转至费用中心的“流水和明细账单”页面,搜索查看声音合成的详细账单。
Flexus视频制作:必须使用Flexus形象,声音使用不受限制。 按视频制作时长计费,计费项为“Flexus分身数字人视频制作”,详见计费说明。 系统声音和Flexus声音免费使用。第三方声音的计费方式,详见购买出门问问套餐包。 标准版视频制作:必须使用标准版形象,声音不支持使用Flexus声音。 按视频制作时
服务端SDK文档 SDK概述 02 使用 MetaStudio提供分身数字人形象定制、声音定制、视频制作、视频直播、智能交互等功能。 定制分身数字人形象 拍摄真人视频 定制形象 定制分身数字人声音 声音录制 定制声音 分身数字人视频制作 界面说明 视频制作 分身数字人视频直播 界面说明 视频直播
稿二:数字人形象采集指南 大家好,今天我很高兴能来到这里进行数字人形象和声音的采集。接下来,我将和大家一起复盘一下数字人的形象拍摄要求。 第一步,我们需要在拍摄前检查自己的穿着,在绿幕的拍摄环境下,不能穿绿色或者透明的衣服、也不要穿含有密集条纹的衣服。我们需要确保面部没有零散的发
参数解释: 声音资产类型。 约束限制: 不涉及。 取值范围: COMMON:通用情感模型 CLONE:语音克隆模型 默认取值: CLONE sex String 参数解释: 声音性别。 约束限制: 不涉及。 取值范围: UNKNOW:未知性别声音 MALE:男性声音 FEMALE:女性声音
参数解释: 声音资产类型。 约束限制: 不涉及。 取值范围: COMMON:通用情感模型 CLONE:语音克隆模型 默认取值: CLONE sex 否 String 参数解释: 声音性别。 约束限制: 不涉及。 取值范围: UNKNOW:未知性别声音 MALE:男性声音 FEMALE:女性声音
参数解释: 声音资产类型。 约束限制: 不涉及。 取值范围: COMMON:通用情感模型 CLONE:语音克隆模型 默认取值: CLONE sex String 参数解释: 声音性别。 约束限制: 不涉及。 取值范围: UNKNOW:未知性别声音 MALE:男性声音 FEMALE:女性声音
制台。 注意事项 避免头部大幅度转动或者摆动,避免嘴巴被遮挡,可能造成口型异常。 视频中需保证仅出现录制者及其声音。如果出现其他人物形象或声音,将会影响口型生成效果和声音克隆效果。 避免动作幅度过大超出画面;避免相机距离人过远;建议人脸在画面中的占比超过1/5。 15秒静默状态时
job_tag 是 String 任务标签,为Flexus版声音的配置。 ECOMMERCE: 电商 NEWS: 新闻 MARKETING: 营销 sex 是 String 语音性别,是男性声音还是女性声音,为Flexus版声音的配置。 FEMALE: 女性 MALE: 男性 默认取值:
管理资产 支持在MetaStudio控制台管理资产,包括查询、重命名、激活/取消激活、查看详情、编辑、删除、恢复等操作。 操作步骤 登录MetaStudio控制台。 在左侧导航栏中,选择“我的创作 > 资源”,如图1所示。 图1 资产 支持管理资产,详细操作如表1所示。 图2 资产详情
business 否 String 业务类型。可填多个,用","分隔。 VOICE_CLONE:声音制作 SYNTHETICS_SOUND:声音合成 ASSET_MANAGER:资产管理 MODELING_2D:形象制作 LIVE_2D:分身数字人视频直播 VIDEO_2D:分身数字人视频制作
分身视频直播首页面的“商品管理”页签,支持新增商品。商品会自动展示在直播间的“商品”页签中,作为视频直播的素材。 登录MetaStudio控制台。 在“工作台”界面,单击“分身视频直播”下方的“开始创建”,进入分身数字人直播首页面。 单击“商品管理”,进入如图1所示的页面。 图1 商品管理页面 单
使用限制 服务使用限制 API使用限制 形象制作限制 声音制作限制 视频制作限制 视频直播限制 Flexus分身数字人限制 照片数字人限制 智能交互限制 资产管理说明 SP用户限制
详细了解MetaStudio服务 服务访问路径 数字内容生产线 访问MetaStudio服务 00:50 访问MetaStudio服务 声音制作和形象制作 声音制作 操作指导 00:50 分身数字人声音制作操作指导 分身数字人形象采集 拍摄指导视频 01:55 分身数字人形象采集指导视频 分身数字人形象采集 拍摄示例视频
business 否 String 业务类型。可填多个,用","分隔。 VOICE_CLONE:声音制作 SYNTHETICS_SOUND:声音合成 ASSET_MANAGER:资产管理 MODELING_2D:形象制作 LIVE_2D:分身数字人视频直播 VIDEO_2D:分身数字人视频制作
附录 授权书 手机录制音频 客户声音制作案例 第三方平台开播指南 FAQ
示例2:资产管理 示例3:分身形象制作管理 示例4:声音制作任务管理 示例5:语音合成管理 示例6:语音同步合成WebSocket接口(Android SDK) 示例7:语音同步合成WebSocket接口(iOS SDK) 示例8:视频制作 示例9:视频制作剧本管理 示例10:视频制作素材图层管理
本节提供通过API Explorer和Postman工具,将资产上传至OBS桶的操作。 总体流程 调用创建资产接口创建资产ID。 调用创建文件并获取上传URL接口创建文件ID,并生成文件上传的URL地址。 使用Postman工具,参考OBS的PUT上传接口,将资产文件上传至URL地址中。
如何调用MetaStudio接口? 数字人相关问题 第三方平台的直播画面不清晰怎么办? 第三方平台的直播画面突然中断是怎么回事? 如何实时切换智能交互的语言和声音? 父主题: 附录
直播业务媒体流如何应对防火墙限制? 第三方平台的直播画面不清晰怎么办? 第三方平台的直播画面突然中断是怎么回事? 第三方平台的直播画面没有声音怎么办?