搜索_华为云

手机录制音频 - 数字内容生产线 MetaStudio

推荐使用48bit采样位录制音频。苹果手机的简易录音机的采集位默认为16bit，无需修改。声道推荐使用单声道录制音频。苹果手机的简易录音机默认为单声道录制，无需修改。音频格式推荐使用无损音质格式保存音频，如WAV、MP3格式。音频命名所有语料录制生成一个长音频WAV或MP3文件，命名示例：Voice

帮助中心 > 数字内容生产线 MetaStudio > 用户指南 > 附录
第三方平台的直播画面没有声音怎么办？ - 数字内容生产线 MetaStudio

具设置的桌面音频设备与Windows系统的声音输出设备不一致导致。检查方法如下所示：检查OBS桌面音频设备检查Windows系统的声音输出设备检查OBS桌面音频设备本地打开OBS视频采集工具。在界面下方，选择“混音器”。图1 OBS工具单击“桌面音频”区域的图标，

帮助中心 > 数字内容生产线 MetaStudio > 常见问题 > 视频直播
查询用户配置的个性化音频时长 - 数字内容生产线 MetaStudio

查询用户配置的个性化音频时长功能介绍查询用户配置的个性化音频时长调用方法请参见如何调用API。 URI GET /v1/{project_id}/voice-training-manage/user/tenant-duration-cfg 表1 路径参数参数是否必选参数类型

 帮助中心 > 数字内容生产线 MetaStudio > API参考 > 声音制作任务管理
真人声音录制 - 数字内容生产线 MetaStudio

5分钟。进阶版：整段录制生成一个WAV或MP3格式音频，总时长10~30分钟，建议15分钟。高品质：整段录制生成一个WAV或MP3格式音频，总时长1小时以上，建议1小时。原声录制音频和其对应生成的音色播报示例，如客户声音制作案例所示。录音准备表1 录音准备声音类型录制设备和软件

 帮助中心 > 数字内容生产线 MetaStudio > 用户指南 > 声音制作
声音制作 - 数字内容生产线 MetaStudio

声音制作方式选择“基础版声音制作”，音频格式为WAV或MP3文件。需整段录制，每句之间有2~3秒的停顿。音频时长3~10分钟，建议5分钟。请完善声音信息输入声音名称，示例：欢快女声。请制作声音使用“语料上传”的方式，直接上传一个已录制好的长音频WAV或MP3文件，无需压缩，无需携带文案txt文件。

帮助中心 > 数字内容生产线 MetaStudio > 快速入门
视频制作 - 数字内容生产线 MetaStudio

选择“文本驱动”的方式。在文本输入框中，输入文本内容，以生成音频，如图2所示。文本示例：今天是9月26日，星期二，天气晴朗，欢迎大家到访。我们精心布置了现场，室内摆放了各类植物和鲜花，场地宽敞明亮，足够大家在室内共同交流和活动。图2 文本驱动音频制作完成后，可单击音量图标，调整音频的音量。上述操作全部完成后，第一个场景的视频内容已制作完成。

帮助中心 > 数字内容生产线 MetaStudio > 快速入门
创建声音制作任务（自研模型） - 数字内容生产线 MetaStudio

基础版声音制作：需整段录制生成一个WAV或MP3格式的音频文件，时长3~10分钟，建议5分钟。进阶版声音制作：需整段录制生成一个WAV或MP3格式的音频文件，时长10~30分钟，建议15分钟。高品质声音制作：需整段录制生成一个WAV或MP3格式的音频文件，时长1小时以上，建议1小时。每种

 帮助中心 > 数字内容生产线 MetaStudio > 用户指南 > 声音制作
视频制作 - 数字内容生产线 MetaStudio

复展示。音频驱动需从本地上传已录制好的音频。音频文件格式需要为WAV、MP3或M4A，大小不能超过100M。可单击“导入”上传音频，也可以直接拖拽本地音频文件至提示区域中，完成上传。单击左侧的图标，可试听音频效果。如果音频效果不佳，可以单击“导入”，覆盖更新音频。图2 音频驱动

 帮助中心 > 数字内容生产线 MetaStudio > 用户指南 > 视频制作
客户声音制作案例 - 数字内容生产线 MetaStudio

zip，下载如表1所示的音频文件。 mos分是从音色相似度、情感表达效果和声音音质方面，进行整体效果综合评分的结果。表1 音频文件版本类别原音文件合成音文件版本差异适用场景基础版声音制作女声基础版媒体1.wav 基础版媒体2.wav 支持手机录制20条语料音频（5分钟），

帮助中心 > 数字内容生产线 MetaStudio > 用户指南 > 附录
视频制作限制 - 数字内容生产线 MetaStudio

不支持Edge浏览器。视频素材总大小小于1GB。同时叠加的视频总数量最多支持2个。音频格式音频支持的格式为：MP3、M4A、WAV。音频要求如下所示：仅提取单声道音频。音频素材总大小小于500MB。图片格式图片支持的格式为：PNG、JPG、JPEG。图片要求如下所示：

帮助中心 > 数字内容生产线 MetaStudio > 产品介绍 > 使用限制
视频制作界面说明 - 数字内容生产线 MetaStudio

音乐：各类音乐列表，可本地导入音频文件。支持添加为背景音乐。文本：用于在画布中添加文本。 2 画面布局区域视频画面制作区域，可以制作和预览视频画面。 3 音频制作区域音频制作区域，可选择下述1种方式生成音频。文本驱动：通过输入文本的方式生成音频。文本支持插入停顿、调整语速，

帮助中心 > 数字内容生产线 MetaStudio > 用户指南 > 视频制作
创建高级版语音训练任务 - 数字内容生产线 MetaStudio

创建高级版语音训练任务功能介绍用户创建语音训练高级版任务，该接口会返回一个obs上传地址，用于上传语音文件。语音文件为一段WAV格式的长音频文件，仅支持将语音文件打包成zip压缩格式上传。文件上传后，调用“提交语音训练任务”接口，启动审核和训练。调用方法请参见如何调用API。

帮助中心 > 数字内容生产线 MetaStudio > API参考 > 声音制作任务管理
直播控制HTTP Command命令说明 - 数字内容生产线 MetaStudio

用于互动回复。数字人不变时，背景不变。其参数结构定义为“PlayTextInfo”。音频驱动方式：对应Command命令为“INSERT_PLAY_AUDIO”，即插入驱动音频，用于音频直接驱动。数字人不变时，背景不变。其参数结构定义为“PlayAudioInfo”。控制数

 帮助中心 > 数字内容生产线 MetaStudio > API参考 > 附录
制作照片数字人视频 - 数字内容生产线 MetaStudio

播报内容生成后，单击右侧的“试听”，可以试听播报效果。语音上传：本地录制音频后上传。音频格式需要为WAV或MP3格式，音频大小不超过20MB，时长不超过5分钟。在线录音：在线录制音频。录音时长不能超过5分钟，为保证音频生成的效果，请保持录音环境安静无噪音。支持试听录制生成的语音。文

 帮助中心 > 数字内容生产线 MetaStudio > 用户指南 > 照片数字人
视频直播限制 - 数字内容生产线 MetaStudio

视频采样格式为YUV420。视频素材总大小小于1GB。同时叠加的视频总数量为3，包含互动时配置的视频。音频格式音频支持的格式为：MP3、M4A、WAV。音频要求如下所示：仅提取单声道音频。音频素材总大小小于500MB。图片格式图片支持的格式为：PNG、JPG、JPEG。图片要求如下所示：

帮助中心 > 数字内容生产线 MetaStudio > 产品介绍 > 使用限制
算法备案公示 - 数字内容生产线 MetaStudio

分身数字人驱动算法是指通过深度学习生成数字人驱动模型，模型生成后，输入音频来合成数字人视频的一种技术。其基本情况包括：输入数据：真人视频、音频。算法原理：通过深度学习算法来学习真人视频，生成驱动该真人形象的数字人模型。通过该模型输入音频，合成数字人视频。输出结果：数字人视频。应用领域：

帮助中心 > 数字内容生产线 MetaStudio > 产品介绍
照片数字人限制 - 数字内容生产线 MetaStudio

80。音频音频录制要求，如下所示：单声道音频。清晰人声无背景音乐与杂音。音频格式要求，如下所示：支持的格式为：MP3、WAV。大小不超过20MB，时长不超过5分钟。文本驱动文本驱动方式的要求如下所示：文本输入长度不超过2000字。通过文本合成的音频时长不能超过5分钟。

帮助中心 > 数字内容生产线 MetaStudio > 产品介绍 > 使用限制
如何呈现PPT的动画效果？ - 数字内容生产线 MetaStudio

签，导入使用。请注意：视频中PPT每页播放的时间如果与对应音频的时长不匹配，需要将完整的PPT视频按页切割成独立的子视频，一一上传至视频制作界面，按场景依次添加使用。添加后的视频支持仅播放一次，或者循环播放，直至音频播报结束。父主题：视频制作

 帮助中心 > 数字内容生产线 MetaStudio > 常见问题 > 视频制作
获取TTS异步任务 - 数字内容生产线 MetaStudio

state String 音频文件是否已生成完成。该标记为PROCESSING时，应该每隔3秒再次调用本接口获取音频文件(WAITING 等待中,PROCESSING 处理中,SUCCEED 成功,FAILED 失败) audio_file_url String 音频文件下载链接，有效期为1个小时。

帮助中心 > 数字内容生产线 MetaStudio > API参考 > 语音合成管理
创建TTS异步任务 - 数字内容生产线 MetaStudio

默认取值： false silence_flag 否 Boolean 异常时是否返回静默音频流默认取值： false silence_time_ms 否 Integer 异常时返回的静默音频流时长，单位毫秒。取值范围： 0-5000 默认取值： 2000 callback_config

帮助中心 > 数字内容生产线 MetaStudio > API参考 > 语音合成管理

总条数： 108

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

手机录制音频 - 数字内容生产线 MetaStudio

第三方平台的直播画面没有声音怎么办？ - 数字内容生产线 MetaStudio

查询用户配置的个性化音频时长 - 数字内容生产线 MetaStudio

真人声音录制 - 数字内容生产线 MetaStudio

声音制作 - 数字内容生产线 MetaStudio

视频制作 - 数字内容生产线 MetaStudio

创建声音制作任务（自研模型） - 数字内容生产线 MetaStudio

视频制作 - 数字内容生产线 MetaStudio

客户声音制作案例 - 数字内容生产线 MetaStudio

视频制作限制 - 数字内容生产线 MetaStudio

视频制作界面说明 - 数字内容生产线 MetaStudio

创建高级版语音训练任务 - 数字内容生产线 MetaStudio

直播控制HTTP Command命令说明 - 数字内容生产线 MetaStudio

制作照片数字人视频 - 数字内容生产线 MetaStudio

视频直播限制 - 数字内容生产线 MetaStudio

算法备案公示 - 数字内容生产线 MetaStudio

照片数字人限制 - 数字内容生产线 MetaStudio

如何呈现PPT的动画效果？ - 数字内容生产线 MetaStudio

获取TTS异步任务 - 数字内容生产线 MetaStudio

创建TTS异步任务 - 数字内容生产线 MetaStudio

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线