搜索_华为云

手机录制音频 - 数字内容生产线 MetaStudio

推荐使用48bit采样位录制音频。苹果手机的简易录音机的采集位默认为16bit，无需修改。声道推荐使用单声道录制音频。苹果手机的简易录音机默认为单声道录制，无需修改。音频格式推荐使用无损音质格式保存音频，如WAV、MP3格式。音频命名所有语料录制生成一个长音频WAV或MP3文件，命名示例：Voice

帮助中心 > 数字内容生产线 MetaStudio > 用户指南 > 附录
第三方平台的直播画面没有声音怎么办？ - 数字内容生产线 MetaStudio

第三方平台的直播画面没有声音怎么办？如果用户在第三方直播平台的直播画面没有声音，需排查是否是OBS工具设置的桌面音频设备与Windows系统的声音输出设备不一致导致。检查方法如下所示：检查OBS桌面音频设备检查Windows系统的声音输出设备检查OBS桌面音频设备本地打开OBS视频采集工具。

帮助中心 > 数字内容生产线 MetaStudio > 常见问题 > 视频直播
声音制作 - 数字内容生产线 MetaStudio

声音制作方式选择“基础版声音制作”，音频格式为WAV或MP3文件。需整段录制，每句之间有2~3秒的停顿。音频时长3~10分钟，建议5分钟。请完善声音信息输入声音名称，示例：欢快女声。请制作声音使用“语料上传”的方式，直接上传一个已录制好的长音频WAV或MP3文件，无需压缩，无需携带文案txt文件。

帮助中心 > 数字内容生产线 MetaStudio > 快速入门
客户声音制作案例 - 数字内容生产线 MetaStudio

zip，下载如表1所示的音频文件。 mos分是从音色相似度、情感表达效果和声音音质方面，进行整体效果综合评分的结果。表1 音频文件版本类别原音文件合成音文件版本差异适用场景基础版声音制作女声基础版媒体1.wav 基础版媒体2.wav 支持手机录制20条语料音频（5分钟），

帮助中心 > 数字内容生产线 MetaStudio > 用户指南 > 附录
真人声音录制 - 数字内容生产线 MetaStudio

优先使用专业录音设备录制音频，推荐使用Adobe Audition软件进行录音。如果不具备专业录音设备，可使用手机录制音频，详情请参见手机录制音频。录音环境安静，无回音、混响、噪声，避免出现汽车鸣笛、他人说话、走动等杂声。可使用“分贝仪”应用来测试录音环境的底噪，建议底噪低于0dB。

帮助中心 > 数字内容生产线 MetaStudio > 用户指南 > 声音制作
查询用户配置的个性化音频时长 - 数字内容生产线 MetaStudio

查询用户配置的个性化音频时长功能介绍查询用户配置的个性化音频时长调用方法请参见如何调用API。 URI GET /v1/{project_id}/voice-training-manage/user/tenant-duration-cfg 表1 路径参数参数是否必选参数类型

 帮助中心 > 数字内容生产线 MetaStudio > API参考 > 声音制作任务管理
算法备案公示 - 数字内容生产线 MetaStudio

算法基本原理分身数字人驱动算法是指通过深度学习生成数字人驱动模型，模型生成后，输入音频来合成数字人视频的一种技术。其基本情况包括：输入数据：真人视频、音频。算法原理：通过深度学习算法来学习真人视频，生成驱动该真人形象的数字人模型。通过该模型输入音频，合成数字人视频。输出结果：数字人视频。

帮助中心 > 数字内容生产线 MetaStudio > 产品介绍
基于图片URL创建照片建模任务 - 数字内容生产线 MetaStudio

获取。响应消息头中X-Subject-Token的值。 Authorization 否 String 使用AK/SK方式认证时必选，携带的鉴权信息。 X-Sdk-Date 否 String 使用AK/SK方式认证时必选，请求的发生时间。格式为(YYYYMMDD'T'HHMMSS'Z')。

帮助中心 > 数字内容生产线 MetaStudio > API参考 > 3D数字人 > 3D数字人风格化照片建模
创建高级版语音训练任务 - 数字内容生产线 MetaStudio

audio_uploading_url Array of strings 音频上传的地址。通过该obs地址上传时，需设置content-type为audio/wav txt_uploading_url Array of strings 文本上传的地址。通过该obs地址上传时需设置content-type为text/plain

帮助中心 > 数字内容生产线 MetaStudio > API参考 > 声音制作任务管理
数字人支持添加动作吗？ - 数字内容生产线 MetaStudio

数字人支持添加动作吗？需要数字人模型训练时使用的形象采集视频包含动作编排，才可以添加动作，详见动作编排定制采集指南。目前仅视频制作支持数字人插入动作，如图1所示。在数字人卡片上有标识，说明当前数字人支持添加动作。添加动作时需要注意，动作生效需要有足够的音频时间，如果音频太短，数字人可能来不及做动作。

帮助中心 > 数字内容生产线 MetaStudio > 常见问题 > 数字人
视频直播 - 数字内容生产线 MetaStudio

图3 开播界面音频驱动单击“上传音频”，从本地上传已录制好的音频，如图4所示。每个音频不能超过100M，支持WAV、M4A和MP3格式，每个场景的音频总时长不能低于1分钟。开播后会直接播放音频，声音是音频原有声音。用户也可以设置主播和助播的声音，用于开播后，使用主播或助播声音，播报发送的互动内容。

帮助中心 > 数字内容生产线 MetaStudio > 用户指南 > 视频直播
视频制作 - 数字内容生产线 MetaStudio

图2 文本驱动音频制作完成后，可单击音量图标，调整音频的音量。上述操作全部完成后，第一个场景的视频内容已制作完成。如果还需要制作更多场景，可单击“场景”区域的“+”图标，新增场景。制作过程参考第一个场景即可。图3 场景区域所有场景设置完成后，单击界面右上角的“合成视频”，弹出“合成设置”对话框。

帮助中心 > 数字内容生产线 MetaStudio > 快速入门
视频制作 - 数字内容生产线 MetaStudio

复展示。音频驱动需从本地上传已录制好的音频。音频文件格式需要为WAV、MP3或M4A，大小不能超过100M。可单击“导入”上传音频，也可以直接拖拽本地音频文件至提示区域中，完成上传。单击左侧的图标，可试听音频效果。如果音频效果不佳，可以单击“导入”，覆盖更新音频。图2 音频驱动

 帮助中心 > 数字内容生产线 MetaStudio > 用户指南 > 视频制作
如何呈现PPT的动画效果？ - 数字内容生产线 MetaStudio

选择创建视频，可以设置每张幻灯片放映的时间等参数。单击“创建视频”，在弹出的对话框中，选择本地存放目录，并设置视频名称。单击“保存”，生成视频文件。视频文件生成后，需要在视频制作界面的“视频”页签，导入使用。请注意：视频中PPT每页播放的时间如果与对应音频的时长不匹配，需要将完整的PPT视频按页

 帮助中心 > 数字内容生产线 MetaStudio > 常见问题 > 视频制作
创建TTS异步任务 - 数字内容生产线 MetaStudio

创建TTS异步任务功能介绍该接口用于对外生成音频文件使用本接口前，需要在MetaStudio控制台服务概览页面，开通“声音合成”的按需计费。详细操作为：单击“声音合成”卡片中的“去开通”，在弹出的“开通按需计费服务提示”对话框中，勾选同意协议。单击“确定”，开通按需计费。

帮助中心 > 数字内容生产线 MetaStudio > API参考 > 语音合成管理
获取TTS异步任务 - 数字内容生产线 MetaStudio

获取。响应消息头中X-Subject-Token的值。 Authorization 否 String 使用AK/SK方式认证时必选，携带的鉴权信息。 X-Sdk-Date 否 String 使用AK/SK方式认证时必选，请求的发生时间。 X-Project-Id 否 String

帮助中心 > 数字内容生产线 MetaStudio > API参考 > 语音合成管理
直播控制HTTP Command命令说明 - 数字内容生产线 MetaStudio

Markup Language）标记语言。需要使用的标签，如下所示： <speak>：此标签为所有文本的根节点。一切需要调用SSML标签的文本，都要包含在<speak> </speak>标记对中。 <emotion>：情感标签，对指定的一或多句话生效。标签开始在句子起始位置，标签结束在句子结尾。用法为：<emotion

帮助中心 > 数字内容生产线 MetaStudio > API参考 > 附录
视频制作界面说明 - 数字内容生产线 MetaStudio

如果是多音字可设置正确的发音，还可以选择不同的声音，试听生成的音频效果。支持开启字幕展示功能。音频驱动：从本地上传音频文件，作为视频的语音。音频驱动方式，仅支持中文普通话的场景下能开启字幕。还可以设置音频的音量，和调整画布的横竖屏展示。 4 视频场景区域如果一个视频包含多场景，可以新增场景依次制作，顺序播放。

帮助中心 > 数字内容生产线 MetaStudio > 用户指南 > 视频制作
制作名片 - 数字内容生产线 MetaStudio

播报内容生成后，单击右侧的“试听”，可以试听播报效果。语音上传：本地录制音频后上传。音频格式需要为WAV或MP3格式，音频大小不超过20MB，时长不超过5分钟。在线录音：在线录制音频。录音时长不能超过5分钟，为保证音频生成的效果，请保持录音环境安静无噪音。支持试听录制生成的语音。文本驱

 帮助中心 > 数字内容生产线 MetaStudio > 用户指南 > 数字人名片制作
照片数字人限制 - 数字内容生产线 MetaStudio

音频录制要求，如下所示：单声道音频。清晰人声无背景音乐与杂音。音频格式要求，如下所示：支持的格式为：MP3、WAV。大小不超过20MB，时长不超过5分钟。文本驱动文本驱动方式的要求如下所示：文本输入长度不超过2000字。通过文本合成的音频时长不能超过5分钟。在照片数字人制作

 帮助中心 > 数字内容生产线 MetaStudio > 产品介绍 > 使用限制

总条数： 141

上一页
1
2
3
4
5
...
8
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

手机录制音频 - 数字内容生产线 MetaStudio

第三方平台的直播画面没有声音怎么办？ - 数字内容生产线 MetaStudio

声音制作 - 数字内容生产线 MetaStudio

客户声音制作案例 - 数字内容生产线 MetaStudio

真人声音录制 - 数字内容生产线 MetaStudio

查询用户配置的个性化音频时长 - 数字内容生产线 MetaStudio

算法备案公示 - 数字内容生产线 MetaStudio

基于图片URL创建照片建模任务 - 数字内容生产线 MetaStudio

创建高级版语音训练任务 - 数字内容生产线 MetaStudio

数字人支持添加动作吗？ - 数字内容生产线 MetaStudio

视频直播 - 数字内容生产线 MetaStudio

视频制作 - 数字内容生产线 MetaStudio

视频制作 - 数字内容生产线 MetaStudio

如何呈现PPT的动画效果？ - 数字内容生产线 MetaStudio

创建TTS异步任务 - 数字内容生产线 MetaStudio

获取TTS异步任务 - 数字内容生产线 MetaStudio

直播控制HTTP Command命令说明 - 数字内容生产线 MetaStudio

视频制作界面说明 - 数字内容生产线 MetaStudio

制作名片 - 数字内容生产线 MetaStudio

照片数字人限制 - 数字内容生产线 MetaStudio

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线