搜索_华为云

示例7：语音同步合成WebSocket接口（iOS SDK） - 数字内容生产线 MetaStudio

示例7：语音同步合成WebSocket接口（iOS SDK）语音同步合成WebSocket接口示例，详见语音同步合成iOS SDK。父主题：应用示例

 帮助中心 > 数字内容生产线 MetaStudio > API参考 > 应用示例
客户声音制作案例 - 数字内容生产线 MetaStudio

zip，下载如表1所示的音频文件。 mos分是从音色相似度、情感表达效果和声音音质方面，进行整体效果综合评分的结果。表1 音频文件版本类别原音文件合成音文件版本差异适用场景基础版声音制作女声基础版媒体1.wav 基础版媒体2.wav 支持手机录制20条语料音频（5分钟），

帮助中心 > 数字内容生产线 MetaStudio > 用户指南 > 附录
删除TTS租户级自定义读法配置 - 数字内容生产线 MetaStudio

删除TTS租户级自定义读法配置功能介绍该接口用于删除TTS租户级自定义读法配置。调用方法请参见如何调用API。 URI DELETE /v1/{project_id}/ttsc/vocabulary-configs 表1 路径参数参数是否必选参数类型描述 project_id

帮助中心 > 数字内容生产线 MetaStudio > API参考 > 语音合成管理
修改TTS租户级自定义读法配置 - 数字内容生产线 MetaStudio

修改TTS租户级自定义读法配置功能介绍该接口用于修改TTS租户级自定义读法配置。调用方法请参见如何调用API。 URI PUT /v1/{project_id}/ttsc/vocabulary-configs/{vocabulary_id} 表1 路径参数参数是否必选

 帮助中心 > 数字内容生产线 MetaStudio > API参考 > 语音合成管理
示例6：语音同步合成WebSocket接口（Android SDK） - 数字内容生产线 MetaStudio

示例6：语音同步合成WebSocket接口（Android SDK）语音同步合成WebSocket接口示例，详见语音同步合成Android SDK。父主题：应用示例

 帮助中心 > 数字内容生产线 MetaStudio > API参考 > 应用示例
视频制作限制 - 数字内容生产线 MetaStudio

不支持Edge浏览器。视频素材总大小小于1GB。同时叠加的视频总数量最多支持2个。音频格式音频支持的格式为：MP3、M4A、WAV。音频要求如下所示：仅提取单声道音频。音频素材总大小小于500MB。图片格式图片支持的格式为：PNG、JPG、JPEG。图片要求如下所示：

帮助中心 > 数字内容生产线 MetaStudio > 产品介绍 > 使用限制
视频制作 - 数字内容生产线 MetaStudio

选择“文本驱动”的方式。在文本输入框中，输入文本内容，以生成音频，如图2所示。文本示例：今天是9月26日，星期二，天气晴朗，欢迎大家到访。我们精心布置了现场，室内摆放了各类植物和鲜花，场地宽敞明亮，足够大家在室内共同交流和活动。图2 文本驱动音频制作完成后，可单击音量图标，调整音频的音量。上述操作全部完成后，第一个场景的视频内容已制作完成。

帮助中心 > 数字内容生产线 MetaStudio > 快速入门
购买语音包后试听一直转圈圈是为什么？ - 数字内容生产线 MetaStudio

购买语音包后试听一直转圈圈是为什么？需要检查已购买的第三方声音AK/SK是否配置正确，详见购买出门问问声音套餐。如果配置有误，则无法使用。父主题：计费咨询

 帮助中心 > 数字内容生产线 MetaStudio > 常见问题 > 计费咨询
直播控制RTSA Command命令说明 - 数字内容生产线 MetaStudio

PROCESSING：数字人的工作状态。数字人会根据直播任务中预置的文本或音频进行直播。 PLAY_PAUSE：数字人直播暂停状态。此时数字人会处于静默状态，等待恢复剧本播放的指令。 TAKE_OVER：真人接管状态。MetaStudio直播服务会获取RTC通道中来自主播端的音频，实时驱动数字人进行直播。 PLAY_END：退出直播任务状态。

帮助中心 > 数字内容生产线 MetaStudio > API参考 > 附录
查询配置热词记录详情 - 数字内容生产线 MetaStudio

热词记录ID。 robot_id String 应用ID。 hot_words_type String 热词类型。说明： SIS:使用的语音识别服务为SIS时选此类型 vocabulary_id String 热词ID(sis中配置)。 sis_project_id String

帮助中心 > 数字内容生产线 MetaStudio > API参考 > 智能交互 > 智能交互管理 > 智能交互数字人热词记录管理
创建声音制作任务（自研模型） - 数字内容生产线 MetaStudio

基础版声音制作：需整段录制生成一个WAV或MP3格式的音频文件，时长3~10分钟，建议5分钟。进阶版声音制作：需整段录制生成一个WAV或MP3格式的音频文件，时长10~30分钟，建议15分钟。高品质声音制作：需整段录制生成一个WAV或MP3格式的音频文件，时长1小时以上，建议1小时。每种

 帮助中心 > 数字内容生产线 MetaStudio > 用户指南 > 声音制作
查询热词记录列表 - 数字内容生产线 MetaStudio

热词记录ID。 robot_id String 应用ID。 hot_words_type String 热词类型。说明： SIS:使用的语音识别服务为SIS时选此类型 vocabulary_id String 热词ID(sis中配置)。 sis_project_id String

帮助中心 > 数字内容生产线 MetaStudio > API参考 > 智能交互 > 智能交互管理 > 智能交互数字人热词记录管理
查询应用列表 - 数字内容生产线 MetaStudio

is_ifly_production Boolean 是否为正式环境默认取值： false tail_silence_time Integer 语音识别后端点静音时长默认500ms 取值范围： 0-3000 role_id String 奇妙问角色ID。 sis_region Integer

帮助中心 > 数字内容生产线 MetaStudio > API参考 > 智能交互 > 智能交互管理 > 智能交互数字人应用管理
查询应用详情 - 数字内容生产线 MetaStudio

is_ifly_production Boolean 是否为正式环境默认取值： false tail_silence_time Integer 语音识别后端点静音时长默认500ms 取值范围： 0-3000 role_id String 奇妙问角色ID。 sis_region Integer

帮助中心 > 数字内容生产线 MetaStudio > API参考 > 智能交互 > 智能交互管理 > 智能交互数字人应用管理
文本驱动SSML定义 - 数字内容生产线 MetaStudio

文本驱动SSML定义 MetaStudio语音驱动采用语音合成标记语言（SSML，Speech Synthesis Markup Language）来控制数字人的行为，包括动作、情绪以及TTS语音合成的多音字、停顿等。 SSML基础定义可参考语音合成标记语言版本 1.0。Meta

帮助中心 > 数字内容生产线 MetaStudio > API参考 > 附录
照片数字人限制 - 数字内容生产线 MetaStudio

80。音频音频录制要求，如下所示：单声道音频。清晰人声无背景音乐与杂音。音频格式要求，如下所示：支持的格式为：MP3、WAV。大小不超过20MB，时长不超过5分钟。文本驱动文本驱动方式的要求如下所示：文本输入长度不超过2000字。通过文本合成的音频时长不能超过5分钟。

帮助中心 > 数字内容生产线 MetaStudio > 产品介绍 > 使用限制
修改应用 - 数字内容生产线 MetaStudio

zh_CN：简体中文（已下线，请使用CN） en_US：英语（已下线，请使用EN） CN：中文 EN：英文 tail_silence_time 否 Integer 语音识别后端点静音时长默认500ms 取值范围： 0-3000 enable_question_audit 否 Boolean 提问文本审核开关

 帮助中心 > 数字内容生产线 MetaStudio > API参考 > 智能交互 > 智能交互管理 > 智能交互数字人应用管理
创建应用 - 数字内容生产线 MetaStudio

zh_CN：简体中文（已下线，请使用CN） en_US：英语（已下线，请使用EN） CN：中文 EN：英文 tail_silence_time 否 Integer 语音识别后端点静音时长默认500ms 取值范围： 0-3000 enable_question_audit 否 Boolean 提问文本审核开关

 帮助中心 > 数字内容生产线 MetaStudio > API参考 > 智能交互 > 智能交互管理 > 智能交互数字人应用管理
直播控制HTTP Command命令说明 - 数字内容生产线 MetaStudio

用于互动回复。数字人不变时，背景不变。其参数结构定义为“PlayTextInfo”。音频驱动方式：对应Command命令为“INSERT_PLAY_AUDIO”，即插入驱动音频，用于音频直接驱动。数字人不变时，背景不变。其参数结构定义为“PlayAudioInfo”。控制数

 帮助中心 > 数字内容生产线 MetaStudio > API参考 > 附录
API使用限制 - 数字内容生产线 MetaStudio

获取语音训练任务审核结果 20次/秒 10次/秒 10次/秒设置任务批次 10次/秒 3次/秒 3次/秒确认在线录音结果 10次/秒 3次/秒 3次/秒获取在线录音确认结果 20次/秒 10次/秒 10次/秒语音合成管理创建TTS试听任务 5次/秒 3次/秒 3次/秒获取TTS试听文件

 帮助中心 > 数字内容生产线 MetaStudio > 产品介绍 > 使用限制

总条数： 172

上一页
1
2
3
4
5
...
9
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

示例7：语音同步合成WebSocket接口（iOS SDK） - 数字内容生产线 MetaStudio

客户声音制作案例 - 数字内容生产线 MetaStudio

删除TTS租户级自定义读法配置 - 数字内容生产线 MetaStudio

修改TTS租户级自定义读法配置 - 数字内容生产线 MetaStudio

示例6：语音同步合成WebSocket接口（Android SDK） - 数字内容生产线 MetaStudio

视频制作限制 - 数字内容生产线 MetaStudio

视频制作 - 数字内容生产线 MetaStudio

购买语音包后试听一直转圈圈是为什么？ - 数字内容生产线 MetaStudio

直播控制RTSA Command命令说明 - 数字内容生产线 MetaStudio

查询配置热词记录详情 - 数字内容生产线 MetaStudio

创建声音制作任务（自研模型） - 数字内容生产线 MetaStudio

查询热词记录列表 - 数字内容生产线 MetaStudio

查询应用列表 - 数字内容生产线 MetaStudio

查询应用详情 - 数字内容生产线 MetaStudio

文本驱动SSML定义 - 数字内容生产线 MetaStudio

照片数字人限制 - 数字内容生产线 MetaStudio

修改应用 - 数字内容生产线 MetaStudio

创建应用 - 数字内容生产线 MetaStudio

直播控制HTTP Command命令说明 - 数字内容生产线 MetaStudio

API使用限制 - 数字内容生产线 MetaStudio

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线