搜索_华为云

数字人支持TTS和ASR吗？ - 数字内容生产线 MetaStudio

数字人支持TTS和ASR吗？已支持TTS（文本转语音），详见创建TTS异步任务。MetaStudio不提供ASR（语音转文本），用户如有ASR需求，可以查看语音交互服务或其他ASR服务。父主题：数字人

 帮助中心 > 数字内容生产线 MetaStudio > 常见问题 > 数字人
第三方声音支持的语言类型 - 数字内容生产线 MetaStudio

第三方声音支持的语言类型第三方声音支持的语言类型，如表1所示。表1 语言类型语言类型语种出门问问（方言）支持7种语言：东北话、广西话、湖北话、陕西话、四川话、粤语、港台。出门问问（预置声音）支持19种语言：中文、英文、德语、法语、韩语、葡萄牙语、日语、西班牙语、意

 帮助中心 > 数字内容生产线 MetaStudio > 用户指南 > 声音制作 > 购买声音套餐
获取在线录音确认结果 - 数字内容生产线 MetaStudio

获取在线录音确认结果功能介绍获取在线录音确认结果。调用方法请参见如何调用API。 URI GET /v1/{project_id}/voice-training-manage/user/training-segment 表1 路径参数参数是否必选参数类型描述 project_id

帮助中心 > 数字内容生产线 MetaStudio > API参考 > 声音制作任务管理
确认在线录音结果 - 数字内容生产线 MetaStudio

确认在线录音结果功能介绍确认在线录音结果。调用方法请参见如何调用API。 URI POST /v1/{project_id}/voice-training-manage/user/training-segment 表1 路径参数参数是否必选参数类型描述 project_id

帮助中心 > 数字内容生产线 MetaStudio > API参考 > 声音制作任务管理
Web语音唤醒 - 数字内容生产线 MetaStudio

用户，用户需要参考更新唤醒模型，将模型更新至本地模型路径中。使用要求 WebSDK版本为3.0.1及以上。仅支持数字人平台配置或内置ASR（语音转文本）能力的方案。不支持WebSocket接口驱动数字人方案，即文本驱动方案。在调用create接口之前，必须要有用户点击集成WebSDK的页面的行为。

帮助中心 > 数字内容生产线 MetaStudio > API参考 > 智能交互 > 智能交互客户端SDK > Web SDK > 接口参考
创建高级版语音训练任务 - 数字内容生产线 MetaStudio

创建高级版语音训练任务功能介绍用户创建语音训练高级版任务，该接口会返回一个obs上传地址，用于上传语音文件。语音文件为一段WAV格式的长音频文件，仅支持将语音文件打包成zip压缩格式上传。文件上传后，调用“提交语音训练任务”接口，启动审核和训练。调用方法请参见如何调用API。

帮助中心 > 数字内容生产线 MetaStudio > API参考 > 声音制作任务管理
语音同步合成WebSocket接口 - 数字内容生产线 MetaStudio

sample_rate String body voice_data中音频的采样率。取值示例：16000、24000。 voice_data String body 音频数据，为base64编码的pcm音频流。 pcm格式为16位单声道，采样率见sample_rate字段，默认16000。

帮助中心 > 数字内容生产线 MetaStudio > API参考 > 语音合成管理
创建智能交互数字人 - 数字内容生产线 MetaStudio

有问题，会给出相应提示。尾静音时长云端对音频进行VAD检测，发现一句话末尾的静音时长超过500ms，会结束语音识别。建议该值大于500ms。委托语言交互服务(SIS) 如需使用热词功能，请开启委托授权。SIS服务用于将用户口述音频转换为文本。热词仅开启“委托语言交互服务(SIS)”后，才会展示“热词”配置。

帮助中心 > 数字内容生产线 MetaStudio > 用户指南 > 智能交互 > 创建智能交互数字人（奇妙问）
创建智能交互数字人 - 数字内容生产线 MetaStudio

有问题，会给出相应提示。尾静音时长云端对音频进行VAD检测，发现一句话末尾的静音时长超过500ms，会结束语音识别。建议该值大于500ms。委托语言交互服务(SIS) 如需使用热词功能，请开启委托授权。SIS服务用于将用户口述音频转换为文本。热词仅开启“委托语言交互服务(SIS)”后，才会展示“热词”配置。

帮助中心 > 数字内容生产线 MetaStudio > 用户指南 > 智能交互 > 创建智能交互数字人（第三方语言模型）
智能交互设置 - 数字内容生产线 MetaStudio

有问题，会给出相应提示。尾静音时长云端对音频进行VAD检测，发现一句话末尾的静音时长超过500ms，会结束语音识别。建议该值大于500ms。委托语言交互服务(SIS) 如需使用热词功能，请开启委托授权。SIS服务用于将用户口述音频转换为文本。热词仅开启“委托语言交互服务(SIS)”后，才会展示“热词”配置。

帮助中心 > 数字内容生产线 MetaStudio > 用户指南 > 视频直播
手机录制音频 - 数字内容生产线 MetaStudio

推荐使用48bit采样位录制音频。苹果手机的简易录音机的采集位默认为16bit，无需修改。声道推荐使用单声道录制音频。苹果手机的简易录音机默认为单声道录制，无需修改。音频格式推荐使用无损音质格式保存音频，如WAV、MP3格式。音频命名所有语料录制生成一个长音频WAV或MP3文件，命名示例：Voice

帮助中心 > 数字内容生产线 MetaStudio > 用户指南 > 附录
创建TTS异步任务 - 数字内容生产线 MetaStudio

默认取值： false silence_flag 否 Boolean 异常时是否返回静默音频流默认取值： false silence_time_ms 否 Integer 异常时返回的静默音频流时长，单位毫秒。取值范围： 0-5000 默认取值： 2000 callback_config

帮助中心 > 数字内容生产线 MetaStudio > API参考 > 语音合成管理
创建智能交互数字人（SDK场景） - 数字内容生产线 MetaStudio

配置检查单击“配置检查”，自动检查当前页签配置是否正确，如果有问题，会给出相应提示。尾静音时长云端对音频进行VAD检测，发现一句话末尾的静音时长超过500ms，会结束语音识别。建议该值大于500ms。表2 创建应用参数说明第三方应用配置说明如下所示：如果科大讯飞AI

帮助中心 > 数字内容生产线 MetaStudio > 用户指南 > 智能交互 > 创建智能交互数字人（二次开发场景）
获取TTS异步任务 - 数字内容生产线 MetaStudio

state String 音频文件是否已生成完成。该标记为PROCESSING时，应该每隔3秒再次调用本接口获取音频文件(WAITING 等待中,PROCESSING 处理中,SUCCEED 成功,FAILED 失败) audio_file_url String 音频文件下载链接，有效期为1个小时。

帮助中心 > 数字内容生产线 MetaStudio > API参考 > 语音合成管理
声音制作任务管理 - 数字内容生产线 MetaStudio

查询用户配置的个性化音频时长创建基础版语音训练任务创建进阶版语音训练任务创建高级版语音训练任务查询语音训练任务列表提交语音训练任务查询语音训练任务详情删除语音训练任务查询任务操作日志获取语音文件上传地址获取语音训练任务审核结果设置任务批次确认在线录音结果获取在线录音确认结果

 帮助中心 > 数字内容生产线 MetaStudio > API参考
获取语音驱动数据 - 数字内容生产线 MetaStudio

” is_tail Boolean 是否为尾部(任务数据已全部生成，后续没有新的数据) 默认取值： false audio String 音频数据，Base64编码，1秒内的数据。 blendshapes Array of strings 语音驱动的表情基数据。 animations

帮助中心 > 数字内容生产线 MetaStudio > API参考 > 3D数字人 > 3D数字人语音驱动
查询用户配置的个性化音频时长 - 数字内容生产线 MetaStudio

查询用户配置的个性化音频时长功能介绍查询用户配置的个性化音频时长调用方法请参见如何调用API。 URI GET /v1/{project_id}/voice-training-manage/user/tenant-duration-cfg 表1 路径参数参数是否必选参数类型

 帮助中心 > 数字内容生产线 MetaStudio > API参考 > 声音制作任务管理
事件通知（EventMap） - 数字内容生产线 MetaStudio

speakingStart 数字人开始讲话事件。 × √ speakingStop 数字人结束讲话事件。 × √ speechRecognized ASR对提问进行语音识别后输出为文本的事件。 × √ semanticRecognized LLM对提问进行语义识别后输出回复文本的事件。speechR

帮助中心 > 数字内容生产线 MetaStudio > API参考 > 智能交互 > 智能交互客户端SDK > Web SDK > 接口参考
制作照片数字人视频 - 数字内容生产线 MetaStudio

播报内容生成后，单击右侧的“试听”，可以试听播报效果。语音上传：本地录制音频后上传。音频格式需要为WAV或MP3格式，音频大小不超过20MB，时长不超过5分钟。在线录音：在线录制音频。录音时长不能超过5分钟，为保证音频生成的效果，请保持录音环境安静无噪音。支持试听录制生成的语音。文

 帮助中心 > 数字内容生产线 MetaStudio > 用户指南 > 照片数字人
制作名片 - 数字内容生产线 MetaStudio

播报内容生成后，单击右侧的“试听”，可以试听播报效果。语音上传：本地录制音频后上传。音频格式需要为WAV或MP3格式，音频大小不超过20MB，时长不超过5分钟。在线录音：在线录制音频。录音时长不能超过5分钟，为保证音频生成的效果，请保持录音环境安静无噪音。支持试听录制生成的语音。文

 帮助中心 > 数字内容生产线 MetaStudio > 用户指南 > 数字人名片制作

总条数： 172

上一页
1
2
3
4
5
...
9
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

数字人支持TTS和ASR吗？ - 数字内容生产线 MetaStudio

第三方声音支持的语言类型 - 数字内容生产线 MetaStudio

获取在线录音确认结果 - 数字内容生产线 MetaStudio

确认在线录音结果 - 数字内容生产线 MetaStudio

Web语音唤醒 - 数字内容生产线 MetaStudio

创建高级版语音训练任务 - 数字内容生产线 MetaStudio

语音同步合成WebSocket接口 - 数字内容生产线 MetaStudio

创建智能交互数字人 - 数字内容生产线 MetaStudio

创建智能交互数字人 - 数字内容生产线 MetaStudio

智能交互设置 - 数字内容生产线 MetaStudio

手机录制音频 - 数字内容生产线 MetaStudio

创建TTS异步任务 - 数字内容生产线 MetaStudio

创建智能交互数字人（SDK场景） - 数字内容生产线 MetaStudio

获取TTS异步任务 - 数字内容生产线 MetaStudio

声音制作任务管理 - 数字内容生产线 MetaStudio

获取语音驱动数据 - 数字内容生产线 MetaStudio

查询用户配置的个性化音频时长 - 数字内容生产线 MetaStudio

事件通知（EventMap） - 数字内容生产线 MetaStudio

制作照片数字人视频 - 数字内容生产线 MetaStudio

制作名片 - 数字内容生产线 MetaStudio

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线