搜索_华为云

示例6：语音同步合成WebSocket接口（Android SDK） - 数字内容生产线 MetaStudio

示例6：语音同步合成WebSocket接口（Android SDK）语音同步合成WebSocket接口示例，详见语音同步合成Android SDK。父主题：应用示例

 帮助中心 > 数字内容生产线 MetaStudio > API参考 > 应用示例
Web语音唤醒 - 数字内容生产线 MetaStudio

用户，用户需要参考更新唤醒模型，将模型更新至本地模型路径中。使用要求 WebSDK版本为3.0.1及以上。仅支持数字人平台配置或内置ASR（语音转文本）能力的方案。不支持WebSocket接口驱动数字人方案，即文本驱动方案。在调用create接口之前，必须要有用户点击集成WebSDK的页面的行为。

帮助中心 > 数字内容生产线 MetaStudio > API参考 > 智能交互 > 智能交互客户端SDK > Web SDK > 接口参考
手机录制音频 - 数字内容生产线 MetaStudio

推荐使用48bit采样位录制音频。苹果手机的简易录音机的采集位默认为16bit，无需修改。声道推荐使用单声道录制音频。苹果手机的简易录音机默认为单声道录制，无需修改。音频格式推荐使用无损音质格式保存音频，如WAV、MP3格式。音频命名所有语料录制生成一个长音频WAV或MP3文件，命名示例：Voice

帮助中心 > 数字内容生产线 MetaStudio > 用户指南 > 附录
获取语音文件上传地址 - 数字内容生产线 MetaStudio

授权书的上传地址。表3 segment_url 参数参数类型描述 audio_uploading_url Array of strings 音频上传的地址。说明：通过该obs地址上传时需要设置content-type为audio/wav txt_uploading_url Array

帮助中心 > 数字内容生产线 MetaStudio > API参考 > 声音制作任务管理
语音同步合成WebSocket接口 - 数字内容生产线 MetaStudio

sample_rate String body voice_data中音频的采样率。取值示例：16000、24000。 voice_data String body 音频数据，为base64编码的pcm音频流。 pcm格式为16位单声道，采样率见sample_rate字段，默认16000。

帮助中心 > 数字内容生产线 MetaStudio > API参考 > 语音合成管理
创建高级版语音训练任务 - 数字内容生产线 MetaStudio

创建高级版语音训练任务功能介绍用户创建语音训练高级版任务，该接口会返回一个obs上传地址，用于上传语音文件。语音文件为一段WAV格式的长音频文件，仅支持将语音文件打包成zip压缩格式上传。文件上传后，调用“提交语音训练任务”接口，启动审核和训练。调用方法请参见如何调用API。

帮助中心 > 数字内容生产线 MetaStudio > API参考 > 声音制作任务管理
真人声音录制 - 数字内容生产线 MetaStudio

5分钟。进阶版：整段录制生成一个WAV或MP3格式音频，总时长10~30分钟，建议15分钟。高品质：整段录制生成一个WAV或MP3格式音频，总时长1小时以上，建议1小时。原声录制音频和其对应生成的音色播报示例，如客户声音制作案例所示。录音准备表1 录音准备声音类型录制设备和软件

 帮助中心 > 数字内容生产线 MetaStudio > 用户指南 > 声音制作
创建TTS异步任务 - 数字内容生产线 MetaStudio

默认取值： false silence_flag 否 Boolean 异常时是否返回静默音频流默认取值： false silence_time_ms 否 Integer 异常时返回的静默音频流时长，单位毫秒。取值范围： 0-5000 默认取值： 2000 callback_config

帮助中心 > 数字内容生产线 MetaStudio > API参考 > 语音合成管理
获取TTS异步任务 - 数字内容生产线 MetaStudio

state String 音频文件是否已生成完成。该标记为PROCESSING时，应该每隔3秒再次调用本接口获取音频文件(WAITING 等待中,PROCESSING 处理中,SUCCEED 成功,FAILED 失败) audio_file_url String 音频文件下载链接，有效期为1个小时。

帮助中心 > 数字内容生产线 MetaStudio > API参考 > 语音合成管理
智能交互设置 - 数字内容生产线 MetaStudio

有问题，会给出相应提示。尾静音时长云端对音频进行VAD检测，发现一句话末尾的静音时长超过500ms，会结束语音识别。建议该值大于500ms。委托语言交互服务(SIS) 如需使用热词功能，请开启委托授权。SIS服务用于将用户口述音频转换为文本。热词仅开启“委托语言交互服务(SIS)”后，才会展示“热词”配置。

帮助中心 > 数字内容生产线 MetaStudio > 用户指南 > 视频直播
查询用户配置的个性化音频时长 - 数字内容生产线 MetaStudio

查询用户配置的个性化音频时长功能介绍查询用户配置的个性化音频时长调用方法请参见如何调用API。 URI GET /v1/{project_id}/voice-training-manage/user/tenant-duration-cfg 表1 路径参数参数是否必选参数类型

 帮助中心 > 数字内容生产线 MetaStudio > API参考 > 声音制作任务管理
创建智能交互数字人 - 数字内容生产线 MetaStudio

有问题，会给出相应提示。尾静音时长云端对音频进行VAD检测，发现一句话末尾的静音时长超过500ms，会结束语音识别。建议该值大于500ms。委托语言交互服务(SIS) 如需使用热词功能，请开启委托授权。SIS服务用于将用户口述音频转换为文本。热词仅开启“委托语言交互服务(SIS)”后，才会展示“热词”配置。

帮助中心 > 数字内容生产线 MetaStudio > 用户指南 > 智能交互 > 创建智能交互数字人（奇妙问）
创建智能交互数字人 - 数字内容生产线 MetaStudio

有问题，会给出相应提示。尾静音时长云端对音频进行VAD检测，发现一句话末尾的静音时长超过500ms，会结束语音识别。建议该值大于500ms。委托语言交互服务(SIS) 如需使用热词功能，请开启委托授权。SIS服务用于将用户口述音频转换为文本。热词仅开启“委托语言交互服务(SIS)”后，才会展示“热词”配置。

帮助中心 > 数字内容生产线 MetaStudio > 用户指南 > 智能交互 > 创建智能交互数字人（第三方语言模型）
创建智能交互数字人（SDK场景） - 数字内容生产线 MetaStudio

配置检查单击“配置检查”，自动检查当前页签配置是否正确，如果有问题，会给出相应提示。尾静音时长云端对音频进行VAD检测，发现一句话末尾的静音时长超过500ms，会结束语音识别。建议该值大于500ms。表2 创建应用参数说明第三方应用配置说明如下所示：如果科大讯飞AI

帮助中心 > 数字内容生产线 MetaStudio > 用户指南 > 智能交互 > 创建智能交互数字人（二次开发场景）
应用示例 - 数字内容生产线 MetaStudio

示例2：资产管理示例3：分身形象制作管理示例4：声音制作任务管理示例5：语音合成管理示例6：语音同步合成WebSocket接口（Android SDK）示例7：语音同步合成WebSocket接口（iOS SDK）示例8：视频制作示例9：视频制作剧本管理示例10：视频制作素材图层管理

 帮助中心 > 数字内容生产线 MetaStudio > API参考
事件通知（EventMap） - 数字内容生产线 MetaStudio

speakingStart 数字人开始讲话事件。 × √ speakingStop 数字人结束讲话事件。 × √ speechRecognized ASR对提问进行语音识别后输出为文本的事件。 × √ semanticRecognized LLM对提问进行语义识别后输出回复文本的事件。speechR

帮助中心 > 数字内容生产线 MetaStudio > API参考 > 智能交互 > 智能交互客户端SDK > Web SDK > 接口参考
快速入门 - 数字内容生产线 MetaStudio

表2 浏览器适配详情操作系统类型浏览器类型浏览器版本 Windows Chrome浏览器 91+ Edge浏览器 80+ Android 移动版Chrome浏览器 91+ iOS 移动版Safari浏览器 17.3+ Mac Safari浏览器 15.6+ 表3 透明背景支持情况

 帮助中心 > 数字内容生产线 MetaStudio > API参考 > 智能交互 > 智能交互客户端SDK > Web SDK
创建智能交互数字人 - 数字内容生产线 MetaStudio

配置检查单击“配置检查”，自动检查当前页签配置是否正确，如果有问题，会给出相应提示。尾静音时长云端对音频进行VAD检测，发现一句话末尾的静音时长超过500ms，会结束语音识别。建议该值大于500ms。图2 获取访问权限单击“确定”，创建应用，创建效果如图3所示。可单击“修改”，修改配置。

帮助中心 > 数字内容生产线 MetaStudio > 用户指南 > 智能交互 > 创建智能交互数字人（华为云CBS）
创建智能交互数字人 - 数字内容生产线 MetaStudio

配置检查单击“配置检查”，自动检查当前页签配置是否正确，如果有问题，会给出相应提示。尾静音时长云端对音频进行VAD检测，发现一句话末尾的静音时长超过500ms，会结束语音识别。建议该值大于500ms。单击“确定”，创建应用，创建效果如图2所示。可单击“修改”，修改配置。图2

帮助中心 > 数字内容生产线 MetaStudio > 用户指南 > 智能交互 > 创建智能交互数字人（科大讯飞）
智能交互限制 - 数字内容生产线 MetaStudio

表1 硬件设备要求硬件配置最低配置 CPU i5及以上版本。内存 8G以上。硬盘 128G及以上。操作系统 Windows或Android系统。麦克风需要有麦克风，且要保障1米以内的拾音效果。扬声器需要有扬声器。触摸屏需要有触摸屏。带宽 4M以上。由于浏览

 帮助中心 > 数字内容生产线 MetaStudio > 产品介绍 > 使用限制

总条数： 157

上一页
1
2
3
4
5
...
8
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

示例6：语音同步合成WebSocket接口（Android SDK） - 数字内容生产线 MetaStudio

Web语音唤醒 - 数字内容生产线 MetaStudio

手机录制音频 - 数字内容生产线 MetaStudio

获取语音文件上传地址 - 数字内容生产线 MetaStudio

语音同步合成WebSocket接口 - 数字内容生产线 MetaStudio

创建高级版语音训练任务 - 数字内容生产线 MetaStudio

真人声音录制 - 数字内容生产线 MetaStudio

创建TTS异步任务 - 数字内容生产线 MetaStudio

获取TTS异步任务 - 数字内容生产线 MetaStudio

智能交互设置 - 数字内容生产线 MetaStudio

查询用户配置的个性化音频时长 - 数字内容生产线 MetaStudio

创建智能交互数字人 - 数字内容生产线 MetaStudio

创建智能交互数字人 - 数字内容生产线 MetaStudio

创建智能交互数字人（SDK场景） - 数字内容生产线 MetaStudio

应用示例 - 数字内容生产线 MetaStudio

事件通知（EventMap） - 数字内容生产线 MetaStudio

快速入门 - 数字内容生产线 MetaStudio

创建智能交互数字人 - 数字内容生产线 MetaStudio

创建智能交互数字人 - 数字内容生产线 MetaStudio

智能交互限制 - 数字内容生产线 MetaStudio

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线