搜索_华为云

创建智能交互数字人 - 数字内容生产线 MetaStudio

有问题，会给出相应提示。尾静音时长云端对音频进行VAD检测，发现一句话末尾的静音时长超过500ms，会结束语音识别。建议该值大于500ms。委托语言交互服务(SIS) 如需使用热词功能，请开启委托授权。SIS服务用于将用户口述音频转换为文本。热词仅开启“委托语言交互服务(SIS)”后，才会展示“热词”配置。

帮助中心 > 数字内容生产线 MetaStudio > 用户指南 > 智能交互 > 创建智能交互数字人（奇妙问）
创建智能交互数字人 - 数字内容生产线 MetaStudio

有问题，会给出相应提示。尾静音时长云端对音频进行VAD检测，发现一句话末尾的静音时长超过500ms，会结束语音识别。建议该值大于500ms。委托语言交互服务(SIS) 如需使用热词功能，请开启委托授权。SIS服务用于将用户口述音频转换为文本。热词仅开启“委托语言交互服务(SIS)”后，才会展示“热词”配置。

帮助中心 > 数字内容生产线 MetaStudio > 用户指南 > 智能交互 > 创建智能交互数字人（第三方语言模型）
创建智能交互数字人 - 数字内容生产线 MetaStudio

配置检查单击“配置检查”，自动检查当前页签配置是否正确，如果有问题，会给出相应提示。尾静音时长云端对音频进行VAD检测，发现一句话末尾的静音时长超过500ms，会结束语音识别。建议该值大于500ms。图2 获取访问权限单击“确定”，创建应用，创建效果如图3所示。可单击“修改”，修改配置。

帮助中心 > 数字内容生产线 MetaStudio > 用户指南 > 智能交互 > 创建智能交互数字人（华为云CBS）
创建智能交互数字人 - 数字内容生产线 MetaStudio

配置检查单击“配置检查”，自动检查当前页签配置是否正确，如果有问题，会给出相应提示。尾静音时长云端对音频进行VAD检测，发现一句话末尾的静音时长超过500ms，会结束语音识别。建议该值大于500ms。单击“确定”，创建应用，创建效果如图2所示。可单击“修改”，修改配置。图2

帮助中心 > 数字内容生产线 MetaStudio > 用户指南 > 智能交互 > 创建智能交互数字人（科大讯飞）
智能交互设置 - 数字内容生产线 MetaStudio

有问题，会给出相应提示。尾静音时长云端对音频进行VAD检测，发现一句话末尾的静音时长超过500ms，会结束语音识别。建议该值大于500ms。委托语言交互服务(SIS) 如需使用热词功能，请开启委托授权。SIS服务用于将用户口述音频转换为文本。热词仅开启“委托语言交互服务(SIS)”后，才会展示“热词”配置。

帮助中心 > 数字内容生产线 MetaStudio > 用户指南 > 视频直播
创建智能交互数字人（SDK场景） - 数字内容生产线 MetaStudio

配置检查单击“配置检查”，自动检查当前页签配置是否正确，如果有问题，会给出相应提示。尾静音时长云端对音频进行VAD检测，发现一句话末尾的静音时长超过500ms，会结束语音识别。建议该值大于500ms。表2 创建应用参数说明第三方应用配置说明如下所示：如果科大讯飞AI

帮助中心 > 数字内容生产线 MetaStudio > 用户指南 > 智能交互 > 创建智能交互数字人（二次开发场景）
手机录制音频 - 数字内容生产线 MetaStudio

推荐使用48bit采样位录制音频。苹果手机的简易录音机的采集位默认为16bit，无需修改。声道推荐使用单声道录制音频。苹果手机的简易录音机默认为单声道录制，无需修改。音频格式推荐使用无损音质格式保存音频，如WAV、MP3格式。音频命名所有语料录制生成一个长音频WAV或MP3文件，命名示例：Voice

帮助中心 > 数字内容生产线 MetaStudio > 用户指南 > 附录
制作照片数字人视频 - 数字内容生产线 MetaStudio

播报内容生成后，单击右侧的“试听”，可以试听播报效果。语音上传：本地录制音频后上传。音频格式需要为WAV或MP3格式，音频大小不超过20MB，时长不超过5分钟。在线录音：在线录制音频。录音时长不能超过5分钟，为保证音频生成的效果，请保持录音环境安静无噪音。支持试听录制生成的语音。文

 帮助中心 > 数字内容生产线 MetaStudio > 用户指南 > 照片数字人
声音制作任务管理 - 数字内容生产线 MetaStudio

查询用户配置的个性化音频时长创建基础版语音训练任务创建进阶版语音训练任务创建高级版语音训练任务查询语音训练任务列表提交语音训练任务查询语音训练任务详情删除语音训练任务查询任务操作日志获取语音文件上传地址获取语音训练任务审核结果设置任务批次确认在线录音结果获取在线录音确认结果

 帮助中心 > 数字内容生产线 MetaStudio > API参考
视频制作 - 数字内容生产线 MetaStudio

复展示。音频驱动需从本地上传已录制好的音频。音频文件格式需要为WAV、MP3或M4A，大小不能超过100M。可单击“导入”上传音频，也可以直接拖拽本地音频文件至提示区域中，完成上传。单击左侧的图标，可试听音频效果。如果音频效果不佳，可以单击“导入”，覆盖更新音频。图2 音频驱动

 帮助中心 > 数字内容生产线 MetaStudio > 用户指南 > 视频制作
视频制作限制 - 数字内容生产线 MetaStudio

一个视频制作剧本，仅支持使用一个数字人模型和一个音色模型。文本驱动每个单场景输入文字的数量不超过1万字。所有场景输入文字的数量不超过10万字。每个单场景如果包含语音合成标记语言SSML标签，文字数量需小于128K。音频驱动每个单场景上传音频的大小不超过100M。视频格式插入的视频素材支持的格

 帮助中心 > 数字内容生产线 MetaStudio > 产品介绍 > 使用限制
文本驱动SSML定义 - 数字内容生产线 MetaStudio

dio数字人</prosody> word标签描述 <word></word>：设置选中文字为连读模式。选中文字只能包含文字，不能有标点符号或者空格等字符。语法 1 <word>文字</word> 属性无标签关系可以包含文本，不可以包含其他标签。备注 1 <wor

帮助中心 > 数字内容生产线 MetaStudio > API参考 > 附录
查询用户配置的个性化音频时长 - 数字内容生产线 MetaStudio

查询用户配置的个性化音频时长功能介绍查询用户配置的个性化音频时长调用方法请参见如何调用API。 URI GET /v1/{project_id}/voice-training-manage/user/tenant-duration-cfg 表1 路径参数参数是否必选参数类型

 帮助中心 > 数字内容生产线 MetaStudio > API参考 > 声音制作任务管理
算法备案公示 - 数字内容生产线 MetaStudio

分身数字人驱动算法是指通过深度学习生成数字人驱动模型，模型生成后，输入音频来合成数字人视频的一种技术。其基本情况包括：输入数据：真人视频、音频。算法原理：通过深度学习算法来学习真人视频，生成驱动该真人形象的数字人模型。通过该模型输入音频，合成数字人视频。输出结果：数字人视频。应用领域：

帮助中心 > 数字内容生产线 MetaStudio > 产品介绍
视频直播限制 - 数字内容生产线 MetaStudio

视频采样格式为YUV420。视频素材总大小小于1GB。同时叠加的视频总数量为3，包含互动时配置的视频。音频格式音频支持的格式为：MP3、M4A、WAV。音频要求如下所示：仅提取单声道音频。音频素材总大小小于500MB。图片格式图片支持的格式为：PNG、JPG、JPEG。图片要求如下所示：

帮助中心 > 数字内容生产线 MetaStudio > 产品介绍 > 使用限制
SDK合规使用指南 - 数字内容生产线 MetaStudio

意或取得其他合法性基础。您可以参考如下方式提供条款内容： 1. 以文字方式向用户告知第三方SDK名称：数字人智能交互Web SDK 第三方公司名称：华为云计算技术有限公司收集个人信息类型：您或您的最终用户的音频数据或文本数据、应用信息（浏览器User Agent）、SDK接口调用记录。

帮助中心 > 数字内容生产线 MetaStudio > API参考 > 智能交互 > 智能交互客户端SDK > Web SDK
SDK隐私声明 - 数字内容生产线 MetaStudio

您授权所进行的个人信息处理活动的效力。权限权限描述使用目的获取麦克风权限获取浏览器的麦克风设备权限开始语音交互时，用于进行语音识别文字，获取交互答案对未成年人的保护您承诺在您开始使用本服务时是成年人。如您是未成年人，则需要您的父母或监护人同意您使用本服务并同意相关服务条款。

帮助中心 > 数字内容生产线 MetaStudio > API参考 > 智能交互 > 智能交互客户端SDK > Web SDK
制作名片 - 数字内容生产线 MetaStudio

播报内容生成后，单击右侧的“试听”，可以试听播报效果。语音上传：本地录制音频后上传。音频格式需要为WAV或MP3格式，音频大小不超过20MB，时长不超过5分钟。在线录音：在线录制音频。录音时长不能超过5分钟，为保证音频生成的效果，请保持录音环境安静无噪音。支持试听录制生成的语音。文

 帮助中心 > 数字内容生产线 MetaStudio > 用户指南 > 数字人名片制作
事件通知（EventMap） - 数字内容生产线 MetaStudio

speakingStart 数字人开始讲话事件。 × √ speakingStop 数字人结束讲话事件。 × √ speechRecognized ASR对提问进行语音识别后输出为文本的事件。 × √ semanticRecognized LLM对提问进行语义识别后输出回复文本的事件。speechR

帮助中心 > 数字内容生产线 MetaStudio > API参考 > 智能交互 > 智能交互客户端SDK > Web SDK > 接口参考
错误码 - 数字内容生产线 MetaStudio

20020032 生成临时试听音频失败生成临时试听音频失败重新生成临时试听音频 400 MSS.20020033 资产不存在样例音频资产不存在样例音频请联系管理员确认 400 MSS.20020034 根据标注信息切割音频失败根据标注信息切割音频失败请联系管理员确认 400

帮助中心 > 数字内容生产线 MetaStudio > API参考 > 附录

总条数： 123

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

创建智能交互数字人 - 数字内容生产线 MetaStudio

创建智能交互数字人 - 数字内容生产线 MetaStudio

创建智能交互数字人 - 数字内容生产线 MetaStudio

创建智能交互数字人 - 数字内容生产线 MetaStudio

智能交互设置 - 数字内容生产线 MetaStudio

创建智能交互数字人（SDK场景） - 数字内容生产线 MetaStudio

手机录制音频 - 数字内容生产线 MetaStudio

制作照片数字人视频 - 数字内容生产线 MetaStudio

声音制作任务管理 - 数字内容生产线 MetaStudio

视频制作 - 数字内容生产线 MetaStudio

视频制作限制 - 数字内容生产线 MetaStudio

文本驱动SSML定义 - 数字内容生产线 MetaStudio

查询用户配置的个性化音频时长 - 数字内容生产线 MetaStudio

算法备案公示 - 数字内容生产线 MetaStudio

视频直播限制 - 数字内容生产线 MetaStudio

SDK合规使用指南 - 数字内容生产线 MetaStudio

SDK隐私声明 - 数字内容生产线 MetaStudio

制作名片 - 数字内容生产线 MetaStudio

事件通知（EventMap） - 数字内容生产线 MetaStudio

错误码 - 数字内容生产线 MetaStudio

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线