搜索_华为云

获取TTS试听文件 - 数字内容生产线 MetaStudio

对应的SDK代码示例。状态码状态码描述 200 处理成功。 400 参数异常 500 服务端异常错误码请参见错误码。父主题：语音合成管理

 帮助中心 > 数字内容生产线 MetaStudio > API参考 > 语音合成管理
3D数字人语音驱动 - 数字内容生产线 MetaStudio

3D数字人语音驱动创建语音驱动任务获取语音驱动任务列表创建语音驱动表情动画任务获取语音驱动表情数据获取语音驱动数据父主题： 3D数字人

 帮助中心 > 数字内容生产线 MetaStudio > API参考 > 3D数字人
查询语音合成WebSocket接口使用的音色ID - 数字内容生产线 MetaStudio

查询语音合成WebSocket接口使用的音色ID 语音同步合成WebSocket接口需要使用音色ID，可通过下述方法查询。登录MetaStudio控制台。在左侧导航栏中，选择“我的创作”。选择“资源”页签，单击“声音”页签。单击需要使用的声音卡片，进入“声音详情”界面。

帮助中心 > 数字内容生产线 MetaStudio > API参考 > 附录
查询语音训练任务列表 - 数字内容生产线 MetaStudio

查询语音训练任务列表功能介绍查询语音训练任务列表调用方法请参见如何调用API。 URI GET /v1/{project_id}/voice-training-manage/user/jobs 表1 路径参数参数是否必选参数类型描述 project_id 是 String

帮助中心 > 数字内容生产线 MetaStudio > API参考 > 声音制作任务管理
视频制作 - 数字内容生产线 MetaStudio

画布制作完成后，再制作语音。选择“文本驱动”的方式。在文本输入框中，输入文本内容，以生成音频，如图2所示。文本示例：今天是9月26日，星期二，天气晴朗，欢迎大家到访。我们精心布置了现场，室内摆放了各类植物和鲜花，场地宽敞明亮，足够大家在室内共同交流和活动。图2 文本驱动音频制作完成后，可单击音量图标，调整音频的音量。

帮助中心 > 数字内容生产线 MetaStudio > 快速入门
产品优势 - 数字内容生产线 MetaStudio

控制台自助服务，一站式快速生成所需内容用户申请账号并上传相关授权，拍摄训练所需音视频素材，上传进行模型训练，生成自定义形象和声音。选择背景、声音、模特等内容，基于文本或语音智能驱动，实现视频制作、视频直播、智能交互等能力。华为云盘古数字人大模型，赋能千行百业数字化营销新模式 MetaStudio服务依托华

 帮助中心 > 数字内容生产线 MetaStudio > 产品介绍
真人声音录制 - 数字内容生产线 MetaStudio

真人声音录制客户录制真人音频，上传至MetaStudio进行AI训练，即可得到和真人音色1:1复刻的声音模型。声音模型可实现文本转语音，应用于数字人视频制作、直播、交互问答等场景中。不同版本录制规格如下：基础版：整段录制生成一个WAV或MP3格式音频，总时长3~10分钟，建议5分钟。

帮助中心 > 数字内容生产线 MetaStudio > 用户指南 > 声音制作
主入口（HwICSUiSdk） - 数字内容生产线 MetaStudio

interactionModeSwitch 切换交互模式（语音问答/文本问答）。 interruptSpeaking 中断数字人讲话。 muteRemoteAudio 数字人静音。 sendDrivenText 发送智能交互数字人主动播报的文本信息。 sendTextQuestion 发送问题文本。 setConfig

帮助中心 > 数字内容生产线 MetaStudio > API参考 > 智能交互 > 智能交互客户端SDK > Web SDK > 接口参考
购买出门问问声音套餐 - 数字内容生产线 MetaStudio

问问提供的第三方声音。访问云商店语音合成商品页面，进入云商店商品“语音合成”的购买页面。用户可以在界面下方查看商品详情，确定要购买的商品规格。支持购买下述套餐：语音合成体验套餐语音合成小型套餐语音合成中型套餐语音合成大型套餐上述套餐购买完成后，所有预置的第三方声音

 帮助中心 > 数字内容生产线 MetaStudio > 用户指南 > 声音制作 > 购买声音套餐
制作名片 - 数字内容生产线 MetaStudio

选择性别“男生”或“女生”。声音提供下述种方式，生成名片预览语音片段。播报内容生成后，单击右侧的“试听”，可以试听播报效果。语音上传：本地录制音频后上传。音频格式需要为WAV或MP3格式，音频大小不超过20MB，时长不超过5分钟。在线录音：在线录制音频。录音时长不能超过5分钟，为保证音频生

 帮助中心 > 数字内容生产线 MetaStudio > 用户指南 > 数字人名片制作
制作照片数字人视频 - 数字内容生产线 MetaStudio

听播报效果。语音上传：本地录制音频后上传。音频格式需要为WAV或MP3格式，音频大小不超过20MB，时长不超过5分钟。在线录音：在线录制音频。录音时长不能超过5分钟，为保证音频生成的效果，请保持录音环境安静无噪音。支持试听录制生成的语音。文本驱动：通过输入文本，选择声音的方式，生成播报内容。不能超过2000字。

帮助中心 > 数字内容生产线 MetaStudio > 用户指南 > 照片数字人
算法备案公示 - 数字内容生产线 MetaStudio

数字人语音的一种技术。其基本情况包括：输入数据：真人语音音频。算法原理：通过深度学习算法，学习真人语音音频生成数字人声音模型，通过该模型，输入文本生成数字人语音。输出结果：接近真人音色的数字人语音。应用领域：分身数字人声音制作算法可以应用于数字人视频合成时的语音配音。

帮助中心 > 数字内容生产线 MetaStudio > 产品介绍
常见问题 - 数字内容生产线 MetaStudio

需要将两条通知的text值拼接在一起才是完整的内容。文本问答的用法智能交互默认是语音问答，如需使用文本问答，需要切换模式。可以通过下述2种方式处理：在开始对话时设置。使用startChat接口开启对话时，设置成文本问答模式，如下所示： const { result } =

帮助中心 > 数字内容生产线 MetaStudio > API参考 > 智能交互 > 智能交互客户端SDK > Web SDK
确认在线录音结果 - 数字内容生产线 MetaStudio

确认在线录音结果功能介绍确认在线录音结果。调用方法请参见如何调用API。 URI POST /v1/{project_id}/voice-training-manage/user/training-segment 表1 路径参数参数是否必选参数类型描述 project_id

帮助中心 > 数字内容生产线 MetaStudio > API参考 > 声音制作任务管理
视频制作 - 数字内容生产线 MetaStudio

支持下述2种方式生成语音。每个场景仅支持选择一种音频生成方式。文本驱动在文本输入框中，输入文本内容，以生成音频，如图1所示。文本示例：今天是9月26日，星期二，天气晴朗，欢迎大家到访。我们精心布置了现场，室内摆放了各类植物和鲜花，场地宽敞明亮，足够大家在室内共同交流和活动。图1 文本驱动

 帮助中心 > 数字内容生产线 MetaStudio > 用户指南 > 视频制作
事件通知（EventMap） - 数字内容生产线 MetaStudio

speakingStop 数字人结束讲话事件。 speechRecognized ASR对提问进行语音识别后输出为文本的事件。 semanticRecognized LLM对提问进行语义识别后输出回复文本的事件。speechRecognized和semanticRecognized分别为问题和答案，每轮问答共用一个chatId。

帮助中心 > 数字内容生产线 MetaStudio > API参考 > 智能交互 > 智能交互客户端SDK > Web SDK > 接口参考
声音制作任务管理 - 数字内容生产线 MetaStudio

查询用户配置的个性化音频时长创建基础版语音训练任务创建进阶版语音训练任务创建高级版语音训练任务查询语音训练任务列表提交语音训练任务查询语音训练任务详情删除语音训练任务查询任务操作日志获取语音文件上传地址获取语音训练任务审核结果设置任务批次确认在线录音结果获取在线录音确认结果

 帮助中心 > 数字内容生产线 MetaStudio > API参考
附录 - 数字内容生产线 MetaStudio

直播控制HTTP Command命令说明直播控制RTSA Command命令说明文本驱动SSML定义系统资产标签定义服务支持的字体资源类型使用Java代码生成文件内容的MD5值查询语音合成WebSocket接口使用的音色ID 预置音色ID列表查询预置音色ID

帮助中心 > 数字内容生产线 MetaStudio > API参考
修订记录 - 数字内容生产线 MetaStudio

交互数字人主动播报文本信息。解决IDE加载TS声明文件报错问题。 2024-11-13 本次变更如下：新增发布2.1.0版本SDK，相比2.0.3版本，变更点如下所示：支持文本问答。 startChat新增入参，参考表15，用来设置交互模式（语音问答/文本问答）。新增接口

 帮助中心 > 数字内容生产线 MetaStudio > API参考 > 智能交互 > 智能交互客户端SDK > Web SDK
服务支持的字体 - 数字内容生产线 MetaStudio

服务支持的字体 MetaStudio制作视频添加的字幕，视频画面中的文本信息都涉及字体。目前MetaStudio服务支持的字体及语言类型如表1所示。表1 服务支持的字体说明字体名称支持的语言类型 Adelle_Sans_Global Adelle_Sans_Global_Bold

帮助中心 > 数字内容生产线 MetaStudio > API参考 > 附录

总条数： 145

上一页
1
2
3
4
5
...
8
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

获取TTS试听文件 - 数字内容生产线 MetaStudio

3D数字人语音驱动 - 数字内容生产线 MetaStudio

查询语音合成WebSocket接口使用的音色ID - 数字内容生产线 MetaStudio

查询语音训练任务列表 - 数字内容生产线 MetaStudio

视频制作 - 数字内容生产线 MetaStudio

产品优势 - 数字内容生产线 MetaStudio

真人声音录制 - 数字内容生产线 MetaStudio

主入口（HwICSUiSdk） - 数字内容生产线 MetaStudio

购买出门问问声音套餐 - 数字内容生产线 MetaStudio

制作名片 - 数字内容生产线 MetaStudio

制作照片数字人视频 - 数字内容生产线 MetaStudio

算法备案公示 - 数字内容生产线 MetaStudio

常见问题 - 数字内容生产线 MetaStudio

确认在线录音结果 - 数字内容生产线 MetaStudio

视频制作 - 数字内容生产线 MetaStudio

事件通知（EventMap） - 数字内容生产线 MetaStudio

声音制作任务管理 - 数字内容生产线 MetaStudio

附录 - 数字内容生产线 MetaStudio

修订记录 - 数字内容生产线 MetaStudio

服务支持的字体 - 数字内容生产线 MetaStudio

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线