搜索_华为云

数字人说话是文本驱动还是语音驱动？ - 数字内容生产线 MetaStudio

数字人说话是文本驱动还是语音驱动？数字人视频制作、视频直播、分身数字人名片和照片数字人都支持文本驱动和语音驱动的方式说话。父主题：数字人

 帮助中心 > 数字内容生产线 MetaStudio > 常见问题 > 数字人
文本驱动SSML定义 - 数字内容生产线 MetaStudio

用的标签。 speak标签描述 <speak></speak>：SSML文本的根节点。语法 1 <speak>这里输入SSML标签的文本</speak> 属性无标签关系 <speak>可以包含文本和标签，包括<break>、<phoneme>、<say-as>、<sub>标签。

帮助中心 > 数字内容生产线 MetaStudio > API参考 > 附录
数字人支持TTS和ASR吗？ - 数字内容生产线 MetaStudio

数字人支持TTS和ASR吗？已支持TTS（文本转语音），详见创建TTS异步任务。MetaStudio不提供ASR（语音转文本），用户如有ASR需求，可以查看语音交互服务或其他ASR服务。父主题：数字人

 帮助中心 > 数字内容生产线 MetaStudio > 常见问题 > 数字人
服务支持的字体 - 数字内容生产线 MetaStudio

服务支持的字体 MetaStudio制作视频添加的字幕，视频画面中的文本信息都涉及字体。目前MetaStudio服务支持的字体及语言类型如表1所示。表1 服务支持的字体说明字体名称支持的语言类型 Adelle_Sans_Global Adelle_Sans_Global_Bold

帮助中心 > 数字内容生产线 MetaStudio > API参考 > 附录
真人声音录制 - 数字内容生产线 MetaStudio

真人声音录制客户录制真人音频，上传至MetaStudio进行AI训练，即可得到和真人音色1:1复刻的声音模型。声音模型可实现文本转语音，应用于数字人视频制作、直播、交互问答等场景中。不同版本录制规格如下：基础版：整段录制生成一个WAV或MP3格式音频，总时长3~10分钟，建议5分钟。

帮助中心 > 数字内容生产线 MetaStudio > 用户指南 > 声音制作
视频制作 - 数字内容生产线 MetaStudio

画布制作完成后，再制作语音。选择“文本驱动”的方式。在文本输入框中，输入文本内容，以生成音频，如图2所示。文本示例：今天是9月26日，星期二，天气晴朗，欢迎大家到访。我们精心布置了现场，室内摆放了各类植物和鲜花，场地宽敞明亮，足够大家在室内共同交流和活动。图2 文本驱动音频制作完成后，可单击音量图标，调整音频的音量。

帮助中心 > 数字内容生产线 MetaStudio > 快速入门
照片数字人限制 - 数字内容生产线 MetaStudio

支持的格式为：MP3、WAV。大小不超过20MB，时长不超过5分钟。文本驱动文本驱动方式的要求如下所示：文本输入长度不超过2000字。通过文本合成的音频时长不能超过5分钟。在照片数字人制作页面，选择“文本驱动”方式驱动照片说话时，需要输入文本并选择音色，再单击“试听”预估音频时长。如果超过5分钟，会导致照片数字人制作失败。

帮助中心 > 数字内容生产线 MetaStudio > 产品介绍 > 使用限制
多语言的计费规则？ - 数字内容生产线 MetaStudio

多语言的计费规则？文本转语音是以字数来计费的，多语言不是计费项，无需另外付费。自研声音目前只有中英文，声音合成按需计费标准为：¥200.00/百万字，可以在MetaStudio服务概览页面的“声音合成”卡片中查看，如图1所示。图1 声音合成计费项第三方声音的计费标准，详见云商店语音合成商品页面的价格表。

帮助中心 > 数字内容生产线 MetaStudio > 常见问题 > 计费咨询
Web语音唤醒 - 数字内容生产线 MetaStudio

本地模型路径中。使用要求 WebSDK版本为3.0.1及以上。仅支持数字人平台配置或内置ASR（语音转文本）能力的方案。不支持WebSocket接口驱动数字人方案，即文本驱动方案。在调用create接口之前，必须要有用户点击集成WebSDK的页面的行为。浏览器通过有上述点

 帮助中心 > 数字内容生产线 MetaStudio > API参考 > 智能交互 > 智能交互客户端SDK > Web SDK > 接口参考
创建进阶版语音训练任务 - 数字内容生产线 MetaStudio

支持2种方式上传语音文件：语音文件和文本文件打包成zip上传：语音文件已经切分成100个wav文件，每个语音文件对应一个txt文本文件，所有文件打包成zip文件。语音文件命名规则：0.wav~99.wav；文本文件命名规则：0.txt~99.txt。语音文件和文本文件逐句上传：每次上传一句

 帮助中心 > 数字内容生产线 MetaStudio > API参考 > 声音制作任务管理
常见问题 - 数字内容生产线 MetaStudio

n进行文本问答了。数字人主动播报与文本问答的区别是什么？智能交互同时支持数字人主动播报和文本问答两种能力，两者都是通过文字驱动数字人讲话。区别如下所示：主动播报：主动播报是直接将sendDrivenText接口传入的文本作为数字人播报内容，来驱动数字人讲话。文本问答：文

 帮助中心 > 数字内容生产线 MetaStudio > API参考 > 智能交互 > 智能交互客户端SDK > Web SDK
创建基础版语音训练任务 - 数字内容生产线 MetaStudio

支持2种方式上传语音文件：语音文件和文本文件打包成zip上传：语音文件已经切分成20个wav文件，每个语音文件对应一个txt文本文件，所有文件打包成zip文件。语音文件命名规则：0.wav~19.wav；文本文件命名规则：0.txt~19.txt。语音文件和文本文件逐句上传：每次上传一句

 帮助中心 > 数字内容生产线 MetaStudio > API参考 > 声音制作任务管理
视频制作 - 数字内容生产线 MetaStudio

一种音频生成方式。文本驱动在文本输入框中，输入文本内容，以生成音频，如图1所示。文本示例：今天是9月26日，星期二，天气晴朗，欢迎大家到访。我们精心布置了现场，室内摆放了各类植物和鲜花，场地宽敞明亮，足够大家在室内共同交流和活动。图1 文本驱动文本内容的操作说明如表1所示。

帮助中心 > 数字内容生产线 MetaStudio > 用户指南 > 视频制作
直播控制HTTP Command命令说明 - 数字内容生产线 MetaStudio

支持如下两种模式：纯文本模式使用纯文本，示例：大家好，我是人工智能小A，是位虚拟主播。标签模式标签模式使用SSML（Speech Synthesis Markup Language）标记语言。需要使用的标签，如下所示： <speak>：此标签为所有文本的根节点。一切需要调

 帮助中心 > 数字内容生产线 MetaStudio > API参考 > 附录
视频制作公共配置 - 数字内容生产线 MetaStudio

的“取消应用”，取消使用。文本文本界面详情，如图8所示。图8 文本界面文本界面说明，如表7所示。表7 界面元素说明界面元素说明界面默认展示两列文本，单击图标后，缩小展示为1列文本。单击图标，可恢复为2列展示。文本列表系统支持的文本列表。字体分别为：鸿蒙常规、鸿蒙粗体、鸿蒙细体、鸿蒙中黑。

帮助中心 > 数字内容生产线 MetaStudio > 用户指南 > 视频制作
视频直播公共配置 - 数字内容生产线 MetaStudio

还支持设置大小，拖动位置。文本文本界面详情，如图6所示。图6 文本界面文本界面说明，如表6所示。表6 界面元素说明界面元素说明界面默认展示两列文本，单击图标后，缩小展示为1列文本。单击图标，可恢复为2列展示。文本列表系统支持的文本列表。字体分别为：鸿蒙常规、鸿蒙粗体、鸿蒙细体、鸿蒙中黑。

帮助中心 > 数字内容生产线 MetaStudio > 用户指南 > 视频直播
智能交互第三方LLM回调接口 - 数字内容生产线 MetaStudio

Array of ChatChoice objects 生成的文本列表。表7 ChatChoice 参数是否必选参数类型描述 message 是表8 objects 生成文本的内容。 index 是 Integer 生成文本在列表中的索引值，从0开始计算。表8 MessageItem

帮助中心 > 数字内容生产线 MetaStudio > API参考 > 智能交互 > 智能交互第三方LLM回调
主入口（HwICSUiSdk） - 数字内容生产线 MetaStudio

切换交互模式（语音问答/文本问答）。 × √ interruptSpeaking 中断数字人讲话。 × √ muteRemoteAudio 数字人静音。 √ √ sendDrivenText 发送智能交互数字人主动播报的文本信息。 × √ sendTextQuestion 发送问题文本。 × √

帮助中心 > 数字内容生产线 MetaStudio > API参考 > 智能交互 > 智能交互客户端SDK > Web SDK > 接口参考
视频直播界面说明 - 数字内容生产线 MetaStudio

频文件。支持添加为背景视频。商品：商品列表。需要自定义创建商品，一个商品可以同时包含贴图、视频、文本和音频内容。文本：文本模板列表，可选择一个文本模板，在视频直播画面上添加文本。 ② 直播画面预览窗口，用于预览视频直播静态画面效果。 ③ 直播剧本由多个场景构成，每个场景由多个段落组成。

帮助中心 > 数字内容生产线 MetaStudio > 用户指南 > 视频直播
产品优势 - 数字内容生产线 MetaStudio

控制台自助服务，一站式快速生成所需内容用户申请账号并上传相关授权，拍摄训练所需音视频素材，上传进行模型训练，生成自定义形象和声音。选择背景、声音、模特等内容，基于文本或语音智能驱动，实现视频制作、视频直播、智能交互等能力。华为云盘古数字人大模型，赋能千行百业数字化营销新模式 MetaStudio服务依

 帮助中心 > 数字内容生产线 MetaStudio > 产品介绍

总条数： 513

上一页
1
2
3
4
5
...
26
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

数字人说话是文本驱动还是语音驱动？ - 数字内容生产线 MetaStudio

文本驱动SSML定义 - 数字内容生产线 MetaStudio

数字人支持TTS和ASR吗？ - 数字内容生产线 MetaStudio

服务支持的字体 - 数字内容生产线 MetaStudio

真人声音录制 - 数字内容生产线 MetaStudio

视频制作 - 数字内容生产线 MetaStudio

照片数字人限制 - 数字内容生产线 MetaStudio

多语言的计费规则？ - 数字内容生产线 MetaStudio

Web语音唤醒 - 数字内容生产线 MetaStudio

创建进阶版语音训练任务 - 数字内容生产线 MetaStudio

常见问题 - 数字内容生产线 MetaStudio

创建基础版语音训练任务 - 数字内容生产线 MetaStudio

视频制作 - 数字内容生产线 MetaStudio

直播控制HTTP Command命令说明 - 数字内容生产线 MetaStudio

视频制作公共配置 - 数字内容生产线 MetaStudio

视频直播公共配置 - 数字内容生产线 MetaStudio

智能交互第三方LLM回调接口 - 数字内容生产线 MetaStudio

主入口（HwICSUiSdk） - 数字内容生产线 MetaStudio

视频直播界面说明 - 数字内容生产线 MetaStudio

产品优势 - 数字内容生产线 MetaStudio

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线