检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
视频制作界面如图1所示。各区域详细说明,如表1所示。 用户使用数字人形象创作的视频,都会自动保存在MetaStudio控制台首页“最近项目”区域的“视频项目”页签中。用户可以根据实际情况,进行二次创作。 图1 视频制作界面 表1 界面说明 序号 区域名称 说明 1 视频素材区域 设置视频的场景,包括如下内容。视频素材的操作详情,请参考视频制作公共配置。
great security risks. It is recommended that the AK and SK be stored in ciphertext in configuration files or environment variables and decrypted
分身形象或声音制作的不好,可以使用原有资源重新制作吗? 分身形象和声音制作的处理方式相同,均需根据实际情况进行处理。下面以形象制作为例,进行说明。 如果当前分身形象制作的素材质量不佳,管理员会通过用户提交训练任务时输入的手机号联系用户。用户可以在管理员驳回任务后重新提交训练视频,
形象拍摄指导文档下载 如需查看拍摄真人视频的PDF文件,请单击形象拍摄指导下载文件。 父主题: 形象制作
Command命令说明 文本驱动SSML定义 系统资产标签定义 服务支持的字体 资源类型 使用Java代码生成文件内容的MD5值 预置音色ID列表 查询音色ID
为什么会欠费? 除用户在资源购买页面,付费购买的资源外,用户还需查看如图1所示的服务概览页面。查看是否有计费项开通了按需计费,在计费项卡片右上角会有已开通按需计费的提示。超出套餐包的资源会自动走按需计费。 图1 服务概览页面 父主题: 计费咨询
话框。 参数设置说明如下所示: 分辨率:根据实际情况,选择视频的分辨率。 导出为:输入导出文件的名称。 画质增强:开启后将提升视频清晰度,合成时间相应变长。请根据实际情况确定是否开启。 单击“确定”,弹出“视频制作任务中心”对话框。 可查看视频合成任务的进度,直至合成成功。 单击
声音录制指导文档下载 如需查看真人声音录制的的PDF文件,请单击声音制作录制指导下载文件。 父主题: 声音制作
支持在MetaStudio控制台管理资产,包括查询、重命名、激活/取消激活、查看详情、编辑、删除、恢复等操作。 操作步骤 登录MetaStudio控制台。 在左侧导航栏中,选择“我的创作 > 资源”,如图1所示。 图1 资产 支持管理资产,详细操作如表1所示。 图2 资产详情 表1 资产管理 操作 说明 查询资产 界
<word></word>标签用于设置选中文字为连读模式。 MetaStudio包含多种TTS音色,每种音色支持的SSML标签能力是有差异的,请通过“查询资产详情”接口,获取每个音色支持使用的标签。 speak标签 描述 <speak></speak>:SSML文本的根节点。 语法 1 <s
系统资产标签定义 查询资产列表接口支持使用“tags”标签对分身数字人模型进行分类。 “tags”取值及其含义,如表1所示。 表1 tags标签说明 tags取值类型 说明 数字人类型 取值如下: VIRTUAL_AVATARS:分身数字人 VIRTUAL_HUMANS:虚拟数字人
great security risks. It is recommended that the AK and SK be stored in ciphertext in configuration files or environment variables and decrypted
推荐使用服务预置语料,也可自定义语料。系统会自动根据停顿做切割,自动识别文本内容。 音频文件命名无要求,可自定义,命名示例:Voice.wav。 进阶版 高品质 制作声音模型 准备好音频文件后,就可以上传至MetaStudio控制台,进行声音训练。详细操作如下所示: 创建声音制作任务(自研模型) 查看声音 声音模型制作耗时,如下所示:
资源”对话框,如图3所示。 可以看到资源名称、总量、可激活数量和激活截止时间。可以自主设置激活数量,无需一次性全部激活。 图3 激活资源 根据实际情况,设置本次需要激活的数量,单击“确定”。 界面右上角提示“激活成功”,说明激活已成功。 父主题: SP用户
文本问答:文本问答是使用sendTextQuestion接口输入文本问题,将大模型返回内容作为数字人播报内容,而不是直接播报问题。 为什么要定制语音唤醒模型? 根据唤醒词定制的唤醒模型,可以提升唤醒词的准确率。 能否直接在本地修改唤醒词? 不行。模型和唤醒词是绑定的,不支持本地修改唤醒词。 集成Web
单击图中第一个链接“任务中心-视频”,可进入“任务中心 > 照片数字人”页面,查看任务进度,详情请参见查看任务。 单击图中第二个链接“我的创作-视频”,可进入“我的创作 > 视频”界面,查看已生成的视频,详情请参见查看视频。 图2 照片数字人视频生成进度 等待视频生成完成后,界面会提示“照片数字人视频生成成功”,如图3所示。
数字人支持TTS和ASR吗? 已支持TTS(文本转语音),详见创建TTS异步任务。MetaStudio不提供ASR(语音转文本),用户如有ASR需求,可以查看语音交互服务或其他ASR服务。 父主题: 数字人
如果在出门问问购买了多个套餐, 这些套餐的使用凭证默认相同,配置一次即可。 在MetaStudio控制台查看消费明细:支持在MetaStudio控制台查看出门问问小语种克隆套餐包的消费明细。且操作与出门问问语音合成套餐包的消费明细查看操作相同,可直接参考。 续购套餐:如果已购套餐包的用量已耗尽或者套餐包到期,可再次购买套餐包使用。
单击声音右侧的图标,切换数字人声音。 这里选择的声音,需要与前面选择的语言匹配。如果是中文,则选择中文声音,否则数字人表达会有问题。 还可以根据实际情况,设置语速、音量和音高。 语速:设置语速,取值范围[0.5X,2X]。设置为0.5X时,声音放慢至0.5倍速播放;设置为2X时,声音加速至2倍速播放。
客户经理的联系方式,可以在云商店语音合成商品页面查看,如图1所示。 图1 查看联系方式 操作步骤如下所示。详细操作请联系奇妙问平台客服,详见云商店语音合成商品页面,如图1所示。 新增知识库:可以上传普通文件或者新增问答题库。 创建角色:在奇妙问创建问答角色。 查看角色信息:查看奇妙问创建角色的RoleI