检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
声音录制指导文档下载 如需查看真人声音录制的的PDF文件,请单击声音制作录制指导下载文件。 父主题: 声音制作
<word></word>标签用于设置选中文字为连读模式。 MetaStudio包含多种TTS音色,每种音色支持的SSML标签能力是有差异的,请通过“查询资产详情”接口,获取每个音色支持使用的标签。 speak标签 描述 <speak></speak>:SSML文本的根节点。 语法 1 <s
单击图中第一个链接“任务中心-视频”,可进入“任务中心 > 照片数字人”页面,查看任务进度,详情请参见查看任务。 单击图中第二个链接“我的创作-视频”,可进入“我的创作 > 视频”界面,查看已生成的视频,详情请参见查看视频。 图2 照片数字人视频生成进度 等待视频生成完成后,界面会提示“照片数字人视频生成成功”,如图3所示。
metastudio.modeling.enterpriselivepackage 包含: 形象制作5个 声音制作5个 视频制作5路 说明: 查询接口中通过business_type来区分3种类型。 智能交互基础版 路 包年包月 hws.resource.type.metastudio
智能交互支持富媒体吗? 支持的富媒体格式 用户与数字人进行智能交互问答时,支持展示如下格式的富媒体: 图片:JPG、PNG、BMP、GIF、SVG。 视频:MP4。 导入富媒体操作 支持通过问答库导入富媒体。以奇妙问知识库为例,参考新增知识库,补充富媒体知识,示例如表1所示。 如
同意协议。单击“确定”,开通按需计费。 如需查看声音合成的使用量,单击左下角的“已使用量”,跳转至费用中心的“流水和明细账单”页面,搜索查看声音合成的详细账单。 3D数字人 照片建模 左下角展示用户已购买资源的剩余量。单击图标,可以查看剩余量详情的列表数据。 语音驱动 左下角展示
数字人名片制作 制作名片 查看任务 查看名片
照片数字人 制作照片数字人视频 查看任务 查看视频
用户可以单击“查看制作任务列表”,进入分身数字人定制任务列表页面。 单击任务所在行的“查看详情”,进入“定制任务详情”页面。 查看分身数字人定制任务审核进展。当前状态为“系统审核中”,需要等待服务管理员审核通过后,状态变更为“待算法训练”。 如果数字人定制任务被驳回,需要查看驳回原因,并重新按照要求录制视频并上传。
租户管理 查看租户资源用量信息 查看租户资源列表 统计时间段内过期的资源数量
交训练任务。 查看声音训练任务。 在“任务中心 > 声音制作”页面,查看生成的Flexus声音制作任务。 “服务类型”为“Flexus版”,声音名称为设置的“数字人名称”。Flexus声音制作任务耗时较短。 单击任务所在行的“查看详情”,进入“任务详情”页面。 查看分身数字人定制
租户操作 SP关联租户,并为租户分配资源后,租户可以在MetaStudio控制台查看已分配的资源列表,正常使用MetaStudio服务并消耗相应的资源。 前提条件 SP用户已关联当前租户,操作请参考关联租户。 SP用户已分配资源给当前租户,操作请参考分配资源。 操作步骤 租户登录
详细操作请参见购买出门问问声音套餐。 查看已购套餐余额的操作如下所示: 登录MetaStudio控制台。 在左侧导航栏中,选择“我的创作”。 选择“声音 > 已购”,单击已购套餐右侧的“付费管理”,可以查看余额,如图1所示。 图1 查看套餐余额 父主题: 视频制作
数字人与用户进行智能交互对话时,语音识别不准确的专业词汇,可以作为热词反馈到语音模型,以提高语音识别的准确率。 单击热词后面的问号图标,在提示框中单击“查看教程”,可以查看配置视频。 如果开启热词配置,需要同时配置下述参数: SIS服务授权:SIS服务用于将用户口述音频转换为文本,需要开启授权。 详细操作如下所示:
AIUI通用语义模型应用,不支持直接切换为星火交互认知大模型,不适用。建议参考创建科大讯飞应用(星火交互认知大模型)单独为其创建应用。 创建应用 配置应用 查看应用信息 (可选)开启闲聊功能 模拟测试 (可选)新增English情景模式 创建应用 访问科大讯飞的AIUI开放平台。 在界面上方的主菜
AIUI通用语义模型,不适用。建议参考创建科大讯飞应用(AIUI通用语义模型)单独为其创建应用。 创建应用 (可选)创建问答库 配置应用 查看应用信息 (可选)开启闲聊功能 模拟测试 (可选)新增English情景模式 创建应用 访问科大讯飞的AIUI开放平台。 在界面上方的主菜
声音制作任务提交成功后,需要等待1天左右的时间审核。任务审核通过后,启动声音制作。声音模型制作耗时约5个工作日。 图2 制作任务提交成功 用户可以单击“查看制作任务列表”,查看声音制作任务审核进展。 当状态变更为“系统审核完成”,自动启动算法训练。如果系统存在多个算法训练任务,可能会存在排队和延迟的现象,请耐心等待。
声音模型制作耗时,如下所示: 基础版:约1~3个工作日。 进阶版:约1~3个工作日。 高品质:约5个工作日。 图2 制作任务提交成功 用户可以单击“查看制作任务列表”,查看声音制作任务审核进展。 当状态变更为“系统审核完成”,自动启动算法训练。如果系统存在多个算法训练任务,可能会存在排队和延迟的现象,请耐心等待。
应用名称 与科大讯飞平台应用的“应用名称”保持一致,如查看应用信息-应用名称所示。 APPID 与科大讯飞平台应用的“APPID”保持一致,如查看应用信息-APPID所示。 APPKEY 与科大讯飞平台应用的“APPKEY”保持一致,如查看应用信息-APPKEY所示。 APISECRET
可以看到用户创建的所有直播间的开播任务列表。如果同一个直播间,开播多次,则生成对应个数的开播任务。 可以查看任务ID、直播名称、封面、创建时间、开播时间、结束时间和当前的直播状态(直播中或直播结束)。 如果直播结束,可单击直播间任务右侧的“查看详情”,进入当前直播间,修改直播间内容,重新开播。 图1 直播任务管理