检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
是否必选 参数类型 描述 provider 是 String 第三方TTS供应商类型。 XIMALAYA:喜马拉雅TTS HUAWEI_EI:华为云EI TTS MOBVOI:出门问问 TTS AUDIOX:逻辑智能 TTS SINOVOICE:捷通华声 TTS DATABAKER:标贝
智能交互限制 智能交互对硬件设备的最低配置要求,如表1所示。 表1 硬件设备要求 硬盘配置 最低配置 CPU i5及以上版本。 内存 8G以上。 硬盘 128G及以上。 操作系统 Windows或Android系统。 麦克风 需要有麦克风,且要保障1米以内的拾音效果。 扬声器 需要有扬声器。
a 参数 参数类型 描述 provider String 第三方TTS供应商类型。 XIMALAYA:喜马拉雅TTS HUAWEI_EI:华为云EI TTS MOBVOI:出门问问 TTS AUDIOX:逻辑智能 TTS SINOVOICE:捷通华声 TTS DATABAKER:标贝
查看视频 如果用户需要查看已生成的照片数字人视频,可参考本节操作。 操作步骤 登录MetaStudio控制台。 在左侧导航栏中,单击“我的创作”。 选择“视频”页签,如图1所示。 在“视频”页面,可以看到已生成的视频列表,以卡片形式排列展示。 支持对视频进行如下操作: 单击播放图标,播放照片数字人视频。
授权浏览器麦克风的访问权限 支持对Chrome浏览器和Mac系统的浏览器,授权麦克风的访问权限。 谷歌浏览器 打开Chrome浏览器,单击浏览器右上方的图标,从下拉框中选择“设置”。 进入“设置”页面。 在左侧导航栏中,选择“隐私设置和安全性”。 在右侧界面中,单击“网络设置”,进入“网络设置”页面。
删除资产 支持在MetaStudio控制台删除资产,操作方式详见本节。 操作步骤 登录MetaStudio控制台。 在左侧导航栏中,单击“我的创作”。 选择“资源”页签,如图1所示。 图1 资源页面 如果需要删除已激活的资产,可以通过下述2种方式删除。 方式一:单击资产卡片中的“
创建高级版语音训练任务 功能介绍 用户创建语音训练高级版任务,该接口会返回一个obs上传地址,用于上传语音文件。 语音文件为一段WAV格式的长音频文件,仅支持将语音文件打包成zip压缩格式上传。 文件上传后,调用“提交语音训练任务”接口,启动审核和训练。 调用方法 请参见如何调用API。
查看任务 如果用户需要查看分身数字人名片生成任务,可参考本节操作。 操作步骤 登录MetaStudio控制台。 在左侧导航栏中,单击“任务中心”。 选择“分身名片”页签,如图1所示。 在“分身名片”页面,可以查看全部任务,包括生成中、生成成功和生成失败的任务。 在下方的名片列表中
创建角色 支持在奇妙问创建角色,详情如下所示: 创建角色:在奇妙问创建问答角色。 查看角色信息:查看奇妙问创建的角色ID和角色密钥,即MetaStudio平台API调用所需的RoleId和AppSecret。 前提条件 使用奇妙问前,需提交工单申请使用手机号注册账号。 创建角色
制作照片数字人视频 支持上传正面清晰的人像照片,生成会说话的照片数字人视频。 操作限制 照片数字人视频制作限制,如照片数字人限制所示。 操作步骤 登录MetaStudio控制台。 在“工作台”界面,单击“照片数字人”,进入照片数字人制作页面,如图1所示。 界面左侧展示配置项,右侧展示预览效果。配置操作,请参考表1。
配置特殊词表 支持全局设置多音字或者别名,设置完成后,所有视频草稿自动生效。 操作步骤 登录MetaStudio控制台。 在左侧导航栏中,单击“我的创作”。 选择“声音”页签,单击界面右侧的“特殊词表”,进入如图1所示的界面。 图1 特殊词表 单击“新建词表”,界面新增一行特殊词,如图2所示。
如何在MetaStudio控制台呈现PPT的动画效果? 在视频制作界面导入的PPT,不支持展示动画、视频、动图等动态元素。如需展示动态效果,需将PPT导出为视频后,再上传至MetaStudio控制台使用。 PPT转视频的操作方法,如下所示: 本地打开PPT文件,在左上方的导航栏中,选择“文件
智能交互设置 直播间页面支持弹幕规则使用“智能交互”的方式,去回复直播间用户的提问。智能交互的方式相当于提供了一个第三方语言模型去答复用户问题。 操作步骤 登录MetaStudio控制台。 在“工作台”界面,单击“分身视频直播”下方的“开始创建”,进入分身数字人直播首页面。 在“
智能交互第三方LLM回调接口 功能介绍 MetaStudio智能交互服务支持开发者自定义数字人大脑(即第三方LLM)。当用户与数字人对话时,将触发调用该接口,由该接口返回问题对应的答案文本内容。 签名计算方法 第三方LLM自定义接口,使用HMACSHA256签名模式,需要在URL
视频制作 MetaStudio服务支持制作数字人视频。 操作步骤 登录MetaStudio控制台。 在“工作台”界面,单击“分身视频制作”下方的“开始创建”。 进入视频制作界面,界面详情如图1所示。 图1 视频制作界面 在画布区域,设置角色、背景、贴图、视频等内容。 详细操作请参见视频制作素材操作详情。
创建科大讯飞应用(AIUI通用语义模型) 在科大讯飞创建AIUI通用语义模型的应用。详细操作如下所示: AIUI通用语义模型应用,不支持直接切换为星火交互认知大模型,不适用。建议参考创建科大讯飞应用(星火交互认知大模型)单独为其创建应用。 创建应用 配置应用 查看应用信息 (可选)开启闲聊功能
创建科大讯飞应用(星火交互认知大模型) 在科大讯飞创建星火交互认知大模型的应用。详细操作如下所示: 星火交互认知大模型应用,不支持直接切换为AIUI通用语义模型,不适用。建议参考创建科大讯飞应用(AIUI通用语义模型)单独为其创建应用。 创建应用 (可选)创建问答库 配置应用 查看应用信息
查看任务 如果用户需要查看照片数字人视频生成任务,可参考本节操作。 操作步骤 登录MetaStudio控制台。 在左侧导航栏中,单击“任务中心”。 选择“照片数字人”页签,如图1所示。 在“照片数字人”页面,可以查看全部生成的视频,包括生成中、生成成功和生成失败的任务。 在下方的
创建进阶版语音训练任务 功能介绍 用户创建语音训练进阶版任务,该接口会返回一个obs上传地址,用于上传语音文件。 支持2种方式上传语音文件: 语音文件和文本文件打包成zip上传:语音文件已经切分成100个wav文件,每个语音文件对应一个txt文本文件,所有文件打包成zip文件。语音文件命名规则:0
制作名片 用户可以为分身数字人制作形象名片,且支持试听和查看数字人语音表达效果。 操作步骤 登录MetaStudio控制台。 在“工作台”界面,单击“分身数字人名片制作”,弹出“请选择您要使用的名片模板”对话框,如图1所示。 服务提供了名片模板,用户可以基于模板制作名片。 图1 选择名片模板