检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
MetaStudio控制台页面 在智能交互编辑页面,依次设置角色和背景。 单击左侧导航栏中的“应用”,如图2所示。 参数配置说明如表1所示。 图2 创建应用 表1 创建应用 参数 说明 第三方应用 从下拉框中选择“奇妙问”。 应用名称 设置当前智能交互数字人应用的名称。 账号 注册奇妙问的账号,即用户注册奇妙问的手机号。
object 分身数字人在背景图片的位置设置。不设置默认在图片中间。 说明: 此参数废弃。分身数字人在背景中位置在layer_config参数中配置。 human_size_2d 否 HumanSize2D object 分身数字人在背景图片的大小设置。 说明: 此参数废弃。分身数字人
多轮语境理解能力 配置数值越高,问答请求携带的历史对话个数越多,语境理解能力更强。 配置说明,如下所示: 如果设置为“1”,则问答请求时,不支持携带历史会话。 如果设置为非“1”,则问答请求时,携带历史会话。示例:取值为“3”时,问答请求中会携带1个最新问题,和历史最新的2个问题
该接口用于获取TTS租户级自定义读法配置。 调用方法 请参见如何调用API。 URI GET /v1/{project_id}/ttsc/vocabulary-configs 表1 路径参数 参数 是否必选 参数类型 描述 project_id 是 String 项目ID,获取方法请参考获取项目ID。 表2
如何访问MetaStudio服务 视频直播 如何搭建直播间 00:46 2.如何搭建直播间 视频直播 直播剧本设置 01:16 3.直播剧本设置 视频直播 直播间弹幕互动设置 01:04 4.直播间弹幕互动设置 视频直播 使用RTMP推流至直播平台 00:30 5.使用RTMP推流至直播平台 视频直播
操作前提 注册操作 注册华为账号:单击进入注册页面。 完成实名认证:单击进入实名认证。 账户充值:为确保正常使用MetaStudio,您需要进行账户充值。 开通MetaStudio服务:单击进入MetaStudio控制台,根据开通引导完成服务开通。 推荐浏览器 推荐使用Chrom
PPT,再插入需要分享的PPT页,详情请参见PPT。每页PPT会对应生成一个场景,依次设置完成所有场景即可。 所有场景设置完成后,单击界面右上角的“合成视频”,弹出“合成设置”对话框。 参数设置说明如下所示: 分辨率:根据实际情况,选择视频的分辨率。 导出为:输入导出文件的名称。
跨域问题。 调用方法 请参见如何调用API。 URI POST /v1/{project_id}/digital-human-chat/once-code 表1 路径参数 参数 是否必选 参数类型 描述 project_id 是 String 项目ID,获取方法请参考获取项目ID。
音频驱动:上传音频,通过音频驱动数字人说话。 即兴直播:无需设置剧本,直接开播。开播后数字人是不说话的,需要发送互动内容,或者开启真人接管,驱动数字人说话。 互动设置:支持弹幕、用户入场 、点赞和送礼设置。 直播配置:支持开播设置、输出设置、风控设置和更多设置。 界面下方的“加载完自动直播”,默认勾
安卓手机的超级录音机的录音参数设置方式,如下所示: 打开超级录音机软件。 为了能正常录音和保存文件,需要先授权给软件录音和存储权限,即允许“超级录音机”访问媒体。 进入软件设置页面。 设置如下选项: 录制设置 > 录音音质:选择“高清”。 录制设置 > 录音保存格式:选择“WAV”或“MP3”。
回到“应用配置”页面,开启“兜底设置”及其下的“讯飞闲聊”,如图14所示。 讯飞闲聊能够完成基本的问答,或者委婉表达自己不知道答案。 图14 兜底设置 单击“应用配置”界面右上方的“保存修改”。 界面提示“保存成功”,说明应用配置页面的修改已生效。 配置热词。 展开“语音识别”下方的“高级设置”,如图15所示。
查询音色ID 使用接口查询音色ID 支持使用查询资产列表接口,查询音色ID。需要设置如下参数: offset=0:从第一个音色开始查询,可以根据实际情况设置。 limit=60:一次可以查询的声音数据,可以根据实际情况设置。 asset_type=VOICE_MODEL:资产类型为音色模型。
操作步骤 登录MetaStudio控制台,单击“智能交互”,如图1所示。 图1 MetaStudio控制台页面 在智能交互编辑页面,依次设置角色和背景。 单击左侧导航栏中的“应用”,如图2所示。 参数配置说明如表1所示。 图2 创建应用 表1 创建应用 参数 说明 第三方应用
object 分身数字人在背景图片的位置设置。不设置默认在图片中间。 说明: 此参数废弃。分身数字人在背景中位置在layer_config参数中配置。 human_size_2d 否 HumanSize2D object 分身数字人在背景图片的大小设置。 说明: 此参数废弃。分身数字人
回到“应用配置”页面,开启“兜底设置”及其下的“讯飞闲聊”,如图8所示。 讯飞闲聊能够完成基本的问答,或者委婉表达自己不知道答案。 图8 兜底设置 单击“应用配置”界面右上方的“保存修改”。 界面提示“保存成功”,说明应用配置页面的修改已生效。 配置热词。 展开“语音识别”下方的“高级设置”,如图9所示。
示例:分身数字人形象制作。 请选择资源实例 从下拉框中选择已购买的资源实例。 示例:分身数字人形象制作 - 2025-11-01。 请选择资源数量 设置资源数量,不能超过所选资源实例已激活的数量。 示例:2。 请选择日期 资源激活后,从激活日期开始计算,有效期是一年。这里选择的日期,为有效期内的时间。
文本驱动:通过输入文本的方式生成音频。文本支持插入停顿、调整语速,如果是多音字可设置正确的发音,还可以选择不同的声音,试听生成的音频效果。支持开启字幕展示功能。 音频驱动:从本地上传音频文件,作为视频的语音。音频驱动方式,仅支持中文普通话的场景下能开启字幕。 还可以设置音频的音量,和调整画布的横竖屏展示。 4 视频场景区域
出门问问声音套餐”章节。 调用方法 请参见如何调用API。 URI POST /v1/{project_id}/ttsc/async-jobs 表1 路径参数 参数 是否必选 参数类型 描述 project_id 是 String 项目ID,获取方法请参考获取项目ID。 请求参数
如需使用第三方声音进行语音合成,请购买出门问问声音套餐。 图1 声音合成 功能介绍 该接口用于TTS流式合成音频,用于文本转化为语音,并实时返回合成的音频数据。 调用方法 构造请求 请求URL:wss://metastudio-api.{region}.myhuaweicloud.com:443/v1/{p
主文件大小不超过100M 调用方法 请参见如何调用API。 URI POST /v1/{project_id}/digital-assets 表1 路径参数 参数 是否必选 参数类型 描述 project_id 是 String 项目ID,获取方法请参考获取项目ID。 请求参数 表2