检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
是否必选 参数类型 描述 dx 否 Integer 参数解释: 字幕框左下角像素点坐标。 约束限制: 不涉及。 默认取值: 不涉及。 取值范围: 0-1920 dy 否 Integer 参数解释: 字幕框左下角像素点坐标。 约束限制: 不涉及。 默认取值: 不涉及。 取值范围: 0-1920
SubtitleConfig 参数 参数类型 描述 dx Integer 参数解释: 字幕框左下角像素点坐标。 约束限制: 不涉及。 默认取值: 不涉及。 取值范围: 0-1920 dy Integer 参数解释: 字幕框左下角像素点坐标。 约束限制: 不涉及。 默认取值: 不涉及。 取值范围: 0-1920
创建智能交互数字人 介绍如何在MetaStudio平台创建智能交互数字人,实现用户和数字人进行交互对话。相应的场景说明,请参考场景说明。 前提条件 已配置完成奇妙问,示例如创建智能交互数字人(奇妙问)所示。 操作步骤 登录MetaStudio控制台,单击“智能交互”,如图1所示。
创建高级版语音训练任务 功能介绍 用户创建语音训练高级版任务,该接口会返回一个obs上传地址,用于上传语音文件。 语音文件为一段WAV格式的长音频文件,仅支持将语音文件打包成zip压缩格式上传。 文件上传后,调用“提交语音训练任务”接口,启动审核和训练。 调用方法 请参见如何调用API。
查询语音训练任务详情 功能介绍 查询语音训练任务详情 调用方法 请参见如何调用API。 URI GET /v1/{project_id}/voice-training-manage/user/jobs/{job_id} 表1 路径参数 参数 是否必选 参数类型 描述 project_id
switch 查询欢迎词功能开关 智能交互数字人热点问题管理 表22 智能交互数字人热点问题管理接口 接口 说明 POST /v1/{project_id}/digital-human-chat/hot-question 创建热点问题 GET /v1/{project_id}/d
参数类型 描述 dx Integer 字幕左上角像素点坐标。 说明: *横屏(16:9)视频像素为1920x1080;竖屏(9:16)视频像素为1080x1920。 取值范围: 0-1920 dy Integer 字幕左上角像素点坐标。 说明: *横屏(16:9)视频像素为1920
47010066 热点问题不存在 热点问题不存在 请使用正确的热点问题ID查询或检查是否正确配置热点问题 400 MSS.47010068 热点问题数量超过最大上限 热点问题数量超过最大上限,请联系开发人员 请联系技术支持 400 MSS.47010069 热点问题已存在 热点问题已存在 请配置其他的热点问题
MetaStudio SSML当前支持如下能力: TTS语音合成时,控制文字读音。 包含如下标签: <speak></speak>标签为SSML文本根节点。 <break/>标签用于静音停顿,可设置停顿时长。 <phoneme></phoneme>标签,用于标记多音字发音。 <say-as><
创建智能交互数字人 介绍如何在MetaStudio平台创建智能交互数字人,实现用户和数字人进行交互对话。相应的场景说明,请参考场景说明。 前提条件 已配置完成第三方应用,示例如创建智能交互数字人(科大讯飞)所示。 操作步骤 登录MetaStudio控制台,单击“智能交互”,如图1所示。
创建进阶版语音训练任务 功能介绍 用户创建语音训练进阶版任务,该接口会返回一个obs上传地址,用于上传语音文件。 支持2种方式上传语音文件: 语音文件和文本文件打包成zip上传:语音文件已经切分成100个wav文件,每个语音文件对应一个txt文本文件,所有文件打包成zip文件。语音文件命名规则:0
参数类型 描述 dx Integer 字幕左上角像素点坐标。 说明: *横屏(16:9)视频像素为1920x1080;竖屏(9:16)视频像素为1080x1920。 取值范围: 0-1920 dy Integer 字幕左上角像素点坐标。 说明: *横屏(16:9)视频像素为1920
算法备案公示 下述内容为MetaStudio服务提供的算法备案信息、基本原理、运行机制和目的意图等内容,以保障用户的知情权,方便用户更好的选择和使用MetaStudio服务。 华为云MetaStudio分身数字人驱动算法 表1 分身数字人驱动算法 算法项 描述 算法名称 华为云MetaStudio分身数字人驱动算法
创建基础版语音训练任务 功能介绍 用户创建语音训练基础版任务,该接口会返回一个obs上传地址,用于上传语音文件。 支持2种方式上传语音文件: 语音文件和文本文件打包成zip上传:语音文件已经切分成20个wav文件,每个语音文件对应一个txt文本文件,所有文件打包成zip文件。语音文件命名规则:0
声音制作限制 声音制作限制说明,如表1所示。 表1 声音制作限制 限制项 说明 用户限制 MetaStudio不支持个人用户定制声音,仅支持企业用户。 定制声音时,从平台下载的授权书中有明确说明,定制音色需授权给公司使用。 使用限制 制作好的声音模型不支持下载或导出至本地。 声音
形象制作限制 形象制作限制说明,如表1所示。 表1 形象制作限制 限制项 说明 用户限制 MetaStudio不支持个人用户定制形象,仅支持企业用户。 定制分身形象时,从平台下载的授权书中有明确说明,定制分身形象需授权给公司使用。 使用限制 制作好的数字人模型不支持下载或导出至本地。
查询语音训练任务列表 功能介绍 查询语音训练任务列表 调用方法 请参见如何调用API。 URI GET /v1/{project_id}/voice-training-manage/user/jobs 表1 路径参数 参数 是否必选 参数类型 描述 project_id 是 String
分身数字人X轴位置,即分身数字图片底边中心点像素的X轴的像素值。 横屏(16:9)背景图片像素为1920x1080;竖屏(9:16)背景图片像素为1080x1920。 取值范围: -1920-3840 position_y Integer 分身数字Y轴位置,即分身数字图片底边中心点像素的Y轴的像素值。
是否必选 参数类型 描述 dx 否 Integer 参数解释: 字幕框左下角像素点坐标。 约束限制: 不涉及。 默认取值: 不涉及。 取值范围: 0-1920 dy 否 Integer 参数解释: 字幕框左下角像素点坐标。 约束限制: 不涉及。 默认取值: 不涉及。 取值范围: 0-1920
即兴直播:无需设置剧本,直接开播。开播后数字人是不说话的,需要发送互动内容,或者开启真人接管,驱动数字人说话。 互动设置:支持弹幕、用户入场 、点赞和送礼设置。 直播配置:支持开播设置、输出设置、风控设置和更多设置。 界面下方的“加载完自动直播”,默认勾选,单击“准备开播”加载完成后自动开播。