检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
创建基础版语音训练任务 功能介绍 用户创建语音训练基础版任务,该接口会返回一个obs上传地址,用于上传语音文件。 支持2种方式上传语音文件: 语音文件和文本文件打包成zip上传:语音文件已经切分成20个wav文件,每个语音文件对应一个txt文本文件,所有文件打包成zip文件。语音文件命名规则:0
单击webm2mov,将视频格式转换小工具webm2mov_20240814.rar下载至本地。 下载过程大约耗时3~5分钟,请耐心等待。 如果用户需要自定义工具,可以获取其源码。 本地解压工具包,得到ffmpeg目录和运行文件webm2mov.exe。 双击webm2mov.exe,弹出如图1所示的界面。
视频直播 环境准备 已安装SDK。 场景说明 该场景通过示例代码,介绍了如何使用MetaStudio Java SDK来实现数字人直播功能。 建模示例 详情请参考数字人直播。
数字人名片制作 环境准备 已安装SDK。 场景说明 该场景通过示例代码,介绍了如何使用MetaStudio Java SDK来实现数字人名片制作功能。 建模示例 详情请参考数字人名片制作。
视频制作 环境准备 已安装SDK。 场景说明 该场景通过示例代码,介绍了如何使用MetaStudio Java SDK来实现数字人视频制作功能。 建模示例 详情请参考数字人视频制作。
如何调用MetaStudio接口? MetaStudio提供RESTful API和Java/Python/Go三种语言的SDK。API调用请参考《API参考》,SDK集成请参考API Explorer中的“代码示例”。 父主题: FAQ
视频制作剧本管理 环境准备 已安装SDK。 场景说明 该场景通过示例代码,介绍了如何使用MetaStudio Java SDK来实现数字人视频制作剧本管理功能。 建模示例 详情请参考视频制作剧本管理。
如何调用MetaStudio接口? MetaStudio提供RESTful API和Java/Python/Go三种语言的SDK。API调用请参考《API参考》,SDK集成请参考API Explorer中的“代码示例”。 父主题: API和SDK使用
MetaStudio提供下述声音制作方式: 基础版声音制作:需整段录制生成一个WAV或MP3格式的音频文件,时长3~10分钟,建议5分钟。 进阶版声音制作:需整段录制生成一个WAV或MP3格式的音频文件,时长10~30分钟,建议15分钟。 高品质声音制作:需整段录制生成一个WAV或MP3格式的音频文件,时长1小时以上,建议1小时。
支持全局设置自定义读法,设置完成后,所有视频制作剧本自动生效。 操作步骤 登录MetaStudio控制台。 在左侧导航栏中,单击“我的创作”。 选择“声音”页签,单击界面右侧的“特殊词表”,进入如图1所示的界面。 图1 特殊词表 单击“新建词表”,界面新增一行自定义读法,如图2所示。
查询视频制作任务列表 功能介绍 该接口用于查询视频制作任务列表。可查询分身数字人视频制作列表,照片数字人视频制作列表等。 默认查询最近一个月任务记录。 调用方法 请参见如何调用API。 URI GET /v1/{project_id}/digital-human-videos 表1
获取账号ID 直播控制HTTP Command命令说明 直播控制RTSA Command命令说明 文本驱动SSML定义 系统资产标签定义 服务支持的字体 资源类型 使用Java代码生成文件内容的MD5值 预置音色ID列表 查询音色ID
Config object 自定义直播平台鉴权配置 callback_config 是 Array of StandardPlatformApiConfig objects 自定义直播平台回调配置。同一种类型仅保留一个配置,如果配置多个会随机保存一个。 表4 UpdateCust
CustomPlatformAuthConfig object 自定义直播平台鉴权配置 callback_config 是 Array of StandardPlatformApiConfig objects 自定义直播平台回调配置。同一种类型仅保留一个配置,如果配置多个会随机保存一个。 表4 CustomPlatformAuthConfig
智能交互设置 直播间页面支持弹幕规则使用“智能交互”的方式,去回复直播间用户的提问。智能交互的方式相当于提供了一个第三方语言模型去答复用户问题。 操作步骤 登录MetaStudio控制台。 在“工作台”界面,单击“分身视频直播”下方的“开始创建”,进入分身数字人直播首页面。 在“
创建高级版语音训练任务 功能介绍 用户创建语音训练高级版任务,该接口会返回一个obs上传地址,用于上传语音文件。 语音文件为一段WAV格式的长音频文件,仅支持将语音文件打包成zip压缩格式上传。 文件上传后,调用“提交语音训练任务”接口,启动审核和训练。 调用方法 请参见如何调用API。
查看界面右侧的“互动问答”页签,如图1所示。 参数配置说明,如表1所示。 图1 创建应用 表1 创建应用 参数 说明 第三方应用 选择“第三方语言模型”。 应用名称 输入自定义的应用名称。 APPID MetaStudio对接第三方语言模型LLM时,需要LLM提供的APPID信息。 APPKEY MetaStud
CustomPlatformAuthConfig object 自定义直播平台鉴权配置 callback_config Array of StandardPlatformApiConfig objects 自定义直播平台回调配置。同一种类型仅保留一个配置,如果配置多个会随机保存一个。 表5 PlatformAuthorizationInfo
REPLY_COMMAND_FINISH:回复播放完成通知。 回调事件结构体定义: event_type:事件类型。 message:事件描述。 SHOOT_SCRIPT_SWITCH事件回调定义如下: { "event_type": "SHOOT_SCRIPT_SWITCH"
CustomPlatformAuthConfig object 自定义直播平台鉴权配置 callback_config Array of StandardPlatformApiConfig objects 自定义直播平台回调配置。同一种类型仅保留一个配置,如果配置多个会随机保存一个。 表7 PlatformAuthorizationInfo