检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
数字人名片制作 环境准备 已安装SDK。 场景说明 该场景通过示例代码,介绍了如何使用MetaStudio Java SDK来实现数字人名片制作功能。 建模示例 详情请参考数字人名片制作。
视频直播 环境准备 已安装SDK。 场景说明 该场景通过示例代码,介绍了如何使用MetaStudio Java SDK来实现数字人直播功能。 建模示例 详情请参考数字人直播。
资产管理 环境准备 已安装SDK。 场景说明 该场景通过示例代码,介绍了如何使用MetaStudio Java SDK来实现数字人资产管理功能。 建模示例 详情请参考资产管理。
SmartVideoLayerConfig 参数 是否必选 参数类型 描述 video_url 是 String 视频文件的URL。 video_cover_url 否 String 视频封面文件的URL。 display_duration 否 Integer 参数解释: 图片显示时长,单位s。
视频制作剧本管理 环境准备 已安装SDK。 场景说明 该场景通过示例代码,介绍了如何使用MetaStudio Java SDK来实现数字人视频制作剧本管理功能。 建模示例 详情请参考视频制作剧本管理。
1次/秒 查询资产概要 20次/秒 10次/秒 10次/秒 查询资产复制信息 20次/秒 10次/秒 10次/秒 复制资产 4次/秒 3次/秒 3次/秒 文件管理 创建文件并获取上传URL 10次/秒 5次/秒 5次/秒 删除文件 10次/秒 5次/秒 5次/秒 确认文件已上传 10次/秒
需整段录制所有语料生成一个长音频WAV或MP3格式文件,每句之间有2~3秒的停顿。WAV或MP3格式文件可直接上传MetaStudio控制台,无需压缩,无需提供语料txt文件。 推荐使用服务预置语料,也可自定义语料。系统会自动根据停顿做切割,自动识别文本内容。 音频文件命名无要求,可自定义,命名示例:Voice
视频制作 环境准备 已安装SDK。 场景说明 该场景通过示例代码,介绍了如何使用MetaStudio Java SDK来实现数字人视频制作功能。 建模示例 详情请参考数字人视频制作。
在“识别热词”区域,单击“下载热词模板”,将模板下载至本地。 本地打开模板文件,按照模板提示,输入需要添加的热词,示例如下所示: 数字人对话,weight:4.0 文件编辑完成后,单击“上传热词”,将文件上传至应用中。 单击界面右上方的“保存修改”,保存应用修改。 配置应用的设备人设。
RESIZE codec 是 String 参数解释: 视频编码格式及视频文件格式。 约束限制: 仅分身数字人视频制作支持VP8编码。 取值范围: H264:h264编码,输出mp4文件。 VP8:vp8编码,输出webm文件。 默认取值: 不涉及 bitrate 是 Integer 参数解释:
10001007 资产文件过大,请勿超过5242880字节 资产文件过大,请勿超过5242880字节 请压缩文件大小,或替换成小文件 400 MSS.10001008 资产主文件已存在 资产主文件已存在 请勿重复上传主文件 400 MSS.10001009 资产封面文件已存在 资产封面文件已存在
9d9af9e0f743"/>,非常高兴给大家介绍MetaStudio。</speak> insert-action id通过查询资产列表接口获取,查询时asset_type=ANIMATION 多音字标签:<phoneme ph="拼音">汉字</phoneme>,南京<phoneme
在“识别热词”区域,单击“下载热词模板”,将模板下载至本地。 本地打开模板文件,按照模板提示,输入需要添加的热词,示例如下所示: 数字人对话,weight:4.0 文件编辑完成后,单击“上传热词”,将文件上传至应用中。 单击界面右上方的“保存修改”,保存应用修改。 配置应用的设备人设。
DELETE_FORCE:强制删除,该模式会立即删除资产 RESTORE:恢复 UNACTIVE:取消激活 ACTIVE:激活 SHARE:共享 UNSHARE:取消共享 asset_ids 是 Array of strings 资产ID列表 params 否 String 操作参数 响应参数 状态码:
启动数字人智能交互任务 功能介绍 该接口用于启动数字人智能交互任务。 调用方法 请参见如何调用API。 URI POST /v1/{project_id}/digital-human-chat/smart-chat-rooms/{room_id}/smart-chat-jobs 表1
获取语音驱动表情数据 功能介绍 该接口用于获取生成的数字人表情驱动数据 调用方法 请参见如何调用API。 URI GET /v1/{project_id}/fas-jobs/{job_id} 表1 路径参数 参数 是否必选 参数类型 描述 project_id 是 String 租户项目ID
1次/秒 查询资产概要 20次/秒 10次/秒 10次/秒 查询资产复制信息 20次/秒 10次/秒 10次/秒 复制资产 4次/秒 3次/秒 3次/秒 文件管理 创建文件并获取上传URL 10次/秒 5次/秒 5次/秒 删除文件 10次/秒 5次/秒 5次/秒 确认文件已上传 10次/秒
包括如下内容: 贴图:从本地选择图片。 视频:从本地选择视频文件。 文本:手工输入文本内容。 音频:从本地选择音频文件。 单击“创建”,界面提示“创建成功”。 在“商品管理”页面,新增一行商品。 支持对商品执行如下操作: 单击商品所在行的“查看”,进入商品详情界面,支持单击“编辑”,修改商品信息。
所有语料录制生成一个长音频WAV或MP3文件,命名示例:Voice.wav。 音频导出 操作如下所示: 打开超级录音机软件,进入音频文件列表页面。 通过长按音频文件的方式,选中所有文件,单击分享图标,可选择隔空投送或其他第三方应用导出音频文件至PC中。 一个长音频文件无需压缩,可直接上传至MetaStudio控制台,进行声音训练。
音色资产ID,可以从资产库中查询。 introduction_audio_asset_id 否 String 自我介绍语音资产ID,用于驱动数字人口型。 说明: 介绍语音需要作为asset_type=AUDIO资产先上传至资产库。 使用时从资产库中查询。 video_asset_name