检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
声音录制指导文档下载 如需查看真人声音录制的的PDF文件,请单击声音制作录制指导下载文件。 父主题: 声音制作
无需开发。 图1 智能交互 场景二:用户使用第三方语言模型,自主开发API实现与数字人对话场景。 开发者基于智能交互服务定义的API接口结构,自主开发第三方语言模型API,对接第三方语言模型到智能交互服务,实现智能交互能力。操作请参考创建智能交互数字人(第三方语言模型)。 场景
允许访问本资产的租户列表。 响应参数 状态码: 200 表27 响应Header参数 参数 参数类型 描述 X-Request-Id String 请求ID。 表28 响应Body参数 参数 参数类型 描述 asset_id String 数字资产ID。 状态码: 400 表29 响应Body参数
)。 表3 请求Body参数 参数 是否必选 参数类型 描述 asset_ids 是 Array of strings 需要查询的资产ID。 响应参数 状态码: 200 表4 响应Header参数 参数 参数类型 描述 X-Request-Id String 请求ID。 表5 响应Body参数
稿四:春江花月夜 《春江花月夜》是唐代诗人张若虚的代表作之一,以下是《春江花月夜》的原文以及解析。 原文: 春江潮水连海平,海上明月共潮生。 滟滟随波千万里,何处春江无月明! 江流宛转绕芳甸,月照花林皆似霰; 空里流霜不觉飞,汀上白沙看不见。 江天一色无纤尘,皎皎空中孤月轮。 江畔何人初见月?江月何年初照人?
用户可以单击“查看制作任务列表”,进入分身数字人定制任务列表页面。 单击任务所在行的“查看详情”,进入“定制任务详情”页面。 查看分身数字人定制任务审核进展。当前状态为“系统审核中”,需要等待服务管理员审核通过后,状态变更为“待算法训练”。 如果数字人定制任务被驳回,需要查看驳回原因,并重新按照要求录制视频并上传。
VOLUME_DOWN:音量降低 默认取值: 不涉及。 表10 VoiceConfig 参数 是否必选 参数类型 描述 voice_asset_id 是 String 参数解释: 音色资产ID,可以从资产库中查询。 音色ID的查询操作,详见查询预置音色ID。 约束限制: 不涉及。 取值范围:
}/copy 复制视频制作剧本 数字人视频制作管理 表4 数字人视频制作管理接口 接口 说明 GET /v1/{project_id}/digital-human-videos 查询视频制作任务列表 分身数字人视频制作管理 表5 分身数字人视频制作管理接口 接口 说明 POST
查询音色ID 支持在MetaStudio控制台或通过API接口查询音色ID,详情如下所示: 在控制台查询音色ID(方式一):仅支持查询自定义音色ID。 在控制台查询音色ID(方式二):支持查询全量音色ID。 使用接口查询音色ID:支持查询全量音色ID。 在控制台查询音色ID(方式一)
例”页签查看对应编程语言类型的SDK代码,如图1 获取SDK代码示例所示。 图1 获取SDK代码示例 SDK列表 目前MetaStudio提供了Java、Python和Go语言SDK供开发者使用,如表1所示。您可以在GitHub仓库查看SDK更新历史、获取安装包以及查看指导文档。
买的总数量。 单击图标,可以查看剩余量详情的列表数据。 分身数字人名片制作 左下角展示用户已购买资源的剩余量和总量。单击图标,可以查看剩余量详情的列表数据。 照片数字人视频制作 左下角展示用户已购买资源的剩余量和总量。单击图标,可以查看剩余量详情的列表数据。 如需开通按需计费,需
系统资产标签定义 查询资产列表接口支持使用“tags”标签对分身数字人模型进行分类。 “tags”取值及其含义,如表1所示。 表1 tags标签说明 tags取值类型 说明 数字人类型 取值如下: VIRTUAL_AVATARS:分身数字人 VIRTUAL_HUMANS:虚拟数字人
查询委托 功能介绍 该接口用于查询项目下委托 调用方法 请参见如何调用API。 URI GET /v1/{project_id}/digital-human-chat/agency 表1 路径参数 参数 是否必选 参数类型 描述 project_id 是 String 被委托服务
用于语音驱动的音频文件上传URL列表。 script_cover_url String 剧本封面下载url。 表5 VoiceConfig 参数 参数类型 描述 voice_asset_id String 参数解释: 音色资产ID,可以从资产库中查询。 音色ID的查询操作,详见查询预置音色ID。 约束限制:
command取值为START时,为必填项。 表2 Config结构体 参数 是否必选 参数类型 参数位置 描述 voice_asset_id 是 String body 音色ID,获取方式详见获取音色ID。 speed 否 integer body 语速。 当取值为“100”时,表示一个成年人正常的语速,约为250字/分钟。
参数w用于方便前端计算字幕框左上角坐标,后台不使用该参数 取值范围: 0-1920 表7 VoiceConfig 参数 参数类型 描述 voice_asset_id String 参数解释: 音色资产ID,可以从资产库中查询。 音色ID的查询操作,详见查询预置音色ID。 约束限制: 不涉及。 取值范围: 字符长度1-256位。
查询语音训练任务详情 功能介绍 查询语音训练任务详情 调用方法 请参见如何调用API。 URI GET /v1/{project_id}/voice-training-manage/user/jobs/{job_id} 表1 路径参数 参数 是否必选 参数类型 描述 project_id
声音模型制作耗时,如下所示: 基础版:约1~3个工作日。 进阶版:约1~3个工作日。 高品质:约5个工作日。 图2 制作任务提交成功 用户可以单击“查看制作任务列表”,查看声音制作任务审核进展。 当状态变更为“系统审核完成”,自动启动算法训练。如果系统存在多个算法训练任务,可能会存在排队和延迟的现象,请耐心等待。
0,可选值有: 1.0: 对应的输出为: 动作数据:75个骨骼旋转值 表情数据:52ARkit表情及参数 2.0: 对应的输出为: 动作数据:55个骨骼旋转值+骨骼3D坐标 表情数据:178个控制器的数据 状态码: 400 表9 响应Body参数 参数 参数类型 描述 error_code
声音制作任务提交成功后,需要等待1天左右的时间审核。任务审核通过后,启动声音制作。声音模型制作耗时约5个工作日。 图2 制作任务提交成功 用户可以单击“查看制作任务列表”,查看声音制作任务审核进展。 当状态变更为“系统审核完成”,自动启动算法训练。如果系统存在多个算法训练任务,可能会存在排队和延迟的现象,请耐心等待。