检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
获取语音驱动数据 功能介绍 该接口用于获取生成的数字人驱动数据,包括语音、表情、动作等。 调用方法 请参见如何调用API。 URI GET /v1/{project_id}/ttsa-jobs/{job_id} 表1 路径参数 参数 是否必选 参数类型 描述 project_id
获取语音驱动表情数据 功能介绍 该接口用于获取生成的数字人表情驱动数据 调用方法 请参见如何调用API。 URI GET /v1/{project_id}/fas-jobs/{job_id} 表1 路径参数 参数 是否必选 参数类型 描述 project_id 是 String 租户项目ID
智能交互驱动停止对话流程图,如图4所示。 智能交互驱动心跳保活流程图,如图 智能交互驱动心跳保活流程图所示。 智能交互驱动超时流程图,如图6所示。 智能交互驱动任务结束流程图,如图7所示。 智能交互驱动WebSocket接口说明,如智能交互驱动WebSocket接口所示。 图1 智能交互非流式驱动流程图 图2 智能交互流式驱动流程图
肢体驱动数据格式如何定义? MetaStudio肢体驱动数据的前三个为Hips骨骼的Translation信息,按XYZ排列,后接75根骨骼的旋转数据,具体定义如下: 序号 骨骼名称 0 Hips 1 Spine 2 Spine1 3 Spine2 4 Spine3 5 Neck
文本驱动SSML定义 MetaStudio语音驱动采用语音合成标记语言(SSML,Speech Synthesis Markup Language)来控制数字人的行为,包括动作、情绪以及TTS语音合成的多音字、停顿等。 SSML基础定义可参考语音合成标记语言版本 1.0。Meta
创建视频驱动任务 功能介绍 该接口用于创建视频驱动任务。 调用方法 请参见如何调用API。 URI POST /v1/{project_id}/video-motion-capture-jobs 表1 路径参数 参数 是否必选 参数类型 描述 project_id 是 String
产管理相关接口从资产库查出。 script_type 否 String 脚本类型,即视频制作的驱动方式。默认TEXT TEXT: 文本驱动,即通过TTS合成语音 AUDIO: 语音驱动 默认取值: TEXT text 否 String HTML格式的台词,可包含动作。最多2048个字符。
智能交互驱动 前提条件 智能交互驱动流程 智能交互驱动WebSocket接口 父主题: 智能交互
表情驱动数据格式如何定义? MetaStudio表情驱动的表情基数据总共52个系数,每个系数的取值范围在0~1之间,表情基系数的顺序性定义如下: 序号 表情名称 0 mouthPucker 1 mouthPressLeft 2 mouthPressRight 3 mouthRollUpper
智能交互驱动WebSocket接口 终端节点获取方式 智能交互驱动WebSocket接口终端节点的获取方式,如表1所示。 表1 终端节点获取方式 场景 获取方式 未通过WEB SDK调用场景 终端节点地址从接口StartSmartChatJob.xml的响应参数chat_access_address中获取。
查询视频驱动任务详情 功能介绍 该接口用于查询视频驱动任务详情。 调用方法 请参见如何调用API。 URI GET /v1/{project_id}/video-motion-capture-jobs/{job_id} 表1 路径参数 参数 是否必选 参数类型 描述 project_id
停止视频驱动任务 功能介绍 该接口用于停止视频驱动任务。 调用方法 请参见如何调用API。 URI POST /v1/{project_id}/video-motion-capture-jobs/{job_id}/finish 表1 路径参数 参数 是否必选 参数类型 描述 project_id
查询视频驱动任务列表 功能介绍 该接口用于查询视频驱动任务列表。 调用方法 请参见如何调用API。 URI GET /v1/{project_id}/video-motion-capture-jobs 表1 路径参数 参数 是否必选 参数类型 描述 project_id 是 String
控制数字人驱动 功能介绍 该接口用于控制数字人驱动。 调用方法 请参见如何调用API。 URI POST /v1/{project_id}/video-motion-capture-jobs/{job_id}/command 表1 路径参数 参数 是否必选 参数类型 描述 project_id
3D数字人语音驱动 创建语音驱动任务 获取语音驱动任务列表 创建语音驱动表情动画任务 获取语音驱动表情数据 获取语音驱动数据 父主题: 3D数字人
total Integer 语音驱动任务总数。 取值范围: 0-2147483647 ttsa_jobs Array of TTSAJob objects 语音驱动任务列表。 表6 TTSAJob 参数 参数类型 描述 job_id String 语音驱动任务ID。 state String
创建语音驱动表情动画任务 功能介绍 该接口用于创建驱动数字人表情的任务。 调用方法 请参见如何调用API。 URI POST /v1/{project_id}/ttsa/fas 表1 路径参数 参数 是否必选 参数类型 描述 project_id 是 String 租户项目ID 请求参数
3D数字人视频驱动 创建视频驱动任务 查询视频驱动任务列表 查询视频驱动任务详情 停止视频驱动任务 控制数字人驱动 父主题: 3D数字人
前提条件 需要申请开通智能交互权限后,才可集成智能交互SDK,并使用Websocket接口驱动数字人。 父主题: 智能交互驱动
API的方式人工接管直播。人工接管以后,支持通过下述方式驱动数字人说话: 文本驱动方式:对应Command命令为“INSERT_PLAY_SCRIPT”,即插入表演脚本,用于互动回复。数字人不变时,背景不变。其参数结构定义为“PlayTextInfo”。 音频驱动方式:对应Command命令为“IN