检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
支持流式文本消息。seq为流式文本序号,从1开始计数;is_last用于判断流式文本的最后一包数据。如果不使用流式文本消息,seq设置为“1”,is_last设置为“true”。 建议每个分包数据长度大于6个字,否则可能会导致数字人说话卡顿。 详细交互流程如下所示: 用户发送文本驱动消息。
示例:4. 它不仅拥有出色的功能,还具备卓越的性能,序号4无需阅读。 音频格式 推荐使用无损音质格式保存音频文件,如WAV、MP3格式。 原始录音数据,需为48kHz采样率、16bit编码和单声道。 录制风格 录制全程保持语境风格一致,避免多种情绪混杂。如直播场景时,录制风格需接近日常直播效果。
获取语音驱动任务列表 20次/秒 10次/秒 - 创建语音驱动表情动画任务 2次/秒 2次/秒 - 获取语音驱动表情数据 20次/秒 10次/秒 - 获取语音驱动数据 20次/秒 10次/秒 - 3D数字人视频驱动 创建视频驱动任务 2次/秒 2次/秒 - 查询视频驱动任务列表 20次/秒
获取动作编排视频分片 取值范围: 0-64 video_multipart_count 否 Integer 训练视频上传分片数(上传时对唯一训练视频文件的数据分片,用于对该文件的并发上传,不是分多个视频文件上传)。 取值范围: 1-1000 默认取值: 1 action_video_multipart_count
默认取值: UPLOAD_VIDEO video_multipart_count 否 Integer 训练视频上传分片数(上传时对唯一训练视频文件的数据分片,用于对该文件的并发上传,不是分多个视频文件上传)。 取值范围: 1-1000 默认取值: 1 action_video_multipart_count
获取语音驱动任务列表 20次/秒 10次/秒 - 创建语音驱动表情动画任务 2次/秒 2次/秒 - 获取语音驱动表情数据 20次/秒 10次/秒 - 获取语音驱动数据 20次/秒 10次/秒 - 3D数字人视频驱动 创建视频驱动任务 2次/秒 2次/秒 - 查询视频驱动任务列表 20次/秒
CAPTURE: 直播助手,将摄像头获取视频流推送到RTC房间 ANIMATION: VDS服务,从RTC房间拉视频流生成动作数据 RENDER: 渲染服务,将动作数据渲染成数字人动画 PLAYER: 普通观看方,可选择原始视频流或者数字人动画视频流观看 INFERENCE_USER:
CAPTURE: 直播助手,将摄像头获取视频流推送到RTC房间 ANIMATION: VDS服务,从RTC房间拉视频流生成动作数据 RENDER: 渲染服务,将动作数据渲染成数字人动画 PLAYER: 普通观看方,可选择原始视频流或者数字人动画视频流观看 INFERENCE_USER:
CAPTURE: 直播助手,将摄像头获取视频流推送到RTC房间 ANIMATION: VDS服务,从RTC房间拉视频流生成动作数据 RENDER: 渲染服务,将动作数据渲染成数字人动画 PLAYER: 普通观看方,可选择原始视频流或者数字人动画视频流观看 INFERENCE_USER:
查询参数,是可选部分,并不是每个API都有查询参数。查询参数前面需要带一个“?”,形式为“参数名=参数取值”,例如“?limit=10”,表示查询不超过10条数据。 例如您需要创建IAM用户,由于IAM为全局服务,则使用任一区域的Endpoint,比如“华北-北京四”区域的Endpoint(iam.cn-north-4
描述 X-Request-Id String 请求ID。 表5 响应Body参数 参数 参数类型 描述 offset Integer 与第一条数据的偏移量 取值范围: 0-2147483647 默认取值: 0 limit Integer 页面大小 取值范围: 1-1000 默认取值:
描述 X-Request-Id String 请求ID。 表5 响应Body参数 参数 参数类型 描述 offset Integer 与第一条数据的偏移量 取值范围: 0-2147483647 默认取值: 0 limit Integer 页面大小 取值范围: 1-1000 默认取值:
描述 X-Request-Id String 请求ID。 表5 响应Body参数 参数 参数类型 描述 offset Integer 与第一条数据的偏移量 取值范围: 0-2147483647 默认取值: 0 limit Integer 页面大小 取值范围: 1-1000 默认取值:
描述 X-Request-Id String 请求ID。 表5 响应Body参数 参数 参数类型 描述 offset Integer 与第一条数据的偏移量 取值范围: 0-2147483647 默认取值: 0 limit Integer 页面大小 取值范围: 1-1000 默认取值:
描述 X-Request-Id String 请求ID。 表5 响应Body参数 参数 参数类型 描述 offset Integer 与第一条数据的偏移量 取值范围: 0-2147483647 默认取值: 0 limit Integer 页面大小 取值范围: 1-1000 默认取值:
描述 X-Request-Id String 请求ID。 表5 响应Body参数 参数 参数类型 描述 offset Integer 与第一条数据的偏移量 取值范围: 0-2147483647 默认取值: 0 limit Integer 页面大小 取值范围: 1-1000 默认取值:
描述 X-Request-Id String 请求ID。 表5 响应Body参数 参数 参数类型 描述 offset Integer 与第一条数据的偏移量 取值范围: 0-2147483647 默认取值: 0 limit Integer 页面大小 取值范围: 1-1000 默认取值:
描述 X-Request-Id String 请求ID。 表5 响应Body参数 参数 参数类型 描述 offset Integer 与第一条数据的偏移量 取值范围: 0-2147483647 默认取值: 0 limit Integer 页面大小 取值范围: 1-1000 默认取值:
StyleAssetItem objects 风格化素材资产组合。 extra_meta StyleExtraMeta object 数字人风格额外元数据信息 style_id String 数字人风格ID create_time String 数字人风格创建时间,格式遵循:RFC 3339。
GET /v1/{project_id}/fas-jobs/{job_id} 获取语音驱动表情数据 GET /v1/{project_id}/ttsa-jobs/{job_id} 获取语音驱动数据 3D数字人视频驱动 表31 3D数字人视频驱动接口 接口 说明 POST /v1/{pr