检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
停顿做切割,自动识别文本内容。 音频文件命名无要求,可自定义,命名示例:Voice.wav。 进阶版 高品质 制作声音模型 准备好音频文件后,就可以上传至MetaStudio控制台,进行声音训练。详细操作如下所示: 创建声音制作任务(自研模型) 查看声音 声音模型制作耗时,如下所示:
查询视频驱动任务列表 功能介绍 该接口用于查询视频驱动任务列表。 调用方法 请参见如何调用API。 URI GET /v1/{project_id}/video-motion-capture-jobs 表1 路径参数 参数 是否必选 参数类型 描述 project_id 是 String
查询视频驱动任务详情 功能介绍 该接口用于查询视频驱动任务详情。 调用方法 请参见如何调用API。 URI GET /v1/{project_id}/video-motion-capture-jobs/{job_id} 表1 路径参数 参数 是否必选 参数类型 描述 project_id
创建视频驱动任务 功能介绍 该接口用于创建视频驱动任务。 调用方法 请参见如何调用API。 URI POST /v1/{project_id}/video-motion-capture-jobs 表1 路径参数 参数 是否必选 参数类型 描述 project_id 是 String
户Token接口获取,响应消息头中X-Subject-Token的值。 请求参数 表5、表6和表7中的请求参数为WebSocket建连成功后,用户与数字人对话的请求参数。 表5 请求Message参数 参数 是否必选 参数类型 描述 request_id 否 String 请求ID。
创建一次性鉴权码 功能介绍 该接口用于创建一次性鉴权码,有效期5分钟,鉴权码只能使用一次,每次使用后需要重新获取。 接口只能通过第三方后台调用,不能在浏览器前台直接调用,否则会有跨域问题。 调用方法 请参见如何调用API。 URI POST /v1/{project_id}/di
如果调用API时,返回“APIGW.0308”错误信息,是触发了API流控限制。需要参考下述表格中的流控值,调整调用API的间隔时间,控制请求的发送速度;或者等待一段时间后,再发送API请求。 “APIGW”开头的错误码列表,详见错误码说明。 表2 API流控限制 接口分类 接口名称 单租户接口流控 (华北-北京四)
0x2160、2160x3840六种分辨率。4K分辨率视频需要分身数字人模型支持4K的情况下才能使用。 clip_mode=CROP,裁剪后视频,(dx,dy)为原点,保留视频像宽度为width。 分身数字人直播目前只支持1080x1920。 取值范围: 0-3840 height
语音文件和文本文件逐句上传:每次上传一句语料的语音文件和文本文件,再调用“确认在线录音结果”接口确认语音和文本内容是否一致。确认成功后再上传和确认下一句。 文件上传后,调用“提交语音训练任务”接口,启动审核和训练。 调用方法 请参见如何调用API。 URI POST /v1/{projec
0x2160、2160x3840六种分辨率。4K分辨率视频需要分身数字人模型支持4K的情况下才能使用。 clip_mode=CROP,裁剪后视频,(dx,dy)为原点,保留视频像宽度为width。 分身数字人直播目前只支持1080x1920。 取值范围: 0-3840 height
语音文件和文本文件逐句上传:每次上传一句语料的语音文件和文本文件,再调用“确认在线录音结果”接口确认语音和文本内容是否一致。确认成功后再上传和确认下一句。 文件上传后,调用“提交语音训练任务”接口,启动审核和训练。 调用方法 请参见如何调用API。 URI POST /v1/{projec
确认文件已上传 功能介绍 资产文件上传完毕后,通过该接口确认上传完成。 调用方法 请参见如何调用API。 URI POST /v1/{project_id}/files/{file_id}/complete 表1 路径参数 参数 是否必选 参数类型 描述 project_id 是
否 String 按直播间类型查询。直播间类型。 NORMAL:普通直播间,直播间一直存在,可以反复开播 TEMP:临时直播间,直播任务结束后自动清理直播间。 TEMPLATE:直播间模板。 template_own_type 否 String 按照自己拥有的和别人分享以及公共的模板进行查询
参数解释: 文件内容MD5值。按照RFC 1864标准计算出消息体的MD5摘要字符串,即消息体128-bit MD5值经过base64编码后得到的字符串。 md5值获取详情请参考使用Java代码生成文件内容的MD5值。 约束限制: 不涉及 取值范围: 字符长度24位。 默认取值:
用户创建语音训练高级版任务,该接口会返回一个obs上传地址,用于上传语音文件。 语音文件为一段WAV格式的长音频文件,仅支持将语音文件打包成zip压缩格式上传。 文件上传后,调用“提交语音训练任务”接口,启动审核和训练。 调用方法 请参见如何调用API。 URI POST /v1/{project_id}/vo
参数解释: 事件内容关键字段 说明: event_type为1,2,3,4:与LiveEventReport中event.content中反序列化后的JSON字段对应。如:弹幕事件上报事件。 { "timestamp": 1694481224245, "type": 1, "content":
asset_file_category 是 String 文件在资产中的分类。每种资产类型包含的文件分类不同。 MAIN:主文件 OTHER:其他文件 PACKAGE:打包后的资产文件 file_multipart_count 否 Integer ORI4K文件分段上传数量,默认值为1 取值范围: 1-100 默认取值:
参数解释: 事件内容关键字段 说明: event_type为1,2,3,4:与LiveEventReport中event.content中反序列化后的JSON字段对应。如:弹幕事件上报事件。 { "timestamp": 1694481224245, "type": 1, "content":
参数解释: 事件内容关键字段 说明: event_type为1,2,3,4:与LiveEventReport中event.content中反序列化后的JSON字段对应。如:弹幕事件上报事件。 { "timestamp": 1694481224245, "type": 1, "content":
如果调用API时,返回“APIGW.0308”错误信息,是触发了API流控限制。需要参考下述表格中的流控值,调整调用API的间隔时间,控制请求的发送速度;或者等待一段时间后,再发送API请求。 “APIGW”开头的错误码列表,详见错误码说明。 表1 API流控限制 接口分类 接口名称 单租户接口流控 (华北-北京四)