检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
音频驱动方式:对应Command命令为“INSERT_PLAY_AUDIO”,即插入驱动音频,用于音频直接驱动。数字人不变时,背景不变。其参数结构定义为“PlayAudioInfo”。 控制数字人直播过程接口的Command命令说明,如下所示: Command命令为“GET_CURREN
直播控制RTSA Command命令说明 直播控制RTSA Command命令详细说明,如下所示: 数字人直播状态变化图 RTSA Command定义 数字人直播状态变化图 数字人直播状态变化流程图,如图1所示。 图1 直播状态变化流程图 流程图说明,如下所示: PREPROCE
请求ID。 表6 响应Body参数 参数 参数类型 描述 commond_result String 命令执行结果。 EXCUTE_SUCCESS: 命令提交成功 EXCUTE_FAILED: 命令提交失败 attachment_upload_url Array of strings 附件上传地址
返回结果 状态码 请求发送以后,您会收到响应,其中包含状态码、响应消息头和消息体。 状态码是一组从1xx到5xx的数字代码,状态码表示了请求响应的状态,完整的状态码列表请参见状态码。 对于管理员创建IAM用户接口,如果调用后返回状态码为“201”,则表示请求成功。 响应消息头 对
t连接。 连接建立成功后,MetaStudio智能交互服务已准备就绪,会发送START_CHAT命令给第三方应用。第三方应用接收到START_CHAT命令后,用户开始发送文本驱动命令。 详细交互流程如下所示: 用户请求建立与数字人对话的WebSocket连接。 代码示例如下所示:
对下载的SDK安装包进行完整性校验,判断下载过程是否存在篡改和丢包现象。 操作步骤 参考下载SDK安装包,下载SDK安装包至本地。 打开本地命令运行程序,输入如下命令,在本地生成SDK安装包的SHA256值。 其中,“D:\HwICSUiSdk-1.0.0.zip”为SDK安装包的本地存放路径及安装包名称,请根据实际情况修改。
见《用户指南》的“创建智能交互数字人”章节。 chat_id 是 String 对话ID。 command 是 String 操作命令。 包含如下命令: TEXT_DRIVE:文本驱动 INTERRUPT_CHAT:中断对话 STOP_CHAT:停止对话 data 是 ChatReqDataInfo
SDK为了方便用户集成使用,会同时包含UI相关资源。 speechRecognized和semanticRecognized通知的流式返回有什么差异? 差异如下所示: speechRecognized的流式返回是覆盖式返回。后一条通知中的text字段值包含前一条通知的内容。例如:第一条通知的text值为“你吃”,第二
销毁交互任务。 【请求参数】 无 【返回参数】 无 【代码示例】 HwICSUiSdk.destroy(); getJobInfo (static) getJobInfo(): Promise<JobInfo> 【功能说明】 获取交互任务信息。 【请求参数】 无 【返回参数】 表7 JobInfo
状态码 调用数字内容生产线API时,可能返回的状态码如表1 状态码所示。 表1 状态码 返回值 说明 200 OK 请求正常。 201 Created 创建类的请求完全成功。 202 Accepted 已经接受请求,但未处理完成。 204 No Content 请求完全成功,同时HTTP响应不包含响应体。
特征与表情基系数的关系。 用户使用时,输入音频流或音频文件。 音频经过安全审核后,进入下一步操作,否则不返回结果。 对音频特征提取后,获取音频特征,再通过算法将音频特征转换为表情基系数。 返回结果数据。 算法应用场景 数字人语音驱动算法可用于短视频制作、直播、交互等场景。在特定场
"question_list" : [ { "question" : "你叫什么名字" } ] } 响应示例 状态码: 200 处理成功返回。 { "intent_id" : "dce6e2196d02471b83ec48e31dea550c", "identify" :
创建高级版语音训练任务 功能介绍 用户创建语音训练高级版任务,该接口会返回一个obs上传地址,用于上传语音文件。 语音文件为一段WAV格式的长音频文件,仅支持将语音文件打包成zip压缩格式上传。 文件上传后,调用“提交语音训练任务”接口,启动审核和训练。 调用方法 请参见如何调用API。
"skill_id" : "39b9cedccec1f19b33d8f7ce1a6d35b9" } 响应示例 状态码: 200 处理成功返回。 { "intent_id" : "dce6e2196d02471b83ec48e31dea550c", "identify" :
com/v1/70b76xxxxxx34253880af501cdxxxxxx/digital-human-chat/once-code 响应示例 状态码: 200 处理成功返回。 { "once_code" : "OATAXWpTNDPGjVyzxNLKvumcv297Q7uUz5CCltLtFDE1uqnPAPmS4jm61XnMQGuV"
创建进阶版语音训练任务 功能介绍 用户创建语音训练进阶版任务,该接口会返回一个obs上传地址,用于上传语音文件。 支持2种方式上传语音文件: 语音文件和文本文件打包成zip上传:语音文件已经切分成100个wav文件,每个语音文件对应一个txt文本文件,所有文件打包成zip文件。语音文件命名规则:0
"业务咨询", "identify" : "SKILL_BUSINESS_CONSULT" } 响应示例 状态码: 200 处理成功返回。 { "skill_id" : "39b9cedccec1f19b33d8f7ce1a6d35b9", "identify" :
创建基础版语音训练任务 功能介绍 用户创建语音训练基础版任务,该接口会返回一个obs上传地址,用于上传语音文件。 支持2种方式上传语音文件: 语音文件和文本文件打包成zip上传:语音文件已经切分成20个wav文件,每个语音文件对应一个txt文本文件,所有文件打包成zip文件。语音文件命名规则:0
人模型资产名称。 contact 否 String 分身数字人训练任务创建者的手机号。 command_message 否 String 命令类型: UPDATE_VIDEO: 更新视频 UPLOAD_VIDEO:上传视频 CONFIRM_ACTION_VIDEO: 确认动作编排视频
附录 状态码 错误码 获取项目ID 获取账号ID 直播控制HTTP Command命令说明 直播控制RTSA Command命令说明 文本驱动SSML定义 系统资产标签定义 服务支持的字体 资源类型 使用Java代码生成文件内容的MD5值