检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
获取语音驱动数据 功能介绍 该接口用于获取生成的数字人驱动数据,包括语音、表情、动作等。 调用方法 请参见如何调用API。 URI GET /v1/{project_id}/ttsa-jobs/{job_id} 表1 路径参数 参数 是否必选 参数类型 描述 project_id
查询分身数字人视频制作任务详情 功能介绍 该接口用于查询分身数字人视频制作任务详情。 调用方法 请参见如何调用API。 URI GET /v1/{project_id}/2d-digital-human-videos/{job_id} 表1 路径参数 参数 是否必选 参数类型 描述
修订记录 表1 修订记录 修改时间 修改说明 2024-12-30 本次变更如下: 新增发布3.0.1版本SDK,相比2.2.0版本,变更点如下所示: 新增语音唤醒能力,详见Web语音唤醒。 新增接口initResourcePath,支持设置语音唤醒算法以及资源路径,保证正常使用语音唤醒能力
查询知识库技能详情 功能介绍 该接口用于查询知识库技能详情。 调用方法 请参见如何调用API。 URI GET /v1/{project_id}/digital-human-chat/knowledge/skill/{skill_id} 表1 路径参数 参数 是否必选 参数类型 描述
查询欢迎词详情 功能介绍 该接口用于查询欢迎词详情。 调用方法 请参见如何调用API。 URI GET /v1/{project_id}/digital-human-chat/welcome-speech/{welcome_speech_id} 表1 路径参数 参数 是否必选 参数类型
查询安抚话术详情 功能介绍 该接口用于查询安抚话术详情。 调用方法 请参见如何调用API。 URI GET /v1/{project_id}/digital-human-chat/pacify-words/{pacify_words_id} 表1 路径参数 参数 是否必选 参数类型
修改欢迎词 功能介绍 该接口用于修改欢迎词。 调用方法 请参见如何调用API。 URI PUT /v1/{project_id}/digital-human-chat/welcome-speech/{welcome_speech_id} 表1 路径参数 参数 是否必选 参数类型 描述
修改安抚话术 功能介绍 该接口用于修改安抚话术。 调用方法 请参见如何调用API。 URI PUT /v1/{project_id}/digital-human-chat/pacify-words/{pacify_words_id} 表1 路径参数 参数 是否必选 参数类型 描述
创建进阶版语音训练任务 功能介绍 用户创建语音训练进阶版任务,该接口会返回一个obs上传地址,用于上传语音文件。 支持2种方式上传语音文件: 语音文件和文本文件打包成zip上传:语音文件已经切分成100个wav文件,每个语音文件对应一个txt文本文件,所有文件打包成zip文件。语音文件命名规则
更新视频制作剧本 功能介绍 该接口用于更新视频制作剧本。 调用方法 请参见如何调用API。 URI PUT /v1/{project_id}/digital-human-video-scripts/{script_id} 表1 路径参数 参数 是否必选 参数类型 描述 project_id
创建照片分身数字人视频制作任务 功能介绍 该接口用于创建照片分身数字人视频制作任务。 调用方法 请参见如何调用API。 URI POST /v1/{project_id}/photo-digital-human-videos 表1 路径参数 参数 是否必选 参数类型 描述 project_id
创建科大讯飞应用(星火交互认知大模型) 在科大讯飞创建星火交互认知大模型的应用。详细操作如下所示: 星火交互认知大模型应用,不支持直接切换为AIUI通用语义模型,不适用。建议参考创建科大讯飞应用(AIUI通用语义模型)单独为其创建应用。 创建应用 (可选)创建问答库 配置应用 查看应用信息
系统资产标签定义 查询资产列表接口支持使用“tags”标签对分身数字人模型进行分类。 “tags”取值及其含义,如表1所示。 表1 tags标签说明 tags取值类型 说明 数字人类型 取值如下: VIRTUAL_AVATARS:分身数字人 VIRTUAL_HUMANS:虚拟数字人
语音同步合成WebSocket接口 前提条件 本接口目前仅支持“华北-北京四”和“华东-上海一”区域使用,且必须提交工单申请开通后才能使用。 使用本接口前,需要在MetaStudio控制台服务概览页面,开通“声音合成”的按需计费。 详细操作为:单击“声音合成”卡片中的“去开通”,在弹出的
算法备案公示 下述内容为MetaStudio服务提供的算法备案信息、基本原理、运行机制和目的意图等内容,以保障用户的知情权,方便用户更好的选择和使用MetaStudio服务。 华为云MetaStudio分身数字人驱动算法 表1 分身数字人驱动算法 算法项 描述 算法名称 华为云MetaStudio
智能交互驱动WebSocket接口 终端节点获取方式 智能交互驱动WebSocket接口终端节点的获取方式,如表1所示。 表1 终端节点获取方式 场景 获取方式 未通过WEB SDK调用场景 终端节点地址从接口StartSmartChatJob.xml的响应参数chat_access_address
构造请求 本节介绍REST API请求的组成,并以调用IAM服务的管理员创建IAM用户来说明如何调用API,该API获取用户的Token,Token可以用于调用其他API时鉴权。 您还可以通过这个视频教程了解如何构造请求调用API:https://bbs.huaweicloud.com
文本驱动SSML定义 MetaStudio语音驱动采用语音合成标记语言(SSML,Speech Synthesis Markup Language)来控制数字人的行为,包括动作、情绪以及TTS语音合成的多音字、停顿等。 SSML基础定义可参考语音合成标记语言版本 1.0。MetaStudio
智能交互支持富媒体吗? 支持的富媒体格式 用户与数字人进行智能交互问答时,支持展示如下格式的富媒体: 图片:JPG、PNG、BMP、GIF、SVG。 视频:MP4。 导入富媒体操作 支持通过问答库导入富媒体。以奇妙问知识库为例,参考新增知识库,补充富媒体知识,示例如表1所示。 如果使用服务提供
状态码 调用数字内容生产线API时,可能返回的状态码如表1 状态码所示。 表1 状态码 返回值 说明 200 OK 请求正常。 201 Created 创建类的请求完全成功。 202 Accepted 已经接受请求,但未处理完成。 204 No Content 请求完全成功,同时HTTP