检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
创建对话链接 功能介绍 该接口用于创建对话链接。 调用方法 请参见如何调用API。 URI POST /v1/{project_id}/digital-human-chat/create-dialog-url 表1 路径参数 参数 是否必选 参数类型 描述 project_id 是
结束数字人智能交互任务 功能介绍 该接口用于结束数字人智能交互任务。 调用方法 请参见如何调用API。 URI POST /v1/{project_id}/digital-human-chat/smart-chat-rooms/{room_id}/smart-chat-jobs/{job_id}/stop
创建知识库问法 功能介绍 该接口用于创建知识库问法。接口使用限制详见API使用限制。 调用方法 请参见如何调用API。 URI POST /v1/{project_id}/digital-human-chat/knowledge/question 表1 路径参数 参数 是否必选 参数类型
启动数字人智能直播任务 功能介绍 该接口用于启动数字人智能直播任务。 调用方法 请参见如何调用API。 URI POST /v1/{project_id}/smart-live-rooms/{room_id}/smart-live-jobs 表1 路径参数 参数 是否必选 参数类型
查询欢迎词详情 功能介绍 该接口用于查询欢迎词详情。 调用方法 请参见如何调用API。 URI GET /v1/{project_id}/digital-human-chat/welcome-speech/{welcome_speech_id} 表1 路径参数 参数 是否必选 参数类型
修改欢迎词 功能介绍 该接口用于修改欢迎词。 调用方法 请参见如何调用API。 URI PUT /v1/{project_id}/digital-human-chat/welcome-speech/{welcome_speech_id} 表1 路径参数 参数 是否必选 参数类型 描述
批量修改知识库问法 功能介绍 该接口用于批量修改知识库问法。接口使用限制详见API使用限制。 调用方法 请参见如何调用API。 URI PUT /v1/{project_id}/digital-human-chat/knowledge/question-batch 表1 路径参数
创建智能直播间 功能介绍 该接口用于创建智能直播间。 调用方法 请参见如何调用API。 URI POST /v1/{project_id}/smart-live-rooms 表1 路径参数 参数 是否必选 参数类型 描述 project_id 是 String 项目ID,获取方法请参考获取项目ID。
修改安抚话术 功能介绍 该接口用于修改安抚话术。 调用方法 请参见如何调用API。 URI PUT /v1/{project_id}/digital-human-chat/pacify-words/{pacify_words_id} 表1 路径参数 参数 是否必选 参数类型 描述
创建进阶版语音训练任务 功能介绍 用户创建语音训练进阶版任务,该接口会返回一个obs上传地址,用于上传语音文件。 支持2种方式上传语音文件: 语音文件和文本文件打包成zip上传:语音文件已经切分成100个wav文件,每个语音文件对应一个txt文本文件,所有文件打包成zip文件。语音文件命名规则:0
复制资产 功能介绍 该接口用于在Region B复制Region A的指定资产。 调用方法 请参见如何调用API。 URI POST /v1/{project_id}/digital-assets-by-replication-info 表1 路径参数 参数 是否必选 参数类型 描述
文本驱动SSML定义 MetaStudio语音驱动采用语音合成标记语言(SSML,Speech Synthesis Markup Language)来控制数字人的行为,包括动作、情绪以及TTS语音合成的多音字、停顿等。 SSML基础定义可参考语音合成标记语言版本 1.0。Meta
资源类型 MetaStudio计费中涉及的资源类型,包括商用资源类型、POC测试用需管理员分配的资源类型。 表1 商用资源类型(租户订购) 类别 资源名称 单位 计费模式 资源类型编码 备注 分身数字人 形象制作 个 一次性 hws.resource.type.metastudio
快速入门 环境要求 Web SDK运行环境要求,如表1所示。 表1 环境要求 环境项 使用限制 开发工具 Microsoft Visual Studio Code、WebStorm或其他Web IDE开发工具。 语言 Javascript或Typescript。 编译环境 建议Node
直播控制RTSA Command命令说明 直播控制RTSA Command命令详细说明,如下所示: 数字人直播状态变化图 RTSA Command定义 数字人直播状态变化图 数字人直播状态变化流程图,如图1所示。 图1 直播状态变化流程图 流程图说明,如下所示: PREPROCE
API概览 华为云MetaStudio服务对应的接口列表如下所示,在调用API前,您需要先获取用户Token,Token可以用于调用其他API时鉴权,具体如何调用API请参考应用示例。 数字资产管理 表1 数字资产管理接口 接口 说明 POST /v1/{project_id}/digital-assets
常见问题 智能交互SDK安装包里为什么有图片资源? SDK里面包含图片资源,是因为智能交互的动效、背景可能需要图片资源才能展示更好的效果。所以智能交互Web SDK为了方便用户集成使用,会同时包含UI相关资源。 speechRecognized和semanticRecognized通知的流式返回有什么差异?
智能交互公共配置 智能交互界面支持添加角色、背景、对话配置,可参考本节进行操作。 角色 角色界面详情,如图1所示。 图1 角色界面 角色界面说明,如表1所示。 表1 界面元素说明 界面元素 说明 定制数字人 单击“定制数字人”,跳转至形象制作页面,界面详情和操作指导,详见创建分身数字人定制任务。
肢体驱动数据格式如何定义? MetaStudio肢体驱动数据的前三个为Hips骨骼的Translation信息,按XYZ排列,后接75根骨骼的旋转数据,具体定义如下: 序号 骨骼名称 0 Hips 1 Spine 2 Spine1 3 Spine2 4 Spine3 5 Neck
接口参考 主入口(HwICSUiSdk) 事件通知(EventMap) 错误码(ICSError) 授权浏览器麦克风的访问权限 Web语音唤醒 父主题: Web SDK