检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
查询热点问题详情 功能介绍 该接口用于查询热点问题详情。 调用方法 请参见如何调用API。 URI GET /v1/{project_id}/digital-human-chat/hot-question/{hot_question_id} 表1 路径参数 参数 是否必选 参数类型
修改热点问题 功能介绍 该接口用于修改热点问题。 调用方法 请参见如何调用API。 URI PUT /v1/{project_id}/digital-human-chat/hot-question/{hot_question_id} 表1 路径参数 参数 是否必选 参数类型 描述
复制视频制作剧本 功能介绍 该接口用于复制视频制作剧本。 调用方法 请参见如何调用API。 URI POST /v1/{project_id}/digital-human-video-scripts/{script_id}/copy 表1 路径参数 参数 是否必选 参数类型 描述
创建TTS试听任务 功能介绍 该接口用于创建生成播报内容的语音试听文件任务。 第三方音色试听需要收费,收费标准参考:https://marketplace.huaweicloud.com/product/OFFI919400645308506112#productid=OFFI919400645308506112
结束数字人智能交互任务 功能介绍 该接口用于结束数字人智能交互任务。 调用方法 请参见如何调用API。 URI POST /v1/{project_id}/digital-human-chat/smart-chat-rooms/{room_id}/smart-chat-jobs/{job_id}/stop
创建TTS异步任务 功能介绍 该接口用于对外生成音频文件 使用本接口前,需要在MetaStudio控制台服务概览页面,开通“声音合成”的按需计费。 详细操作为:单击“声音合成”卡片中的“去开通”,在弹出的“开通按需计费服务提示”对话框中,勾选同意协议。单击“确定”,开通按需计费。
查看租户资源列表 功能介绍 查看租户资源列表。 按需套餐包用量本接口无法查询,需要调用CBC接口查询。按需套餐包用量查询和查询资源包信息。 各种资源的计费方式请参考计费说明。 调用方法 请参见如何调用API。 URI GET /v1/{project_id}/tenants/resources
创建基础版语音训练任务 功能介绍 用户创建语音训练基础版任务,该接口会返回一个obs上传地址,用于上传语音文件。 支持2种方式上传语音文件: 语音文件和文本文件打包成zip上传:语音文件已经切分成20个wav文件,每个语音文件对应一个txt文本文件,所有文件打包成zip文件。语音文件命名规则:0
查询欢迎词详情 功能介绍 该接口用于查询欢迎词详情。 调用方法 请参见如何调用API。 URI GET /v1/{project_id}/digital-human-chat/welcome-speech/{welcome_speech_id} 表1 路径参数 参数 是否必选 参数类型
启动数字人智能直播任务 功能介绍 该接口用于启动数字人智能直播任务。 调用方法 请参见如何调用API。 URI POST /v1/{project_id}/smart-live-rooms/{room_id}/smart-live-jobs 表1 路径参数 参数 是否必选 参数类型
修改欢迎词 功能介绍 该接口用于修改欢迎词。 调用方法 请参见如何调用API。 URI PUT /v1/{project_id}/digital-human-chat/welcome-speech/{welcome_speech_id} 表1 路径参数 参数 是否必选 参数类型 描述
创建进阶版语音训练任务 功能介绍 用户创建语音训练进阶版任务,该接口会返回一个obs上传地址,用于上传语音文件。 支持2种方式上传语音文件: 语音文件和文本文件打包成zip上传:语音文件已经切分成100个wav文件,每个语音文件对应一个txt文本文件,所有文件打包成zip文件。语音文件命名规则:0
系统资产标签定义 查询资产列表接口支持使用“tags”标签对分身数字人模型进行分类。 “tags”取值及其含义,如表1所示。 表1 tags标签说明 tags取值类型 说明 数字人类型 取值如下: VIRTUAL_AVATARS:分身数字人 VIRTUAL_HUMANS:虚拟数字人
文本驱动SSML定义 MetaStudio语音驱动采用语音合成标记语言(SSML,Speech Synthesis Markup Language)来控制数字人的行为,包括动作、情绪以及TTS语音合成的多音字、停顿等。 SSML基础定义可参考语音合成标记语言版本 1.0。Meta
智能交互支持富媒体吗? 支持的富媒体格式 用户与数字人进行智能交互问答时,支持展示如下格式的富媒体: 图片:JPG、PNG、BMP、GIF、SVG。 视频:MP4。 导入富媒体操作 支持通过问答库导入富媒体。以奇妙问知识库为例,参考新增知识库,补充富媒体知识,示例如表1所示。 如
资源类型 MetaStudio计费中涉及的资源类型,包括商用资源类型、POC测试用需管理员分配的资源类型。 表1 商用资源类型(租户订购) 类别 资源名称 单位 计费模式 资源类型编码 备注 分身数字人 形象制作 个 一次性 hws.resource.type.metastudio
常见问题 智能交互SDK安装包里为什么有图片资源? SDK里面包含图片资源,是因为智能交互的动效、背景可能需要图片资源才能展示更好的效果。所以智能交互Web SDK为了方便用户集成使用,会同时包含UI相关资源。 speechRecognized和semanticRecognized通知的流式返回有什么差异?
智能交互素材操作详情 智能交互界面支持添加角色、背景、对话等素材。本节提供各类素材的详细操作过程。 角色 角色界面详情,如图1所示。 图1 角色界面 角色界面说明,如表1所示。 表1 界面元素说明 界面元素 说明 定制数字人 单击“定制数字人”,跳转至形象制作页面,界面详情和操作指导,详见创建分身数字人定制任务。
直播控制RTSA Command命令说明 直播控制RTSA Command命令详细说明,如下所示: 数字人直播状态变化图 RTSA Command定义 数字人直播状态变化图 数字人直播状态变化流程图,如图1所示。 图1 直播状态变化流程图 流程图说明,如下所示: PREPROCE
肢体驱动数据格式如何定义? MetaStudio肢体驱动数据的前三个为Hips骨骼的Translation信息,按XYZ排列,后接75根骨骼的旋转数据,具体定义如下: 序号 骨骼名称 0 Hips 1 Spine 2 Spine1 3 Spine2 4 Spine3 5 Neck