检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
修订记录 表1 修订记录 修改时间 修改说明 2024-12-30 第十四次正式发布 本次变更如下: 语音合成管理接口组,新增接口:设置TTS租户级自定义读法配置、获取TTS租户级自定义读法配置、删除TTS租户级自定义读法配置、修改TTS租户级自定义读法配置。 2024-12-05
智能交互限制 智能交互对硬件设备的最低配置要求,如表1所示。 表1 硬件设备要求 硬件配置 最低配置 CPU i5及以上版本。 内存 8G以上。 硬盘 128G及以上。 操作系统 Windows或Android系统。 麦克风 需要有麦克风,且要保障1米以内的拾音效果。 扬声器 需要有扬声器
使用前必读 数字内容生产线(MetaStudio)解决方案,提供数字人视频与直播、智能交互等服务,使能千行百业场景应用。 您可以使用本文档提供的API对华为云MetaStudio服务进行相关操作,如形象制作、声音制作、视频制作等。支持的全部操作请参见API概览。 在调用华为云MetaStudio
智能直播间管理 创建智能直播间 查询智能直播间列表 查询智能直播剧本详情 更新智能直播间信息 删除智能直播间 创建智能直播间互动规则库 查询智能直播间互动规则库列表 更新智能直播间互动规则库 删除智能直播间互动规则库 父主题: 分身视频直播
配置对话机器人服务CBS 在对话机器人服务配置问答机器人。MetaStudio创建对话时,如果“第三方应用”需要选择“华为云CBS”时,才需要执行本节操作,详情请参考表1。 操作步骤 登录MetaStudio控制台。 单击界面左上角的图标,在弹出的浮动框中,搜索“对话机器人服务 CBS
智能交互管理 智能交互数字人对话管理 智能交互数字人对话任务管理 智能交互数字人应用管理 智能交互数字人鉴权码管理 智能交互数字人激活码管理 智能交互数字人知识库技能管理 智能交互数字人知识库意图管理 智能交互数字人知识库问法管理 智能交互数字人欢迎词管理 智能交互数字人安抚话术管理
数字人相关问题 数字人相关问题集合,如表1所示。 表1 数字人问题 序号 问题 答案 1 数字人支持换脸吗? 不支持。 2 数字人支持换衣服吗? 不支持。 3 数字人支持添加动作吗? 需要同时满足下述2个条件,才可以添加动作: 提交工单申请开通动作编排能力。 生成数字人的形象采集训练视频需要包含动作编排
数字人相关问题 数字人相关问题集合,如表1所示。 表1 数字人问题 序号 问题 答案 1 数字人支持换脸吗? 不支持。 2 数字人支持换衣服吗? 不支持。 3 数字人支持添加动作吗? 需要同时满足下述2个条件,才可以添加动作: 提交工单申请开通动作编排能力。 生成数字人的形象采集训练视频需要包含动作编排
API使用限制 使用API调用声音的限制说明 用户使用视频直播或智能交互接口调用音色时,需要先确认能否在MetaStudio控制台的视频直播间编辑界面或智能交互对话设置页面,选到当前音色。 如果界面正常展示且可以选择此音色使用,说明接口可以正常调用此音色,否则接口无法调用。 API
API概览 华为云MetaStudio服务对应的接口列表如下所示,在调用API前,您需要先获取用户Token,Token可以用于调用其他API时鉴权,具体如何调用API请参考应用示例。 数字资产管理 表1 数字资产管理接口 接口 说明 POST /v1/{project_id}/digital-assets
在科大讯飞平台创建应用(星火交互认知大模型) 在科大讯飞AIUI开放平台,创建星火交互认知大模型的应用。 星火交互认知大模型应用,不支持直接切换为AIUI通用语义模型。因为已配置内容不适用,建议参考在科大讯飞平台创建应用(AIUI通用语义模型)单独为其创建应用。 详细操作如下所示,
创建高级版语音训练任务 功能介绍 用户创建语音训练高级版任务,该接口会返回一个obs上传地址,用于上传语音文件。 语音文件为一段WAV格式的长音频文件,仅支持将语音文件打包成zip压缩格式上传。 文件上传后,调用“提交语音训练任务”接口,启动审核和训练。 调用方法 请参见如何调用API
查询语音训练任务详情 功能介绍 查询语音训练任务详情 调用方法 请参见如何调用API。 URI GET /v1/{project_id}/voice-training-manage/user/jobs/{job_id} 表1 路径参数 参数 是否必选 参数类型 描述 project_id
创建基础版语音训练任务 功能介绍 用户创建语音训练基础版任务,该接口会返回一个obs上传地址,用于上传语音文件。 支持2种方式上传语音文件: 语音文件和文本文件打包成zip上传:语音文件已经切分成20个wav文件,每个语音文件对应一个txt文本文件,所有文件打包成zip文件。语音文件命名规则
示例1:上传资产 本节提供通过API Explorer和Postman工具,将资产上传至OBS桶的操作。 总体流程 调用创建资产接口创建资产ID。 调用创建文件并获取上传URL接口创建文件ID,并生成文件上传的URL地址。 使用Postman工具,参考OBS的PUT上传接口,将资产文件上传至
创建进阶版语音训练任务 功能介绍 用户创建语音训练进阶版任务,该接口会返回一个obs上传地址,用于上传语音文件。 支持2种方式上传语音文件: 语音文件和文本文件打包成zip上传:语音文件已经切分成100个wav文件,每个语音文件对应一个txt文本文件,所有文件打包成zip文件。语音文件命名规则
查询语音训练任务列表 功能介绍 查询语音训练任务列表 调用方法 请参见如何调用API。 URI GET /v1/{project_id}/voice-training-manage/user/jobs 表1 路径参数 参数 是否必选 参数类型 描述 project_id 是 String
查询数字人名片制作任务详情 功能介绍 该接口用于查询数字人名片制作任务详情。 调用方法 请参见如何调用API。 URI GET /v1/{project_id}/digital-human-business-cards/{job_id} 表1 路径参数 参数 是否必选 参数类型 描述
更新数字人名片制作 功能介绍 该接口用于更新数字人名片制作任务。 调用方法 请参见如何调用API。 URI PUT /v1/{project_id}/digital-human-business-cards/{job_id} 表1 路径参数 参数 是否必选 参数类型 描述 project_id
创建数字人名片制作 功能介绍 该接口用于数字人名片制作任务。 调用方法 请参见如何调用API。 URI POST /v1/{project_id}/digital-human-business-cards 表1 路径参数 参数 是否必选 参数类型 描述 project_id 是 String