在科大讯飞平台创建应用(星火交互认知大模型) 在科大讯飞AIUI开放平台,创建星火交互认知大模型的应用。 星火交互认知大模型应用,不支持直接切换为AIUI通用语义模型。因为已配置内容不适用,建议参考在科大讯飞平台创建应用(AIUI通用语义模型)单独为其创建应用。 详细操作如下所示
机器人ID。 约束限制: reply_mode为INTELLIGENT_REPLY时必填,智能交互配置的大模型机器人ID。 获取方法请参考创建应用。 取值范围: 字符长度0-64位。 默认取值: 不涉及 play_type String 回复播放类型。 APPEND:追加,放置在场景播放队列尾部
示例5:语音合成管理 语音合成管理示例代码,详见MetaStudio数字人语音合成管理。 父主题: 应用示例
示例9:视频制作剧本管理 视频制作剧本管理示例代码,详见MetaStudio数字人视频制作剧本管理。 父主题: 应用示例
示例3:分身形象制作管理 分身形象制作管理示例代码,详见MetaStudio数字人分身形象制作管理。 父主题: 应用示例
查询知识库问法列表 功能介绍 该接口用于查询知识库问法列表。接口使用限制详见API使用限制。 调用方法 请参见如何调用API。 URI GET /v1/{project_id}/digital-human-chat/knowledge/question 表1 路径参数 参数 是否必选
创建知识库意图和问法 功能介绍 该接口用于创建知识库意图和问法。一个意图包含一个主题,一个答案,若干个问法等。接口使用限制详见API使用限制。 调用方法 请参见如何调用API。 URI POST /v1/{project_id}/digital-human-chat/knowledge/intent-question
智能交互数字人知识库技能管理 创建知识库技能 查询知识库技能列表 修改知识库技能 查询知识库技能详情 删除知识库技能 导出知识库技能 父主题: 智能交互管理
示例10:视频制作素材图层管理 视频制作素材图层管理能力,详见MetaStudio数字人图层管理。 父主题: 应用示例
在科大讯飞创建同名技能并导入技能文件:将MetaStudio导出的技能文件导入至科大讯飞的同名技能中。 创建智能交互数字人中的“第三方应用”选择“科大讯飞AIUI通用语义模型”或“科大讯飞星火交互认知大模型”时,才需要执行本节操作。 在MetaStudio控制台创建技能并导出技能文件
基本信息:图片的用途。 图3 上传图片 单击“图片上传”区域,从本地选择需要上传的图片资产。 单击界面右上方的“保存”,在弹出的“资产保存成功”对话框中,单击“知道了”。 资产保存成功后,返回到“我的创作 > 资源 > 已激活”页面,如图4所示。资产上传完成后,默认是已激活状态,可直接在控制台中使用。
智能交互数字人应用管理 创建应用 查询应用列表 查询应用详情 修改应用 删除应用 校验应用 父主题: 智能交互管理
可在直播中返回场景、段落事件的字段,适用于接口调用或客户二次开发使用的场景。 直播间ID 无需设置,当前直播间保存后自动展示。 上述操作完成后,需要单击界面右上角的图标,保存直播内容。 单击界面右下方的“准备开播”,弹出“风险提示”对话框,如图12所示。 用户需要参照风险提示项,逐一核查并优化直播内容。
示例6:语音同步合成WebSocket接口(Android SDK) 语音同步合成WebSocket接口示例,详见语音同步合成Android SDK。 父主题: 应用示例
查询知识库意图列表 功能介绍 该接口用于查询知识库意图列表。接口使用限制详见API使用限制。 调用方法 请参见如何调用API。 URI GET /v1/{project_id}/digital-human-chat/knowledge/intent 表1 路径参数 参数 是否必选
智能交互数字人知识库意图管理 创建知识库意图 查询知识库意图列表 查询知识库意图详情 修改知识库意图 删除知识库意图 创建知识库意图和问法 父主题: 智能交互管理
智能交互数字人知识库问法管理 创建知识库问法 查询知识库问法列表 查询知识库问法详情 修改知识库问法 删除知识库问法 批量创建知识库问法 批量修改知识库问法 父主题: 智能交互管理
台,详见直播平台对接。 :操作回退图标。 :操作恢复图标。 :屏幕布局,默认为“9:16”,可以切换为“16:9”。 :保存图标,图标右侧自动展示最近一次的保存时间。 :清空图标,单击可以一次性清空直播间所有内容。 父主题: 视频直播
示例7:语音同步合成WebSocket接口(iOS SDK) 语音同步合成WebSocket接口示例,详见语音同步合成iOS SDK。 父主题: 应用示例
真人声音录制 客户录制真人音频,上传至MetaStudio进行AI训练,即可得到和真人音色1:1复刻的声音模型。 声音模型可实现文本转语音,应用于数字人视频制作、直播、交互问答等场景中。不同版本录制规格如下: 基础版:整段录制生成一个WAV或MP3格式音频,总时长3~10分钟,建议5分钟。
您即将访问非华为云网站,请注意账号财产安全