检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
单击“安全性与隐私”图标,如图1所示。进入“安全性与隐私”界面。 图1 系统偏好设置 选择“隐私”页签。在左侧目录树中,单击“麦克风”,如图2所示。 将需要使用麦克风的应用设置为允许。 图2 安全性与隐私 父主题: 接口参考
连接,用来实现对话功能。操作请参考智能交互驱动。 图2 创建应用 表1 创建应用 参数 说明 第三方应用 请从下拉框中选择“第三方驱动”。 应用名称 用户根据实际情况自定义即可。 图3 操作流程图 单击“确定”,创建应用。 (可选)创建对话,操作请参考对话。 单击界面右上角的“发布”,发布数字人智能交互对话。
默认值:120。 单击“去设置”,弹出“智能交互”对话框,如图2所示。 需要创建智能交互应用,详细的参数配置说明如表2所示。 图2 智能交互 表2 创建应用 参数 说明 第三方应用 选择“第三方语言模型”。 应用名称 用户根据实际情况自定义即可。 APPID MetaStudio服务对接第
0秒未收到第三方应用的TEXT_DRIVE命令或PING命令,MetaStudio将主动关闭WebSocket连接。 会话任务结束 MetaStudio智能对话服务结束时,如:应用或其对话页面关闭。MetaStudio将发送JOB_FINISHED命令给第三方应用,并关闭WebSocket连接。
创建智能交互数字人(科大讯飞) 前提条件 创建技能 创建科大讯飞应用(AIUI通用语义模型) 创建科大讯飞应用(星火交互认知大模型) (可选)提升问答交互次数 创建智能交互数字人 父主题: 智能交互
什么是数字内容生产线 数字内容生产线(MetaStudio)解决方案,提供数字人视频与直播、智能交互等服务,使能千行百业场景应用。 应用场景 教育:数字人课件制作、虚拟老师教学。 政府及公共事业:数字人代言、数字人宣讲、数字人会议等。 医疗健康:智能医疗客服、虚拟医生培训等。 金
20次/秒 10次/秒 10次/秒 智能交互数字人应用管理 创建应用 5次/秒 3次/秒 - 查询应用列表 20次/秒 10次/秒 10次/秒 查询应用详情 20次/秒 10次/秒 10次/秒 修改应用 5次/秒 10次/秒 - 删除应用 5次/秒 3次/秒 - 智能交互数字人鉴权码管理
huaweicloud.sdk.metastudio.v1.model.*; public class ConfirmFileUploadSolution { public static void main(String[] args) { // The
String 输出数据的格式版本,如请求中无此参数,则输出数据格式为1.0,可选值有: 1.0: 对应的输出为: 动作数据:75个骨骼旋转值 表情数据:52ARkit表情及参数 2.0: 对应的输出为: 动作数据:55个骨骼旋转值+骨骼3D坐标 表情数据:178个控制器的数据 响应参数 状态码:
客户端SDK参考-快速入门-表3。 对话 配置对话,可以设置数字人欢迎语和热点问题,方便用户与数字人进行交互问答。执行对话配置前,需要完成应用创建操作。 配置对话的详细操作,如下所示: 登录MetaStudio控制台,单击“智能交互”,如图3所示。 图3 MetaStudio控制台页面
替换更新至视频直播的当前场景中。 在视频直播画面预览区域,如果存在多种素材,支持对数字人进行图层管理,如:上移一层、下移一层、置顶、置底、应用到全局、删除等。还支持设置大小,拖动位置。 将鼠标放在数字人上方,数字人右上角展示图标。单击图标,可以将数字人更新至当前视频直播的所有场景中。
智能交互管理 智能交互数字人对话管理 智能交互数字人对话任务管理 智能交互数字人应用管理 智能交互数字人鉴权码管理 智能交互数字人激活码管理 智能交互数字人知识库技能管理 智能交互数字人知识库意图管理 智能交互数字人知识库问法管理 智能交互数字人欢迎词管理 智能交互数字人热点问题管理
插入音乐 将鼠标放在音乐上方,右上角展示图标。单击图标,添加至视频草稿的所有场景中,作为视频的背景音乐。 取消应用 如果音乐已添加为视频的背景音乐,可单击音乐右上角的“取消应用”,取消使用。 文本 文本界面详情,如图8所示。 图8 文本界面 文本界面说明,如表7所示。 表7 界面元素说明
越业界。 应用场景 华为云Flexus版数字人为中小企业提供了一种高效、经济的解决方案,覆盖了教育、医疗、广电传媒和电商等多个行业场景。中小企业对换背景诉求较低,Flexus版可短平快地解决客户应用需求,助力企业在数字化竞争中取得优势。 教育领域 数字人技术的重要应用之一。在教育
打开简易录音机软件,单击底部的“播放”菜单,进入“播放”页面。 单击界面右上方的“编辑”,进入音频文件编辑页面。 选中所有的音频文件,单击“分享”,可选择隔空投送或其他第三方应用导出音频文件至PC中。 一个长音频文件无需压缩,可直接上传至MetaStudio控制台,进行声音训练。 安卓手机 安卓手机推荐下载软件“超级录音机”进行录音,如图2所示。
data 是 ChatReqDataInfo object 对话请求数据信息。 表7 ChatReqDataInfo 参数 是否必选 参数类型 描述 text 是 String 文本信息。 seq 否 Integer 数据包序号。 is_last 否 Boolean 判断是否为最后一个文本。
智能交互对话ID,获取方法请参考创建智能交互对话直播间。 表2 Query参数 参数 是否必选 参数类型 描述 robot_id 是 String 应用ID,获取方法请参考创建应用。 请求参数 表3 请求Header参数 参数 是否必选 参数类型 描述 X-Auth-Token 否 String 用户T
String 输出数据的格式版本,如请求中无此参数,则输出数据格式为1.0,可选值有: 1.0: 对应的输出为: 动作数据:75个骨骼旋转值 表情数据:52ARkit表情及参数 2.0: 对应的输出为: 动作数据:55个骨骼旋转值+骨骼3D坐标 表情数据:178个控制器的数据 状态码: 400
String 输出数据的格式版本,如请求中无此参数,则输出数据格式为1.0,可选值有: 1.0: 对应的输出为: 动作数据:75个骨骼旋转值 表情数据:52ARkit表情及参数 2.0: 对应的输出为: 动作数据:55个骨骼旋转值+骨骼3D坐标 表情数据:178个控制器的数据 状态码: 400
MetaStudio提供形象制作、声音定制、分身形象视频制作、分身形象视频直播、分身形象名片制作、智能交互等能力,如表1所示。 表1 功能特性 功能名称 功能描述 应用场景 形象制作 拍摄真人视频,建模生成分身形象。 作为虚拟形象使用,如虚拟主播、虚拟主持、虚拟客服、虚拟老师等。 声音制作 录制真人声音,