正在生成
详细信息:
检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
setConfig(config: ConfigMap): void 【功能说明】 设置配置项,用于控制是否显示字幕或交互按钮。 【请求参数】 表4 config 参数 是否必须 默认值 类型 描述 config 是 - ConfigMap 配置信息,请参见表5。 表5 ConfigMap 参数 是否必须 默认值
SDK下载 下载SDK安装包 完整性校验 父主题: 智能交互客户端SDK
配置对话机器人服务CBS 在对话机器人服务配置问答机器人。MetaStudio创建对话时,如果“第三方应用”需要选择“华为云CBS”时,才需要执行本节操作,详情请参考表1。 操作步骤 登录MetaStudio控制台。 单击界面左上角的图标,在弹出的浮动框中,搜索“对话机器人服务 CBS”,如图1所示。
digital human config info. 资产信息无效,请检查数字人的ID配置。 20010053 Invalid command, please check your command. 非法command命令,请检查你的command参数。 20010056 2d digital
场景说明 智能交互包含如下场景: 场景一:用户开箱即用的智能交互数字人场景。 在MetaStudio控制台完成交互配置,包括LLM或者大模型配置,通过Web页面浏览,无需开发。 图1 智能交互 场景二:用户使用第三方语言模型,自主开发API实现与数字人对话场景。 开发者基于智能交
object 视频输出配置。 play_policy 否 PlayPolicy object 剧本播放策略 output_urls 否 Array of strings 参数解释: RTMP视频推流第三方直播平台地址。 说明: 直播过程中刷新地址,需要调用COMMAND命令REFRESH_OUTPUT_URL。
进行智能交互时,透明背景支持的浏览器及其版本,详见客户端SDK参考-快速入门-表3。 对话 配置对话,可以设置数字人欢迎语和热点问题,方便用户与数字人进行交互问答。执行对话配置前,需要完成应用创建操作。 配置对话的详细操作,如下所示: 登录MetaStudio控制台,单击“智能交互”,如图3所示。
图层位置配置。 size LayerSizeConfig object 图层大小配置。 image_config ImageLayerConfig object 素材图片图层配置。 video_config VideoLayerConfig object 素材视频图层配置。 text_config
图层位置配置。 size LayerSizeConfig object 图层大小配置。 image_config ImageLayerConfig object 素材图片图层配置。 video_config VideoLayerConfig object 素材视频图层配置。 text_config
String 第三方用户ID。不允许输入中文。 表3 请求Body参数 参数 是否必选 参数类型 描述 command 是 String 命令名称。 BODY_POS_RESET:视觉驱动复位 HIPS_POS_ADJUST:模型位移调整 EYE_POS:眼神锁定/解锁 SKEL
表情驱动数据格式如何定义? MetaStudio表情驱动的表情基数据总共52个系数,每个系数的取值范围在0~1之间,表情基系数的顺序性定义如下: 序号 表情名称 0 mouthPucker 1 mouthPressLeft 2 mouthPressRight 3 mouthRollUpper
常见问题 智能交互SDK安装包里为什么有图片资源? SDK里面包含图片资源,是因为智能交互的动效、背景可能需要图片资源才能展示更好的效果。所以智能交互Web SDK为了方便用户集成使用,会同时包含UI相关资源。 speechRecognized和semanticRecognized通知的流式返回有什么差异?
视频直播限制 分身数字人直播限制,如下所示: 直播间配置约束 直播任务退出说明 直播播放说明 直播内容审核说明 直播间配置约束 直播间配置限制,如表1所示。 表1 直播间限制 直播间配置 限制 多场景配置 每个单场景,如果通过“文本驱动”方式生成语音时,所有段落汇总的文字数量需大于200字。
目前MetaStudio提供了Java、Python和Go语言SDK供开发者使用,如表1所示。您可以在GitHub仓库查看SDK更新历史、获取安装包以及查看指导文档。 SDK已知安全漏洞及修复版本、规避方案,请单击表1中的SDK对应语言的Github地址进行查看。 表1 服务端SDK
LiveEventCallBackConfig object 直播事件HTTPS回调通知配置 rtc_callback_config 否 RTCLiveEventCallBackConfig object RTC回调事件配置。兼容处理,未携带配置则默认订阅LIVE_PROGRESS review_config
接口,实现智能交互能力。 这里配置的是MetaStudio服务调用第三方语言模型的API地址。 流式响应 MetaStudio智能交互服务提供流式问答(响应更快)和非流式问答两种方式,第三方语言模型可以选择其中一种响应方式。 多轮语境理解能力 配置数值越高,问答请求携带的历史对话个数越多,语境理解能力更强。
智能交互限制 智能交互对硬件设备的最低配置要求,如表1所示。 表1 硬件设备要求 硬盘配置 最低配置 CPU i5及以上版本。 内存 8G以上。 硬盘 128G及以上。 操作系统 Windows或Android系统。 麦克风 需要有麦克风,且要保障1米以内的拾音效果。 扬声器 需要有扬声器。
应用创建成功,自动进入新增应用的“应用配置”页面。 配置应用 在界面上方的主菜单中,单击“我的应用”。 单击新增应用所在行的图标,进入“应用配置”页面。 图3 应用配置页面 配置“自然语言模型”,保持默认值“AIUI通用语义模型”。 单击“管理技能配置”,弹出“配置应用需要的技能”对话框,如图4所示。
如图8所示。 图8 构建发布 配置应用 在界面上方的主菜单中,单击“我的应用”。 单击新增应用所在行的图标,进入“应用配置”页面。 图9 应用配置页面 配置“自然语言模型”,从下拉框中选择“星火交互认知大模型”。 单击“管理技能配置”,弹出“配置应用需要的技能”对话框,如图10所示。
操作步骤 登录MetaStudio控制台。 在“工作台”界面,单击“照片数字人”,进入照片数字人制作页面,如图1所示。 界面左侧展示配置项,右侧展示预览效果。配置操作,请参考表1。 图1 照片数字人制作页面 表1 界面操作说明 区域 参数 说明 01 请上传您的照片 人像照片 单击“查看