可视化大屏AI虚拟人插件-
版本: V1.0 | 交付方式: License |
适用于: Windows/Linux/Android/iOS/Unix/其他 | 上架日期: 2024-08-06 01:01:25 |
商品构成
整个交互系统由以下部分组成,作用分别说明如下:
类别 | 条目 | 描述 |
客户端软件 | 3D 虚拟人 形象 | 支持写实、美型、卡通等多种风格的数字人形象 |
客户端SDK插件 | 支持H5、Unity、Unreal Engine等多个平台插件 | |
服务端软件 | AI虚拟人驱动算法服务(STA) | 含中文口型对齐、动作分析、情绪分析服务 |
语音识别 服务(ASR) | 中文普通话语音识别服务 | |
语音合成 服务( TTS ) | 中文普通话语音合成服务 | |
智能问答服务(NLP) | 中文单轮问答知识库的录入、编辑、训练、发布服务 |
安装调试
客户购买本商品后,需要进行几方面的准备工作:
1)客户需按照本商品供应商提出的要求提供私有化部署的硬件设备,本商品供应商则进一步将服务端软件部署在相关硬件设备上;
2)客户安排内部开发人员进行SDK对接,将合适平台下的AI虚拟人SDK插件集成到自己的可视化大屏应用中去,目前支持的SDK平台包括H5、Unity、Unreal Engine等;
3)客户指派内部运营人员登录服务端运营工具,构建自己的FAQ知识库,并完成一键训练和一键发布。特别地,如客户需要虚拟人形象定制、音色定制、知识库定制(表格图谱、文档问答、任务型多轮对话)、接入自有大语言模型等增值服务,可向本产品的技术供应商咨询并获取相关服务。
用户操作
在完成系统的安装调试后,用户即可按照以下操作流程与虚拟人进行互动:
1)启动可视化大屏和AI虚拟人服务;
2)按照软件交付自行选择的语音输入方式(语音唤醒、鼠标触发录音、手机扫码接管中的一种)与AI虚拟人进行互动;
3)互动内容的范围为在服务端运营工具所配置的知识领域;
4)互动期间可通过键盘热键触发特定话术播报,也可以通过键盘操作控制人物移动;
5)互动结束后退出AI虚拟人服务及系统。
功能说明
本商品具备的功能说明如下:
- 虚拟人形象配置
1)支持从形象库中选择不同性别、年龄、风格的虚拟人形象;
2)支持为虚拟人形象配置不同的音色。
- 虚拟人交互方式
1)支持客户从语音唤醒、鼠标触发录音、手机扫码接管等三种输入方式中选择一种最适合自身场景的方案;
2)支持为后台配置的常用话术配置键盘快捷键,并可以随时使用按键触发。
- 虚拟人智能问答
1)支持客户自行录入和训练自己的FAQ知识库;
2)支持接入用户提供的NLP知识库或大语言模型;
3)支持表格图谱类型知识库的定制;
4)支持文档问答类型知识库的定制;
5)支持任务型多轮对话的定制。
- 虚拟人智能驱动
1)口型对齐及驱动:通过口型对齐引擎对TTS语音进行分析,得到口型对齐结果,并驱动虚拟人口型变化;
2)行为分析及驱动:通过行为分析引擎对TTS文字进行分析,得到动作分析结果,并驱动虚拟人动作表现;
3)情绪分析及驱动:通过情绪分析引擎对TTS文字进行分析,得到情绪分析结果,从而影响虚拟人在对话过程中的情感状态, 并与肢体动作协调一致。
- 虚拟人人工控制
1)通过键盘可控制3D虚拟人播报后台配置过的特定话术,从而灵活配置欢迎语、结束语等内容;
2)通过键盘可控制3D虚拟人按照特定的路径进行移动,从而提高虚拟人交互的表现力。