检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
第三方声音的计费方式,详见购买出门问问套餐包。 标准版视频制作:必须使用标准版形象,声音不支持使用Flexus声音。 按视频制作时长计费,计费项为“分身数字人视频制作”,详见计费说明。 系统声音免费使用。第三方声音的计费方式,详见购买出门问问套餐包。 父主题: 使用限制
购买声音套餐 第三方声音支持的语言类型 购买出门问问声音套餐 父主题: 声音制作
分身视频直播 智能直播间管理 直播任务管理 第三方直播平台管理 直播商品管理
app_key 否 String 第三方语言模型应用密钥。 llm_url 否 String 第三方语言模型地址。 is_stream 否 Boolean 是否采用流式响应。
app_key 否 String 第三方语言模型应用密钥。 llm_url 否 String 第三方语言模型地址。 is_stream 否 Boolean 是否采用流式响应。
声音制作 真人声音录制 声音录制指导文档下载 创建声音制作任务(自研模型) 创建声音制作任务(第三方模型) 查看声音 声音更新记录 购买声音套餐 文案样例(基础版) 文案样例(进阶版) 文案样例(高品质)
智能交互 前提条件 场景说明 创建智能交互数字人(华为云CBS) 创建智能交互数字人(科大讯飞) 创建智能交互数字人(奇妙问) 创建智能交互数字人(第三方语言模型) 创建智能交互数字人(二次开发场景) 智能交互公共配置
app_key 否 String 第三方语言模型应用密钥。 llm_url 否 String 第三方语言模型地址。 is_stream 否 Boolean 是否采用流式响应。
app_id String 第三方应用ID。 app_type Integer 对接第三方应用厂商类型。
app_id String 第三方应用ID。 app_type Integer 对接第三方应用厂商类型。
声音模型不是通用模型,不与第三方服务兼容。用户在MetaStudio制作的模型,仅支持在本服务内使用。 父主题: 使用限制
图1 创建应用 表1 创建应用 参数 说明 第三方应用 从下拉框中选择“第三方驱动”。 应用名称 输入自定义的应用名称。 “互动问答”页签配置完成后,还需执行下述操作,对应的操作流程图,如图2所示。 下载并集成智能交互Web SDK,操作请参考智能交互SDK。
智能交互:对接第三方大脑,通过数字人交互的方式与用户进行问答。 父主题: 声音和形象制作
在客户端防火墙配置SparkRTC端口和域名白名单。 配置SparkRTC端口的防火墙白名单,如表1所示。 表1 防火墙端口白名单 端口类型 端口 TCP端口 443、6447 UDP端口 20000-20063 配置SparkRTC域名的防火墙白名单,如表2所示。
数字人模型不是通用模型,不与第三方服务兼容。用户在MetaStudio制作的模型,仅支持在本服务内使用。 数字人不支持换脸、换衣服。 如果形象训练视频包含动作编排,那么生成的数字人卡片会有标识,说明当前数字人支持添加动作。 父主题: 使用限制
对接生产环境 对接科大讯飞现网的自然语言模型,具体以“第三方应用”配置的模型为准,可提升应用运行的稳定性。 对话内容合规审核 开启后,自动审核用户提问内容。若存在违禁词,将自动拦截,并返回默认答案。如果关闭,将无法审核用户提问内容。
图1 创建应用 表1 创建应用 参数 说明 第三方应用 配置说明如下所示: 如果科大讯飞AIUI开放平台应用使用AIUI通用语义模型,则从下拉框中选择“科大讯飞AIUI通用语义模型”。
通过长按音频文件的方式,选中所有文件,单击分享图标,可选择隔空投送或其他第三方应用导出音频文件至PC中。 一个长音频文件无需压缩,可直接上传至MetaStudio控制台,进行声音训练。 父主题: 附录
BASIC: 基础版(20句话) MIDDLE: 进阶版(100句话) ADVANCE: 高级版 THIRD_PARTY: 第三方出门问问训练版 THIRD_PARTY_LJZN: 第三方逻辑智能训练版 FLEXUS: Flexus版---用的是大模型特征提取 batch_name
连接建立成功后,MetaStudio智能交互服务已准备就绪,会发送START_CHAT命令给第三方应用。第三方应用接收到START_CHAT命令后,用户开始发送文本驱动命令。 详细交互流程如下所示: 用户请求建立与数字人对话的WebSocket连接。