检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
用户需要参考表1进行配置,如果需要分配多种资源类型,可单击右侧的图标,新增资源行。 图3 分配资源 表1 参数说明 参数 说明 请选择资源类型 从下拉框中选择已购买的资源类型。 示例:分身数字人形象制作。 请选择资源实例 从下拉框中选择已购买的资源实例。 示例:分身数字人形象制作
商品资产组合配置 功能介绍 商品资产组合配置 调用方法 请参见如何调用API。 URI POST /v1/{project_id}/products/{product_id}/assets 表1 路径参数 参数 是否必选 参数类型 描述 project_id 是 String 项目ID,获取方法请参考获取项目ID。
参数 参数类型 描述 X-Request-Id String 请求ID。 表4 响应Body参数 参数 参数类型 描述 hot_words_id String 热词记录ID。 robot_id String 应用ID。 hot_words_type String 热词类型。 说明:
配置特殊词表 支持全局设置多音字或者别名,设置完成后,所有视频草稿自动生效。 操作步骤 登录MetaStudio控制台。 在左侧导航栏中,单击“我的创作”。 选择“声音”页签,单击界面右侧的“特殊词表”,进入如图1所示的界面。 图1 特殊词表 单击“新建词表”,界面新增一行特殊词,如图2所示。
查询用户配置的个性化音频时长 功能介绍 查询用户配置的个性化音频时长 调用方法 请参见如何调用API。 URI GET /v1/{project_id}/voice-training-manage/user/tenant-duration-cfg 表1 路径参数 参数 是否必选 参数类型
配置对话机器人服务CBS 在对话机器人服务配置问答机器人。MetaStudio创建对话时,如果“第三方应用”需要选择“华为云CBS”时,才需要执行本节操作,详情请参考表1。 操作步骤 登录MetaStudio控制台。 单击界面左上角的图标,在弹出的浮动框中,搜索“对话机器人服务 CBS”,如图1所示。
gion。 热词ID:需要确保热词ID所在Region、语言类型与智能交互配置的SIS委托站点、语言类型一致,否则热词配置不生效。 需参考创建热词表,创建一个热词表,再参考调用热词表,复制热词ID至当前“热词ID”配置中。 声音 这里选择的声音,需要与前面选择的语言匹配。如果是中
视频直播限制 分身数字人直播限制,如下所示: 直播间配置约束 直播任务退出说明 直播播放说明 直播内容审核说明 直播间配置约束 直播间配置限制,如表1所示。 表1 直播间限制 直播间配置 限制 多场景配置 每个单场景,如果通过“文本驱动”方式生成语音时,所有段落汇总的文字数量需大于200字。
服务提供了名片模板,用户可以基于模板制作名片。 图1 选择名片模板 选择一款名片模板,单击“开始制作”,进入名片制作页面,如图2所示。 界面左侧为名片配置内容,右侧为名片预览效果图。参数配置说明如表1所示。 图2 制作名片 表1 参数说明 区域 参数 说明 请填写数字人信息 上传头像 需提前准备一张正面清晰且
解除所有IP访问的限制。 在客户端防火墙配置SparkRTC端口和域名白名单。 配置SparkRTC端口的防火墙白名单,如表1所示。 表1 防火墙端口白名单 端口类型 端口 TCP端口 443、6447 UDP端口 20000-20063 配置SparkRTC域名的防火墙白名单,如表2所示。
场景说明 智能交互包含如下场景: 场景一:用户开箱即用的智能交互数字人场景。 在MetaStudio控制台完成交互配置,包括LLM或者大模型配置,通过Web页面浏览,无需开发。 图1 智能交互 场景二:用户使用第三方语言模型,自主开发API实现与数字人对话场景。 开发者基于智能交
图1 MetaStudio控制台页面 在智能交互编辑页面,依次设置角色和背景。 单击左侧导航栏中的“应用”,如图2所示,请参考表1进行配置。 配置完成后,还需执行下述操作,对应的操作流程图,如图3所示。 下载并集成智能交互Web SDK,操作请参考智能交互SDK。 在Web SD
如图8所示。 图8 构建发布 配置应用 在界面上方的主菜单中,单击“我的应用”。 单击新增应用所在行的图标,进入“应用配置”页面。 图9 应用配置页面 配置“自然语言模型”,从下拉框中选择“星火交互认知大模型”。 单击“管理技能配置”,弹出“配置应用需要的技能”对话框,如图10所示。
接口,实现智能交互能力。 这里配置的是MetaStudio服务调用第三方语言模型的API地址。 流式响应 MetaStudio智能交互服务提供流式问答(响应更快)和非流式问答两种方式,第三方语言模型可以选择其中一种响应方式。 多轮语境理解能力 配置数值越高,问答请求携带的历史对话个数越多,语境理解能力更强。
删除资产,需增加“mode=force”参数配置。 调用方法 请参见如何调用API。 URI DELETE /v1/{project_id}/digital-assets/{asset_id} 表1 路径参数 参数 是否必选 参数类型 描述 project_id 是 String
智能交互限制 智能交互对硬件设备的最低配置要求,如表1所示。 表1 硬件设备要求 硬盘配置 最低配置 CPU i5及以上版本。 内存 8G以上。 硬盘 128G及以上。 操作系统 Windows或Android系统。 麦克风 需要有麦克风,且要保障1米以内的拾音效果。 扬声器 需要有扬声器。
域。因为展厅的配置,均在“华北-北京四”区域。 在左侧导航栏中,选择“我的创作”。 界面右侧选择“智能交互 > 对话项目”页签,如图1所示。 图1 对话项目 找到需要修改的对话项目,单击右侧的“编辑”,进入对话编辑界面,如图2所示。 图中标识“1”处为语言修改配置。请根据实际情况切换语言,目前仅支持中文和英文。
域。因为展厅的配置,均在“华北-北京四”区域。 在左侧导航栏中,选择“我的创作”。 界面右侧选择“智能交互 > 对话项目”页签,如图1所示。 图1 对话项目 找到需要修改的对话项目,单击右侧的“编辑”,进入对话编辑界面,如图2所示。 图中标识“1”处为语言修改配置。请根据实际情况切换语言,目前仅支持中文和英文。
操作步骤 登录MetaStudio控制台。 在“工作台”界面,单击“照片数字人”,进入照片数字人制作页面,如图1所示。 界面左侧展示配置项,右侧展示预览效果。配置操作,请参考表1。 图1 照片数字人制作页面 表1 界面操作说明 区域 参数 说明 01 请上传您的照片 人像照片 单击“查看
应用创建成功,自动进入新增应用的“应用配置”页面。 配置应用 在界面上方的主菜单中,单击“我的应用”。 单击新增应用所在行的图标,进入“应用配置”页面。 图3 应用配置页面 配置“自然语言模型”,保持默认值“AIUI通用语义模型”。 单击“管理技能配置”,弹出“配置应用需要的技能”对话框,如图4所示。