检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
快速入门 环境要求 Web SDK运行环境要求,如表1所示。 表1 环境要求 环境项 使用限制 开发工具 Microsoft Visual Studio Code、WebStorm或其他Web IDE开发工具。 语言 Javascript或Typescript。 编译环境 建议Node
创建照片检测任务 功能介绍 该接口用于创建照片检测任务,检测照片是否满足制作照片数字人的要求。 调用方法 请参见如何调用API。 URI POST /v1/{project_id}/photo-detection 表1 路径参数 参数 是否必选 参数类型 描述 project_id
照片数字人视频制作配置 限制 人像照片 制作照片数字人的人像照片拍摄要求,如下所示: 真人正面照,不支持动漫卡通形象;面部占比50%以上,侧脸俯仰角度不超过15度。 五官清晰无遮挡,目视前方。 良好的亮度,确保面部细节。 照片内不能出现多张人脸。 人像照片格式要求,如下所示: 支持
场景说明 智能交互包含如下场景: 场景一:用户开箱即用的智能交互数字人场景。 在MetaStudio控制台完成交互配置,包括LLM或者大模型配置,通过Web页面浏览,无需开发。 图1 智能交互 场景二:用户使用第三方语言模型,自主开发API实现与数字人对话场景。 开发者基于智能交
进行智能交互时,透明背景支持的浏览器及其版本,详见客户端SDK参考-快速入门-表3。 对话 配置对话,可以设置数字人欢迎语和热点问题,方便用户与数字人进行交互问答。执行对话配置前,需要完成应用创建操作。 配置对话的详细操作,如下所示: 登录MetaStudio控制台,单击“智能交互”,如图3所示。
片制作页面,如图2所示。 界面左侧为名片配置内容,右侧为名片预览效果图。参数配置说明如表1所示。 图2 制作名片 表1 参数说明 区域 参数 说明 请填写数字人信息 上传头像 需提前准备一张正面清晰且无遮挡的数字人形象照片,并满足如下要求: 图片格式:png、jpg、jpeg、webp。
同时叠加的视频总数量最多支持2个。 音频格式 音频支持的格式为:MP3、M4A、WAV。 音频要求如下所示: 仅提取单声道音频。 音频素材总大小小于500MB。 图片格式 图片支持的格式为:PNG、JPG、JPEG。 图片要求如下所示: 分辨率最大支持1080P。 图片素材总大小小于500MB。 字幕
没有权限访问技能配置 没有权限访问技能配置 访问本租户下的技能配置 403 MSS.47010028 没有权限访问问答对配置 没有权限访问问答对配置 访问本租户下的问答对配置 403 MSS.47010031 没有权限访问问法配置 没有权限访问问法配置 访问本租户下的问法配置 403 MSS
接口,实现智能交互能力。 这里配置的是MetaStudio服务调用第三方语言模型的API地址。 流式响应 MetaStudio智能交互服务提供流式问答(响应更快)和非流式问答两种方式,第三方语言模型可以选择其中一种响应方式。 多轮语境理解能力 配置数值越高,问答请求携带的历史对话个数越多,语境理解能力更强。
色并不能满足用户对精细化授权的要求,无法完全达到企业对权限最小化的安全管控要求。 策略:IAM最新提供的一种细粒度授权的能力,可以精确到具体服务的操作、资源以及请求条件等。基于策略的授权是一种更加灵活的授权方式,能够满足企业对权限最小化的安全管控要求。 如表1所示,包括了MetaStudio的所有系统策略。
应用创建成功,自动进入新增应用的“应用配置”页面。 配置应用 在界面上方的主菜单中,单击“我的应用”。 单击新增应用所在行的图标,进入“应用配置”页面。 图3 应用配置页面 配置“自然语言模型”,保持默认值“AIUI通用语义模型”。 单击“管理技能配置”,弹出“配置应用需要的技能”对话框,如图4所示。
如图8所示。 图8 构建发布 配置应用 在界面上方的主菜单中,单击“我的应用”。 单击新增应用所在行的图标,进入“应用配置”页面。 图9 应用配置页面 配置“自然语言模型”,从下拉框中选择“星火交互认知大模型”。 单击“管理技能配置”,弹出“配置应用需要的技能”对话框,如图10所示。
域。因为展厅的配置,均在“华北-北京四”区域。 在左侧导航栏中,选择“我的创作”。 界面右侧选择“智能交互 > 对话项目”页签,如图1所示。 图1 对话项目 找到需要修改的对话项目,单击右侧的“编辑”,进入对话编辑界面,如图2所示。 图中标识“1”处为语言修改配置。请根据实际情况切换语言,目前仅支持中文和英文。
MetaStudio控制台页面 在智能交互编辑页面,依次设置角色和背景。 单击左侧导航栏中的“应用”,如图2所示。 参数配置说明如表1所示。 图2 创建应用 表1 创建应用 参数 说明 第三方应用 如果已配置对话机器人服务CBS,请从下拉框中选择“华为云CBS”。 应用名称 用户根据实际情况自定义即可。
域。因为展厅的配置,均在“华北-北京四”区域。 在左侧导航栏中,选择“我的创作”。 界面右侧选择“智能交互 > 对话项目”页签,如图1所示。 图1 对话项目 找到需要修改的对话项目,单击右侧的“编辑”,进入对话编辑界面,如图2所示。 图中标识“1”处为语言修改配置。请根据实际情况切换语言,目前仅支持中文和英文。
解除所有IP访问的限制。 在客户端防火墙配置SparkRTC端口和域名白名单。 配置SparkRTC端口的防火墙白名单,如表1所示。 表1 防火墙端口白名单 端口类型 端口 TCP端口 443、6447 UDP端口 20000-20063 配置SparkRTC域名的防火墙白名单,如表2所示。
前提条件 已配置完成奇妙问,示例如创建智能交互数字人(奇妙问)所示。 操作步骤 登录MetaStudio控制台,单击“智能交互”,如图1所示。 图1 MetaStudio控制台页面 在智能交互编辑页面,依次设置角色和背景。 单击左侧导航栏中的“应用”,如图2所示。 参数配置说明如表1所示。
创建应用 参数 说明 第三方应用 配置说明如下所示: 科大讯飞平台应用的“自然语言模型”配置为“AIUI通用语义模型”时,如配置应用所示。请从下拉框中选择“科大讯飞AIUI通用语义模型”。 科大讯飞平台应用的“自然语言模型”配置为“星火交互认知大模型”时,如配置应用所示。请从下拉框中选择“科大讯飞星火交互认知大模型”。
创建应用 参数 说明 第三方应用 配置说明如下所示: 科大讯飞平台应用的“自然语言模型”配置为“AIUI通用语义模型”时,如配置应用所示。请从下拉框中选择“科大讯飞AIUI通用语义模型”。 科大讯飞平台应用的“自然语言模型”配置为“星火交互认知大模型”时,如配置应用所示。请从下拉框中选择“科大讯飞星火交互认知大模型”。
图层位置配置。 size LayerSizeConfig object 图层大小配置。 image_config ImageLayerConfig object 素材图片图层配置。 video_config VideoLayerConfig object 素材视频图层配置。 text_config