检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
风格化照片建模生成的模型文件是什么格式? 风格化照片建模生成Glb格式的模型文件。 父主题: 照片建模
如图8所示。 图8 构建发布 配置应用 在界面上方的主菜单中,单击“我的应用”。 单击新增应用所在行的图标,进入“应用配置”页面。 图9 应用配置页面 配置“自然语言模型”,从下拉框中选择“星火交互认知大模型”。 单击“管理技能配置”,弹出“配置应用需要的技能”对话框,如图10所示。
创建智能交互数字人(第三方语言模型) 创建智能交互数字人 父主题: 智能交互
应用创建成功,自动进入新增应用的“应用配置”页面。 配置应用 在界面上方的主菜单中,单击“我的应用”。 单击新增应用所在行的图标,进入“应用配置”页面。 图3 应用配置页面 配置“自然语言模型”,保持默认值“AIUI通用语义模型”。 单击“管理技能配置”,弹出“配置应用需要的技能”对话框,如图4所示。
voice_properties 否 VoiceProperties object 声音配置信息,为Flexus版声音的配置项,标准版声音不支持此配置。 supported_service 否 Array of strings 该任务所生成的模型支持的业务类型,可多选。 Flexus版数字人仅支持选择“VIDEO_2D”。
创建声音制作任务(自研模型) MetaStudio已经预置了各种类型的声音,可以在视频制作界面或视频直播界面查看。如果预置声音仍无法满足用户需求,可使用自研模型自定义生成声音。 操作限制 MetaStudio不支持个人用户定制声音,仅支持企业用户。 定制声音时,从平台下载的授权书
如何接收并激活声音和分身模型资产? 管理员或其他租户如果推送声音或分身模型资产给当前租户,当前租户需在7天内完成接收和激活操作。如果超过7天未操作,需要管理员或其他用户重新推送资产给当前租户。 声音和分身模型资产的接收、激活操作均相同,下面以分身模型资产的接收、激活操作为例演示。
更新分身数字人模型训练任务 功能介绍 该接口用于更新分身数字人模型训练任务。用于在自动审核或者人工审核不通过情况下,更新训练视频、身份证照片等。 该接口只能在AUTO_VERIFY_FAILED或者MANUAL_VERIFY_FAILED状态下调用 调用方法 请参见如何调用API。
兰语、荷兰语、西班牙语、印尼语、阿拉伯语、葡萄牙语、泰语。 须知:当前参数配置仅作为标识,对训练结果没有任何影响。 请选择输出模型语言 选择输出的声音模型支持的语言。 支持如下语言: 多语种:输出的声音模型,支持合成的语言类型包括中文、英文、德语、法语、土耳其语、菲律宾语、日语、
删除分身数字人模型训练任务 功能介绍 该接口用于删除分身数字人模型训练任务。同时需要删除训练任务相关的训练视频、身份证照片、授权文件、模型资产等。 该接口应当在任务处于以下状态时调用:WAIT_FILE_UPLOAD、AUTO_VERIFY_FAILED、MANUAL_VERIF
租户执行分身数字人模型训练任务命令 功能介绍 该接口用于租户执行分身数字人模型训练任务命令,如提交训练审核等。 调用方法 请参见如何调用API。 URI POST /v1/{project_id}/digital-human-training-manage/user/jobs/{job_id}/command
时用户已经可以使用模型) JOB_FINISH: 任务结束,是最终状态,不支持修改此状态(NA用户任务的完成状态,并且此状态表明模型效果已通过用户的验收) 挂起,仅NA白名单用户有该状态 JOB_PENDING: 挂起任务 asset_id String 模型资产ID。 project_id
照片建模任务出现异常问题怎么办? 若界面提示模型名重复 由于同一个账号下模型名称不可以重复,因此,您需要重新更换模型名称。 若界面提示照片太大 请您重新更换一个大小低于6MB照片。 父主题: 照片建模
接口,实现智能交互能力。 这里配置的是MetaStudio服务调用第三方语言模型的API地址。 流式响应 MetaStudio智能交互服务提供流式问答(响应更快)和非流式问答两种方式,第三方语言模型可以选择其中一种响应方式。 多轮语境理解能力 配置数值越高,问答请求携带的历史对话个数越多,语境理解能力更强。
时用户已经可以使用模型) JOB_FINISH: 任务结束,是最终状态,不支持修改此状态(NA用户任务的完成状态,并且此状态表明模型效果已通过用户的验收) 挂起,仅NA白名单用户有该状态 JOB_PENDING: 挂起任务 asset_id String 模型资产ID。 project_id
算法基本原理 分身数字人驱动算法是指通过深度学习生成数字人驱动模型,模型生成后,输入音频来合成数字人视频的一种技术。 其基本情况包括: 输入数据:真人视频、音频。 算法原理:通过深度学习算法来学习真人视频,生成驱动该真人形象的数字人模型。通过该模型输入音频,合成数字人视频。 输出结果:数字人视频。
业场景应用。 主要功能如下所示,详见功能特性。 数字内容生产线Metastudio通过AI学习真人形象和声音,来生成数字人模型,相应功能为形象制作、声音制作和Flexus分身数字人。再将模型用于音视频内容的创作,相应功能为视频制作、视频直播和智能交互,主要是生成画面内容。也可以直
基于盘古数字人大模型,华为云MetaStudio打造了一站式、全流程的数字人直播服务,通过高效的训练和推理服务,重塑千行百业的电商直播。 数字人模型生成和驱动:基于一张照片或者一段3-5分钟视频,可以生成分身数字人模型,生成效率相比业界提升3倍以上。在数字人模型生成以后,可以通过模型驱动推
产品预置了唤醒能力,详见预制唤醒能力,如果用户需要更新唤醒词,需要参考定制唤醒能力处理。唤醒模型定制完成后,产品会提供给用户,用户需要参考更新唤醒模型,将模型更新至本地模型路径中。 使用要求 WebSDK版本为3.0.1及以上。 仅支持数字人平台配置或内置ASR(语音转文本)能力的方案。不支持WebSocket接口驱动数字人方案,即文本驱动方案。
录制真人声音,建模生成声音模型。 声音模型可为数字人配音,生成音视频内容,应用于视频制作、视频直播和智能交互,或生成数字人名片和照片数字人。 须知: 制作好的声音模型不支持下载或导出至本地。 声音模型不是通用模型,不与第三方服务兼容。用户在MetaStudio制作的模型,仅支持在本服务内使用。