检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
常用概念 数字人 数字人是一种以数字形式存在于数字空间中的虚拟人物,它具有拟人或真人的外貌、行为特点,并具备一定的智能和情感,可以进行交互和表达。数字人也可以被称之为虚拟形象、数字虚拟人、虚拟数字人等。数字人的核心技术主要包括计算机视觉、计算机图形学、动作捕捉和驱动、图像渲染和人工智能等。
基本概念 分身数字人Flexus版针对中小企业客户,提供1080P的实景数字人、1分钟语料声音克隆能力和120分钟1080P视频制作能力,帮助客户通过手机拍摄即可轻松制作数字人。Flexus分身数字人不仅简化制作流程,还显著降低技术门槛,且购买简单,为中小企业提供超简单、超高性价比数字人。
功能特性 数字内容生产线Metastudio通过AI学习真人形象和声音,来生成数字人模型,相应功能为形象制作、声音制作和Flexus分身数字人。再将模型用于音视频内容的创作,相应功能为视频制作、视频直播和智能交互,主要是生成画面内容。也可以直接通过静态的人脸照片生成视频,对应功能为照片数字人。
删除委托 功能介绍 该接口用于删除项目下委托。 调用方法 请参见如何调用API。 URI DELETE /v1/{project_id}/digital-human-chat/agency/{role_type} 表1 路径参数 参数 是否必选 参数类型 描述 project_id
查询委托 功能介绍 该接口用于查询项目下委托 调用方法 请参见如何调用API。 URI GET /v1/{project_id}/digital-human-chat/agency 表1 路径参数 参数 是否必选 参数类型 描述 project_id 是 String 被委托服务
创建委托 功能介绍 该接口用于创建委托。 调用方法 请参见如何调用API。 URI POST /v1/{project_id}/digital-human-chat/agency/{role_type} 表1 路径参数 参数 是否必选 参数类型 描述 project_id 是 String
最新动态 本文介绍了数字内容生产线 MetaStudio各特性版本的功能发布和对应的文档动态,新特性将在各个区域(Region)陆续发布,欢迎体验。 2022年12月 序号 功能名称 功能描述 阶段 相关文档 1 数字内容生产线服务上线(受限公测) MetaStudio依托图形引
查看数字人定制任务 数字人定制任务审核通过后,启动算法训练,会在3个工作日内训练完成并生成数字人,请耐心等待。 操作步骤 登录MetaStudio控制台。 在左侧导航栏中,单击“任务中心”。 在“分身数字人”页签,单击数字人定制任务右侧的“查看详情”,进入“定制任务详情”页面。
智能交互驱动流程 流程图示例 用户与数字人进行智能交互的流程图示例,如下所示,对应流程的详细说明,如流程图总体说明所示。 智能交互非流式驱动流程图,如图1所示。 智能交互流式驱动流程图,如图2所示。 智能交互驱动打断对话流程图,如图3所示。 智能交互驱动停止对话流程图,如图4所示。
新闻播报风格文案 我国是世界上首个国内发明专利有效量超三百万件的国家, 我国发明专利有效量已位居世界第一。 截至二零二二年底,高价值发明专利拥有量达到一百三十二点四万件, 占发明专利有效量的比重超过四成。 我国正在从知识产权引进大国向知识产权创造大国转变, 知识产权工作正在从追求数量向提高质量转变。
事件通知(EventMap) 本节介绍Web SDK的EventMap事件。 表1 通知列表 接口 描述 error 错误事件。 enterSleep 数字人自动休眠事件。 jobInfoChange 交互任务信息变更事件。 speakingStart 数字人开始讲话事件。 speakingStop
真人声音录制 客户录制真人音频,上传至MetaStudio进行AI训练,即可得到和真人音色1:1复刻的声音模型。 声音模型可实现文本转语音,应用于数字人视频制作、直播、交互问答等场景中。不同版本录制规格如下: 基础版:整段录制生成一个WAV或MP3格式音频,总时长3~10分钟,建议5分钟。
创建语音驱动表情动画任务 功能介绍 该接口用于创建驱动数字人表情的任务。 调用方法 请参见如何调用API。 URI POST /v1/{project_id}/ttsa/fas 表1 路径参数 参数 是否必选 参数类型 描述 project_id 是 String 租户项目ID 请求参数
创建高级版语音训练任务 功能介绍 用户创建语音训练高级版任务,该接口会返回一个obs上传地址,用于上传语音文件。 语音文件为一段WAV格式的长音频文件,仅支持将语音文件打包成zip压缩格式上传。 文件上传后,调用“提交语音训练任务”接口,启动审核和训练。 调用方法 请参见如何调用API。