检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
将人像照片输入至算法模型中,通过特征提取、人脸重建、素材特征匹配等进行人头重建,生成3D人头模型。 生成的人头模型通过配上默认身体素材配件,形成完整的3D数字人模型,并返回结果。 算法应用场景 数字人照片建模算法可应用于影视制作、仿真形象生成、虚拟现实等领域,能加速数字人模型产业的生产效率。
开播后的效果,如图3所示。如需进行互动,可单击图标,切换到助播声音。输入并发送互动内容,主播暂停播报,并使用助播声音插播发送成功的互动内容。 导入 支持从本地导入文本文件,解析生成段落内容。 导入文件需满足: 支持txt格式,且字数不低于200字。 文本内容根据换行,自动解析为段落。 试听 单击“试听”,可以试听当前直播间剧本。
请按照模板文件的格式,填充完成所有问题分类及其全量语料对,保存文件。 单击“添加文件”,从本地选择文件,单击“确定”。 等待文件导入成功后,可以看到增加成功的问题类别及其全量语料对,示例如图8所示。 图8 批量导入语料 全量导入完成后,单击界面右上方的“对话体验”,输入前面导入的语料对问题。
图片:JPG、PNG、BMP、GIF、SVG。 视频:MP4。 导入富媒体操作 支持通过问答库导入富媒体。以奇妙问知识库为例,参考新增知识库,补充富媒体知识,示例如表1所示。 如果使用服务提供SDK默认样式,受限于浏览器的CSP策略,导入图片、视频链接的域名,需提交工单添加至白名单。 表1 问答知识库
实现数字人形象的验收操作。 图2 数字人定制任务 服务管理员会根据用户反馈的问题,重新优化数字人形象。 数字人定制任务,会重新进行模型训练。等待模型训练完成后,用户可以二次审验,继续4的操作,直至生成符合要求的分身数字人形象。 此时,在“我的创作 > 分身形象”页面,可以看到新增
列展示。 关键词搜索框,可输入文件名称进行精准搜索。 示例:销售指导书。 文件列表 默认展示全量文件。 查看文件 将鼠标放在文件上方,文件右上角展示图标。单击图标,可以在弹出的界面中预览PPT的所有页面内容。 插入文件 将鼠标放在文件上方,文件右上角展示图标。单击图标,弹出如图4
背景:背景图片列表,可本地导入图片。支持透明背景、纯色背景或导入图片。 PPT:PPT文件列表,需要用户从本地导入后使用。 贴图:各类贴图列表,可本地导入素材。支持在当前画面基础上,增加贴图,丰富视频画面。 视频:各类无声音视频列表,可本地导入视频文件。支持添加为背景视频。 音乐
览界面中。 背景 背景界面详情,如图2所示。 图2 背景界面 背景界面说明,如表2所示。 表2 界面元素说明 界面元素 说明 本地导入 单击“本地导入”,从本地选择PNG、JPG、JPEG和BMP格式的图片上传。 也支持直接拖拽本地图片至图片列表区域,完成上传操作。 关键词搜索框,可输入图片名称进行精准搜索。
需注意: 首次购买或创建资产时,免费赠送5G存储空间。 下述场景,使用资产空间不会计费: 用户上传的分身数字人模型、3D数字人模型和声音。 平台生成的分身数字人模型、3D数字人模型和声音。 平台合成的视频资产6个月内,默认不计费。6个月以后,开始计费。 资产管理的含义:提供数字资产存储、简单分类、搜索等基础管理能力。
参考真人声音录制,提前录制一个WAV或MP3格式的长音频文件,每句之间需要有2~3秒的停顿。语料推荐使用文案样例(基础版)。 声音授权签署文件。 操作步骤 登录MetaStudio控制台。 单击“声音制作”下方的“开始创建”,进入声音制作页面。 图1 定制声音 在“华为模型”页签,配置声音制作参数。 界面操作详情,如表1所示。
分身形象制作管理 创建分身数字人模型训练任务 查询分身数字人模型训练任务列表 查询分身数字人模型训练任务详情 删除分身数字人模型训练任务 更新分身数字人模型训练任务 租户执行分身数字人模型训练任务命令
10次/秒 10次/秒 复制资产 4次/秒 3次/秒 3次/秒 文件管理 创建文件并获取上传URL 10次/秒 5次/秒 5次/秒 删除文件 10次/秒 5次/秒 5次/秒 确认文件已上传 10次/秒 5次/秒 5次/秒 创建大文件 10次/秒 5次/秒 5次/秒 视频制作剧本管理 创建视频制作剧本
asset_id String 当任务状态为成功时呈现,音色模型在资产库中的id。 job_failed_code String 当任务失败时呈现,失败错误码。 job_failed_reason String 当任务失败时呈现,失败原因。 create_time Long 任务创建时间。
形象拍摄指导文档下载 如需查看拍摄真人视频的PDF文件,请单击形象拍摄指导下载文件。 父主题: 形象制作
声音录制指导文档下载 如需查看真人声音录制的的PDF文件,请单击声音制作录制指导下载文件。 父主题: 声音制作
科大讯飞平台应用的“自然语言模型”配置为“AIUI通用语义模型”时,如配置应用所示。请从下拉框中选择“科大讯飞AIUI通用语义模型”。 科大讯飞平台应用的“自然语言模型”配置为“星火交互认知大模型”时,如配置应用所示。请从下拉框中选择“科大讯飞星火交互认知大模型”。 应用名称 与科大讯
科大讯飞平台应用的“自然语言模型”配置为“AIUI通用语义模型”时,如配置应用所示。请从下拉框中选择“科大讯飞AIUI通用语义模型”。 科大讯飞平台应用的“自然语言模型”配置为“星火交互认知大模型”时,如配置应用所示。请从下拉框中选择“科大讯飞星火交互认知大模型”。 应用名称 与科大讯
声音制作 真人声音录制 声音录制指导文档下载 创建声音制作任务(自研模型) 创建声音制作任务(第三方模型) 查看声音 购买声音套餐 文案样例(基础版) 文案样例(进阶版) 文案样例(高品质)
服务型数字人:利用深度神经网络进行图像合成、高度拟真的虚拟人。 具备如下特点: 2D模型,通过拍摄真人视频训练生成 无表情&骨骼数据 只能由AI驱动 使用既定表情&动作 IP型数字人:由计算机图形学技术创造出来的与人类形象高度接近的数字化形象。 具备如下特点: 3D模型,通过艺术设计生成 有表情、骨骼数据 可由真人动作驱动
创建智能交互数字人(科大讯飞) 前提条件 创建技能 创建科大讯飞应用(AIUI通用语义模型) 创建科大讯飞应用(星火交互认知大模型) (可选)提升问答交互次数 创建智能交互数字人 父主题: 智能交互