检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
查看名片 如果用户需要查看已生成的分身数字人名片,可参考本节操作。 操作步骤 登录MetaStudio控制台。 在左侧导航栏中,单击“我的创作”。 选择“分身名片”页签,如图1所示。 在“分身名片”页面,可以看到已生成的名片列表,以卡片形式排列展示。 支持对名片进行如下操作: 单击,查看分身数字人的语音表达形态。
图3 名片生成进度 等待名片生成完成后,界面会提示“名片生成成功”,如图4所示。 用户可以执行如下操作: 单击名片,预览名片生成效果。 单击“再次制作”,可再次制作数字人名片。 单击“下载至本地”,下载数字人名片至本地。下载后的文件为mp4格式。 图4 名片生成成功 父主题:
String 参数解释: 文件内容MD5值。按照RFC 1864标准计算出消息体的MD5摘要字符串,即消息体128-bit MD5值经过base64编码后得到的字符串。 md5值获取详情请参考使用Java代码生成文件内容的MD5值。 约束限制: 不涉及 取值范围: 字符长度24位。 默认取值:
变更交互任务信息的事件。交互任务状态发生变化时,会通知使用方。如果交互任务就绪,jobInfo中的jobId为进行中的任务ID,否则jobId为空字符串。 【回调参数】 jobInfo:JobInfo类型。字段定义如表3所示。 表3 JobInfo 参数 类型 描述 jobId string
“算法训练完成”,如图2所示。 查看生成的分身数字人形象是否满足。用户可以在“定制任务详情”界面,执行下述操作。 如果训练生成的数字人形象满足需求,单击右下方的“通过”。在弹出的“确认”对话框中,单击“确认”,数字人形象生成完成。 如果训练生成的数字人形象不满足需求,单击右下方的“驳回”,进入“问题填写”界面。
具备如下特点: 2D模型,通过拍摄真人视频训练生成 无表情&骨骼数据 只能由AI驱动 使用既定表情&动作 IP型数字人:由计算机图形学技术创造出来的与人类形象高度接近的数字化形象。 具备如下特点: 3D模型,通过艺术设计生成 有表情、骨骼数据 可由真人动作驱动 能呈现自定义表情&动作
接集成服务端SDK来调用MetaStudio的相关API,从而实现对MetaStudio服务的快速操作。 在线生成SDK代码 API Explorer能根据需要动态生成SDK代码功能,降低您使用SDK的难度,推荐使用。 您可以在API Explorer中,具体API页面的“代码示
视频画面制作区域,可以制作和预览视频画面。 3 音频制作区域 音频制作区域,可选择下述1种方式生成音频。 文本驱动:通过输入文本的方式生成音频。文本支持插入停顿、调整语速,如果是多音字可设置正确的发音,还可以选择不同的声音,试听生成的音频效果。支持开启字幕展示功能。 音频驱动:从本地上传音频文件,作为视
参考下载SDK安装包,下载SDK安装包至本地。 打开本地命令运行程序,输入如下命令,在本地生成SDK安装包的SHA256值。 其中,“D:\HwICSUiSdk-1.0.0.zip”为SDK安装包的本地存放路径及安装包名称,请根据实际情况修改。 certutil -hashfile D:\HwICSUiSdk-1
支持购买多路,每路按时长计费。 须知: 智能交互中数字人分身的动作是根据数字分身拍摄形象训练生成的,唇形和文字声音匹配,数字分身和背景融合自然,清晰度1080P。 智能交互根据客户需要,后台提供多种知识库配置,支持配置中英双语。 智能交互基于已有训练生成的数字分身形象模型和声音模型,结合知识库,可与用户进行实时对话。
基础版:整段录制生成一个WAV或MP3格式音频,总时长3~10分钟,建议5分钟。 进阶版:整段录制生成一个WAV或MP3格式音频,总时长10~30分钟,建议15分钟。 高品质:整段录制生成一个WAV或MP3格式音频,总时长1小时以上,建议1小时。 原声录制音频和其对应生成的音色播报示例,如客户声音制作案例所示。
手机录制音频 请根据手机类型,执行相应操作: 苹果手机操作 安卓手机 苹果手机操作 苹果手机推荐下载软件“简易录音机(Easy Voice Recorder)”进行录音,如图1所示。 图1 简易录音机 音频录制说明,如表1所示。 表1 音频录制说明 音频录制 说明 采样率 推荐使用48kHz采样率录制音频。
界面右侧上方,展示分身数字人定制流程。下方展示训练视频拍摄指导和样例视频,包括:拍摄前准备、拍摄中操作和拍摄后处理,有效指导用户拍摄生成一段完整可用的训练视频,用于训练生成分身数字人。 图1 定制数字人形象 上传分身数字人训练数据。 界面操作详情,如表1所示。 表1 界面操作说明 区域 参数
风格化照片建模生成的模型文件是什么格式? 风格化照片建模生成Glb格式的模型文件。 父主题: 照片建模
声音制作 MetaStudio支持自定义生成声音。 操作前准备 用户创建声音制作任务前,需要参考操作步骤准备如下内容: 参考真人声音录制,提前录制一个WAV或MP3格式的长音频文件,每句之间需要有2~3秒的停顿。语料推荐使用文案样例(基础版)。 声音授权签署文件。 操作步骤 登录MetaStudio控制台。
使用Java代码生成文件内容的MD5值 生成文件内容的MD5值对应的Java代码示例,如下所示: import java.io.BufferedInputStream; import java.io.FileInputStream; import java.io.IOException;
PICTURE_MODELING:照片建模生成的模型 CHARACTER_CUSTOMIZATION_MODELING:捏脸生成的模型 默认取值: UPLOADED modeling_job_id 否 String 参数解释: 建模任务ID。 约束限制: 仅由MetaStudio服务生成的模型系统自行填写
String 用户类型。 CAPTURE: 直播助手,将摄像头获取视频流推送到RTC房间 ANIMATION: VDS服务,从RTC房间拉视频流生成动作数据 RENDER: 渲染服务,将动作数据渲染成数字人动画 PLAYER: 普通观看方,可选择原始视频流或者数字人动画视频流观看 INFERENCE_USER:
单击“保存”,一条互动规则新增完成。 用户可以根据实际情况,为当前互动库增加更多的互动规则,或者增加更多的互动库。 支持对互动规则执行下述操作: 单击互动规则右侧的“编辑”,在弹出的“互动编辑”对话框中修改互动规则。 单击互动规则右侧的“复制”,复制当前互动规则,生成一条新的互动规则。 单击互动规则右侧的“删除”,删除当前互动规则。
如果用户需要查看照片数字人视频生成任务,可参考本节操作。 操作步骤 登录MetaStudio控制台。 在左侧导航栏中,单击“任务中心”。 选择“照片数字人”页签,如图1所示。 在“照片数字人”页面,可以查看全部生成的视频,包括生成中、生成成功和生成失败的任务。 在下方的视频列表中