检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
获取项目ID 登录MetaStudio控制台。 将鼠标移至界面右上方的用户名称位置,在弹出的下拉框中选择“我的凭证”。 进入“我的凭证 > API凭证”页面,如图1所示。 图1 项目列表 父主题: SP用户
单击图标,弹出“新建问题类别”对话框。 输入“问题类别名称”,示例:闲聊语料。 单击“确定”,“问题类别”区域新增“闲聊语料”。 单击“闲聊语料”,在右侧界面,单击“新建”,弹出“新建知识”对话框。 请根据实际情况输入问答内容,配置示例如图4所示。其中,“答案”必须选择“纯文本”。 图4 新建知识
如果华为云账号已经能满足您的要求,不需要创建独立的IAM用户,您可以跳过本章节,不影响您使用MetaStudio服务的其它功能。 本章节为您介绍对用户授权的方法,操作流程如示例流程所示。 前提条件 给用户组授权之前,请您了解用户组可以添加的MetaStudio系统策略,并结合实际需求进行选择。 MetaStudi
以最多添加40个问答对。 为方便添加问答对,用户可以在本地使用Excel文件,提前准备好技能问答对内容,然后一一填充至线上的技能问答对中,示例如表2所示。 表2 问答对样例 序号 主题 所有问法 数字人回答(2000) 关键词(可选) 1 自动驾驶的优势 自动驾驶领域的优势有哪些?
请完善声音信息 输入声音名称,示例:欢快女声。 请制作声音 使用“语料上传”的方式,直接上传一个已录制好的长音频WAV或MP3文件,无需压缩,无需携带文案txt文件。 请选择声音性别 选择声音的性别,示例:女生。 原始输入语言 选择上传语料所使用的语言,示例:中文。 选择声音标签 声
段落。 单击右上方的“导入”,从本地导入不少于200字的txt文件。如果多个段落,可通过换行来实现,平台会自动解析输入内容。 手工输入文本示例,如下所示: 请注意,当前仅为效果演示,实际需要满足单场景不少于200字,单段落不多于2000字的要求。 段落1.1:大家好,今天欢迎来到
分身数字人名片制作 左下角展示用户已购买资源的剩余量。 照片数字人视频制作 左下角展示用户已购买资源的剩余量。 声音合成 这里的声音合成,仅针对使用声音API调用,通过MetaStudio控制台声音制作方式生成的声音,来合成音频的费用。 如需使用此功能,需单击“去开通”,在弹出的“开通按需计费服
图2 资源管理 在左侧导航栏中,选择“服务概览”。 单击“前往MetaStudio”,进入MetaStudio工作台,可参考用户指南、API参考等手册,使用MetaStudio服务。 父主题: SP用户
题库。 创建角色:在奇妙问创建问答角色。 查看角色信息:查看奇妙问创建角色的RoleId和AppSecret,即MetaStudio平台API调用所需的角色ID和角色密钥。 支持在奇妙问平台查看角色的所有会话记录。 父主题: 创建智能交互数字人(奇妙问)
与AIUI开放平台应用的“APPID”保持一致。 APPKEY 与AIUI开放平台应用的“APPKEY”保持一致。 APISECRET 与AIUI开放平台应用的“APISECRET”保持一致。 对接生产环境 对接科大讯飞现网的自然语言模型,具体以“第三方应用”配置的模型为准,可提升应用运行的稳定性。
台。 需要注意: 使用RTMP推流时,关闭控制台页面不等于结束直播任务,画面会持续生成并计费。如需结束直播画面,需手动单击结束直播或通过API下发结束命令。 直播平台的规定及相关政策请自行了解,部分平台可能限制虚拟内容直播。 常见问题 第三方直播平台直播画面不清晰怎么办? 第三方平台直播画面突然中断是怎么回事?
可以给当前互动库,新增1条互动规则。参数配置说明,如表2所示。 图5 互动规则 表2 互动规则配置说明 参数 说明 类型 互动类型,选择“弹幕”。 互动名称(可选) 互动名称,示例:欢迎进入直播间。 触发方式 当前互动触发的方式,请根据实际情况设置。 回复方式 选择“文本回复”,输入文本内容,当满足触发方式时,数字人会阅读文本内容。
类型 互动类型。 包含如下选项: 弹幕 用户入场 点赞 送礼 互动名称(可选) 互动名称。 触发方式 触发关键词,多个关键词用“|”分隔,示例“链接|型号|优惠”。 服务扫描弹幕的时候,如果扫描到此关键词,自动回复当前互动内容。 回复方式 选择主播或助播进行回复,具体回复内容支持通过下述方式设置。
不佩戴眼镜、墨镜或者帽子,需要露出额头与眉毛。 确保面部无零散发丝,保证无法通过头发空隙看到背景。 确保面部没有较长零散的胡须。 图5 错误示例 图6 正确示例 绿幕数字人拍摄要求 模特拍摄时的手部动作、面部表情以及各方面姿态,都会决定数字人最终呈现时的姿态和动作。因此,我们希望模特在拍摄
苹果手机的简易录音机默认为单声道录制,无需修改。 音频格式 推荐使用无损音质格式保存音频,如WAV、MP3格式。 音频命名 所有语料录制生成一个长音频WAV或MP3文件,命名示例:Voice.wav。 音频导出 操作如下所示: 打开简易录音机软件,单击底部的“播放”菜单,进入“播放”页面。 单击界面右上方的“编辑”,进入音频文件编辑页面。
角色界面默认展示两列数字人,单击图标后,缩小展示为1列数字人。单击图标,可恢复为2列展示。 关键词搜索框,可输入数字人名称进行精准搜索。 示例:yun lan。 刷新图标。如果有关键词,按照关键词进行刷新展示;如果没有关键词,恢复为默认展示。 筛选条件 支持通过角色、性别、姿势、
致后再直播。 图2 桌面音频属性设置 检查Windows系统的声音输出设备 在Windows系统的系统设置中,找到声音设置,查看输出设备,示例如图3所示。 图3 声音输出设备 父主题: 视频直播
购买,个人用户不支持。 按需计费 按需预付费套餐包 3D数字人 照片建模 按照3D风格化基础模型建模,调用API接口的次数计费。 每成功调用一次3D风格化基础模型建模的API,从所购预付费资源包中扣除1次。 计费时优先使用套餐包中的额度,该额度使用完后,转按需付费。 照片建模的含
角色界面默认展示两列数字人,单击图标后,缩小展示为1列数字人。单击图标,可恢复为2列展示。 关键词搜索框,可输入数字人名称进行精准搜索。 示例:yun lan。 刷新图标。如果有关键词,按照关键词进行刷新展示;如果没有关键词,恢复为默认展示。 筛选条件 支持通过角色、性别、姿势、
调用结束数字人智能直播任务接口,停止直播任务。 服务自动关停直播任务 下述场景下, 生成的直播视频流没有观看者,服务为保障租户利益,会自动关停直播任务。 在MetaStudio控制台开播,且没有配置RTMP推流时,用户关闭了视频播放窗口一段时间以后,约2~3分钟。 调用API开播,且没有配置