检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
如何实时切换智能交互的语言和声音? 在展厅等智能交互场景中,会有切换智能交互界面,数字人说话语言和声音的需求。 请参考下述步骤操作: 登录MetaStudio控制台。 如果是展厅场景,需要切换到“华北-北京四”区域。因为展厅的配置,均在“华北-北京四”区域。 在左侧导航栏中,选择“我的创作”。
常用概念 数字人 数字人是一种以数字形式存在于数字空间中的虚拟人物,它具有拟人或真人的外貌、行为特点,并具备一定的智能和情感,可以进行交互和表达。数字人也可以被称之为虚拟形象、数字虚拟人、虚拟数字人等。数字人的核心技术主要包括计算机视觉、计算机图形学、动作捕捉和驱动、图像渲染和人工智能等。
删除资产 支持在MetaStudio控制台删除资产,操作方式详见本节。 操作步骤 登录MetaStudio控制台。 在左侧导航栏中,单击“我的创作”。 选择“资源”页签,如图1所示。 图1 资源页面 如果需要删除已激活的资产,可以通过下述2种方式删除。 方式一:单击资产卡片中的“
手机录制音频 请根据手机类型,执行相应操作: 苹果手机操作 安卓手机 苹果手机操作 苹果手机推荐下载软件“简易录音机(Easy Voice Recorder)”进行录音,如图1所示。 图1 简易录音机 音频录制说明,如表1所示。 表1 音频录制说明 音频录制 说明 采样率 推荐使用48kHz采样率录制音频。
创建智能交互数字人(SDK+API场景) 介绍如何在MetaStudio平台创建智能交互数字人,实现用户和数字人进行交互对话。相应的场景说明,请参考场景说明。 操作步骤 登录MetaStudio控制台,单击“智能交互”,如图1所示。 图1 MetaStudio控制台页面 在智能交互编辑页面,依次设置角色和背景。
服务概览 登录华为云控制台,单击界面左上角的图标,在弹出的服务列表界面中,搜索并单击“数字内容生产线 MetaStudio”服务,进入MetaStudio服务概览页面,如图1所示。 图1 服务概览页面 MetaStudio服务概览页面一共包含3块区域,详细说明如下所示: 服务介绍
视频制作 MetaStudio服务支持制作数字人视频。 操作步骤 登录MetaStudio控制台。 在“工作台”界面,单击“分身视频制作”下方的“开始创建”。 进入视频制作界面,界面详情如图1所示。 图1 视频制作界面 在画布区域,设置角色、背景、贴图、视频等内容。 详细操作请参见视频制作素材操作详情。
稿四:春江花月夜 《春江花月夜》是唐代诗人张若虚的代表作之一,以下是《春江花月夜》的原文以及解析。 原文: 春江潮水连海平,海上明月共潮生。 滟滟随波千万里,何处春江无月明! 江流宛转绕芳甸,月照花林皆似霰; 空里流霜不觉飞,汀上白沙看不见。 江天一色无纤尘,皎皎空中孤月轮。 江畔何人初见月?江月何年初照人?
(可选)提升问答交互次数 科大讯飞免费赠送500次/天的问答交互次数,如需提升问答交互次数,请参考本节操作,订购套餐包。 操作步骤 在界面上方的主菜单中,单击“我的应用”。 单击应用所在行的图标,进入当前应用的“应用配置”页面。 在左侧导航栏中,单击“服务统计”,进入“服务统计”页面,如图1所示。
wav~99.wav;文本文件命名规则:0.txt~99.txt。 语音文件和文本文件逐句上传:每次上传一句语料的语音文件和文本文件,再调用“确认在线录音结果”接口确认语音和文本内容是否一致。确认成功后再上传和确认下一句。 文件上传后,调用“提交语音训练任务”接口,启动审核和训练。 调用方法
wav~19.wav;文本文件命名规则:0.txt~19.txt。 语音文件和文本文件逐句上传:每次上传一句语料的语音文件和文本文件,再调用“确认在线录音结果”接口确认语音和文本内容是否一致。确认成功后再上传和确认下一句。 文件上传后,调用“提交语音训练任务”接口,启动审核和训练。 调用方法
查看视频 如果用户需要查看已生成的照片数字人视频,可参考本节操作。 操作步骤 登录MetaStudio控制台。 在左侧导航栏中,单击“我的创作”。 选择“视频”页签,如图1所示。 在“视频”页面,可以看到已生成的视频列表,以卡片形式排列展示。 支持对视频进行如下操作: 单击播放图标,播放照片数字人视频。
创建知识库技能 功能介绍 该接口用于创建知识库技能。一个技能用于特定场景的交互问答,包含若干个意图等。 调用方法 请参见如何调用API。 URI POST /v1/{project_id}/digital-human-chat/knowledge/skill 表1 路径参数 参数
申请成为SP用户 MetaStudio支持SP模式,此模式对大客户开放,用于分销场景。SP用户支持购买大颗粒度资源包,并分配资源给关联租户使用。 使用限制 SP用户仅对大客户开放申请和使用。 SP用户不支持自己使用购买的资源包。 SP用户不支持访问MetaStudio控制台,进行控制台操作。
第三方平台的直播画面突然中断是怎么回事? 可能是MetaStudio控制台自动退出登录导致。 排查和修改方法,如下所示: 在MetaStudio控制台直播间开播成功时,需要参考图1,单击URL地址右侧的拦截图标,从下拉框中选择允许弹出窗口。 图1 直播间开播 单击“完成”,会新增弹出如图2和图3所示的2个浏览器窗口。
查看会话记录 可以参考本章节,查看已创建角色的对话记录。 操作步骤 登录奇妙问,左侧导航栏中,选择“会话记录”,如图1所示。 会话记录页面会展示所有角色的历史会话记录。 图1 会话记录 支持对会话进行如下操作。 可以通过项目名称、会话开始时间、会话结束时间,快速查询或者导出需要查
配置特殊词表 支持全局设置多音字或者别名,设置完成后,所有视频草稿自动生效。 操作步骤 登录MetaStudio控制台。 在左侧导航栏中,单击“我的创作”。 选择“声音”页签,单击界面右侧的“特殊词表”,进入如图1所示的界面。 图1 特殊词表 单击“新建词表”,界面新增一行特殊词,如图2所示。
第三方平台的直播画面突然中断是怎么回事? 可能是MetaStudio控制台自动退出登录导致。 排查和修改方法,如下所示: 在MetaStudio控制台直播间开播成功时,需要参考图1,单击URL地址右侧的拦截图标,从下拉框中选择允许弹出窗口。 图1 直播间开播 单击“完成”,会新增弹出如图2和图3所示的2个浏览器窗口。
部分浏览器提交H265训练视频失败如何处理? 问题描述 制作分身形象时,上传的训练视频无法播放,或提交训练任务时,提示分辨率不符合要求,如下图所示。 图1 分身形象制作 问题原因 由于Chrome等浏览器只支持硬解码H265(HEVC)视频,当您的PC硬件不支持解码H265(HE
语音同步合成WebSocket接口 前提条件 本接口目前仅支持“华北-北京四”和“华东-上海一”区域使用,且必须提交工单申请开通后才能使用。 使用本接口前,需要在MetaStudio控制台服务概览页面,开通“声音合成”的按需计费。 详细操作为:单击“声音合成”卡片中的“去开通”,