检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
SDK隐私声明 数字人智能交互Web SDK是由华为云计算技术有限公司(以下简称“我们”或“华为云”)面向华为云客户(以下简称“客户”)提供的数字人智能交互开放能力及服务。
部分浏览器提交H265训练视频失败如何处理? 声音和形象模型支持在其他平台使用吗? 声音和形象模型和音视频内容的关系? Flexus数字人在走动录制时需要注意什么?
以表格方式向用户告知 第三方SDK名称 第三方公司名称 收集个人信息类型 使用目的 隐私政策链接 数字人智能交互Web SDK 华为云计算技术有限公司 您或您的最终用户的音频数据或文本数据、应用信息(浏览器User Agent)、SDK接口调用记录 为华为云客户应用提供数字人智能交互服务
AV1、H265编码格式目前支持Chrome浏览器,不支持Edge浏览器。 视频素材总大小小于1GB。 同时叠加的视频总数量最多支持2个。 音频格式 音频支持的格式为:MP3、M4A、WAV。 音频要求如下所示: 仅提取单声道音频。 音频素材总大小小于500MB。
AV1、H265编码格式目前支持Chrome浏览器,不支持Edge浏览器。 视频采样格式为YUV420。 视频素材总大小小于1GB。 同时叠加的视频总数量为3,包含互动时配置的视频。 音频格式 音频支持的格式为:MP3、M4A、WAV。 音频要求如下所示: 仅提取单声道音频。
图1 直播间开播 单击“完成”,会新增弹出如图2和图3所示的2个浏览器窗口。 MetaStudio控制台超过10分钟不操作,默认会退出登录,导致第三方直播平台的直播画面也中断。需要确保图3的窗口始终是打开的,直播过程中一定不能关闭,这样第三方直播平台的直播才能顺利完成。
图1 直播间开播 单击“完成”,会新增弹出如图2和图3所示的2个浏览器窗口。 MetaStudio控制台超过10分钟不操作,默认会退出登录,导致第三方直播平台的直播画面也中断。需要确保图3的窗口始终是打开的,直播过程中一定不能关闭,这样第三方直播平台的直播才能顺利完成。
浏览器不支持媒体采集。
获取在线录音确认结果
详细操作如下所示: 复制URL至浏览器中,进入“智能交互激活”页面。 复制激活码至激活码框中,单击“立即激活”。 完成验证并等待加载完成,即可开始对话。 图4 智能交互对话项目 父主题: 创建智能交互数字人(二次开发场景)
详细操作如下所示: 复制URL至浏览器中,进入“智能交互激活”页面。 复制激活码至激活码框中,单击“立即激活”。 完成验证并等待加载完成,即可开始对话。 图4 智能交互对话项目 父主题: 创建智能交互数字人(华为云CBS)
如果有声音,就是浏览器的安全策略导致,需要引导用户在create之前点击页面。 检查扬声器设备是否正常。 如果有增删扬声器设备的行为,请刷新或重新打开挂载数字人的页面后重试。如果还不行,请参考第二条,检查设备是否正常。 父主题: Web SDK
详细操作如下所示: 复制URL至浏览器中,进入“智能交互激活”页面。 复制激活码至激活码框中,单击“立即激活”。 完成验证并等待加载完成,即可开始对话。 图3 智能交互对话项目 父主题: 创建智能交互数字人(奇妙问)
详细操作如下所示: 复制URL至浏览器中,进入“智能交互激活”页面。 复制激活码至激活码框中,单击“立即激活”。 完成验证并等待加载完成,即可开始对话。 图3 智能交互对话项目 父主题: 创建智能交互数字人(科大讯飞)
在线录音:在线录制音频。录音时长不能超过5分钟,为保证音频生成的效果,请保持录音环境安静无噪音。支持试听录制生成的语音。 文本驱动:通过输入文本,选择声音的方式,生成播报内容。不能超过2000字。 单击声音图标,会弹出声音对话框,可以选择需要使用的声音。
SDK概述 华为云提供了MetaStudio服务端SDK,您可以直接集成服务端SDK来调用MetaStudio的相关API,从而实现对MetaStudio服务的快速操作。
详细操作如下所示: 复制URL至浏览器中,进入“智能交互激活”页面。 复制激活码至激活码框中,单击“立即激活”。 完成验证并等待加载完成,即可开始对话。 图3 智能交互对话项目 父主题: 创建智能交互数字人(第三方语言模型)
详细操作如下所示: 复制URL至浏览器中,进入“智能交互激活”页面。 复制激活码至激活码框中,单击“立即激活”。 完成验证并等待加载完成,即可开始对话。 图4 智能交互对话项目 父主题: 创建智能交互数字人(二次开发场景)
在线录音:在线录制音频。录音时长不能超过5分钟,为保证音频生成的效果,请保持录音环境安静无噪音。支持试听录制生成的语音。 文本驱动:通过输入文本,选择声音的方式,生成播报内容。不能超过2000字。 单击声音图标,会弹出声音对话框,可以选择需要使用的声音。
须知: 进行智能交互时,透明背景支持的浏览器及版本,详见客户端SDK参考-快速入门-表3。 设置create接口参数config内的配置参数useDefaultBackground,其默认值为true,需修改为false。