检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
如何实时切换智能交互的语言和声音? 在展厅等智能交互场景中,会有切换智能交互界面,数字人说话语言和声音的需求。 请参考下述步骤操作: 登录MetaStudio控制台。 如果是展厅场景,需要切换到“华北-北京四”区域。因为展厅的配置,均在“华北-北京四”区域。 在左侧导航栏中,选择“我的创作”。
如何在MetaStudio控制台呈现PPT的动画效果? 在视频制作界面导入的PPT,不支持展示动画、视频、动图等动态元素。如需展示动态效果,需将PPT导出为视频后,再上传至MetaStudio控制台使用。 PPT转视频的操作方法,如下所示: 本地打开PPT文件,在左上方的导航栏中,选择“文件
智能交互业务媒体流如何应对防火墙限制? 分身数字人智能交互业务使用SparkRTC方式收流,其信令和媒体访问方式为“IP+端口”或“域名+端口”,您的防火墙需要配置SparkRTC端口和域名的白名单,请参考直播业务媒体流如何应对防火墙限制?。 父主题: 智能交互
客户声音制作案例 单击声音样例.zip,下载如表1所示的音频文件。 mos分是从音色相似度、情感表达效果和声音音质方面,进行整体效果综合评分的结果。 表1 音频文件 版本 类别 原音文件 合成音文件 版本差异 适用场景 基础版声音制作 女声 基础版媒体1.wav 基础版媒体2.wav
用户可以使用SP账号购买资源包。对SP账号开放购买的资源包,普通用户不可见。 所有资源的购买操作均相同,下面以“分身数字人形象制作”为例,进行操作演示。 前提条件 当前用户已拥有SP账号。 操作步骤 使用SP用户登录华为云控制台,单击界面左上角的图标,在弹出的服务列表界面中,搜索并单击“数字内容生产线
在左侧导航栏中,单击“我的创作”。 选择“声音”,找到已生成的声音,单击声音卡片中的头像,即可试听声音效果。 用户还可以执行如下操作: 单击“视频制作”,基于已有声音,进行视频制作,操作请参考视频制作。 单击“视频直播”,基于已有声音,制作视频直播,操作请参考视频直播。 图1 声音 父主题: 声音制作
真人声音录制 客户录制真人音频,上传至MetaStudio进行AI训练,即可得到和真人音色1:1复刻的声音模型。 声音模型可实现文本转语音,应用于数字人视频制作、直播、交互问答等场景中。不同版本录制规格如下: 基础版:整段录制生成一个WAV或MP3格式音频,总时长3~10分钟,建议5分钟。
火星并开始进行调查和探测。 这是中国首次将探测器送到火星表面。 美国“珀塞弗伦斯”号探测器在火星上取得样本: 2021年9月美国宇航局的“珀塞弗伦斯”号探测器成功在火星上取得了第一个岩石样本并将其储存在容器中以备将来将样本带回地球分析。 欧洲空间局将派遣太空探测器进行水星探测:
第三方平台开播指南 视频直播支持对接淘宝、抖音、拼多多等第三方平台进行直播,相关操作请提交工单或联系客户经理获取。 常见问题 第三方直播平台直播画面不清晰怎么办? 第三方平台直播画面突然中断是怎么回事? 父主题: 附录
智能交互根据客户需要,后台提供多种知识库配置,支持配置中英双语。 智能交互基于已有训练生成的数字分身形象模型和声音模型,结合知识库,可与用户进行实时对话。 用户购买路数越多,同时进行数字人交互对话的数量则越多。 资源超过有效期后将无法使用,建议开通自动续费功能。 包年/包月 照片数字人视频制作 按照片数字人视频制作时长计费。
从科技创新的角度来看,家用机器人在许多方面都具有创新性。 它采用了简洁、时尚的外观设计,不仅美观大方,而且易于使用和操作。 它可以与智能家居设备进行连接,实现智能家居控制; 在引领科技潮流方面,家用机器人注重持续的技术更新和升级。 它将不断地推出新功能、新技术和新服务,以满足大家不断变化的需求。
数字人技术的重要应用之一。在教育行业,分身数字人可用于教育、培训机构平台、企业内部培训、IP知识视频宣传等。 通过分身数字人进行教育宣传和教育资源推广,进行线上教学和培训,不仅可以大幅节约师资成本,还可以提升教学质量。通过减少对人力的依赖,使教育机构可以将更多精力投入到创新和教学
智能交互驱动流程 流程图示例 用户与数字人进行智能交互的流程图示例,如下所示,对应流程的详细说明,如流程图总体说明所示。 智能交互非流式驱动流程图,如图1所示。 智能交互流式驱动流程图,如图2所示。 智能交互驱动打断对话流程图,如图3所示。 智能交互驱动停止对话流程图,如图4所示。
在左侧导航栏中,单击“我的创作”。 选择“视频”页签,如图1所示。 在“视频”页面,可以看到已生成的视频列表,以卡片形式排列展示。 支持对视频进行如下操作: 单击播放图标,播放照片数字人视频。 单击,在弹出的下拉框中,可下载视频至本地、查看详情、重命名或删除视频。 图1 照片数字人视频
数字人开始讲话事件。 speakingStop 数字人结束讲话事件。 speechRecognized ASR对提问进行语音识别后输出为文本的事件。 semanticRecognized LLM对提问进行语义识别后输出回复文本的事件。speechRecognized和semanticRecogniz
视频直播(英文) 视频直播全流程 01:46 视频直播英文界面全流程演示 视频直播 如何访问MetaStudio服务 00:26 1.如何访问MetaStudio服务 视频直播 如何搭建直播间 00:46 2.如何搭建直播间 视频直播 直播剧本设置 01:16 3.直播剧本设置 视频直播 直播间弹幕互动设置
查询智能直播间列表 功能介绍 该接口用于智能直播间列表。 调用方法 请参见如何调用API。 URI GET /v1/{project_id}/smart-live-rooms 表1 路径参数 参数 是否必选 参数类型 描述 project_id 是 String 项目ID,获取方法请参考获取项目ID。
成成功和生成失败的任务。 在下方的名片列表中,可以查看名片详情,包括名片封面、名称、任务ID、提交时间、生成时间、状态等信息。 支持对名片进行如下操作: 单击“查看”,进入“我的创作 > 分身名片”页面,可以查看名片详情,如查看名片所示。 单击“下载”,将名片下载至本地查看。下载后的文件为mp4格式。
使用。 使用限制 SP用户仅对大客户开放申请和使用。 SP用户不支持自己使用购买的资源包。 SP用户不支持访问MetaStudio控制台,进行控制台操作。 操作步骤 注册华为账号:单击进入注册页面。 完成实名认证:单击进入实名认证。 获取所在Region的项目ID,操作方法如获取项目ID所示。
更新智能直播间互动规则库 功能介绍 该接口用于更新智能直播间互动规则库。 调用方法 请参见如何调用API。 URI PUT /v1/{project_id}/smart-live-interaction-rule-groups/{group_id} 表1 路径参数 参数 是否必选