检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
如何实时切换智能交互的语言和声音? 在展厅等智能交互场景中,会有切换智能交互界面,数字人说话语言和声音的需求。 请参考下述步骤操作: 登录MetaStudio控制台。 如果是展厅场景,需要切换到“华北-北京四”区域。因为展厅的配置,均在“华北-北京四”区域。 在左侧导航栏中,选择“我的创作”。
智能机器人可以通过识别您所使用的食材,提供有关这些食材的营养信息和食谱建议。 它们还能根据您想要的口味和菜谱,自动添加所需的配料和调味品。 他们还可以根据您的个人偏好和历史记录,推荐适合您的菜肴和食谱。 智慧厨房的出现不仅提高了烹饪的效率和质量,还提供了一个新的健康饮食的理念。 智能厨房让我
制作名片 用户可以为分身数字人制作形象名片,且支持试听和查看数字人语音表达效果。 操作步骤 登录MetaStudio控制台。 在“工作台”界面,单击“分身数字人名片制作”,弹出“请选择您要使用的名片模板”对话框,如图1所示。 服务提供了名片模板,用户可以基于模板制作名片。 图1 选择名片模板
2次/秒 - 表2 API流控限制 接口分类 接口名称 单租户接口流控 系统流控 租户管理 查看租户资源用量信息 10次/秒 20次/秒 查看租户资源列表 10次/秒 20次/秒 统计时间段内资源数量 10次/秒 20次/秒 父主题: 使用限制
等待资产同步 待用户审核,仅NA白名单用户有该状态 WAIT_USER_CONFIRM: 等待用户确认训练效果 用户驳回,仅NA白名单用户有该状态 JOB_REJECT: 驳回任务 已完成 JOB_SUCCESS: 训练任务完成(普通用户任务的完成状态,此时用户已经可以使用模型)
名称。用户也可以在提交工单时,同步补充需要的意图列表,让服务进行预置。仅支持选择已有意图,且每个意图仅能新增设置一次。 添加回复话术:单击“添加回复话术”,可以自定义添加当前意图的安抚话术。最多支持添加5个。 如果用户同时配置了通用安抚话术和意图话术,则按照“触发时长”和意图话术
MetaStudio智能交互服务支持开发者自定义数字人大脑(即第三方LLM)。当用户与数字人对话时,将触发调用该接口,由该接口返回问题对应的答案文本内容。 签名计算方法 第三方LLM自定义接口,使用HMACSHA256签名模式,需要在URL中追加参数“secret”和“time_stamp”。 取值方式为:sec
示例1:上传资产 本节提供通过API Explorer和Postman工具,将资产上传至OBS桶的操作。 总体流程 调用创建资产接口创建资产ID。 调用创建文件并获取上传URL接口创建文件ID,并生成文件上传的URL地址。 使用Postman工具,参考OBS的PUT上传接口,将资产文件上传至URL地址中。
urces-usage 查看租户资源用量信息 GET /v1/{project_id}/tenants/resources 查看租户资源列表 GET /v1/{project_id}/tenants/resources-count 统计时间段内资源数量
高品质:整段录制生成一个WAV或MP3格式音频,总时长1小时以上,建议1小时。 原声录制音频和其对应生成的音色播报示例,如客户声音制作案例所示。 录音准备 表1 录音准备 声音类型 录制设备和软件 录音环境 录音文案 基础版 优先使用专业录音设备录制音频,推荐使用Adobe Audition软件进行录音。
MOV、FLV、3GP、WMV和AVI。 说明: 在直播间制作界面,如果添加视频,且视频格式为FLV、3GP、WMV、AVI时,无法展示视频播放效果,仅能图片展示。这是浏览器不兼容导致的,但是不影响直播效果。直播过程中,这些插入的视频可以正常播放和展示。 视频要求如下所示: 分辨率最大支持1080P。
示例:关于产品的链接、型号和优惠等问题,请看界面上方的说明,按照说明操作,就可以详细了解了。 音频:从本地上传一个音频文件,支持MP4、WAV和M4A格式。当命中此规则后,使用此音频进行回复。 智能交互:通过智能交互的方式回复用户问题,相当于提供了一个第三方语言模型去答复用户问题。 素材绑定(可选)
建立WebSocket连接。 发送TTS合成请求,详见请求参数。 请求参数 表1 请求Header参数 参数 是否必选 参数类型 参数位置 描述 X-Auth-Token 是 String header 用户Token。使用Token鉴权方式时必选。 通过调用IAM服务获取用户Token接口获取。
操作步骤 登录MetaStudio控制台。 在“工作台”界面,单击“分身视频制作”下方的“开始创建”。 进入视频制作界面,界面详情如视频制作界面说明-图1所示。操作说明如下所示: 视频素材区域,除了系统预置素材外,角色还可以自定义新增分身数字人,背景、PPT、贴图、视频和音乐还可以从本地导入使用。
智能交互设置 直播间页面支持弹幕规则使用“智能交互”的方式,去回复直播间用户的提问。智能交互的方式相当于提供了一个第三方语言模型去答复用户问题。 操作步骤 登录MetaStudio控制台。 在“工作台”界面,单击“分身视频直播”下方的“开始创建”,进入分身数字人直播首页面。 在“
等待资产同步 待用户审核,仅NA白名单用户有该状态 WAIT_USER_CONFIRM: 等待用户确认训练效果 用户驳回,仅NA白名单用户有该状态 JOB_REJECT: 驳回任务 已完成 JOB_SUCCESS: 训练任务完成(普通用户任务的完成状态,此时用户已经可以使用模型)
在MetaStudio控制台创建技能并导出技能文件 登录MetaStudio控制台。 在左侧导航栏中,选择“我的创作”。 选择“智能交互 > 技能管理”,如图1所示。 图1 智能交互页面 单击右上方的“创建技能”,弹出“创建技能”对话框,如图2所示。 参数配置说明,如表1表1所示。 支持用户最多创建100个技能。
声音制作任务算法训练完成后,可以查看声音。 操作步骤 登录MetaStudio控制台。 在左侧导航栏中,单击“任务中心”。 选择“声音制作”,确认声音制作任务已训练完成。 在左侧导航栏中,单击“我的创作”。 选择“声音”,找到已生成的声音,单击声音卡片中的头像,即可试听声音效果。 用户还可以执行如下操作: 单
查看视频 如果用户需要查看已生成的照片数字人视频,可参考本节操作。 操作步骤 登录MetaStudio控制台。 在左侧导航栏中,单击“我的创作”。 选择“视频”页签,如图1所示。 在“视频”页面,可以看到已生成的视频列表,以卡片形式排列展示。 支持对视频进行如下操作: 单击播放图标,播放照片数字人视频。
查看名片 如果用户需要查看已生成的分身数字人名片,可参考本节操作。 操作步骤 登录MetaStudio控制台。 在左侧导航栏中,单击“我的创作”。 选择“分身名片”页签,如图1所示。 在“分身名片”页面,可以看到已生成的名片列表,以卡片形式排列展示。 支持对名片进行如下操作: 单击,查看分身数字人的语音表达形态。