检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
0/OS-USER/users Content-Type: application/json X-Auth-Token: ABCDEFJ.... 您还可以通过这个视频教程了解如何使用Token认证:https://bbs.huaweicloud.com/videos/101333。 父主题: 如何调用API
emotion>我带大家<phoneme ph="liao3">了</phoneme>解MetaStudio。</speak> 分身数字人视频制作仅<break>和<phoneme>标签生效。 PlayAudioInfo 表3 PlayAudioInfo 参数 是否必选 参数类型
String 音色模型ID。需要使用MetaStudio的数字资产管理相关接口从资产库查出。 script_type 否 String 脚本类型,即视频制作的驱动方式。默认TEXT TEXT: 文本驱动,即通过TTS合成语音 AUDIO: 语音驱动 默认取值: TEXT text 否 String
0-2147483647 job_type String 任务类型。 REAL_JOB:实时任务。如数字人交互。 UNREAL_JOB:非实时任务。如数字人视频制作 状态码: 400 表7 响应Body参数 参数 参数类型 描述 error_code String 错误码。 error_msg String
一旦发现异常情况,机器人会立即发出警报,通知您和家庭成员。 118. 监控服务:机器人可以装备摄像头和传感器,对家庭环境进行监控,并提供实时视频和图像警报。 119. 它们可以在居住区域周围巡逻,确保家庭的安全和隐私。 120. 此外,机器人还可以监控您家的空气质量、温度和湿度等参数,为您的家庭健康保驾护航。
model_resolution String 分身数字人模型分辨率。默认是1080P。 1080P:1080P。支持1080P及720P的视频输出。 4K:4K。支持4K、1080P及720P的视频输出。 app_user_id String 自定义用户id(如创建任务时设置了X-App-UserId则会携带)。
asset_type String 资产类型。 公共资产类型: VOICE_MODEL:音色模型(仅系统管理员可上传,普通租户仅可查询) VIDEO:视频文件 IMAGE:图片文件 PPT:幻灯片文件 MUSIC: 音乐 AUDIO: 音频 COMMON_FILE:通用文件 分身数字人资产:
没有找到可用设备,请排查设备是否就绪。 90100004 no available video input devices 没有找到可用摄像头设备,请排查视频采集设备是否就绪。 90100005 no available audio input devices. 没有找到音频输入设备,请排查音频采集设备是否就绪。
语音同步合成WebSocket接口 前提条件 本接口目前仅支持“华北-北京四”和“华东-上海一”区域使用,且必须提交工单申请开通后才能使用。 使用本接口前,需要在MetaStudio控制台服务概览页面,开通“声音合成”的按需计费。 详细操作为:单击“声音合成”卡片中的“去开通”,
智能交互公共配置 智能交互界面支持添加角色、背景、对话配置,可参考本节进行操作。 角色 角色界面详情,如图1所示。 图1 角色界面 角色界面说明,如表1所示。 表1 界面元素说明 界面元素 说明 定制数字人 单击“定制数字人”,跳转至形象制作页面,界面详情和操作指导,详见创建分身数字人定制任务。
智能交互驱动WebSocket接口 终端节点获取方式 智能交互驱动WebSocket接口终端节点的获取方式,如表1所示。 表1 终端节点获取方式 场景 获取方式 未通过WEB SDK调用场景 终端节点地址从接口StartSmartChatJob.xml的响应参数chat_access_address中获取。
创建技能 技能是一组智能问答对的组合,详细操作如下所示: 在MetaStudio控制台创建技能并导出技能文件:先创建技能,再添加所有问答对后,导出技能文件。 在科大讯飞创建同名技能并导入技能文件:将MetaStudio导出的技能文件导入至科大讯飞的同名技能中。 创建智能交互数字人
直播带货风格文案 哈喽哈喽,宝宝们晚上好呀,欢迎来到我们的直播间。 今天咱们刚刚开播,给大家带来了超多福利,是你想不到的优惠! 在直播间的宝宝可以扣个一,让我看到你们。 当前在直播间的宝宝,我们先来抽五个人免费送一波福利! 今晚的美食专场有饼干,有薯片…还有我也非常喜欢吃的麻辣香锅。
直播带货风格文案 哈喽哈喽,宝宝们晚上好呀,欢迎来到我们的直播间。 爱吃的宝宝们一定要认准我们的直播间,喜欢快乐购物的也要关注我们哦! 今天咱们刚刚开播,给大家带来了超多福利,是你想不到的优惠! 在直播间的宝宝可以扣个一,让我看到你们。 废话不多说,我们先来一波抽奖! 当前在直播
获取项目ID 在调用接口的时候,部分URL中需要填入项目ID,所以需要获取到项目ID。您可以通过以下两种方式获取项目ID。 从控制台获取项目ID 调用API获取项目ID 从控制台获取项目ID 登录管理控制台。 鼠标悬停在右上角的用户名,选择下拉列表中“我的凭证”。 图1 管理控制台
创建智能交互数字人 介绍如何在MetaStudio平台创建智能交互数字人,实现用户和数字人交互对话。相应的场景说明,请参考场景说明。 操作步骤 登录MetaStudio控制台,单击“智能交互”。 在智能交互编辑页面,依次设置角色和背景。 查看界面右侧的“互动问答”页签,如图1所示。
Web语音唤醒 产品预置了唤醒能力,详见预制唤醒能力,如果用户需要更新唤醒词,需要参考定制唤醒能力处理。唤醒模型定制完成后,产品会提供给用户,用户需要参考更新唤醒模型,将模型更新至本地模型路径中。 使用要求 WebSDK版本为3.0.1及以上。 仅支持数字人平台配置或内置ASR(
创建智能交互数字人(SDK场景) 介绍如何在MetaStudio平台创建智能交互数字人,实现用户和数字人对话。相应的场景说明,请参考场景说明。 操作步骤 登录MetaStudio控制台,单击“智能交互”。 在智能交互编辑页面,依次设置角色和背景。 查看界面右侧的“互动问答”页签,如图1所示。
文本驱动SSML定义 MetaStudio语音驱动采用语音合成标记语言(SSML,Speech Synthesis Markup Language)来控制数字人的行为,包括动作、情绪以及TTS语音合成的多音字、停顿等。 SSML基础定义可参考语音合成标记语言版本 1.0。Meta
常见问题 智能交互SDK安装包里为什么有图片资源? SDK里面包含图片资源,是因为智能交互的动效、背景可能需要图片资源才能展示更好的效果。所以智能交互Web SDK为了方便用户集成使用,会同时包含UI相关资源。 speechRecognized和semanticRecognized通知的流式返回有什么差异?