检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
示例1:上传资产 本节提供通过API Explorer和Postman工具,将资产上传至OBS桶的操作。 总体流程 调用创建资产接口创建资产ID。 调用创建文件并获取上传URL接口创建文件ID,并生成文件上传的URL地址。 使用Postman工具,参考OBS的PUT上传接口,将资产文件上传至URL地址中。
的SDK代码,如图1 获取SDK代码示例所示。 图1 获取SDK代码示例 SDK列表 目前MetaStudio提供了Java、Python和Go语言SDK供开发者使用,如表1所示。您可以在GitHub仓库查看SDK更新历史、获取安装包以及查看指导文档。 SDK已知安全漏洞及修复版
d4e5f6。 注意:robotId和taskUrl必须至少设置一个参数。 taskUrl 否 - string 在MetaStudio控制台创建生成的数字人互动任务页面URL。URL获取方式,请参见创建智能交互数字人。 注意:robotId和taskUrl必须至少设置一个参数。
、视频直播和智能交互,主要是生成画面内容。也可以直接通过静态的人脸照片生成视频,对应功能为照片数字人。 功能详情,如表1所示。 表1 功能特性 功能名称 功能描述 形象制作 拍摄真人视频,建模生成数字人形象。 数字人形象可用于生成音视频内容,应用于视频制作、视频直播和智能交互。 须知:
没有阴影或反光。 FAQ: 如果我没有这么多灯光设备,怎么办? 无需过于担心,只要保证人物被均匀、稳定地照亮,并且能清晰地和背景形成区分即可。注意要保证脸部和身体没有出现明显的阴影。在灯光设备有限的情况下,优先打亮被拍摄主体,之后再去对绿幕进行补光。 收音 我们会使用视频中的语音
错误码(ICSError) 本节介绍Web SDK客户端错误码IcsError的详细信息。 表1 错误码说明 错误码 错误描述 错误原因或建议处理方式 20010001 name include invalid symbol 请修改名称中的非法字符 20010010 query asset
是不支持websdk内置语音唤醒能力的)。预制的唤醒能力支持使用“你好云笙”、“稍等一下”、“谢谢再见”三个唤醒词,进行数字人唤醒、打断和退出。 可以通过调用create接口,设置接口参数param中config里的enableLocalWakeup参数来开启Web语音唤醒能力。
交互第三方LLM回调接口。然后由MetaStudio服务调用此接口,实现智能交互能力。 流式响应 MetaStudio智能交互提供流式问答和非流式问答能力,其中流式问答响应更快。开启后使用流式问答能力, 关闭则使用非流式问答能力。 多轮语境理解能力 配置数值越高,问答请求携带的历史对话个数越多,语境理解能力更强。
cognized和semanticRecognized通知的流式返回有什么差异? semanticRecognized 【事件说明】 LLM对提问进行语义识别后输出回复文本的事件。speechRecognized和semanticRecognized分别为问题和答案,每轮问答共用一个chatId。
智能机器人可以通过识别您所使用的食材,提供有关这些食材的营养信息和食谱建议。 它们还能根据您想要的口味和菜谱,自动添加所需的配料和调味品。 他们还可以根据您的个人偏好和历史记录,推荐适合您的菜肴和食谱。 智慧厨房的出现不仅提高了烹饪的效率和质量,还提供了一个新的健康饮食的理念。 智能厨房让我
MOV、FLV、3GP、WMV和AVI。 说明: 在直播间制作界面,如果添加视频,且视频格式为FLV、3GP、WMV、AVI时,无法展示视频播放效果,仅能图片展示。这是浏览器不兼容导致的,但是不影响直播效果。直播过程中,这些插入的视频可以正常播放和展示。 视频要求如下所示: 分辨率最大支持1080P。
图片格式:png、jpg、jpeg、webp。 单击“查看示范”,查看正确示范和错误示范。 界面操作如下所示: 单击“头像区域”,从本地选择分身数字人头像图片。 在弹出的“头像调整”对话框中,可以调整图片大小和图片位置。 单击“确认”,头像上传完成。 性别 选择性别“男生”或“女生”。
语音文件和文本文件逐句上传:每次上传一句语料的语音文件和文本文件,再调用“确认在线录音结果”接口确认语音和文本内容是否一致。确认成功后再上传和确认下一句。 文件上传后,调用“提交语音训练任务”接口,启动审核和训练。 调用方法 请参见如何调用API。 URI POST /v1/{project_id}/voice-
语音文件和文本文件逐句上传:每次上传一句语料的语音文件和文本文件,再调用“确认在线录音结果”接口确认语音和文本内容是否一致。确认成功后再上传和确认下一句。 文件上传后,调用“提交语音训练任务”接口,启动审核和训练。 调用方法 请参见如何调用API。 URI POST /v1/{project_id}/voice-
件。 语音文件为一段WAV格式的长音频文件,仅支持将语音文件打包成zip压缩格式上传。 文件上传后,调用“提交语音训练任务”接口,启动审核和训练。 调用方法 请参见如何调用API。 URI POST /v1/{project_id}/voice-training-manage/user/advance-jobs
获取数字人互动页面URL的方式还有:进入“我的创作 > 智能交互 > 对话项目”页面,单击智能交互对话项目右侧的“复制URL和激活码”,可以将URL和激活码分享给其他用户使用。 详细操作如下所示: 复制URL至浏览器中,进入“智能交互激活”页面。 复制激活码至激活码框中,单击“立即激活”。
分身数字人训练任务标签。 model_version 否 String 分身数字人模型版本。默认是V3.2版本模型。 V3.2:V3.2版本模型 说明: V3和V2版本已废弃不用 取值范围: 0-64 默认取值: V3.2 is_flexus 否 Boolean 是否是基础版的形象训练 默认取值: false
获取数字人互动页面URL的方式还有:进入“我的创作 > 智能交互 > 对话项目”页面,单击智能交互对话项目右侧的“复制URL和激活码”,可以将URL和激活码分享给其他用户使用。 详细操作如下所示: 复制URL至浏览器中,进入“智能交互激活”页面。 复制激活码至激活码框中,单击“立即激活”。
SCENE:按场景随机播报。场景内段落按顺序播报。 SCRIPT_ITEM:按段落随机播报。场景按顺序播报。 SCENE_AND_SCRIPT_ITEM:场景和段落都随机播报。 默认取值: SCRIPT_ITEM need_independent_capture_client 否 Boolean 参数解释:
00020006 token和path中的projectId不匹配 token和path中的projectId不匹配 请检查使用的token和接口调用中的projectId是否为同一个用户项目 403 MSS.00020009 无效参数 非法参数 请检查接口文档和接口参数 403 MSS