检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
表1 终端节点获取方式 场景 获取方式 未通过WEB SDK调用场景 终端节点地址从接口启动数字人智能交互任务的响应参数chat_access_address中获取。 通过WEB SDK调用场景 终端节点地址从智能交互SDK的通知jobInfoChange的参数websocketAddr中获取。
选择开播方式(二选一) 请根据实际情况,选择一种开播方式,并按照界面提示进行操作。 提供下述2种方式开播: 从直播平台获取推流地址。获取方式各平台入口不一,建议咨询对应的直播平台。在MetaStudio服务这里仅需输入推流地址,即可直推平台。 推流即RTMP直推,华为云服务器直接把画面传到
使用Token认证时该字段必选。 注:以下仅为Token示例片段。 MIIPAgYJKoZIhvcNAQcCo...ggg1BBIINPXsidG9rZ API同时支持使用AK/SK认证,AK/SK认证使用SDK对请求进行签名,签名过程会自动往请求中添加Authorization(签名认
"c131886aec...", "name": "IAMUser", "description": "IAM User Description", "areacode": "", "phone": "",
分身形象和声音制作的处理方式相同,均需根据实际情况进行处理。下面以形象制作为例,进行说明。 如果当前分身形象制作的素材质量不佳,管理员会通过用户提交训练任务时输入的手机号联系用户。用户可以在管理员驳回任务后重新提交训练视频,进行数字人形象训练。形象制作任务制作完成前,形象制作资源一直处于占用状态,并未真正扣除。
智能交互驱动流程 流程图示例 用户与数字人进行智能交互的流程图示例,如下所示,对应流程的详细说明,如流程图总体说明所示。 智能交互非流式驱动流程图,如图1所示。 智能交互流式驱动流程图,如图2所示。 智能交互驱动打断对话流程图,如图3所示。 智能交互驱动停止对话流程图,如图4所示。
视频合成失败如何处理? 视频合成失败时,请您根据界面提示信息进行问题定位及修改,如表1所示。 表1 问题定位及修改 错误提示 处理办法 视频名称包含非法字符 请您根据要求修改导出文件名称中的敏感字符。 资产名称重复 请您根据要求重新修改导出文件的名称。 视频任务合成状态一直显示“待合成”
OutputInfo 参数 参数类型 描述 face_addr String 面部表情输入地址。 body_addr String 身体动作输入地址。 audio_addr String 音频输入地址。 session_id Integer 会话ID。 取值范围: 0-4294967295
OutputInfo 参数 参数类型 描述 face_addr String 面部表情输入地址。 body_addr String 身体动作输入地址。 audio_addr String 音频输入地址。 session_id Integer 会话ID。 取值范围: 0-4294967295
script_id 否 String 剧本ID。 说明: 如果shoot_scripts中shoot_script.script_type为"TEXT",则台词以shoot_scripts中的文本为准; 如果shoot_scripts中shoot_script.script_ty
响应参数 状态码:200 表2 响应Body参数 参数 参数类型 描述 csv_file_download_url String csv文件下载地址 state String 任务的状态。 PROCESSING:处理中 SUCCEED:成功 FAILED:失败 error_message
ShootScript(); shootScriptShootScripts.withScriptType(ShootScript.ScriptTypeEnum.fromValue("TEXT")) .withTextConfig(textConfigShootScript)
投送或其他第三方应用导出音频文件至PC中。 一个长音频文件无需压缩,可直接上传至MetaStudio控制台,进行声音训练。 安卓手机 安卓手机推荐下载软件“超级录音机”进行录音,如图2所示。 图2 超级录音机 音频录制说明,如表2所示。 表2 音频录制说明 音频录制 说明 采样率
使用API时返回“APIGW”开头的错误码,该如何处理? 当您使用云服务API,遇到“APIGW”开头的错误码,请参考错误码说明进行处理。 父主题: API和SDK使用
cn-southwest-2: 贵阳1 chat_access_address String 智能交互接入地址。 chat_access_rest_address String 智能交互Rest接口接入地址。 is_transparent Boolean 是否透明背景 默认取值: false default_language
speakingStop 数字人结束讲话事件。 × √ speechRecognized ASR对提问进行语音识别后输出为文本的事件。 × √ semanticRecognized LLM对提问进行语义识别后输出回复文本的事件。speechRecognized和semanticRecogn
系统资产标签定义 查询资产列表接口支持使用“tags”标签对分身数字人模型进行分类。 “tags”取值及其含义,如表1所示。 表1 tags标签说明 tags取值类型 说明 数字人类型 取值如下: VIRTUAL_AVATARS:分身数字人 VIRTUAL_HUMANS:虚拟数字人
方法一:通过剪映将H265(HEVC)视频的格式转码为H264,再上传至MetaStudio控制台,进行形象制作。 详细操作如下所示: 方法二:通过ffmpeg将H265(HEVC)视频的格式转码为H264,再上传至MetaStudio控制台,进行形象制作。 详细操作如下所示: 输入命令行:ffmpeg -i 视频文件名
参数 是否必选 参数类型 描述 face_addr 否 String 面部表情输入地址。 body_addr 否 String 身体动作输入地址。 audio_addr 否 String 音频输入地址。 session_id 否 Integer 会话ID。 取值范围: 0-4294967295
取安装包以及查看指导文档。 SDK已知安全漏洞及修复版本、规避方案,请单击表1中的SDK对应语言的Github地址进行查看。 表1 服务端SDK 语言 Github地址 参考文档 JAVA huaweicloud-sdk-java-v3 Java SDK使用指导 Python h