检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
数字人支持提供语义理解知识库吗? 不提供语义理解知识库。语义理解是知识库的能力,不是数字人的能力。 智能交互的主要功能是通过数字人与用户进行交互问答,也就是用户提问,数字人说出知识库返回的答案。数字人回答的内容,是由大模型或知识库返回的答案决定的。 父主题: 数字人
声音和形象制作 标准版数字人可以用实景拍摄吗? 分身数字人定制任务提交后,审核未通过怎么办? 模型审核和制作可以加快吗? 部分浏览器提交H265训练视频失败如何处理? 声音和形象模型支持在其他平台使用吗? 声音和形象模型和音视频内容的关系? Flexus数字人在走动录制时需要注意什么?
第三方声音支持的语言类型 第三方声音支持的语言类型,如表1所示。 表1 语言类型 语言类型 语种 出门问问(方言) 支持7种语言:东北话、广西话、湖北话、陕西话、四川话、粤语、港台。 出门问问(预置声音) 支持19种语言:中文、英文、德语、法语、韩语、葡萄牙语、日语、西班牙语、意
API和SDK使用 如何获取项目ID? 如何调用MetaStudio接口? Flexus支持通过API集成使用吗? 为什么调用API时提示“APIG.0301”? 使用API时返回“APIGW”开头的错误码,该如何处理? 智能交互SDK从哪里下载?
模型审核和制作可以加快吗? 为了保证模型质量,确保素材符合拍摄要求,训练前素材会经过人工审核。原则上不支持催审和加速,请耐心等待。模型审核制作耗时详情,如表1所示。 表1 模型制作耗时 模型类型 制作耗时 声音模型 声音模型制作耗时,如下所示: 基础版:约1~3个工作日。 进阶版:约1~3个工作日。
视频直播 MetaStudio服务支持使用分身数字人,创建直播间。 操作步骤如下所示: 新增商品 新增互动库 创建直播间 查看直播任务 注意事项 推荐使用Chrome浏览器访问MetaStudio控制台。 新增商品 分身视频直播首页面的“商品管理”页签,支持新增商品。商品会自动展示在直
中的员工设置不同的访问权限,以达到不同员工之间的权限隔离,您可以使用统一身份认证服务(Identity and Access Management,简称IAM)进行精细的权限管理。该服务提供用户身份认证、权限分配、访问控制等功能,可以帮助您安全地控制资源地访问。 通过IAM,您可
创建知识库意图和问法 功能介绍 该接口用于创建知识库意图和问法。一个意图包含一个主题,一个答案,若干个问法等。 调用方法 请参见如何调用API。 URI POST /v1/{project_id}/digital-human-chat/knowledge/intent-question
申请成为SP用户 MetaStudio支持SP模式,此模式对大客户开放,用于分销场景。SP用户支持购买大颗粒度资源包,并分配资源给关联租户使用。 使用限制 SP用户仅对大客户开放申请和使用。 SP用户不支持自己使用购买的资源包。 SP用户不支持访问MetaStudio控制台,进行控制台操作。
操作前提 前提条件 需要申请开通智能交互权限后,才可集成智能交互SDK使用。 WebSDK使用限制 由于浏览器的安全策略限制,仅支持通过“https://域名”方式访问,否则无法正常加载运行智能交互WebSDK。 父主题: 智能交互客户端SDK
用户创建语音训练高级版任务,该接口会返回一个obs上传地址,用于上传语音文件。 语音文件为一段WAV格式的长音频文件,仅支持将语音文件打包成zip压缩格式上传。 文件上传后,调用“提交语音训练任务”接口,启动审核和训练。 调用方法 请参见如何调用API。 URI POST /v1/{project_id}/
声音暂不支持用于智能交互和视频直播。其支持的语言类型,如第三方声音支持的语言类型所示。 购买出门问问小语种克隆套餐包:如果用户需要使用“出门问问声音制作”方式自定义生成声音,需要在云商店购买出门问问小语种克隆套餐包。 获取第三方声音使用凭证:查看已购套餐包的“用户账号”和“登录密
标准版数字人可以用实景拍摄吗? 可以,详见拍摄真人视频中的“实景数字人拍摄要求”。 使用实景拍摄,不支持抠图和更换背景,后期使用数字人会一直带着拍摄的背景。只有绿幕素材后续可以更换背景,蓝幕也不支持更换背景。 父主题: 声音和形象制作
需要有麦克风,且要保障1米以内的拾音效果。 扬声器 需要有扬声器。 触摸屏 需要有触摸屏。 带宽 4M以上。 由于浏览器的安全策略限制,仅支持通过“https://域名”方式访问,否则无法正常加载运行智能交互WebSDK。 智能交互界面对浏览器的要求,如表2所示。 表2 浏览器适配详情 操作系统类型
47010009 没有权限访问 没有权限访问 请访问正确的接口 403 MSS.47010023 没有权限访问技能配置 没有权限访问技能配置 访问本租户下的技能配置 403 MSS.47010028 没有权限访问问答对配置 没有权限访问问答对配置 访问本租户下的问答对配置 403
制作分身形象时,上传的训练视频无法播放,或提交训练任务时,提示分辨率不符合要求,如下图所示。 图1 分身形象制作 问题原因 由于Chrome等浏览器只支持硬解码H265(HEVC)视频,当您的PC硬件不支持解码H265(HEVC)视频时,Chrome等浏览器将无法播放H265(HEVC)视频,并获取不到视频分辨率等参数。
个场景,设置生成下一个场景的画面布局和剧本内容。 图7 直播间界面 所有场景的画面布局和剧本设置完成后,单击界面右侧的“互动设置”页签,如图8所示。 互动设置包含4类设置:弹幕、用户入场、点赞和送礼。支持直接导入互动管理中设置好的互动库,也支持在当前直播间逐条设置互动规则。所有类型总计可添加100个互动规则。
音克隆能力和120分钟1080P视频制作能力,帮助客户通过手机拍摄即可轻松制作数字人。Flexus分身数字人不仅简化制作流程,还显著降低技术门槛,且购买简单,为中小企业提供超简单、超高性价比数字人。 使用限制 Flexus分身数字人目前仅支持视频制作,不支持视频直播和智能交互。 产品特性
token和租户id不匹配 请检查携带的鉴权信息 对应处理方式如下所示: 请参考认证鉴权获取token。 请参考认证鉴权重新获取token。 重新获取与token匹配的项目ID,详见获取项目ID。 403 MSS.000000004 非法访问,未鉴权或者鉴权失败 非法访问,未鉴权或者鉴权失败
直播控制HTTP Command命令说明 分身数字人直播过程中,支持通过HTTP API的方式人工接管直播。人工接管以后,支持通过下述方式驱动数字人说话: 文本驱动方式:对应Command命令为“INSERT_PLAY_SCRIPT”,即插入表演脚本,用于互动回复。数字人不变时,