检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
fo中说明。 view_mode String 横竖屏类型。默认值为:VERTICAL。 LANDSCAPE:横屏。 VERTICAL: 竖屏。 默认取值: VERTICAL error_info ErrorResponse object 数字人直播间出错信息。 shared_config
算法备案公示 下述内容为MetaStudio服务提供的算法备案信息、基本原理、运行机制和目的意图等内容,以保障用户的知情权,方便用户更好的选择和使用MetaStudio服务。 华为云MetaStudio分身数字人驱动算法 表1 分身数字人驱动算法 算法项 描述 算法名称 华为云MetaStudio分身数字人驱动算法
SDK隐私声明 数字人智能交互Web SDK是由华为云计算技术有限公司(以下简称“我们”或“华为云”)面向华为云客户(以下简称“客户”)提供的数字人智能交互开放能力及服务。 客户根据数字人智能交互Web SDK的开发文档和指南在其应用中集成了数字人智能交互Web SDK后,我们将通过被集成的数字人智能交互Web
子资源类型。当前只有flexus套餐包存在该字段 voice_clone_flexus: 语音克隆Flexus版 modeling_count_2d_model_flexus: 分身数字人形象制作Flexus版 video_time_flexus_2d_model: 分身数字人Flexus版本视频制作
创建热词记录 功能介绍 该接口用于创建热词记录。 调用方法 请参见如何调用API。 URI POST /v1/{project_id}/digital-human-chat/hot-words 表1 路径参数 参数 是否必选 参数类型 描述 project_id 是 String
页面的行为。 浏览器通过有上述点击的行为,才能获取采集声音的权限。否则无法采集声音,无法正常使用语音唤醒能力。 预制唤醒能力 自3.0.1版本开始,SDK支持唤醒能力(注意:如果使用了websocket接口驱动数字人的方案,是不支持websdk内置语音唤醒能力的)。预制的唤醒能力
须知: Flexus数字人视频制作时,必须使用flexus形象;声音可以使用flexus声音或标准版声音。标准版视频制作,不支持使用flexus形象或声音。 Flexus数字人与标准版数字人的视频制作资源不共享,分开计费。 按需计费 按需预付费套餐包 一次性计费 分身数字人形象制作
创建高级版语音训练任务 功能介绍 用户创建语音训练高级版任务,该接口会返回一个obs上传地址,用于上传语音文件。 语音文件为一段WAV格式的长音频文件,仅支持将语音文件打包成zip压缩格式上传。 文件上传后,调用“提交语音训练任务”接口,启动审核和训练。 调用方法 请参见如何调用API。
修改热词记录 功能介绍 该接口用于修改热词记录。 调用方法 请参见如何调用API。 URI PUT /v1/{project_id}/digital-human-chat/hot-words/{hot_words_id} 表1 路径参数 参数 是否必选 参数类型 描述 project_id
视频直播限制 分身数字人直播限制,如下所示: 直播间配置约束 直播任务退出说明 直播播放说明 直播内容审核说明 直播间配置约束 直播间配置限制,如表1所示。 表1 直播间限制 直播间配置 限制 文本驱动 每个单场景中所有段落输入文字的总量需大于200字。 每个段落的文本字符数量需
model_version String 参数解释: 分身数字人模型版本 约束限制: 不涉及 取值范围: V2: V2版本模型 V3:V3版本模型 V3_2:V3.2版本模型 默认取值: V2 model_resolution String 参数解释: 分身数字人模型分辨率。 约束限制:
创建进阶版语音训练任务 功能介绍 用户创建语音训练进阶版任务,该接口会返回一个obs上传地址,用于上传语音文件。 支持2种方式上传语音文件: 语音文件和文本文件打包成zip上传:语音文件已经切分成100个wav文件,每个语音文件对应一个txt文本文件,所有文件打包成zip文件。语音文件命名规则:0
创建基础版语音训练任务 功能介绍 用户创建语音训练基础版任务,该接口会返回一个obs上传地址,用于上传语音文件。 支持2种方式上传语音文件: 语音文件和文本文件打包成zip上传:语音文件已经切分成20个wav文件,每个语音文件对应一个txt文本文件,所有文件打包成zip文件。语音文件命名规则:0
strings 分身数字人训练任务标签。 model_version String 分身数字人模型版本。默认是V3.2版本模型。 V3.2:V3.2版本模型 说明: V3和V2版本已废弃不用 取值范围: 0-64 默认取值: V3.2 matting_type String 抠图类型。默认是AI。
主入口(HwICSUiSdk) 本节介绍Web SDK的接口详情。 表1 接口 接口 描述 activeInteractionMode 获取当前生效的交互模式(语音问答/文本问答)。 addEventListeners 回调注册。 checkBrowserSupport 检查浏览器是否支持。
横竖屏类型。 约束限制: 用户无需填写,通过video_config中分辨率判断 取值范围: LANDSCAPE:横屏。 VERTICAL: 竖屏。 默认取值: VERTICAL co_streamer_config 否 CoStreamerConfig object 助播配置 表4
45000021 推理外部错误 推理模块初始化失败 联系技术支持,确认具体问题。 400 MSS.45000022 模型混合异常 横屏模型不能和竖屏模型一起使用 要求用户更换为同类型的模型 400 MSS.45000023 客户长时间不加入rtc房间 用户关闭页面等操作,会导致退出rt
strings 分身数字人训练任务标签。 model_version String 分身数字人模型版本。默认是V3.2版本模型。 V3.2:V3.2版本模型 说明: V3和V2版本已废弃不用 取值范围: 0-64 默认取值: V3.2 matting_type String 抠图类型。默认是AI。
orders, and order backlog, is ranked first in the world. 父主题: 文案样例(基础版)
查询应用详情 功能介绍 该接口用于查询应用详情。 调用方法 请参见如何调用API。 URI GET /v1/{project_id}/digital-human-chat/robot/{robot_id} 表1 路径参数 参数 是否必选 参数类型 描述 project_id 是 String