检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
建议选用与40mm-85mm焦距等效镜头,避免使用超广角。 在合适的高度,将相机竖置固定于三脚架上,确保水平。相机与人物眼神平齐,对焦于面部区域(参考图1),确保面部清晰不失焦。若录制全身,请确保模特脚底有绿幕空隙。 图1 相机机位参考图 建议使用相机竖拍。模特处于相机拍摄画框中间,与画框保持边距,确保模特做手势时不会越出画面。参见图2。
dx 是 Integer 参数解释: 图层左上角像素点的X轴位置值(画布左上角坐标是0x0)。 横屏(16:9)画布像素为1920x1080;竖屏(9:16)画布像素为1080x1920。 约束限制: 该值为相对于画布的像素值,仅表示布局位置关系,与输出画面分辨率无关。 取值范围: -1920-3840
常见问题 智能交互SDK安装包里为什么有图片资源? SDK里面包含图片资源,是因为智能交互的动效、背景可能需要图片资源才能展示更好的效果。所以智能交互Web SDK为了方便用户集成使用,会同时包含UI相关资源。 speechRecognized和semanticRecognized通知的流式返回有什么差异?
符号""《》()·~--等。 Flexus分身数字人 Flexus分身数字人左上角会有标识。未带有标识的数字人均为标准版形象。 需注意Flexus视频制作和标准版视频制作分开计费,从各自的套餐包中扣除费用。 Flexus视频制作:必须使用Flexus形象,声音使用不受限制。 按视
dx Integer 参数解释: 图层左上角像素点的X轴位置值(画布左上角坐标是0x0)。 横屏(16:9)画布像素为1920x1080;竖屏(9:16)画布像素为1080x1920。 约束限制: 该值为相对于画布的像素值,仅表示布局位置关系,与输出画面分辨率无关。 取值范围: -1920-3840
事件通知(EventMap) 本节介绍Web SDK的EventMap事件。 表1 通知列表 接口 描述 error 错误事件。 enterSleep 数字人自动休眠事件。 jobInfoChange 交互任务信息变更事件。 speakingStart 数字人开始讲话事件。 speakingStop
设置直播循环播放的次数,或“无限循环”。 默认播放1次。 直播窗口 直播窗口展示尺寸,不同方案均可调整为竖向。 包含如下选项: 竖屏 全屏:推荐用全屏,捕获的画面更大,需在直播伴侣中旋转使用。 默认为“竖屏”。 更多设置 事件回调地址 可在直播中返回场景、段落事件的字段,适用于接口调用或客户二次开发使用的场景。
智能交互公共配置 智能交互界面支持添加角色、背景、对话,可参考本节进行操作。 角色 角色界面详情,如图1所示。 图1 角色界面 角色界面说明,如表1所示。 表1 界面元素说明 界面元素 说明 定制数字人 单击“定制数字人”,跳转至形象制作页面,界面详情和操作指导,详见创建分身数字人定制任务。
of strings 分身数字人训练视频上传URL。该url在文件上传成功后失效,只能上传一次。注意:视频必须是1080p或者4K分辨率(横、竖屏皆可)的mp4格式,视频长度须大于等于3分钟且小于等于10分钟,否则审核会不通过。 说明: 通过该地址上传时,需设置content-typ
SDK合规使用指南 《中华人民共和国个人信息保护法》自2021年11月1日起正式施行后,监管部门、各行业参与方和终端消费者越来越关注用户的隐私保护问题。为了有效治理App、SDK违规收集使用个人信息的现象,监管部门也陆续出台相关标准规范。 您作为华为云客户为最终用户提供服务,知悉
Android 移动版Chrome浏览器 91+ Ios 移动版Safari浏览器 17.3+ Mac Safari浏览器 15.6+ 表3 透明背景支持情况 操作系统类型 浏览器类型 浏览器版本 Windows Chrome浏览器 94+ Edge浏览器 94+ Android 移动版Chrome浏览器
同一批录音必须使用同一套录制设备和环境。 建议使用对应版本预置的文案样例:文案样例(基础版)、文案样例(进阶版)、文案样例(高品质)。 支持自定义文案,单句文案长短需和样例相当。 不建议临场即兴发挥录制,避免出现较多嗯、啊等语气词,影响连贯性。 进阶版 高品质 专业录音棚+高保真MIC录制。 开始录音 必须录
String 训练类型。 BASIC: 基础版(20句话) MIDDLE: 进阶版(100句话) ADVANCE: 高级版 THIRD_PARTY: 第三方出门问问训练版 THIRD_PARTY_LJZN: 第三方逻辑智能训练版 FLEXUS: Flexus版---用的是大模型特征提取 batch_name
描述 tenant_id String 租户id basic_min Integer 基础版最低时长(秒) 取值范围: 0-2147483647 basic_max Integer 基础版最高时长(秒) 取值范围: 0-2147483647 basic_advice_value Integer
view_mode 否 String 横竖屏类型(内部参数,不对外开放)。默认值是LANDSCAPE。 LANDSCAPE:横屏。 VERTICAL:竖屏。 请求参数 表3 请求Header参数 参数 是否必选 参数类型 描述 X-Auth-Token 否 String 用户Token。使用Token鉴权方式时必选。
自动分段后的文本效果。 手动分段:自定义分隔符和分隔长度的方式,对文档进行分段处理。 索引配置 配置索引的类型。 包含如下选项: 标准版 高配版 单击“保存”。 保存成功后,“普通文档”页签下新增一行知识库。请根据实际情况,对知识库进行编辑、设置或删除操作。 图6 普通文档 上传问答题库的操作。
model_version 否 String 参数解释: 分身数字人模型版本 约束限制: 不涉及 取值范围: V2: V2版本模型 V3:V3版本模型 V3_2:V3.2版本模型 默认取值: V2 model_resolution 否 String 参数解释: 分身数字人模型分辨率。 约束限制:
String 训练类型。 BASIC: 基础版(20句话) MIDDLE: 进阶版(100句话) ADVANCE: 高级版 THIRD_PARTY: 第三方出门问问训练版 THIRD_PARTY_LJZN: 第三方逻辑智能训练版 FLEXUS: Flexus版---用的是大模型特征提取 job_id
model_version 否 String 参数解释: 分身数字人模型版本 约束限制: 不涉及 取值范围: V2: V2版本模型 V3:V3版本模型 V3_2:V3.2版本模型 默认取值: V2 model_resolution 否 String 参数解释: 分身数字人模型分辨率。 约束限制:
fo中说明。 view_mode String 横竖屏类型。默认值为:VERTICAL。 LANDSCAPE:横屏。 VERTICAL: 竖屏。 默认取值: VERTICAL error_info ErrorResponse object 数字人直播间出错信息。 shared_config