检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
SDK概述 数字人智能交互SDK是基于数字内容生产线服务提供的能力进行封装,以简化用户的开发工作。用户直接调用智能交互Web SDK提供的接口,即可实现使用数字人智能交互业务能力的目的。 智能交互提供了如下主流平台SDK供开发者使用。 表1 客户端SDK 客户端 集成SDK 接口参考
后,产品会提供给用户,用户需要参考更新唤醒模型,将模型更新至本地模型路径中。 使用要求 WebSDK版本为3.0.1及以上。 仅支持数字人平台配置或内置ASR(语音转文本)能力的方案。不支持WebSocket接口驱动数字人方案,即文本驱动方案。 在调用create接口之前,必须要
中断数字人讲话。 × √ muteRemoteAudio 数字人静音。 √ √ sendDrivenText 发送智能交互数字人主动播报的文本信息。 × √ sendTextQuestion 发送问题文本。 × √ setConfig 更新配置项。 √ √ setLogLevel 设置日志级别。
参数类型 描述 X-Auth-Token 否 String 用户Token。使用Token鉴权方式时必选。 通过调用IAM服务获取用户Token接口获取。 响应消息头中X-Subject-Token的值。 Authorization 否 String 使用AK/SK方式认证时必选,携带的鉴权信息。
PlayPolicy object 剧本播放策略 output_urls 否 Array of strings 参数解释: RTMP视频推流第三方直播平台地址。 说明: 直播过程中刷新地址,需要调用COMMAND命令REFRESH_OUTPUT_URL。 约束限制: 不涉及 取值范围: 当前仅支持一条RTMP出流地址。
包含如下选项: 弹幕 用户入场 点赞 送礼 互动名称(可选) 互动名称。 触发方式 触发关键词,多个关键词用“|”分隔,示例“链接|型号|优惠”。 服务扫描弹幕的时候,如果扫描到此关键词,自动回复当前互动内容。 回复方式 选择主播或助播进行回复,具体回复内容支持通过下述方式设置。 文本:通
is_inheritance_platform_callback 否 Boolean 参数解释: 是否继承直播平台回调配置,默认true 约束限制: 不涉及。 取值范围: true:继承直播平台callback配置 false:不继承直播平台callback配置 默认取值: false 默认取值: false 表30
不能超过2000字。 单击声音图标,会弹出声音对话框,可以选择需要使用的声音。 无标注的系统声音,均为免费声音,可直接选用。 标注有“第三方”的声音,需要购买激活后才能使用,操作请参考购买出门问问声音套餐。 设置完成后,单击“生成视频”,弹出如图2所示的对话框,显示照片数字人视频的生成进度。
不同Key对应Value取值如下: 公共资产属性: BACKGROUND_IMG:视频制作的2D背景图片,可取值Yes CREATED_BY_PLATFORM:是否平台生成,可取值Yes 分身数字人资产属性: MATERIAL_IMG:素材图片,用作前景。可取值Yes MATERIAL_VIDEO:素材视频,用作前景。可取值Yes
is_inheritance_platform_callback Boolean 参数解释: 是否继承直播平台回调配置,默认true 约束限制: 不涉及。 取值范围: true:继承直播平台callback配置 false:不继承直播平台callback配置 默认取值: false 默认取值: false 表31
PlatformLiveDetailInfo 参数 参数类型 描述 platform_id String 直播平台ID。 platform String 直播平台。美团填写meituan account String 授权账号信息。 美团平台对应:opBizCode live_id String 直播ID。如果配置,则段落切换回调中会携带该信息。
PlatformLiveDetailInfo 参数 参数类型 描述 platform_id String 直播平台ID。 platform String 直播平台。美团填写meituan account String 授权账号信息。 美团平台对应:opBizCode live_id String 直播ID。如果配置,则段落切换回调中会携带该信息。
PlatformLiveDetailInfo 参数 参数类型 描述 platform_id String 直播平台ID。 platform String 直播平台。美团填写meituan account String 授权账号信息。 美团平台对应:opBizCode live_id String 直播ID。如果配置,则段落切换回调中会携带该信息。
使用AK/SK方式认证时必选,请求的发生时间。 格式为(YYYYMMDD'T'HHMMSS'Z')。 X-App-UserId 否 String 第三方用户ID。不允许输入中文。 响应参数 状态码:200 表3 响应Header参数 参数 参数类型 描述 X-Request-Id String
支持新增、复制段落,或使用txt格式文本导入剧本,平台自动解析输入内容。 直播剧本包含下述设置: 剧本驱动 支持下述三种方式任选其一: 文本驱动:输入文本,通过文本驱动数字人说话。 音频驱动:上传音频,通过音频驱动数字人说话。 即兴直播:无需设置剧本,直接开播。开播后数字人是不说话的,需要发送互动内容,或者开启真人接管,驱动数字人说话。
X-Project-Id 否 String 使用AK/SK方式认证时必选,携带项目ID信息。 X-App-UserId 否 String 第三方用户ID。不允许输入中文。 表3 请求Body参数 参数 是否必选 参数类型 描述 tag 否 String 任务标签。 ECOMMERCE:
仍无法满足用户需求,可使用自研模型自定义生成声音。 操作限制 MetaStudio不支持个人用户定制声音,仅支持企业用户。 定制声音时,从平台下载的授权书中有明确说明,定制音色需授权给公司使用。 操作前准备 用户创建声音制作任务前,需要参考操作步骤准备如下内容: 使用“语料上传”
使用AK/SK方式认证时必选,请求的发生时间。 格式为(YYYYMMDD'T'HHMMSS'Z')。 X-App-UserId 否 String 第三方用户ID。不允许输入中文。 表3 请求Body参数 参数 是否必选 参数类型 描述 asset_name 否 String 参数解释: 资产名称。
需求,可以参考本节操作,自定义生成分身数字人。 注意事项 MetaStudio不支持个人用户定制形象,仅支持企业用户。 定制分身形象时,从平台下载的授权书中有明确说明,定制分身形象需授权给公司使用。 操作前准备 用户创建分身数字人定制任务前,需要参考操作步骤准备如下内容: 5~6
不能超过2000字。 单击声音图标,会弹出声音对话框,可以选择需要使用的声音。 无标注的系统声音,均为免费声音,可直接选用。 标注有“第三方”的声音,需要购买激活后才能使用,操作请参考购买出门问问声音套餐。 请填写名片信息 姓名 必填项,数字人姓名。 不能超过32字符。 职称 必填项,数字人职称。