检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
示例8:视频直播对接实时音视频客户端SDK 视频直播对接实时音视频客户端SDK应用示例代码,请参考MetaStudio数字人直播对接实时音视频客户端SDK。 父主题: 应用示例
2倍语速。 取值范围:[50,200] 默认值:100 pitch 否 integer body 音高。 取值范围:[50,200] 默认值:100 volume 否 integer body 音量。 取值范围:[90,240] 默认值:140 sample_rate 否 String
50-200 默认取值: 100 pitch Integer 音高。默认值100,最小值50,最大值200。 取值范围: 50-200 默认取值: 100 volume Integer 音量。默认值140,最小值90,最大值240。 取值范围: 90-240 默认取值: 140 provider
在文本输入框中,输入文本内容,以生成音频,如图1所示。 文本示例:今天是9月26日,星期二,天气晴朗,欢迎大家到访。我们精心布置了现场,室内摆放了各类植物和鲜花,场地宽敞明亮,足够大家在室内共同交流和活动。 图1 文本驱动 文本内容的操作说明如表1所示。 不同声音对表1中操作的支持
94+ Edge浏览器 94+ Android 移动版Chrome浏览器 94+ iOS 移动版Safari浏览器 17.3+ Mac Safari浏览器 16.4+ 快速集成SDK 建议将下载的SDK压缩包放置在自己项目的“sdk”目录下。 在项目代码中引入“HwICSUiSdk”。
风格化ID。需要调用数字人风格管理相关接口,从系统中查得。 camera_position 否 String 人位置及相机位置。由如下4组浮点数组成的字符:人位置的X/Y/Z值,人角度的Pitch/Yaw/Roll值;相机位置的X/Y/Z值,相机角度的Pitch/Yaw/Roll值。 job_type 否
String 项目ID,获取方法请参考获取项目ID。 请求参数 表2 请求Header参数 参数 是否必选 参数类型 描述 X-Auth-Token 否 String 用户Token。使用Token鉴权方式时必选。 通过调用IAM服务获取用户Token接口获取。 响应消息头中X-Subject-Token的值。
X-Auth-Token 否 String 用户Token。使用Token鉴权方式时必选。 通过调用IAM服务获取用户Token接口获取。 响应消息头中X-Subject-Token的值。 Authorization 否 String 使用AK/SK方式认证时必选,携带的鉴权信息。 X-Sdk-Date
项目ID,获取方法请参考获取项目ID。 script_id 是 String 剧本ID。 请求参数 表2 请求Header参数 参数 是否必选 参数类型 描述 X-Auth-Token 否 String 用户Token。使用Token鉴权方式时必选。 通过调用IAM服务获取用户Token接口获取。
视频制作界面如图1所示。各区域详细说明,如表1所示。 用户使用数字人形象创作的视频,都会自动保存在MetaStudio控制台首页“最近项目”区域的“视频项目”页签中。用户可以根据实际情况,进行二次创作。 图1 视频制作界面 表1 界面说明 序号 区域名称 说明 1 视频素材区域 设置视频的场景,包括如下
String 项目ID,获取方法请参考获取项目ID。 请求参数 表2 请求Header参数 参数 是否必选 参数类型 描述 X-Auth-Token 否 String 用户Token。使用Token鉴权方式时必选。 通过调用IAM服务获取用户Token接口获取。 响应消息头中X-Subject-Token的值。
String 项目ID,获取方法请参考获取项目ID。 请求参数 表2 请求Header参数 参数 是否必选 参数类型 描述 X-Auth-Token 否 String 用户Token。使用Token鉴权方式时必选。 通过调用IAM服务获取用户Token接口获取。 响应消息头中X-Subject-Token的值。
项目ID,获取方法请参考获取项目ID。 script_id 是 String 剧本ID。 请求参数 表2 请求Header参数 参数 是否必选 参数类型 描述 X-Auth-Token 否 String 用户Token。使用Token鉴权方式时必选。 通过调用IAM服务获取用户Token接口获取。
50-200 默认取值: 100 pitch Integer 音高。默认值100,最小值50,最大值200。 取值范围: 50-200 默认取值: 100 volume Integer 音量。默认值140,最小值90,最大值240。 取值范围: 90-240 默认取值: 140 provider
浏览器通过有上述点击的行为,才能获取采集声音的权限。否则无法采集声音,无法正常使用语音唤醒能力。 浏览器使用限制,请参见表1。 表1 浏览器适配详情 操作系统类型 浏览器类型 浏览器版本 Windows Chrome浏览器 91+ Edge浏览器 91+ Android 移动版Chrome浏览器
项目ID,获取方法请参考获取项目ID。 job_id 是 String 任务ID。 请求参数 表2 请求Header参数 参数 是否必选 参数类型 描述 X-Auth-Token 否 String 用户Token。使用Token鉴权方式时必选。 通过调用IAM服务获取用户Token接口获取。
项目ID,获取方法请参考获取项目ID。 job_id 是 String 任务ID。 请求参数 表2 请求Header参数 参数 是否必选 参数类型 描述 X-Auth-Token 否 String 用户Token。使用Token鉴权方式时必选。 通过调用IAM服务获取用户Token接口获取。
50-200 默认取值: 100 pitch Integer 音高。默认值100,最小值50,最大值200。 取值范围: 50-200 默认取值: 100 volume Integer 音量。默认值140,最小值90,最大值240。 取值范围: 90-240 默认取值: 140 provider
X-Auth-Token 否 String 用户Token。使用Token鉴权方式时必选。 通过调用IAM服务获取用户Token接口获取。 响应消息头中X-Subject-Token的值。 Authorization 否 String 使用AK/SK方式认证时必选,携带的鉴权信息。 X-Sdk-Date
PROCESSING:数字人的工作状态。数字人会根据直播任务中预置的文本或音频进行直播。 PLAY_PAUSE:数字人直播暂停状态。此时数字人会处于静默状态,等待恢复剧本播放的指令。 TAKE_OVER:真人接管状态。MetaStudio直播服务会获取RTC通道中来自主播端的音频,实时驱动数字人进行直播。 PLAY_END:退出直播任务状态。