检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
在“直播管理”页签,单击“创建直播间”,进入视频直播制作界面。 选择“互动设置”,单击右侧的“设置”,弹出“智能交互”对话框,如图1所示。 参数配置说明,如表1所示。 图1 智能交互设置 表1 参数说明 参数 说明 应用 请先参考后续步骤5,创建完成应用后,再从下拉框中选择此应用。 弹幕触发间隔时间
启动数字人智能交互任务 功能介绍 该接口用于启动数字人智能交互任务。 调用方法 请参见如何调用API。 URI POST /v1/{project_id}/digital-human-chat/smart-chat-rooms/{room_id}/smart-chat-jobs 表1
tudio服务概览页面。 在左侧导航栏中,选择“子账户隔离配置 > 账户设置”,进入“账户设置”页面,如图1所示。 图1 账户设置 参数配置说明,如表1所示。 表1 参数配置 区域 参数 说明 IAM用户设置 IAM子账户隔离能力 支持开启IAM子账号隔离能力。 取值如下所示:
启动数字人智能直播任务 功能介绍 该接口用于启动数字人智能直播任务。 调用方法 请参见如何调用API。 URI POST /v1/{project_id}/smart-live-rooms/{room_id}/smart-live-jobs 表1 路径参数 参数 是否必选 参数类型
'modelData.js', initModel: true, }); 注意:如果未设置wasmPath和dataPath或设置的不对,会报类似下面的异常。 此时语音唤醒是无法正常使用的,需要将路径设置为正确的才行。 图1 异常报错 interactionModeSwitch (static)
查看数字人定制任务 数字人定制任务审核通过后,启动算法训练,会在3个工作日内训练完成并生成数字人,请耐心等待。 操作步骤 登录MetaStudio控制台。 在左侧导航栏中,单击“任务中心”。 在“分身数字人”页签,单击数字人定制任务右侧的“查看详情”,进入“定制任务详情”页面。
文本驱动:通过输入文本的方式生成音频。文本支持插入停顿、调整语速,如果是多音字可设置正确的发音,还可以选择不同的声音,试听生成的音频效果。支持开启字幕展示功能。 音频驱动:从本地上传音频文件,作为视频的语音。音频驱动方式,仅支持中文普通话的场景下能开启字幕。 还可以设置音频的音量,和调整画布的横竖屏展示。 4 视频场景区域
设置TTS租户级自定义读法配置 功能介绍 该接口用于设置TTS租户级自定义读法配置。 调用方法 请参见如何调用API。 URI POST /v1/{project_id}/ttsc/vocabulary-configs 表1 路径参数 参数 是否必选 参数类型 描述 project_id
窗口捕获方式开播:MetaStudio直播返回的窗口可供第三方直播平台(淘宝、抖音、拼多多等)抓取用于开播。 RTMP推流:即RTMP直推(华为云服务器直接把画面传到直播平台服务器,不需要用户一直打开控制台),从直播平台获取推流地址。获取方式各平台入口不一,建议咨询对应的直播平台。在MetaStudi
设置任务批次 功能介绍 用户设置任务批次,该接口用于批量任务管理场景,设置任务的批次 需要开通NA租户权限后才能正常调用 调用方法 请参见如何调用API。 URI PUT /v1/{project_id}/voice-training-manage/user/batch 表1 路径参数
为保障主播可以截取到完整的直播视频,MetaStudio直播服务提供了控制直播播放的配置。 启动直播前,Console控制台界面,需要去勾选“加载完自动直播”(即配置项“play_policy.auto_play_script”设置为“FALSE”)。启动直播任务后,会等待租户的开始直播指令(如果接口调用的方式,会通过RTSA
HTTP方法 方法 说明 GET 请求服务器返回指定资源。 PUT 请求服务器更新指定资源。 POST 请求服务器新增资源或执行特殊操作。 DELETE 请求服务器删除指定资源,如删除对象等。 HEAD 请求服务器资源头部。 PATCH 请求服务器更新资源的部分内容。 当资源不存在的
Not Acceptable 服务器无法根据客户端请求的内容特性完成请求。 407 Proxy Authentication Required 请求要求代理的身份认证,与401类似,但请求者应当使用代理进行授权。 408 Request Timeout 服务器等候请求时发生超时。 客户
前一个场景,设置生成下一个场景的画面布局和剧本内容。 图7 直播间界面 所有场景的画面布局和剧本设置完成后,单击界面右侧的“互动设置”页签,如图8所示。 互动设置包含4类设置:弹幕、用户入场、点赞和送礼。支持直接导入互动管理中设置好的互动库,也支持在当前直播间逐条设置互动规则。所有类型总计可添加100个互动规则。
场景1”小窗口下方的“+”图标,新增场景,并参考前一个场景,设置生成下一个场景的画面布局和剧本内容。 图9 直播间界面 所有场景的画面布局和剧本设置完成后,单击界面右侧的“互动设置”页签,如图10所示。 图10 互动设置 单击“导入”,弹出“导入互动”对话框。 勾选需要使用的互动
音频驱动:上传音频,通过音频驱动数字人说话。 即兴直播:无需设置剧本,直接开播。开播后数字人是不说话的,需要发送互动内容,或者开启真人接管,驱动数字人说话。 互动设置:支持弹幕、用户入场 、点赞和送礼设置。 直播配置:支持开播设置、输出设置、风控设置和更多设置。 界面下方的“加载完自动直播”,默认勾
String 上传训练数据的地址。训练数据需打包成zip文件后,上传至该url。 create_type取值为package时设置。 说明: 通过该obs地址上传时,需设置content-type为application/zip。 segment_uploading_url segment_uploading_url
声音制作任务提交成功后,需要等待1天左右的时间审核。任务审核通过后,启动声音制作。 图2 制作任务提交成功 用户可以单击“查看制作任务列表”,查看声音制作任务审核进展。 当状态变更为“系统审核完成”,自动启动算法训练。如果系统存在多个算法训练任务,可能会存在排队和延迟的现象,请耐心等待。
MetaStudio控制台的视频直播间编辑界面或智能交互对话设置页面,选到当前音色。 如果界面正常展示且可以选择此音色使用,说明接口可以正常调用此音色,否则接口无法调用。 API流控 数字内容生产线服务对服务端API设置了调用次数限制,避免出现短时间内重复调用API,服务中断的情况。
get_current_state:获取当前直播任务状态。 play_start:数字人启动剧本播放。 play_pause:数字人暂停剧本播放,并保持静默状态。 play_resume:数字人恢复剧本播放。 voice_start:启动数字人实时语音播放。 voice_end:结束数字人实时语音播放。