检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
is_end_at_first_frame Boolean 参数解释: 视频结束帧是否跟起始帧相同。需要多个数字人视频无缝拼接时设置成true。 约束限制: 仅分身数字人视频制作支持,当视频制作时插入动作标签后此设置将失效。 取值范围 true: 开启 false: 不开启 默认取值: false 表6 SubtitleConfig
voice_config VoiceConfig object 语音配置参数。 streamer_action String 参数解释: 助播出声时主播行为设置。 约束限制: 不涉及 取值范围: SILENCE:静默 VOLUME_DOWN:音量降低 默认取值: 不涉及。 表13 VoiceConfig
IMAGE:图片 VIDEO:视频 AUDIO:音频 order 否 Integer 参数解释: 资产次序。不设置或者0表示按照加入时间先后排序。业务上将次序最靠前的图片设置为商品封面。 取值范围: 0-300 默认取值: 0 表5 ProductTextInfo 参数 是否必选 参数类型
voice_config VoiceConfig object 语音配置参数。 streamer_action String 参数解释: 助播出声时主播行为设置。 约束限制: 不涉及 取值范围: SILENCE:静默 VOLUME_DOWN:音量降低 默认取值: 不涉及。 表13 VoiceConfig
功能特性 数字内容生产线Metastudio通过AI学习真人形象和声音,来生成数字人模型,相应功能为形象制作、声音制作和Flexus分身数字人。再将模型用于音视频内容的创作,相应功能为视频制作、视频直播和智能交互,主要是生成画面内容。也可以直接通过静态的人脸照片生成视频,对应功能为照片数字人。
稿二:数字人形象采集指南 大家好,今天我很高兴能来到这里进行数字人形象和声音的采集。接下来,我将和大家一起复盘一下数字人的形象拍摄要求。 第一步,我们需要在拍摄前检查自己的穿着,在绿幕的拍摄环境下,不能穿绿色或者透明的衣服、也不要穿含有密集条纹的衣服。我们需要确保面部没有零散的发
t 获取语音训练任务审核结果 PUT /v1/{project_id}/voice-training-manage/user/batch 设置任务批次 POST /v1/{project_id}/voice-training-manage/user/training-segment
is_end_at_first_frame Boolean 参数解释: 视频结束帧是否跟起始帧相同。需要多个数字人视频无缝拼接时设置成true。 约束限制: 仅分身数字人视频制作支持,当视频制作时插入动作标签后此设置将失效。 取值范围 true: 开启 false: 不开启 默认取值: false 表10 SubtitleConfig
查询音色ID 使用接口查询音色ID 支持使用查询资产列表接口,查询音色ID。需要设置如下参数: offset=0:从第一个音色开始查询,可以根据实际情况设置。 limit=60:一次可以查询的声音数据,可以根据实际情况设置。 asset_type=VOICE_MODEL:资产类型为音色模型。
真人声音录制 客户录制真人音频,上传至MetaStudio进行AI训练,即可得到和真人音色1:1复刻的声音模型。 声音模型可实现文本转语音,应用于数字人视频制作、直播、交互问答等场景中。不同版本录制规格如下: 基础版:整段录制生成一个WAV或MP3格式音频,总时长3~10分钟,建议5分钟。
支持文本问答。 startChat新增入参,参考表16,用来设置交互模式(语音问答/文本问答)。 新增接口activeInteractionMode、interactionModeSwitch、sendTextQuestion,用来获取和设置当前交互模式(语音问答或文本问答),以及发送问题文本。
文本驱动:通过输入文本的方式生成音频。文本支持插入停顿、调整语速,如果是多音字可设置正确的发音,还可以选择不同的声音,试听生成的音频效果。支持开启字幕展示功能。 音频驱动:从本地上传音频文件,作为视频的语音。音频驱动方式,仅支持中文普通话的场景下能开启字幕。 还可以设置音频的音量,和调整画布的横竖屏展示。 4 视频场景区域
4K:4K。支持4K、1080P及720P的视频输出。 默认取值: 1080P app_user_id String 自定义用户id(如创建任务时设置了X-App-UserId则会携带)。 is_flexus Boolean 是否是基础版的形象训练 is_only_human_model
is_end_at_first_frame 否 Boolean 参数解释: 视频结束帧是否跟起始帧相同。需要多个数字人视频无缝拼接时设置成true。 约束限制: 仅分身数字人视频制作支持,当视频制作时插入动作标签后此设置将失效。 取值范围 true: 开启 false: 不开启 默认取值: false 表6 SubtitleConfig
播画面中。 在左侧的“文本设置”界面,设置文本内容和字体样式,如图7所示。 在视频直播画面预览区域,如果存在多种视频直播素材,支持对文本进行图层管理,如:上移一层、下移一层、置顶、置底、复制、应用到全局、删除等。还支持设置大小,拖动位置。 图7 文本设置 父主题: 视频直播
事件通知(EventMap) 本节介绍Web SDK的EventMap事件。 表1 通知列表 接口 描述 error 错误事件。 enterActive 数字人激活事件。 enterSleep 数字人自动休眠事件。 jobInfoChange 交互任务信息变更事件。 speakingStart
的视频画面中。 在左侧的“文本设置”界面,设置文本内容和字体样式,如图9所示。 在视频画面预览区域,如果存在多种视频素材,支持对视频进行图层管理,如:上移一层、下移一层、置顶、置底、复制、应用到全局、删除等。还支持设置大小,拖动位置。 图9 文本设置 父主题: 视频制作
请求Header参数 参数 是否必选 参数类型 描述 X-Auth-Token 是 String 用户Token。需要获取全局级Token(将scope设置为domain) 通过调用IAM服务获取用户Token接口获取(响应消息头中X-Subject-Token的值)。 响应参数 状态码: 200
请求Header参数 参数 是否必选 参数类型 描述 X-Auth-Token 是 String 用户Token。需要获取全局级Token(将scope设置为domain) 通过调用IAM服务获取用户Token接口获取(响应消息头中X-Subject-Token的值)。 响应参数 状态码: 200
视频直播 视频直播界面说明 视频直播 互动管理 商品管理 直播任务管理 智能交互设置 视频直播公共配置