检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
图层位置配置。 size LayerSizeConfig object 图层大小配置。 image_config ImageLayerConfig object 素材图片图层配置。 video_config VideoLayerConfig object 素材视频图层配置。 text_config
制作页面。 界面左侧是声音制作页面,右侧为声音制作流程。声音制作录制教程,可以帮助用户快速制作声音。 图1 定制声音 在“华为模型”页签,配置声音制作参数。 界面操作详情,如表1所示。 表1 界面操作说明 区域 说明 声音制作方式 MetaStudio提供下述声音制作方式: 基础
视频输出配置。 说明: 智能交互仅支持配置codec=H264,bitrate,width,height,frame_rate。 model_asset_id 否 String 数字人模型资产ID。 voice_config 否 VoiceConfig object 语音配置参数。
图层位置配置。 size LayerSizeConfig object 图层大小配置。 image_config ImageLayerConfig object 素材图片图层配置。 video_config VideoLayerConfig object 素材视频图层配置。 text_config
声音授权签署文件。 操作步骤 登录MetaStudio控制台。 单击“声音制作”下方的“开始创建”,进入声音制作页面。 图1 定制声音 在“华为模型”页签,配置声音制作参数。 界面操作详情,如表1所示。 表1 界面操作说明 区域 说明 声音制作方式 选择“基础版声音制作”,音频格式为WAV或MP3
这里设置的多音字,仅对当前视频草稿有效,如需全局生效,可参考配置特殊词表配置。 别名 选中需要通过别名播报的文本内容 ,单击“别名”,设置为实际播报的内容。 须知: 这里设置的别名,仅对当前视频草稿有效,如需全局生效,可参考配置特殊词表配置。 数字英文 示例数字“1024”的读法如下所示:
制作页面。 选择“第三方模型”页签的“出门问问声音制作”方式。 界面左侧是声音制作页面,右侧为声音制作流程,如图1所示。 图1 定制声音 配置声音制作参数。 界面操作详情,如表1所示。 表1 界面操作说明 区域 说明 声音制作方式 选择“出门问问声音制作”。音频时长为0.5~18
视频制作限制 分身数字人视频制作限制说明,如表1所示。 表1 视频制作限制 视频制作配置 限制 场景 一个视频草稿的场景数量不能超过50个。 文本驱动 每个单场景输入文字的数量不超过1万字。 所有场景输入文字的数量不超过10万字。 每个单场景如果包含语音合成标记语言SSML标签,文字数量需小于128K。
间,实现数字人视频制作、直播、智能交互和数字人IP代言等场景。 数字人升级迭代快,提升产品竞争力 口型精准:口型匹配度>95%,多语种无缝切换,泛化能力强。 表情自然:AI眼神纠正,持续眼神交流,细节更丰富。 图像真实:智能重打光,背景融合更真实。 多种复杂场景建模:支持人物走动、侧身等训练,肢体动作更自然。
CustomPlatformAuthConfig object 自定义直播平台鉴权配置 callback_config Array of StandardPlatformApiConfig objects 自定义直播平台回调配置。同一种类型仅保留一个配置,如果配置多个会随机保存一个。 表5 PlatformAuthorizationInfo
ct_id} 删除商品 POST /v1/{project_id}/products/{product_id}/assets 商品资产组合配置 第三方直播平台管理 表12 第三方直播平台管理接口 接口 说明 POST /v1/{project_id}/live-platforms/platforms
CustomPlatformAuthConfig object 自定义直播平台鉴权配置 callback_config Array of StandardPlatformApiConfig objects 自定义直播平台回调配置。同一种类型仅保留一个配置,如果配置多个会随机保存一个。 表7 PlatformAuthorizationInfo
CustomPlatformAuthConfig object 自定义直播平台鉴权配置 callback_config 是 Array of StandardPlatformApiConfig objects 自定义直播平台回调配置。同一种类型仅保留一个配置,如果配置多个会随机保存一个。 表4 CustomPlatformAuthConfig
我们只需要复制这个文案添加到字幕轨道中,找到文字转语音的按钮,选择“电影解说” 这个配音,点击进行转换,然后稍作等待,大家就能听到熟悉的声音。 同样,我们再来试试语音转文字,将我们的视频拖入视频轨道,选中它,找到我们的语音转文字功能,同样转换的速度也是很快。 我们这里是支持字幕一键同步及srt字幕的导出。 聊
常见问题 智能交互SDK安装包里为什么有图片资源? SDK里面包含图片资源,是因为智能交互的动效、背景可能需要图片资源才能展示更好的效果。所以智能交互Web SDK为了方便用户集成使用,会同时包含UI相关资源。 speechRecognized和semanticRecognized通知的流式返回有什么差异?
Config object 自定义直播平台鉴权配置 callback_config 是 Array of StandardPlatformApiConfig objects 自定义直播平台回调配置。同一种类型仅保留一个配置,如果配置多个会随机保存一个。 表4 UpdateCust
style_id 是 String 风格ID name 是 String 模型名称 notify_url 否 String 照片建模任务结束的回调地址。 响应参数 状态码: 200 表4 响应Header参数 参数 参数类型 描述 X-Request-Id String 请求ID。 表5
system_female_002:女性风格02 name 是 String 数字人模型名称,首次创建时使用。 notify_url 否 String 照片建模任务结束的回调地址。 响应参数 状态码: 200 表4 响应Header参数 参数 参数类型 描述 X-Request-Id String 请求ID。 表5
其中“X-Subject-Token”就是需要获取的用户Token。有了Token之后,您就可以使用Token认证调用其他API。 建议在配置文件或者环境变量中密文存放,使用时解密,确保安全。 图1 管理员创建IAM用户响应消息头 响应消息体(可选) 该部分可选。响应消息体通常以
政府推出了一系列的政策和措施,包括改善农村教育、城乡义务教育一体化发展、学前教育普及等。 主要是想提高贫困地区和农村地区的教育质量和资源配置。 最近,很多高校为了迎接新生举办了各种迎新活动。 这些活动包括线上线下的座谈会、文艺演出和志愿者服务等,旨在帮助新生适应大学生活和学习环境。