检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
下载Web SDK安装包。 2.0.0 2024-04-17 Web SDK:HwICSUiSDK-2.0.0.zip 23ab33712d94f2940c147e8a65d8e18e0f3d3ceff8c513c4a4b9d5c03cac46db 重要变更,见•重要变更:1.4.2.1-create新增参数
LayerPositionConfig object 图层位置配置。 size 否 LayerSizeConfig object 图层大小配置。 image_config 否 ImageLayerConfig object 素材图片图层配置。 video_config 否 VideoLayerConfig
LayerPositionConfig object 图层位置配置。 size 否 LayerSizeConfig object 图层大小配置。 image_config 否 ImageLayerConfig object 素材图片图层配置。 video_config 否 VideoLayerConfig
图层位置配置。 size LayerSizeConfig object 图层大小配置。 image_config ImageLayerConfig object 素材图片图层配置。 video_config VideoLayerConfig object 素材视频图层配置。 text_config
设置TTS租户级自定义读法配置 GET /v1/{project_id}/ttsc/vocabulary-configs 获取TTS租户级自定义读法配置 DELETE /v1/{project_id}/ttsc/vocabulary-configs 删除TTS租户级自定义读法配置 PUT /v
制作页面。 界面左侧是声音制作页面,右侧为声音制作流程。声音制作录制教程,可以帮助用户快速制作声音。 图1 定制声音 在“华为模型”页签,配置声音制作参数。 界面操作详情,如表1所示。 表1 界面操作说明 区域 说明 声音制作方式 MetaStudio提供下述声音制作方式: 基础
图层位置配置。 size LayerSizeConfig object 图层大小配置。 image_config ImageLayerConfig object 素材图片图层配置。 video_config VideoLayerConfig object 素材视频图层配置。 text_config
声音授权签署文件。 操作步骤 登录MetaStudio控制台。 单击“声音制作”下方的“开始创建”,进入声音制作页面。 图1 定制声音 在“华为模型”页签,配置声音制作参数。 界面操作详情,如表1所示。 表1 界面操作说明 区域 说明 声音制作方式 选择“基础版声音制作”,音频格式为WAV或MP3
视频输出配置。 说明: 智能交互仅支持配置codec=H264,bitrate,width,height,frame_rate。 model_asset_id 否 String 数字人模型资产ID。 voice_config 否 VoiceConfig object 语音配置参数。
图层位置配置。 size LayerSizeConfig object 图层大小配置。 image_config ImageLayerConfig object 素材图片图层配置。 video_config VideoLayerConfig object 素材视频图层配置。 text_config
这里设置的多音字,仅对当前视频草稿有效,如需全局生效,可参考配置特殊词表配置。 别名 选中需要通过别名播报的文本内容 ,单击“别名”,设置为实际播报的内容。 须知: 这里设置的别名,仅对当前视频草稿有效,如需全局生效,可参考配置特殊词表配置。 数字英文 示例数字“1024”的读法如下所示:
制作页面。 选择“第三方模型”页签的“出门问问声音制作”方式。 界面左侧是声音制作页面,右侧为声音制作流程,如图1所示。 图1 定制声音 配置声音制作参数。 界面操作详情,如表1所示。 表1 界面操作说明 区域 说明 声音制作方式 选择“出门问问声音制作”。音频时长为0.5~18
视频制作限制 分身数字人视频制作限制说明,如表1所示。 表1 视频制作限制 视频制作配置 限制 视频制作剧本 一个视频制作剧本的场景数量不能超过50个。 一个视频制作剧本,仅支持使用一个数字人模型和一个音色模型。 文本驱动 每个单场景输入文字的数量不超过1万字。 所有场景输入文字的数量不超过10万字。
间,实现数字人视频制作、直播、智能交互和数字人IP代言等场景。 数字人升级迭代快,提升产品竞争力 口型精准:口型匹配度>95%,多语种无缝切换,泛化能力强。 表情自然:AI眼神纠正,持续眼神交流,细节更丰富。 图像真实:智能重打光,背景融合更真实。 多种复杂场景建模:支持人物走动、侧身等训练,肢体动作更自然。
CustomPlatformAuthConfig object 自定义直播平台鉴权配置 callback_config Array of StandardPlatformApiConfig objects 自定义直播平台回调配置。同一种类型仅保留一个配置,如果配置多个会随机保存一个。 表5 PlatformAuthorizationInfo
CustomPlatformAuthConfig object 自定义直播平台鉴权配置 callback_config 是 Array of StandardPlatformApiConfig objects 自定义直播平台回调配置。同一种类型仅保留一个配置,如果配置多个会随机保存一个。 表4 CustomPlatformAuthConfig
CustomPlatformAuthConfig object 自定义直播平台鉴权配置 callback_config Array of StandardPlatformApiConfig objects 自定义直播平台回调配置。同一种类型仅保留一个配置,如果配置多个会随机保存一个。 表7 PlatformAuthorizationInfo
我们只需要复制这个文案添加到字幕轨道中,找到文字转语音的按钮,选择“电影解说” 这个配音,点击进行转换,然后稍作等待,大家就能听到熟悉的声音。 同样,我们再来试试语音转文字,将我们的视频拖入视频轨道,选中它,找到我们的语音转文字功能,同样转换的速度也是很快。 我们这里是支持字幕一键同步及srt字幕的导出。 聊
Config object 自定义直播平台鉴权配置 callback_config 是 Array of StandardPlatformApiConfig objects 自定义直播平台回调配置。同一种类型仅保留一个配置,如果配置多个会随机保存一个。 表4 UpdateCust
其中“X-Subject-Token”就是需要获取的用户Token。有了Token之后,您就可以使用Token认证调用其他API。 建议在配置文件或者环境变量中密文存放,使用时解密,确保安全。 图1 管理员创建IAM用户响应消息头 响应消息体(可选) 该部分可选。响应消息体通常以