检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
产品介绍 什么是数字内容生产线 功能特性 产品优势 使用限制 计费说明 03 API 数字内容生产线服务提供了丰富的API和调用示例,您可以通过API实现分身数字人资产管理、视频制作、视频直播、智能交互等功能。 API文档 API概览 API接口 04 SDK 数字内容生产线服
对于管理员创建IAM用户接口,返回如图1所示的消息头,其中“X-Subject-Token”就是需要获取的用户Token。有了Token之后,您就可以使用Token认证调用其他API。 建议在配置文件或者环境变量中密文存放,使用时解密,确保安全。 图1 管理员创建IAM用户响应消息头 响应消息体(可选)
model_asset_id String 模型资产ID,可以从资产库中查询。 asset_name String 资产名称 backup_model_asset_ids Array of strings 主播轮换时备选主播数字人资产ID(仅形象资产,不包含音色),可以从资产库中查询。 状态码:400 表10
import { HwICSUiSdk } from './sdk/HwICSUiSdk' 除以上JS文件引入之外,还需要引入CSS样式文件,可以直接通过link标签引入或者直接在项目中import: <link rel="stylesheet" href="./sdk/HwICSUiSdk
提交成功”,如图2所示。 声音制作任务提交成功后,需要等待1天左右的时间审核。任务审核通过后,启动声音制作。 图2 制作任务提交成功 用户可以单击“查看制作任务列表”,查看声音制作任务审核进展。 当状态变更为“系统审核完成”,自动启动算法训练。如果系统存在多个算法训练任务,可能会存在排队和延迟的现象,请耐心等待。
card_templet_asset_id String 数字人名片模板资产ID,可以从资产库中查询。 card_text_config BusinessCardTextConfig object 用户输入的数字人名片信息。实际可以填写哪些字段取决于名片模板。 card_image_url BusinessCardImageUrl
card_templet_asset_id 是 String 数字人名片模板资产ID,可以从资产库中查询。 card_text_config 是 BusinessCardTextConfig object 用户输入的数字人名片信息。实际可以填写哪些字段取决于名片模板。 card_image_config
model_asset_id String 模型资产ID,可以从资产库中查询。 asset_name String 资产名称 backup_model_asset_ids Array of strings 主播轮换时备选主播数字人资产ID(仅形象资产,不包含音色),可以从资产库中查询。 表8 VoiceConfig
card_templet_asset_id 是 String 数字人名片模板资产ID,可以从资产库中查询。 card_text_config 是 BusinessCardTextConfig object 用户输入的数字人名片信息。实际可以填写哪些字段取决于名片模板。 card_image_config
style String 风格参考 voice_capability VoiceCapability object 音色资产支持的能力集。 说明: 音色能力集只允许查询,不允许设置 external_voice_meta ExternalVoiceAssetMeta object 第三方TTS音色元数据。
strings 参数解释: 回复话术集。 约束限制: 不涉及 取值范围: 最大支持5条预置话术。 单条话术字符长度0-1024位。 默认取值: 不涉及 reply_audios 否 Array of ReplyAudioInfo objects 参数解释: 回复音频集。填写audio_url。
strings 参数解释: 回复话术集。 约束限制: 不涉及 取值范围: 最大支持5条预置话术。 单条话术字符长度0-1024位。 默认取值: 不涉及 reply_audios 否 Array of ReplyAudioInfo objects 参数解释: 回复音频集。填写audio_url。
strings 参数解释: 回复话术集。 约束限制: 不涉及 取值范围: 最大支持5条预置话术。 单条话术字符长度0-1024位。 默认取值: 不涉及 reply_audios Array of ReplyAudioInfo objects 参数解释: 回复音频集。填写audio_url。
、3GP、WMV、AVI时,无法展示视频播放效果,仅能图片展示。这是浏览器不兼容导致的,但是不影响视频合成效果。视频合成后,这些插入的视频可以正常播放和展示。 插入的视频素材,要求如下所示: 分辨率最大支持1080P。 帧率小于等于30fps。 编码为AV1、VP8、VP9、H264或H265格式。
切割,自动识别文本内容。 音频文件命名无要求,可自定义,命名示例:Voice.wav。 进阶版 高品质 制作声音模型 准备好音频文件后,就可以上传至MetaStudio控制台,进行声音训练。详细操作如下所示: 创建声音制作任务(自研模型) 查看声音 声音模型制作耗时,如下所示: 基础版:约1~3个工作日。
为文本。 热词 仅开启“委托语言交互服务(SIS)”后,才会展示“热词”配置。 数字人与用户进行智能交互对话时,语音识别不准确的专业词汇,可以作为热词反馈到语音模型,以提高语音识别的准确率。这里仅开启热词功能,实际的热词配置,请参见对话配置。 SIS委托站点 仅开启“委托语言交互
strings 参数解释: 回复话术集。 约束限制: 不涉及 取值范围: 最大支持5条预置话术。 单条话术字符长度0-1024位。 默认取值: 不涉及 reply_audios 否 Array of ReplyAudioInfo objects 参数解释: 回复音频集。填写audio_url。
否 String 风格参考 voice_capability 否 VoiceCapability object 音色资产支持的能力集。 说明: 音色能力集只允许查询,不允许设置 external_voice_meta 否 ExternalVoiceAssetMeta object 第三方TTS音色元数据。
uman-chat/chat-command/e37a28485f684769aa537466e719629d 等MetaStudio返回可以发送启动对话的消息时,如2所示。用户发送文本驱动消息。 代码示例如下所示: { "request_id": "d7aa08da33
style String 风格参考 voice_capability VoiceCapability object 音色资产支持的能力集。 说明: 音色能力集只允许查询,不允许设置 external_voice_meta ExternalVoiceAssetMeta object 第三方TTS音色元数据。