正在生成
详细信息:
检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
用户与数字人进行智能交互的页面,默认为用户需要自定义富媒体的展示效果,即用户自定义UI界面展示。 通过注册事件通知semanticRecognized获取回复文本,用户可以自行提取图片、视频标签进行自定义显示。 父主题: 智能交互
对于管理员创建IAM用户接口,返回如图1所示的消息头,其中“X-Subject-Token”就是需要获取的用户Token。有了Token之后,您就可以使用Token认证调用其他API。 建议在配置文件或者环境变量中密文存放,使用时解密,确保安全。 图1 管理员创建IAM用户响应消息头 响应消息体(可选)
产品介绍 什么是数字内容生产线 功能特性 产品优势 使用限制 计费说明 03 API 数字内容生产线服务提供了丰富的API和调用示例,您可以通过API实现分身数字人资产管理、视频制作、视频直播、智能交互等功能。 API文档 API概览 API接口参数 04 SDK 数字内容生产
PROCESSING:直播任务运行中。 PLAY_PAUSE:数字人暂停说话,保持静默状态。 TAKE_OVER:真人接管中。 PLAY_END:直播任务结束。 主播端可以发送直播控制指令。 代码示例如下所示: { "message_type" : "live_control", "command" :
model_asset_id String 模型资产ID,可以从资产库中查询。 asset_name String 资产名称 backup_model_asset_ids Array of strings 主播轮换时备选主播数字人资产ID(仅形象资产,不包含音色),可以从资产库中查询。 状态码: 400
style String 风格参考 voice_capability VoiceCapability object 音色资产支持的能力集。 说明: 音色能力集只允许查询,不允许设置 external_voice_meta ExternalVoiceAssetMeta object 第三方TTS音色元数据。
朝单方向走动的距离不超过3步。 实景数字人拍摄要求 若需要录制实景数字人形象,请尽量保证维持静态背景,没有规律性或大幅画面的背景变化。 实景数字人因不需要抠图,可以放宽对着装的要求,支持穿绿色或透明的衣服。 父主题: 拍摄真人视频
如果合成视频的费用使用按需预付费套餐包抵扣,额度使用完后,转按需付费。 须知: Flexus数字人视频制作时,必须使用flexus形象;声音可以使用flexus声音或标准版声音。标准版视频制作,不支持使用flexus形象或声音。 Flexus数字人与标准版数字人的视频制作资源不共享,分开计费。
提交成功”,如图2所示。 声音制作任务提交成功后,需要等待1天左右的时间审核。任务审核通过后,启动声音制作。 图2 制作任务提交成功 用户可以单击“查看制作任务列表”,查看声音制作任务审核进展。 当状态变更为“系统审核完成”,自动启动算法训练。如果系统存在多个算法训练任务,可能会存在排队和延迟的现象,请耐心等待。
import { HwICSUiSdk } from './sdk/HwICSUiSdk' 除以上JS文件引入之外,还需要引入CSS样式文件,可以直接通过link标签引入或者直接在项目中import: <link rel="stylesheet" href="./sdk/HwICSUiSdk
model_asset_id String 模型资产ID,可以从资产库中查询。 asset_name String 资产名称 backup_model_asset_ids Array of strings 主播轮换时备选主播数字人资产ID(仅形象资产,不包含音色),可以从资产库中查询。 表8 VoiceConfig
card_templet_asset_id String 数字人名片模板资产ID,可以从资产库中查询。 card_text_config BusinessCardTextConfig object 用户输入的数字人名片信息。实际可以填写哪些字段取决于名片模板。 card_image_url BusinessCardImageUrl
card_templet_asset_id 是 String 数字人名片模板资产ID,可以从资产库中查询。 card_text_config 是 BusinessCardTextConfig object 用户输入的数字人名片信息。实际可以填写哪些字段取决于名片模板。 card_image_config
card_templet_asset_id 是 String 数字人名片模板资产ID,可以从资产库中查询。 card_text_config 是 BusinessCardTextConfig object 用户输入的数字人名片信息。实际可以填写哪些字段取决于名片模板。 card_image_config
、3GP、WMV、AVI时,无法展示视频播放效果,仅能图片展示。这是浏览器不兼容导致的,但是不影响视频合成效果。视频合成后,这些插入的视频可以正常播放和展示。 视频要求如下所示: 分辨率最大支持1080P。 帧率小于等于30fps。 编码为AV1、VP8、VP9、H264或H265格式。
style String 风格参考 voice_capability VoiceCapability object 音色资产支持的能力集。 说明: 音色能力集只允许查询,不允许设置 external_voice_meta ExternalVoiceAssetMeta object 第三方TTS音色元数据。
这里配置的是MetaStudio服务调用第三方语言模型的API地址。 流式响应 MetaStudio智能交互服务提供流式问答(响应更快)和非流式问答两种方式,第三方语言模型可以选择其中一种响应方式。 多轮语境理解能力 配置数值越高,问答请求携带的历史对话个数越多,语境理解能力更强。 配置说明,如下所示: 如果设置
切割,自动识别文本内容。 音频文件命名无要求,可自定义,命名示例:Voice.wav。 进阶版 高品质 制作声音模型 准备好音频文件后,就可以上传至MetaStudio控制台,进行声音训练。详细操作如下所示: 创建声音制作任务(华为模型) 查看声音 声音模型制作耗时,如下所示: 基础版:约1~3个工作日。
uman-chat/chat-command/e37a28485f684769aa537466e719629d 等MetaStudio返回可以发送启动对话的消息时,如2所示。用户发送文本驱动消息。 代码示例如下所示: { "request_id": "d7aa08da33
"welcome_speech_id" : "af482f19fa934279831844ddeb13eaab", "welcome_speech" : "您好,有什么可以帮助您?", "robot_id" : "b3e2b1db10b34f45bff241b133142627", "create_time"