检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
用户与数字人进行智能交互的页面,默认为用户需要自定义富媒体的展示效果,即用户自定义UI界面展示。 通过注册事件通知semanticRecognized获取回复文本,用户可以自行提取图片、视频标签进行自定义显示。 父主题: 智能交互
对于管理员创建IAM用户接口,返回如图1所示的消息头,其中“X-Subject-Token”就是需要获取的用户Token。有了Token之后,您就可以使用Token认证调用其他API。 建议在配置文件或者环境变量中密文存放,使用时解密,确保安全。 图1 管理员创建IAM用户响应消息头 响应消息体(可选)
model_asset_id String 模型资产ID,可以从资产库中查询。 asset_name String 资产名称 backup_model_asset_ids Array of strings 主播轮换时备选主播数字人资产ID(仅形象资产,不包含音色),可以从资产库中查询。 状态码: 400
朝单方向走动的距离不超过3步。 实景数字人拍摄要求 若需要录制实景数字人形象,请尽量保证维持静态背景,没有规律性或大幅画面的背景变化。 实景数字人因不需要抠图,可以放宽对着装的要求,支持穿绿色或透明的衣服。 父主题: 拍摄真人视频
import { HwICSUiSdk } from './sdk/HwICSUiSdk' 除以上JS文件引入之外,还需要引入CSS样式文件,可以直接通过link标签引入或者直接在项目中import: <link rel="stylesheet" href="./sdk/HwICSUiSdk
提交成功”,如图2所示。 声音制作任务提交成功后,需要等待1天左右的时间审核。任务审核通过后,启动声音制作。 图2 制作任务提交成功 用户可以单击“查看制作任务列表”,查看声音制作任务审核进展。 当状态变更为“系统审核完成”,自动启动算法训练。如果系统存在多个算法训练任务,可能会存在排队和延迟的现象,请耐心等待。
model_asset_id String 模型资产ID,可以从资产库中查询。 asset_name String 资产名称 backup_model_asset_ids Array of strings 主播轮换时备选主播数字人资产ID(仅形象资产,不包含音色),可以从资产库中查询。 表8 VoiceConfig
card_templet_asset_id String 数字人名片模板资产ID,可以从资产库中查询。 card_text_config BusinessCardTextConfig object 用户输入的数字人名片信息。实际可以填写哪些字段取决于名片模板。 card_image_url BusinessCardImageUrl
card_templet_asset_id 是 String 数字人名片模板资产ID,可以从资产库中查询。 card_text_config 是 BusinessCardTextConfig object 用户输入的数字人名片信息。实际可以填写哪些字段取决于名片模板。 card_image_config
card_templet_asset_id 是 String 数字人名片模板资产ID,可以从资产库中查询。 card_text_config 是 BusinessCardTextConfig object 用户输入的数字人名片信息。实际可以填写哪些字段取决于名片模板。 card_image_config
、3GP、WMV、AVI时,无法展示视频播放效果,仅能图片展示。这是浏览器不兼容导致的,但是不影响视频合成效果。视频合成后,这些插入的视频可以正常播放和展示。 插入的视频素材,要求如下所示: 分辨率最大支持1080P。 帧率小于等于30fps。 编码为AV1、VP8、VP9、H264或H265格式。
style String 风格参考 voice_capability VoiceCapability object 音色资产支持的能力集。 说明: 音色能力集只允许查询,不允许设置 external_voice_meta ExternalVoiceAssetMeta object 第三方TTS音色元数据。
这里配置的是MetaStudio服务调用第三方语言模型的API地址。 流式响应 MetaStudio智能交互服务提供流式问答(响应更快)和非流式问答两种方式,第三方语言模型可以选择其中一种响应方式。 多轮语境理解能力 配置数值越高,问答请求携带的历史对话个数越多,语境理解能力更强。 配置说明,如下所示: 如果设置
切割,自动识别文本内容。 音频文件命名无要求,可自定义,命名示例:Voice.wav。 进阶版 高品质 制作声音模型 准备好音频文件后,就可以上传至MetaStudio控制台,进行声音训练。详细操作如下所示: 创建声音制作任务 查看声音 声音模型制作耗时,如下所示: 基础版:约1~3个工作日。
uman-chat/chat-command/e37a28485f684769aa537466e719629d 等MetaStudio返回可以发送启动对话的消息时,如2所示。用户发送文本驱动消息。 代码示例如下所示: { "request_id": "d7aa08da33
"welcome_speech_id" : "af482f19fa934279831844ddeb13eaab", "welcome_speech" : "您好,有什么可以帮助您?", "enable_welcome_speech" : true, "robot_id" : "b3e2b1db
"welcome_speech_id" : "af482f19fa934279831844ddeb13eaab", "welcome_speech" : "您好,有什么可以帮助您?", "enable_welcome_speech" : true, "robot_id" : "b3e2b1db10b3
剧本名称。 script_description String 剧本描述。 model_asset_id String 数字人模型资产ID,可以从资产库中查询。 model_asset_type String 数字人模型类型。 HUMAN_MODEL_2D:分身数字人 HUMAN_MODEL_3D:3D数字人
如果填写了script_id,model_asset_id、voice_config、scene_asset_id、video_config、shoot_scripts可以不填,以脚本中的配置为准。 如果填写了script_id,并且同时也填写了model_asset_id、voice_config、scen
用户驳回,仅NA白名单用户有该状态 JOB_REJECT: 驳回任务 已完成 JOB_SUCCESS: 训练任务完成(普通用户任务的完成状态,此时用户已经可以使用模型) JOB_FINISH: 任务结束,是最终状态,不支持修改此状态(NA用户任务的完成状态,并且此状态表明模型效果已通过用户的验收)