检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
PROCESSING:直播任务运行中。 PLAY_PAUSE:数字人暂停说话,保持静默状态。 TAKE_OVER:真人接管中。 PLAY_END:直播任务结束。 主播端可以发送直播控制指令。 代码示例如下所示: { "message_type" : "live_control", "command" :
用户与数字人进行智能交互的页面,默认为用户需要自定义富媒体的展示效果,即用户自定义UI界面展示。 通过注册事件通知semanticRecognized获取回复文本,用户可以自行提取图片、视频标签进行自定义显示。 父主题: 智能交互
对于管理员创建IAM用户接口,返回如图1所示的消息头,其中“X-Subject-Token”就是需要获取的用户Token。有了Token之后,您就可以使用Token认证调用其他API。 建议在配置文件或者环境变量中密文存放,使用时解密,确保安全。 图1 管理员创建IAM用户响应消息头 响应消息体(可选)
model_asset_id String 模型资产ID,可以从资产库中查询。 asset_name String 资产名称 backup_model_asset_ids Array of strings 主播轮换时备选主播数字人资产ID(仅形象资产,不包含音色),可以从资产库中查询。 状态码: 400
如果合成视频的费用使用按需预付费套餐包抵扣,额度使用完后,转按需付费。 须知: Flexus数字人视频制作时,必须使用flexus形象;声音可以使用flexus声音或标准版声音。标准版视频制作,不支持使用flexus形象或声音。 Flexus数字人与标准版数字人的视频制作资源不共享,分开计费。
import { HwICSUiSdk } from './sdk/HwICSUiSdk' 除以上JS文件引入之外,还需要引入CSS样式文件,可以直接通过link标签引入或者直接在项目中import: <link rel="stylesheet" href="./sdk/HwICSUiSdk
提交成功”,如图2所示。 声音制作任务提交成功后,需要等待1天左右的时间审核。任务审核通过后,启动声音制作。 图2 制作任务提交成功 用户可以单击“查看制作任务列表”,查看声音制作任务审核进展。 当状态变更为“系统审核完成”,自动启动算法训练。如果系统存在多个算法训练任务,可能会存在排队和延迟的现象,请耐心等待。
card_templet_asset_id 是 String 数字人名片模板资产ID,可以从资产库中查询。 card_text_config 是 BusinessCardTextConfig object 用户输入的数字人名片信息。实际可以填写哪些字段取决于名片模板。 card_image_config
card_templet_asset_id String 数字人名片模板资产ID,可以从资产库中查询。 card_text_config BusinessCardTextConfig object 用户输入的数字人名片信息。实际可以填写哪些字段取决于名片模板。 card_image_url BusinessCardImageUrl
model_asset_id String 模型资产ID,可以从资产库中查询。 asset_name String 资产名称 backup_model_asset_ids Array of strings 主播轮换时备选主播数字人资产ID(仅形象资产,不包含音色),可以从资产库中查询。 表8 VoiceConfig
card_templet_asset_id 是 String 数字人名片模板资产ID,可以从资产库中查询。 card_text_config 是 BusinessCardTextConfig object 用户输入的数字人名片信息。实际可以填写哪些字段取决于名片模板。 card_image_config
这里配置的是MetaStudio服务调用第三方语言模型的API地址。 流式响应 MetaStudio智能交互服务提供流式问答(响应更快)和非流式问答两种方式,第三方语言模型可以选择其中一种响应方式。 多轮语境理解能力 配置数值越高,问答请求携带的历史对话个数越多,语境理解能力更强。 配置说明,如下所示: 如果设置
、3GP、WMV、AVI时,无法展示视频播放效果,仅能图片展示。这是浏览器不兼容导致的,但是不影响视频合成效果。视频合成后,这些插入的视频可以正常播放和展示。 插入的视频素材,要求如下所示: 分辨率最大支持1080P。 帧率小于等于30fps。 编码为AV1、VP8、VP9、H264或H265格式。
2024-03-15 本次变更如下: 新增发布1.1.0版本SDK,相比1.0.0版本,新增如下功能: 支持英文版智能交互。 增加热点问题开关,可以控制是否显示热点问题,详情请参考create中config参数配置或setConfig。 如果打开开关,需要智能交互任务已配置热点问题。 2024-01-30
切割,自动识别文本内容。 音频文件命名无要求,可自定义,命名示例:Voice.wav。 进阶版 高品质 制作声音模型 准备好音频文件后,就可以上传至MetaStudio控制台,进行声音训练。详细操作如下所示: 创建声音制作任务(自研模型) 查看声音 声音模型制作耗时,如下所示: 基础版:约1~3个工作日。
uman-chat/chat-command/e37a28485f684769aa537466e719629d 等MetaStudio返回可以发送启动对话的消息时,如2所示。用户发送文本驱动消息。 代码示例如下所示: { "request_id": "d7aa08da33
"welcome_speech_id" : "af482f19fa934279831844ddeb13eaab", "welcome_speech" : "您好,有什么可以帮助您?", "enable_welcome_speech" : true, "robot_id" : "b3e2b1db10b3
"welcome_speech_id" : "af482f19fa934279831844ddeb13eaab", "welcome_speech" : "您好,有什么可以帮助您?", "enable_welcome_speech" : true, "robot_id" : "b3e2b1db
room_type 否 String 参数解释: 直播间类型。 约束限制: 不涉及。 取值范围: NORMAL:普通直播间,直播间一直存在,可以反复开播 TEMP:临时直播间,直播任务结束后自动清理直播间。 TEMPLATE:直播间模板。 默认取值: NORMAL scene_scripts
剧本名称。 script_description String 剧本描述。 model_asset_id String 数字人模型资产ID,可以从资产库中查询。 model_asset_type String 数字人模型类型。 HUMAN_MODEL_2D:分身数字人 HUMAN_MODEL_3D:3D数字人