检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
name 否 String 应用名称。 app_type 否 Integer 对接第三方应用厂商类型。 说明: 0:科大讯飞AIUI;1:华为云CBS;2:科大讯飞星火交互认知大模型;5:第三方驱动;6:第三方语言模型;8:奇妙问 取值范围: 0-32 room_id 否 String
cognized和semanticRecognized通知的流式返回有什么差异? semanticRecognized 【事件说明】 LLM对提问进行语义识别后输出回复文本的事件。speechRecognized和semanticRecognized分别为问题和答案,每轮问答共用一个chatId。
图层配置。 表11 TextConfig 参数 是否必选 参数类型 描述 text 是 String 参数解释: 台词脚本。支持两种模式,纯文本模式和标签模式。 纯文本模式:使用方法,如“大家好,我是人工智大家,是个虚拟主播”。 标签模式:SSML标签的详细定义请参考文本驱动SSML定义。
图层配置。 表11 TextConfig 参数 是否必选 参数类型 描述 text 是 String 参数解释: 台词脚本。支持两种模式,纯文本模式和标签模式。 纯文本模式:使用方法,如“大家好,我是人工智大家,是个虚拟主播”。 标签模式:SSML标签的详细定义请参考文本驱动SSML定义。
name 是 String 应用名称。 app_type 是 Integer 对接第三方应用厂商类型。 说明: 0:科大讯飞AIUI;1:华为云CBS;2:科大讯飞星火交互认知大模型;5:第三方驱动;6:第三方语言模型;8:奇妙问 取值范围: 0-32 room_id 否 String
该字段无需填写。 取值范围: 字符长度0-1024位。 默认取值: 不涉及。 dh_id 否 String 参数解释: 数字人ID。对应形象和音色组合。 约束限制: 该字段暂未启用,无需填写。 取值范围: 字符长度0-64位。 默认取值: 不涉及。 model_asset_id 否
标,新增场景,并参考前一个场景,设置生成下一个场景的画面布局和剧本内容。 图7 直播间界面 所有场景的画面布局和剧本设置完成后,单击界面右侧的“互动设置”页签,如图8所示。 互动设置包含4类设置:弹幕、用户入场、点赞和送礼。支持直接导入互动管理中设置好的互动库,也支持在当前直播间
Flexus形象制作限制说明,如表1所示。 表1 声音制作限制 限制项 说明 Flexus形象和声音使用限制 Flexus分身数字人目前仅支持视频制作,不支持视频直播和智能交互。 视频制作限制 Flexus数字人采用实景拍摄,视频制作时不支持切换背景。 Flexus分身数字人左上角会有标识。未带有标识的数字人均为标准版形象。
图1 角色界面 角色界面说明,如表1所示。 表1 界面元素说明 界面元素 说明 定制数字人 单击“定制数字人”,跳转至形象制作页面,界面详情和操作指导,详见创建分身数字人定制任务。 角色界面默认展示两列数字人,单击图标后,缩小展示为1列数字人。单击图标,可恢复为2列展示。 关键词搜索框,可输入数字人名称进行精准搜索。
操作步骤 登录MetaStudio控制台,单击“智能交互”,如图1所示。 图1 MetaStudio控制台页面 在智能交互编辑页面,依次设置角色和背景。 单击左侧导航栏中的“应用”,如图2所示。 参数配置说明,如表1所示。 图2 创建应用 表1 创建应用 参数 说明 第三方应用 选择“第三方语言模型”。
LV、3GP、WMV、AVI和WEBM。 说明: 在视频制作界面,如果添加视频,且视频格式为FLV、3GP、WMV、AVI时,无法展示视频播放效果,仅能图片展示。这是浏览器不兼容导致的,但是不影响视频合成效果。视频合成后,这些插入的视频可以正常播放和展示。 插入的视频素材,要求如下所示:
含MAIN、COVER和OTHER 资产类型为PPT时,包含MAIN、COVER、PAGE和OTHER 资产类型为HUMAN_MODEL时,包含MAIN、COVER和OTHER 资产类型为VOICE_MODEL时,包含MAIN、SAMPLE(样例音频文件)和OTHER 资产类型为
在文本输入框中,输入文本内容,以生成音频,如图1所示。 文本示例:今天是9月26日,星期二,天气晴朗,欢迎大家到访。我们精心布置了现场,室内摆放了各类植物和鲜花,场地宽敞明亮,足够大家在室内共同交流和活动。 图1 文本驱动 文本内容的操作说明如表1所示。 表1 操作说明 操作 说明 插入停顿 将鼠标放在需要停顿的文字
含MAIN、COVER和OTHER 资产类型为PPT时,包含MAIN、COVER、PAGE和OTHER 资产类型为HUMAN_MODEL时,包含MAIN、COVER和OTHER 资产类型为VOICE_MODEL时,包含MAIN、SAMPLE(样例音频文件)和OTHER 资产类型为
近日,旅美大熊猫丫丫因恶劣的健康状况,引发了网友的大量关注和担忧。 多方纷纷站出来为丫丫发声,盼望它早日归来。 从网友的评论中和声援中,感受到了华人的温度, 前路依然充满荆棘,但我们绝不放弃,永不退缩。 “熊猫外交”也增强了国家文化的生命力、创新力、凝聚力和传播力。 八月二十四日中午十二时,日本福岛第一核电站启动核污染水排海。
图1 角色界面 角色界面说明,如表1所示。 表1 界面元素说明 界面元素 说明 定制数字人 单击“定制数字人”,跳转至形象制作页面,界面详情和操作指导,详见创建分身数字人定制任务。 角色界面默认展示两列数字人,单击图标后,缩小展示为1列数字人。单击图标,可恢复为2列展示。 关键词搜索框,可输入数字人名称进行精准搜索。
将签名信息添加到消息头,从而通过身份认证。 AK(Access Key ID):访问密钥ID。与私有访问密钥关联的唯一标识符;访问密钥ID和私有访问密钥一起使用,对请求进行加密签名。 SK(Secret Access Key):私有访问密钥。与访问密钥ID结合使用,对请求进行加密签名,可标识发送方,并防止请求被修改。
用户在控制台进行数字人名片制作制作,生成的数字人名片,会展示在“我的创作 > 分身名片”页面。 用户在控制台进行智能交互操作,生成的对话项目和技能,会展示在“我的创作 > 智能交互”页面。 一类是通过本地上传或者接收资产管理员转移的资产生成的,会展示在“我的创作 > 资源”页面。 父主题:
次数,从前往后依次命中答复,每次仅回复一条文本内容。 示例:关于产品的链接、型号和优惠等问题,请看界面上方的说明,按照说明操作,就可以详细了解了。 音频:从本地上传一个音频文件,支持MP4、WAV和M4A格式。当命中此规则后,使用此音频进行回复。 智能交互:通过智能交互的方式回复
"shoot_script" : { "text_config" : { "text" : "大家好,我是云笙" }, "animation_config" : [ { "animation" : "7aff