检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
必须选择“纯文本”。 图6 新建知识 设置完成后,单击“确定”。一条语料新增完成。 方式二:批量导入问题类别及其语料。 用户也可以使用批量导入的方式,一次性添加完成问题类别及其所有问答对。操作方式如下所示: 在左侧导航栏中,选择“知识库 > 问答管理”。 单击界面右侧的“导入”,弹出“导入训练语料”对话框。
用户Token。使用Token鉴权方式时必选。 通过调用IAM服务获取用户Token接口获取。 响应消息头中X-Subject-Token的值。 Authorization 否 String 使用AK/SK方式认证时必选,携带的鉴权信息。 X-Sdk-Date 否 String 使用AK/SK方式认证时必选,请求的发生时间。
互动名称(可选) 互动名称。 触发方式 触发关键词,多个关键词用“|”分隔,示例“链接|型号|优惠”。 服务扫描弹幕的时候,如果扫描到此关键词,自动回复当前互动内容。 回复方式 选择主播或助播进行回复,具体回复内容支持通过下述方式设置。 文本:通过文本方式设置回复内容,最多可增加5条回
视频制作配置 限制 多场景配置 每个单场景,如果通过“文本驱动”方式生成语音时,所有段落汇总的文字数量需大于200字。 每个单场景,如果通过“音频驱动”方式生成语音时,每个音频时长需大于1分钟。 文本驱动配置 通过“文本驱动”方式生成语音时,对应的文本要求,如下所示: 每个段落的文本字符
定制声音 在“华为模型”页签,配置声音制作参数。 界面操作详情,如表1所示。 表1 界面操作说明 区域 说明 声音制作方式 MetaStudio提供下述声音制作方式: 基础版声音制作:需整段录制生成一个WAV或MP3格式的音频文件,时长3~10分钟,建议5分钟。 进阶版声音制作:需
还支持设置大小,拖动位置。 视频直播画面创作完成后,请根据实际情况,选择下述一种直播剧本驱动方式。 “剧本驱动”包含3种方式: 文本驱动 需要通过文本驱动数字人说话。支持下述2种方式,增加文本内容。 直接在各个场景的段落框中输入文本内容。可单击图标,新增更多的段落。 单击右上方
直播间配置 限制 多场景配置 每个单场景,如果通过“文本驱动”方式生成语音时,所有段落汇总的文字数量需大于200字。 每个单场景,如果通过“音频驱动”方式生成语音时,每个音频时长需大于1分钟。 文本驱动配置 通过“文本驱动”方式生成语音时,对应的文本要求,如下所示: 每个段落的文本字符
用户Token。使用Token鉴权方式时必选。 通过调用IAM服务获取用户Token接口获取。 响应消息头中X-Subject-Token的值。 Authorization 否 String 使用AK/SK方式认证时必选,携带的鉴权信息。 X-Sdk-Date 否 String 使用AK/SK方式认证时必选,请求的发生时间。
这里配置的是MetaStudio服务调用第三方语言模型的API地址。 流式响应 MetaStudio智能交互服务提供流式问答(响应更快)和非流式问答两种方式,第三方语言模型可以选择其中一种响应方式。 多轮语境理解能力 配置数值越高,问答请求携带的历史对话个数越多,语境理解能力更强。 配置说明,如下所示: 如果设置
系统声音和Flexus声音免费使用。第三方声音的计费方式,详见购买出门问问套餐包。 标准版视频制作:必须使用标准版形象,声音不支持使用Flexus声音。 按视频制作时长计费,计费项为“分身数字人视频制作”,详见计费说明。 系统声音免费使用。第三方声音的计费方式,详见购买出门问问套餐包。 父主题:
文档清洗 表1 参数说明 参数 说明 分段设置 选择文字分段的方式。 包含如下选项: 自动分段:自动对文档进行分段处理。单击“自动分段”,“分段预览”区域会展示自动分段后的文本效果。 手动分段:自定义分隔符和分隔长度的方式,对文档进行分段处理。 索引配置 配置索引的类型。 包含如下选项:
支持的格式为:MP3、WAV。 大小不超过20MB,时长不超过5分钟。 文本驱动 文本驱动方式的要求如下所示: 文本输入长度不超过2000字。 通过文本合成的音频时长不能超过5分钟。 在照片数字人制作页面,选择“文本驱动”方式驱动照片说话时,需要输入文本并选择音色,再单击“试听”预估音频时长。如果超过5分钟,会导致照片数字人制作失败。
大小不超过16MB,照片比例推荐16:9或9:16。 视频名称 使用照片人像合成视频名称。 02 录入播报内容 选择一种方式,生成播报内容 提供下述种方式,生成照片数字人播报内容。 播报内容生成后,单击右侧的“试听”,可以试听播报效果。 语音上传:本地录制音频后上传。音频格式需
智能交互 如何实时切换智能交互的语言和声音? 智能交互支持富媒体吗? 如何自定义域名方式访问智能交互页面? 智能交互业务媒体流如何应对防火墙限制?
音频制作区域,可选择下述1种方式生成音频。 文本驱动:通过输入文本的方式生成音频。文本支持插入停顿、调整语速,如果是多音字可设置正确的发音,还可以选择不同的声音,试听生成的音频效果。支持开启字幕展示功能。 音频驱动:从本地上传音频文件,作为视频的语音。音频驱动方式,仅支持中文普通话的场景下能开启字幕。
类型 互动类型,选择“弹幕”。 互动名称(可选) 互动名称,示例:欢迎进入直播间。 触发方式 当前互动触发的方式,请根据实际情况设置。 回复方式 选择“文本回复”,输入文本内容,当满足触发方式时,数字人会阅读文本内容。 素材绑定(可选) 从本地选择图片或视频上传。当直播间命中当前
系统声音和Flexus声音免费使用。第三方声音的计费方式,详见购买出门问问语音合成套餐包。 标准版视频制作:必须使用标准版形象,声音不支持使用Flexus声音。 按视频制作时长计费,计费项为“分身数字人视频制作”,详见计费说明。 系统声音免费使用。第三方声音的计费方式,详见购买出门问问语音合成套餐包。
用户Token。使用Token鉴权方式时必选。 通过调用IAM服务获取用户Token接口获取。 响应消息头中X-Subject-Token的值。 Authorization 否 String 使用AK/SK方式认证时必选,携带的鉴权信息。 X-Sdk-Date 否 String 使用AK/SK方式认证时必选,请求的发生时间。
用户Token。使用Token鉴权方式时必选。 通过调用IAM服务获取用户Token接口获取。 响应消息头中X-Subject-Token的值。 Authorization 否 String 使用AK/SK方式认证时必选,携带的鉴权信息。 X-Sdk-Date 否 String 使用AK/SK方式认证时必选,请求的发生时间。
说明 用户账号 需要接收资产的租户,其所在Region的项目ID,获取方法请参见获取项目ID。 备注 转移资产的备注信息。 接收方式 租户接收资产的方式。 包含如下设置: 资产转移后用户自动接收:建议勾选,这样资产转移后,租户无需再执行接收资产的操作,否则需要参考接收资产进行操作。