检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
输出的语言受限制。使用自定义声音合成音频时,仅支持17种语言:中文、英文、德语、法语、土耳其语、菲律宾语、日语、意大利语、马来语、俄罗斯语、韩语、芬兰语、西班牙语、印尼语、阿拉伯语、葡萄牙语、荷兰语(暂未开放泰语)。 操作限制 MetaStudio不支持个人用户定制声音,仅支持企业用户。 定制声音时,
视频文件的URL。 约束限制: 仅直播支持外部URL,其他业务通过资产库查询获取,不支持外部URL。 取值范围: 字符长度1-2048位。 默认取值: 不涉及。 video_cover_url 否 String 参数解释: 视频封面文件的URL。 约束限制: 仅直播支持外部URL,其他业务通过资产库查询获取,不支持外部URL。
视频文件的URL。 约束限制: 仅直播支持外部URL,其他业务通过资产库查询获取,不支持外部URL。 取值范围: 字符长度1-2048位。 默认取值: 不涉及。 video_cover_url String 参数解释: 视频封面文件的URL。 约束限制: 仅直播支持外部URL,其他业务通过资产库查询获取,不支持外部URL。
智能交互设置 直播间页面支持弹幕规则使用“智能交互”的方式,去回复直播间用户的提问。智能交互的方式相当于提供了一个第三方语言模型去答复用户问题。 操作步骤 登录MetaStudio控制台。 在“工作台”界面,单击“分身视频直播”下方的“开始创建”,进入分身数字人直播首页面。 在“
视频文件的URL。 约束限制: 仅直播支持外部URL,其他业务通过资产库查询获取,不支持外部URL。 取值范围: 字符长度1-2048位。 默认取值: 不涉及。 video_cover_url String 参数解释: 视频封面文件的URL。 约束限制: 仅直播支持外部URL,其他业务通过资产库查询获取,不支持外部URL。
互动数字人的开场欢迎语。 示例:您好!很高兴为您服务。 常见问题 常见用户提问,支持添加多个。 示例:请问您需要什么商品? 开启实时推荐 是否开启实时推荐,默认关闭。 插件工具 系统预置的插件工具,支持多选。 如“天气查询工具”,可以用于回答天气的问题。 知识库 单击“添加”,在弹
形象制作 MetaStudio服务支持自定义生成分身数字人。 操作前准备 用户创建分身数字人定制任务前,需要参考操作步骤准备如下内容: 5~6分钟绿幕拍摄视频。 注意:如果制作分身形象的时候,选择保留拍摄背景,则需要准备实景背景拍摄视频。 身份证正反面照片。 形象授权签署文件,如授权书所示。
找到需要修改的对话项目,单击右侧的“编辑”,进入对话编辑界面,如图2所示。 图中标识“1”处为语言修改配置。请根据实际情况切换语言,目前仅支持中文和英文。 图中标识“2”处为声音切换入口。单击图标,弹出如图3所示的对话框,选择需要切换的声音。 请注意,切换后的声音必须与前面切换后
制作照片数字人视频 支持上传正面清晰的人像照片,生成会说话的照片数字人视频。 操作限制 照片数字人视频制作限制,如照片数字人限制所示。 操作步骤 登录MetaStudio控制台。 在“工作台”界面,单击“照片数字人”,进入照片数字人制作页面,如图1所示。 界面左侧展示配置项,右侧展示预览效果。配置操作,请参考表1。
注意:MetaStudio服务目前仅支持读取docx(包含图文)、txt和md格式,其他格式暂不支持。 docx格式说明:可以没有标题和分级标题, 如需添加标题和分级标题,请使用word标准格式,如图5和图6所示。 txt格式说明:文档内容当前仅支持纯文本,一行对应一条知识。 星火大
找到需要修改的对话项目,单击右侧的“编辑”,进入对话编辑界面,如图2所示。 图中标识“1”处为语言修改配置。请根据实际情况切换语言,目前仅支持中文和英文。 图中标识“2”处为声音切换入口。单击图标,弹出如图3所示的对话框,选择需要切换的声音。 请注意,切换后的声音必须与前面切换后
操作前提 前提条件 需要申请开通智能交互权限后,才可集成智能交互SDK使用。 WebSDK使用限制 由于浏览器的安全策略限制,仅支持通过“https://域名”方式访问,否则无法正常加载运行智能交互WebSDK。 父主题: 智能交互客户端SDK
取值范围: true: 支持中文多音字 false: 不支持中文多音字 默认取值: false is_support_break_time Boolean 参数解释: 该声音是否支持停顿。 约束限制: 不涉及 取值范围: true: 支持停顿 false: 不支持停顿 默认取值: false
服务,使能千行百业场景应用。 您可以使用本文档提供的API对华为云MetaStudio服务进行相关操作,如形象制作、声音制作、视频制作等。支持的全部操作请参见API概览。 在调用华为云MetaStudio服务的API之前,请确保已经充分了解华为云MetaStudio服务的相关概念,详细信息请参见产品介绍。
视频制作 MetaStudio服务支持制作数字人视频。 操作步骤 登录MetaStudio控制台。 在“工作台”界面,单击“分身视频制作”下方的“开始创建”。 进入视频制作界面,界面详情如图1所示。 图1 视频制作界面 在画布区域,设置角色、背景、贴图、视频等内容。 详细操作请参见视频制作素材操作详情。
语音识别:从下拉框中选择“通用-英文-进场”。 自然语言模型:保持默认值“AIUI通用语义模型”。 管理技能配置:English情景模式下,不支持开启系统预置技能,仅支持开启自定义技能,相应操作请参考配置应用需要的技能。 (可选)开启闲聊技能:可选能力,操作请参考(可选)开启闲聊功能。 模拟测试:操作请参考模拟测试。
接收资产 支持接收资产管理员或其他租户转移给当前租户的声音和分身模型资产。声音和分身模型资产的接收、激活操作均相同,下面以分身模型资产为例进行操作演示。 注意事项 管理员或其他租户如果推送声音或分身模型资产给当前租户,当前租户需在7天内完成接收和激活操作。如果超过7天未操作,需要
图4 文件上传 设置“知识库名称”。 一个知识库可以是一堆文件的集合。 上传文件。 支持上传TXT,PDF,PPTX,DOCX,XLSX,XLM,MD,HTML,CSV,TSV格式的文件,支持同时上传多个文件,每个文件不能超过20M。 单击“下一步”,进入“文档清洗”页面,如图5所示。
<word></word>标签用于设置选中文字为连读模式。 MetaStudio包含多种TTS音色,每种音色支持的SSML标签能力是有差异的,请通过“查询资产详情”接口,获取每个音色支持使用的标签。 speak标签 描述 <speak></speak>:SSML文本的根节点。 语法 1
取值范围: true: 支持中文多音字 false: 不支持中文多音字 默认取值: false is_support_break_time 否 Boolean 参数解释: 该声音是否支持停顿。 约束限制: 不涉及 取值范围: true: 支持停顿 false: 不支持停顿 默认取值: false