检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
取值范围: true: 支持中文多音字 false: 不支持中文多音字 默认取值: false is_support_break_time Boolean 参数解释: 该声音是否支持停顿。 约束限制: 不涉及 取值范围: true: 支持停顿 false: 不支持停顿 默认取值: false
登录MetaStudio控制台。 在左侧导航栏中,单击“我的创作”。 选择“视频”页签,如图1所示。 在“视频”页面,可以看到已生成的视频列表,以卡片形式排列展示。 支持对视频进行如下操作: 单击播放图标,播放照片数字人视频。 单击,在弹出的下拉框中,可下载视频至本地、查看详情、重命名或删除视频。 图1 照片数字人视频
授权浏览器麦克风的访问权限 支持对Chrome浏览器和Mac系统的浏览器,授权麦克风的访问权限。 谷歌浏览器 打开Chrome浏览器,单击浏览器右上方的图标,从下拉框中选择“设置”。 进入“设置”页面。 在左侧导航栏中,选择“隐私设置和安全性”。 在右侧界面中,单击“网络设置”,进入“网络设置”页面。
可多个状态查询,使用英文逗号分隔。 如state=CREATING,PUBLISHED sort_key 否 String 排序字段,支持的排序方式有: 按创建时间排序:create_time 按更新时间排序:update_time 按资产排序:asset_order sort_dir
删除资产 支持在MetaStudio控制台删除资产,操作方式详见本节。 操作步骤 登录MetaStudio控制台。 在左侧导航栏中,单击“我的创作”。 选择“资源”页签,如图1所示。 图1 资源页面 如果需要删除已激活的资产,可以通过下述2种方式删除。 方式一:单击资产卡片中的“
取值范围: true: 支持中文多音字 false: 不支持中文多音字 默认取值: false is_support_break_time 否 Boolean 参数解释: 该声音是否支持停顿。 约束限制: 不涉及 取值范围: true: 支持停顿 false: 不支持停顿 默认取值: false
视频文件的URL。 约束限制: 仅直播支持外部URL,其他业务通过资产库查询获取,不支持外部URL。 取值范围: 字符长度1-2048位。 默认取值: 不涉及。 video_cover_url 否 String 参数解释: 视频封面文件的URL。 约束限制: 仅直播支持外部URL,其他业务通过资产库查询获取,不支持外部URL。
视频文件的URL。 约束限制: 仅直播支持外部URL,其他业务通过资产库查询获取,不支持外部URL。 取值范围: 字符长度1-2048位。 默认取值: 不涉及。 video_cover_url String 参数解释: 视频封面文件的URL。 约束限制: 仅直播支持外部URL,其他业务通过资产库查询获取,不支持外部URL。
创建高级版语音训练任务 功能介绍 用户创建语音训练高级版任务,该接口会返回一个obs上传地址,用于上传语音文件。 语音文件为一段WAV格式的长音频文件,仅支持将语音文件打包成zip压缩格式上传。 文件上传后,调用“提交语音训练任务”接口,启动审核和训练。 调用方法 请参见如何调用API。 URI
生成中、生成成功和生成失败的任务。 在下方的名片列表中,可以查看名片详情,包括名片封面、名称、任务ID、提交时间、生成时间、状态等信息。 支持对名片进行如下操作: 单击“查看”,进入“我的创作 > 分身名片”页面,可以查看名片详情,如查看名片所示。 单击“下载”,将名片下载至本地查看。下载后的文件为mp4格式。
对话ID,每轮问答的ID值唯一。 speechRecognized通知的流式返回跟semanticRecognized是有差异的,详细见:speechRecognized和semanticRecognized通知的流式返回有什么差异? semanticRecognized 【事件说明】 LLM对提问进行语义识别
取值范围: true: 支持中文多音字 false: 不支持中文多音字 默认取值: false is_support_break_time 否 Boolean 参数解释: 该声音是否支持停顿。 约束限制: 不涉及 取值范围: true: 支持停顿 false: 不支持停顿 默认取值: false
在“照片数字人”页面,可以查看全部生成的视频,包括生成中、生成成功和生成失败的任务。 在下方的视频列表中,可以查看视频详情,包括视频封面、名称、任务ID、生成时间、状态。 支持对视频进行如下操作: 单击“查看”,进入“我的创作 > 视频”页面,可以查看视频详情,如查看视频所示。 单击“下载”,将视频下载至本地查看。下载后的文件为mp4格式。
输出的语言受限制。使用自定义声音合成音频时,仅支持17种语言:中文、英文、德语、法语、土耳其语、菲律宾语、日语、意大利语、马来语、俄罗斯语、韩语、芬兰语、西班牙语、印尼语、阿拉伯语、葡萄牙语、荷兰语(暂未开放泰语)。 操作限制 MetaStudio不支持个人用户定制声音,仅支持企业用户。 定制声音时,
视频文件的URL。 约束限制: 仅直播支持外部URL,其他业务通过资产库查询获取,不支持外部URL。 取值范围: 字符长度1-2048位。 默认取值: 不涉及。 video_cover_url String 参数解释: 视频封面文件的URL。 约束限制: 仅直播支持外部URL,其他业务通过资产库查询获取,不支持外部URL。
语音识别:从下拉框中选择“通用-英文-进场”。 自然语言模型:保持默认值“AIUI通用语义模型”。 管理技能配置:English情景模式下,不支持开启系统预置技能,仅支持开启自定义技能,相应操作请参考配置应用需要的技能。 (可选)开启闲聊技能:可选能力,操作请参考(可选)开启闲聊功能。 模拟测试:操作请参考模拟测试。
需在视频草稿中重复设置。 支持在“特殊词表”界面执行下述操作。 修改特殊词:单击特殊词右侧的“编辑”,修改当前特殊词。 单个删除特殊词:单击特殊词右侧的“删除”,删除当前特殊词。 批量删除特殊词:单击界面右上方的“批量管理”,勾选需要删除的特殊词,支持全选,单击“批量删除”即可。
创建进阶版语音训练任务 功能介绍 用户创建语音训练进阶版任务,该接口会返回一个obs上传地址,用于上传语音文件。 支持2种方式上传语音文件: 语音文件和文本文件打包成zip上传:语音文件已经切分成100个wav文件,每个语音文件对应一个txt文本文件,所有文件打包成zip文件。语音文件命名规则:0
找到需要修改的对话项目,单击右侧的“编辑”,进入对话编辑界面,如图2所示。 图中标识“1”处为语言修改配置。请根据实际情况切换语言,目前仅支持中文和英文。 图中标识“2”处为声音切换入口。单击图标,弹出如图3所示的对话框,选择需要切换的声音。 请注意,切换后的声音必须与前面切换后
如何在MetaStudio控制台呈现PPT的动画效果? 在视频制作界面导入的PPT,不支持展示动画、视频、动图等动态元素。如需展示动态效果,需将PPT导出为视频后,再上传至MetaStudio控制台使用。 PPT转视频的操作方法,如下所示: 本地打开PPT文件,在左上方的导航栏中,选择“文件