检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
及TTS语音合成的多音字、停顿等。 SSML基础定义可参考语音合成标记语言版本 1.0。MetaStudio在此基础上,扩展了一些字段用于实现数字人的控制。 MetaStudio SSML当前支持如下能力: TTS语音合成时,控制文字读音。 包含如下标签: <speak></speak>标签为SSML文本根节点。
如果华为云账号已经能满足您的要求,不需要创建独立的IAM用户,您可以跳过本章节,不影响您使用MetaStudio服务的其它功能。 本章节为您介绍对用户授权的方法,操作流程如示例流程所示。 前提条件 给用户组授权之前,请您了解用户组可以添加的MetaStudio系统策略,并结合实际需求进行选择。 MetaStudi
vlog视频都超有用。 再说说其他的,比如你要做原型图,那你可以使用墨刀。 它是一个强大的原型设计工具,大厂的产品经理都在用,能帮你快速做出精美的原型,适用于网站、App等数字产品的设计和开发。 如果要做脑图,亿图可是不二之选,帮你整理思路、分享信息,简直就是工作的好伙伴! 当然
SDK概述 华为云提供了MetaStudio服务端SDK,您可以直接集成服务端SDK来调用MetaStudio的相关API,从而实现对MetaStudio服务的快速操作。 在线生成SDK代码 API Explorer能根据需要动态生成SDK代码功能,降低您使用SDK的难度,推荐使用。
场景二:用户使用第三方语言模型,自主开发API实现与数字人对话场景。 开发者基于智能交互服务定义的API接口结构,自主开发第三方语言模型API,对接第三方语言模型到智能交互服务,实现智能交互能力。操作请参考创建智能交互数字人(第三方语言模型)。 场景三:用户使用智能交互API或SDK,自主开发实现与数字人对话场景。
用户申请账号并上传相关授权,拍摄训练所需音视频素材,上传进行模型训练,生成自定义形象和声音。选择背景、声音、模特等内容,基于文本或语音智能驱动,实现视频制作、视频直播、智能交互等能力。 华为云盘古数字人大模型,赋能千行百业数字化营销新模式 MetaStudio服务依托华为云基础设施、海
创建智能交互数字人 介绍如何在MetaStudio平台创建智能交互数字人,实现用户和数字人进行交互对话。相应的场景说明,请参考场景说明。 操作步骤 登录MetaStudio控制台,单击“智能交互”,如图1所示。 图1 MetaStudio控制台页面 在智能交互编辑页面,依次设置角色和背景。
创建智能交互数字人 介绍如何在MetaStudio平台创建智能交互数字人,实现用户和数字人进行交互对话。相应的场景说明,请参考场景说明。 前提条件 已配置完成奇妙问,示例如创建智能交互数字人(奇妙问)所示。 操作步骤 登录MetaStudio控制台,单击“智能交互”,如图1所示。
智能交互驱动 前提条件 智能交互驱动流程 智能交互驱动WebSocket接口 父主题: 智能交互
创建智能交互数字人(SDK场景) 介绍如何在MetaStudio平台创建智能交互数字人,实现用户和数字人进行交互对话。相应的场景说明,请参考场景说明。 操作步骤 登录MetaStudio控制台,单击“智能交互”,如图1所示。 图1 MetaStudio控制台页面 在智能交互编辑页面,依次设置角色和背景。
真人声音录制 客户录制真人音频,上传至MetaStudio进行AI训练,即可得到和真人音色1:1复刻的声音模型。 声音模型可实现文本转语音,应用于数字人视频制作、直播、交互问答等场景中。不同版本录制规格如下: 基础版:整段录制生成一个WAV或MP3格式音频,总时长3~10分钟,建议5分钟。
创建智能交互数字人 介绍如何在MetaStudio平台创建智能交互数字人,实现用户和数字人进行交互对话。相应的场景说明,请参考场景说明。 前提条件 已配置完成第三方应用,示例如创建智能交互数字人(科大讯飞)所示。 操作步骤 登录MetaStudio控制台,单击“智能交互”,如图1所示。
创建智能交互数字人 介绍如何在MetaStudio平台创建智能交互数字人,实现用户和数字人进行交互对话。相应的场景说明,请参考场景说明。 操作步骤 登录MetaStudio控制台,单击“智能交互”,如图1所示。 图1 MetaStudio控制台页面 在智能交互编辑页面,依次设置角色和背景。
可在合作的第三方平台进行数字人视频直播,如淘宝、拼多多、抖音等。 智能交互 包含下述功能实现场景: 支持开箱即用的智能交互数字人。 支持使用第三方语言模型,自主开发API实现与数字人对话。 支持使用智能交互API或SDK,自主开发实现与数字人对话场景。 智能导购、文旅导览、智能问答、营业厅客服、智能陪练等。
按照MetaStudio服务定义的接口参数格式(详见智能交互第三方LLM回调接口),开发LLM接口,由MetaStudio服务调用此接口,实现智能交互能力。 这里配置的是MetaStudio服务调用第三方语言模型的API地址。 流式响应 MetaStudio智能交互服务提供流式问
会与录制效果保持一致,包括服装、手部动作、面部表情以及各方面的姿态等。所以我们希望您在拍摄时尽可能保持自然,按照平时的说话习惯录制。 拍摄流程 支持手机或相机拍摄,需1080P或更高分辨率。 录制时长为2分钟,包含15秒静默转态和1分45秒的演讲过程。 允许使用中文、英文录制。
单击“分身形象制作”下方的“开始创建”,进入分身形象制作页面。 界面左侧是定制分身数字人的数据上传界面。 界面右侧上方,展示分身数字人定制流程。下方展示训练视频拍摄指导和样例视频,包括:拍摄前准备、拍摄中操作和拍摄后处理,有效指导用户拍摄生成一段完整可用的训练视频,用于训练生成分身数字人。
登录MetaStudio控制台。 单击“Flexus分身数字人”,进入Flexus分身数字人流程介绍页面,如图1所示。 请认真阅读界面上方的规范和避免出现的问题,并仔细观看下方的形象拍摄视频。 图1 流程介绍 单击“下一步”,进入Flexus分身数字人制作页面,如图2所示。 界面操作详情,如表1所示。
Web SDK和服务相关的个人信息,您应通过客户应用提供的路径实现您的个人信息主体权利。 为保障您访问、复制、更正和删除个人信息的权利实现,我们在与客户的协议中,明确要求客户承诺根据法律法规要求向您提供便捷的权利实现方式。您也可以通过本声明“如何联系我们”章节中所述联系方式与我们
单击“声音制作”下方的“开始创建”,进入声音制作页面。 选择“第三方模型”页签的“出门问问声音制作”方式。 界面左侧是声音制作页面,右侧为声音制作流程,如图1所示。 图1 定制声音 配置声音制作参数。 界面操作详情,如表1所示。 表1 界面操作说明 区域 说明 声音制作方式 选择“出门问问声音制作”。音频时长为0